首页> 技术成果
应用行业领域 | 电子信息-计算机软件 |
---|---|
适用范围 | 本产品可应用于数字出版、金融科技、电子书、题库、在线教育、咨询、动漫等领域的内容加工与信息挖掘。 |
成果内容简介 | 本软件主要功能是版面对象(文字、表格、公式、图形等)的自动识别,包括版面分割、样式识别、表格识别、公式识别、图形解析、文字识别与元数据抽取等。可用于数字内容制作(如点读书热区检测)、文件格式转换(如PDF到EPub)、表单识别与金融文档处理、数学公式识别与结构化拷贝、题库构建与试题检索、漫画制作与检索等。目前支持图像、PS、PDF、Word、EPub、网页等文件格式,支持图书、论文、证券研究报告、试题、表单类数据等。 |
前期应用示范情况 | |
获得研发资助情况 | |
转化应用前景 | 通过对于用户输入的图像进行自动分析,从而获取版面中的分镜,并且根据识别的分镜之间的几何位置关系判定其阅读顺序,从而使得图像能更好地在移动设备上阅读。该方法能够自动理解版面,解决了目前方法不能处理复杂布局版面的问题,可以提升处理效率和用户体验。 |