ABBYY近日宣布发布ABBYY FineReader engine 10软件开发工具包 (SDK),这个产品集成了最先进的下一代文档识别技术。FineReader engine 10 对于主要欧洲语言的识别比前一版本快 92% 。亚洲识别速度和准确率提高40%,提供了扩展的图像和照片处理能力,增强了对文档结构的分析和格式重建。另外,一个基于最新API开发的直观界面使客户利用最少的时间和精力开发出所需要的产品。
ABBYY 技术产品部主任安德烈 · 伊萨耶夫说,"真正的挑战不只是加快OCR 处理速度,而是要同时保持客户所希望的OCR准确性"。 FineReader engine 10在这两个基本准则之间达到了一个理想的平衡。
FineReader SDK提供给了开发商和集成商所需要的工具,他们可以将各种识别技术集成到其应用程序。 ABBYY 识别平台提供了广受赞誉的 OCR技术、 智能字符识别 (ICR)技术、 条形码、 checkmark、 字段级/区域的识别以及将扫描的文档和图像转换为可检索和可编辑文本的PDF文件。 FineReader engine 10 支持113种语言的 ICR和 198种语言的OCR。
ABBYY FineReader engine 10主要的新功能包括:
增强快速识别模式 — —对于欧洲语言识别速度提高了92 %,同时保持高水平的识别准确性。它在优化处理速度/高质量识别图像方便达到了完美的平衡。
增加中文、 日语和韩语的 OCR 精度 — —改进了亚洲字符的 OCR 准确性,增强了东亚文字和欧洲语言混排的识别精度。
低分辨率的新识别模式扫描— — 对于低分辨率扫描和低的打印质量文档的识别率提高了20% (例如旧传真)
功能更加强大的 API,使客户的开发更加简单 — —新的 API 为常用的识别任务例如,"将文档转换为归档","基于内容重复使用的文件转换","条码识别"等等,提供了一组预定义的配置文件。 配置文件包括一些预先设定好的处理参数,来确保最好的OCR 质量,而不需要人工调整。对于一些特殊的解决方案客户也可以对参数进行特殊设定。
改进的文档结构和页面版面分析——ABBYY 的第二代 ADRT (自适应文档识别技术),使多页文档的逻辑结构分析得到了很大的增强。 FineReader engine 10 可以准确地重建复杂的文本在原始office文档中的格式,现在表格内容、层次标题、图片和表格标题的表格,并提供改进的脚注和样式的还原。 该产品可在输出文件中更好保留文档布局, 包含文本区域的背景图像,以及文档中图表和图形。
另外, SDK 提供了一个新的文档结构API, 可以轻松地访问和操作文档相关属性,如标题、 章节、 页码、 脚注、 标头和其他的文档结构属性。
处理图像和光的新进展— — 增强型的 ABBYY 数码相机 OCR 技术可以实现智能化校正图像3D扭曲、 ISO噪声和运动模糊。 FineReader engine 10 提供了新的二值化技术,以确保在的图像上文本即使在效果较差的情况下也可以保留相关信息,防止丢失。另外,该解决方案包括一个独特的功能,它可以将图像中的颜色标记和盖章与其余部分分开,从而提高文本的识别精度。
改进的PDF导出— FineReader engine 10 提供了预定义的 PDF 导出配置文件 —包括 MaxQuality、 MinSize、平衡,MaxSpeed—允许集成商实现用较小的文件尺寸,而得到更好的质量 PDF 转换文件。
产品提供与价格策略
ABBYY FineReader engine 10 Windows 版本是可在全球范围内提供灵活、 模块化的商务政策。开发人员可以根据项目情况选择工具和得到最优的报价。报价根据处理站和处理的页数以及CPU内核的数量不同而不同。 对许可模型和定价的信息可以联系您当地的 ABBYY 办事处或 ABBYY 合作伙伴。 也可供测试时间限制的试用版。
用户评论