关于人工智能:合合信息智能文字识别产品通过中国信通院可信AIOCR智能化服务评估

3次阅读

共计 1182 个字符,预计需要花费 3 分钟才能阅读完成。

近年来,我国对数据的器重水平不断加强。2022 年 1 月,国务院印发的《“十四五”数字经济倒退布局》进一步提出,到 2025 年要初步建设数据因素市场体系,并对充分发挥数据因素价值作出重要部署。然而,现阶段有大量的数据信息以图片模式存储,数据流通仍存在隐形的壁垒。
作为将图像信息转换为文字信息的关键技术,OCR(光学字符识别)技术可能在多场景下实现数据信息提取,无效进步业务效率,被广泛应用于金融、交通、医疗等多个畛域。OCR 技术的不断进步可能帮忙机器更好地了解图像和文档,有助于推动 AI 在图像识别与文档解决畛域中的可信化落地。近期,合合信息通过中国信息通信研究院(以下简称“中国信通院”)“可信 AI—OCR 智能化服务”评估工作,并取得“加强级”评级。
现阶段,因为 OCR 规范体系尚不健全,技术和产业短少对立领导,市场上的 OCR 产品类目繁多,却未就“智能化”相干定义造成清晰的概念,给消费者在选购产品、政府在审批企业我的项目、平台企业治理产品准入时带来了选型难题。
中国信通院继续关注 OCR 技术及利用的倒退状况,联结业内多家企业独特制订《OCR 服务智能化分级技术要求和评估办法》,制订了 OCR 服务在性能、性能、平安等方面的技术要求以及评估办法,为 OCR、智能文档解决技术的研发和产业利用提供参考。OCR 智能化服务评估根据《OCR 服务智能化分级技术要求和评估办法》发展,共波及 3 大能力域、6 项能力项及十余项要害指标,综合评估 OCR 产品的性能、性能和服务成熟度。
其中,性能维度涵盖根底类功能测试和加强类功能测试两个方面,从卡证类、票据类、通用表格、通用图片等文字辨认服务层面,综合评估 OCR 智能化产品的性能;性能维度涵盖多种常见业务场景的文字辨认性能测试,例如卡证类文字辨认、票据类文字辨认等,针对字符准确率 / 召回率、字段准确率 / 召回率等指标主观评估 OCR 智能化服务的理论利用成果;服务成熟度包含安全性和可靠性两个能力项,次要评估 OCR 智能化产品是否具备服务可靠性和安全性保障策略。

图源:中国信通院
本轮测试中,合合信息智能文字辨认产品顺利通过全副 7 项根底类性能指标测试以及 9 项加强类性能指标测试,取得“加强级”评级,其智能文字辨认产品展现出良好的性能和服务成熟度。以具备较大难度的证件类和票据类性能测试为例,面对旋转、暗影、反光、褶皱、形变、含糊、多语言、低像素、光照不均等简单场景,合合信息智能文字辨认产品均有较高的辨认准确率,字符准确率别离为 99.21% 和 99.59%,字段准确率别离为 97.87% 和 98.42%。
此外,测试结果显示,合合信息智能文字辨认产品反对超过 50 种简单语言的辨认,为全球化、多语言背景下的信息智能辨认提供了技术撑持。现阶段,合合信息智能文字辨认技术已落地于银行、保险、证券、制作、政务等近 30 个行业,服务寰球超过 200 个国家和地区的集体及企业用户。

正文完
 0