关于人工智能:通用能力及AI核心能力表现优异合合信息智能文档处理系统IDP高评级通过中国信通院评估

29次阅读

共计 1626 个字符,预计需要花费 5 分钟才能阅读完成。

数字经济疾速倒退的背地,寰球数据总量呈现出爆发式增长趋势。智能文档解决(IDP)技术可能高效地从多格局文档中捕获、提取和解决数据,帮忙机构和企业大幅晋升文档解决效率,节约工夫和人力老本。

近期,合合信息智能文字辨认产品通过中国信息通信研究院(以下简称“中国信通院”)“可信 AI—智能文档解决零碎”评估工作,并取得“5 级”评定。据悉,“5 级”为该模块最高评定等级。人工智能技术的利用场景正在一直拓展,其倒退也面临着产品能力参差不齐、不足行业基准和标杆、平安可信要求落实不明确等问题。中国信通院于 2018 年起逐渐构建和欠缺“可信 AI”评测体系,助力人工智能技术的倒退和产业的健康成长,“智能文档解决”是近两年来新增的评测我的项目之一。

 
中国信通院智能文档解决零碎评测体系介绍(图源:中国信通院)

国际数据公司(IDC)最新公布的预测数据显示,中国数据量规模将从 2022 年的 23.88ZB 增长至 2027 年的 76.6ZB,年均增长速度(CAGR)达到 26.3%。其中,企业数据量占据 70%,目前仅有 24% 的数据被用于剖析或 AI 决策。由此可见,企业在经营中积淀下来的数据,有大部分价值尚待开释。计算机信息化零碎中的数据分为结构化数据和非结构化数据,人们日常生活、工作中所接触到的各类办公文档、文本、图片、报表都属于非结构化数据。因为格局简单、规范多样,非结构化数据处理起来既艰难又耗时,智能文档解决技术能够把要害信息从半结构化 / 非结构化数据中提取进去,进一步实现业务流程的端到端自动化。IDC 认为,智能文档解决技术是晋升局部行业、业务、流程的外围生产因素,随着与利用和流程自动化的深度整合,潜在的利用场景宽泛,遍及空间较大。

目前,智能文档解决技术已被广泛应用于文档数字化治理、自动化流程、图文提取等业务场景,并减速浸透金融、政务、医疗、海关等垂直畛域。中国信通院继续关注智能文档解决技术及利用的倒退状况,根据《自然语言解决技术和产品评估办法 第 8 局部:智能文档解决零碎》,全方位评估企业智能文档解决的技术先进度。评估结果显示,合合信息智能文档解决产品在通用能力及 AI 外围能力方面均体现优异:通用能力方面,合合信息产品在信息抽取、表格文字辨认、版面剖析等方面均取得 5 分评分。表格文字辨认、版面剖析是文档解决的难点,合合信息表格文字辨认技术支持辨认图片 /PDF 格局文档中的多类型表格内容。在财报相干表格辨认测试中,合合信息有线表辨认单元格构造准确率高于 98%;无线表辨认在保障表格区域内容的完整性的同时,检测准确率较传统办法显著晋升。

 合合信息“表格文字辨认”解决成果展现 

合合信息版面剖析技术通过解决版面宰割、区域间的逻辑关系解决等方面的难题,可将文档图像切分成不同类型内容(文本、图形、公式、表格等)的区域,并剖析区域之间的关系,让机器更精准地确定文档中的文字地位、字体、大小和排版形式,从各类版式简单的图片文档中精准获取信息。AI 外围能力方面,合合信息产品在 NLP 畛域的文本分类、常识图谱畛域的实体辨认、关系抽取及 OCR 畛域的字符识别、文本行辨认均取得 5 分评分,并反对文本生成、事件抽取等高阶解决能力,其中准确率、召回率、F1 值等指标评分总体较高。合合信息创建于 2006 年,是一家人工智能及大数据科技企业。合合信息智能文档解决产品是一款集图像处理、文档品质判断、文档辨认、版面剖析、文档结构化信息抽取、存储、检索、治理等技术于一体的智能文档解决方案产品,旨在帮忙集体和企业实现文档信息化治理。技术倒退之路上,平安是不可缺席的话题。本月,中国信通院携手合合信息启动了《文档图像篡改检测规范》制订工作,中国图象图形学学会、中国科学技术大学等出名学术机构参加联结编制。该检测规范将基于产业现状,围绕“细粒度”视觉差别伪造图像甄别、生成式图像判断等行业焦点议题,凝聚行业共识,为中国“可信 AI”在机器视觉、图像处理畛域的体系建设提供无力反对。

正文完
 0