近期,2023 年度视觉与学习青年学者研讨会 (Vision And Learning SEminar, VALSE) 圆满闭幕。会议由中国人工智能学会、中国图象图形学学会主办,江南大学和无锡国家高新技术产业开发区治理委员会承办。超五千名专家学者、出名高校师生以及来自 OPPO、华为、百度、合合信息等科技企业的研发人员齐聚大会,共探计算机视觉、图像处理、模式识别与机器学习前沿技术的倒退与利用。
大会现场
VALSE 是一个面向计算机视觉与机器学习畛域国内外华人青年学者的高规格学术研讨会。本届大会共出现了 3 个大会宗旨报告、4 个大会特邀报告、12 个年度停顿报告 (APR) 报告、4 场讲习班 (Tutorial)、20 场研讨会 (Workshop),会议报告总数为历年之最。
往年,VALSE 继承了往届大会的次要程序环节,相干报告和展现从内容上涵盖了计算机视觉、图像处理、模式识别与机器学习畛域的大部分热点钻研方向,研究了上述钻研畛域的国内外前沿停顿。大会邀请中国工程院院士高文传授,欧洲科学院外籍院士焦李成传授,中科院计算所所长陈熙霖研究员做宗旨报告,由 VALSE 联结创始人山世光研究员主持宗旨报告环节。
本届会议 Workshop 环节专一于视觉常识和多重常识表白、语言文字辨认与了解等技术研发及利用热点。文档的智能化解决是计算机视觉在产业中的重要利用方向,现阶段还面临着诸多挑战。作为智能文档解决畛域的代表,合合信息出席会议并进行智能文档解决技术研发与实际成绩分享。
VALSE Workshop 环节,合合信息技术代表就《智能文档图像处理技术利用与实际》主题进行分享
合合信息相干技术人员提到,随着 OCR 技术利用面的继续拓宽,复杂多变的版面、多样化的文本内容给文档的辨认和还原带来了新的挑战。“版面剖析与文档还原”技术对晋升文档图像电子化的视觉效果、信息提取精准度十分要害,是公司重点发力的方向之一。
文档中通常含有大量的图片、表格等非文字内容,一篇一般的论文或者文稿,除文字信息外,其版面往往蕴含页眉、页脚、表格、二维码等多种元素。在向零碎输出文档图像后,机器会对文字局部和版面元素进行剖析和辨认,把若干行文字关联起来,从而取得正确的程序与段落关系,这便是版面剖析技术。
版面剖析的工作指标被分为物理版面剖析和逻辑版面剖析两类,前者次要解决区域分割问题,后者则关注区域之间的逻辑关系或浏览程序。如何精准地分别各类元素,并在文档电子化过程中让它们回归到应有的地位,是该项技术的难点之一。
如果无奈晋升版面剖析的精准度,文件资料在被拍照、扫描成电子文档的过程中便可能呈现漏字、错位的景象,图片转 Word、图片转 Excel 等“可编辑”性的需要将无奈被满足。
“版面剖析与文档还原技术可能帮忙机器‘看懂’文档构造,让文档电子化取得‘所见即所得’的解决成果。”分享环节中,合合信息技术人员提到,文档图片的格局转化流程中,在检测、辨认完出文字信息中的字符、坐标信息,以及版面中段落、印章、表格等元素信息后,机器能力“了解”文档的组成,更好地将图像“还原”成一个可编辑的 Word 或 Excel 文件。
合合信息“智能文档解决——文档还原零碎架构”展现
据理解,合合信息版面剖析技术通过解决版面宰割、区域间的逻辑关系解决等方面的难题,可将文档图像切分成不同类型内容(文本、图形、公式、表格等)的区域,并剖析区域之间的关系,让机器更精准地确定文档中的文字地位、字体、大小和排版形式,从各类版式简单的图片文档中精准获取信息。
合合信息“版面剖析与还原”技术解决成果展现
将来,合合信息将继续为寰球企业和个人用户提供翻新的数字化、智能化服务,助力集体文档解决效率晋升,减速企业全生命周期文档电子化过程。