引言:
信息时代的高速倒退导致数据的大量产生与频繁传输,单单依附人力很难解决这些数据。依靠于人工智能的衰亡与倒退,数据的利用变得更加高效。表格作为数据的一种重要载体,是人们为了让数据的组织模式更加规范和结构化而应用的一种数据类型。
表格的特点:
信息高度精炼集中,不便信息的检索和比拟。表格被宽泛用于示意构造和性能信息,它们呈现在不同品种的文献中,包含报纸、钻研论文和迷信文件等。表格使读者可能疾速地比拟、剖析和了解文件中呈现的事实。表格辨认的目标是获取图像中的表格并拜访其数据,是文档剖析与辨认畛域的一个重要分支。
表格在生成或存储过程中往往以图片或 PDF(Portable Document Format)文件的模式存在,会失落易于计算机了解的原有构造信息。若是采纳人工伎俩对表格进行重新处理录入,会面临效率低下、数据量大导致出错等问题。因而,如何高效地从文档或图像中找到表格区域,同时无效地提取表格中的构造信息和数据内容,成为了一个亟待解决的问题。
表格辨认的倒退历程:
晚期对于表格的辨认大多是针对比较简单或者模板化的表格。从表格的布局构造登程,抽取表格线条或抽取文本块,而后应用规定办法进行剖析,但这些办法往往泛化能力较差,且难以解决简单表格。起初随着深度学习的倒退,无论是机器视觉方向还是自然语言解决方面都取得了微小的停顿,各种表格辨认的计划被提出,并有研究者开始尝试对天然场景下的表格进行解决。
传统的机器学习办法能够实现表格辨认和检测,然而它有肯定的性能局限,特地是在解决简单的表格辨认和检测的技术要求上有肯定的局限性。深度学习技术曾经成为计算机视觉、自然语言解决等畛域具备极高体现能力的新型机器学习办法,近年来,基于深度学习的表格辨认与检测技术也受到了宽泛关注,它能够提供较高的准确率和完整性,起到较好的优化解决方案。
表格辨认与检测通常分为三个根本步骤:
1 表格地位定位
2 单元格宰割
3 内容提取
基于深度学习的表格检测与辨认,将 多层神经网络 利用到解决表格问题上,概括地说,
其特色在于几个方面:
(1)深度学习具备 高精度 和弱小的示意能力,可能无效解决简单的数据,如图像和自然语言。
(2)深度学习的特色通常是 主动学习的,不须要人工标注信息,同时它可能精确地从不同的数据中学习新特色,可能更好地解决一些含糊,简单和非线性的数据
(3)深度学习可能捕捉表格的 简单构造信息,并可能从图像取得更多更有用的技术特色。
与传统的机器学习办法相比基于深度学习的表格检测辨认有以下几点劣势:
(1)数据集品种
基于机器学习的检测识别方法次要面向标注了表格地位的数据集,应用这类数据来训练模型,从而能够取得较高的检测辨认精度;而基于深度学习的检测识别方法则面向标注了表格元素地位的数据集,这类数据能够更具体地形容文档中的表格,能够无效抵御烦扰。
(2)模型准确度
从模型准确度上来看,基于机器学习的表格检测识别方法次要依赖于模型的改良,因此可能在模型准确度上把控较高的水准,即便对于较小的数据集来说;而基于深度学习的表格检测识别方法则更加取决于数据的品种基于更加具体的数据形容,能够使模型的精度晋升到更高的水准。
(3)数据摸索
从数据摸索的角度来看,基于机器学习的表格检测识别方法次要针对已有数据对模型进行训练,以进步检测辨认的效率;而基于深度学习的检测识别方法则可能在残缺的文本中摸索出具体的表格信息,从而获取更多的有用技术特色。
(4)工夫开销
从工夫开销上来看,基于机器学习的表格检测识别方法经常比拟容易受到训练数据和模型规模等因素的影响,而基于深度学习的表格检测识别方法则更加容易进行辨认和检测,所需工夫大大缩短。
比照论断:
1 因其能够解决数据量小、模型成果不现实等问题,基于机器学习的办法依赖于模型的进步.
2 而基于深度学习的办法能够提供残缺的特征描述以及更弱小的抗干扰能力,从而使检测辨认的成果大大晋升。
目前,基于深度学习的表格辨认与检测技术曾经在科研和理论利用方面获得了肯定的成就,常见的表格检测和辨认技术经常与基于深度学习的其余技术联合起来,进行零碎设计。依据眺望智库的数据,基于深度学习的表格检测与辨认技术的市场规模目前曾经从 2016 年的 46600 万美元增长到了 2018 年的 9800 万美元,其中,自然语言解决(NLP)、计算机视觉(CV)和图像处理等技术将无望引领下一步的增长能源。
合合信息认为,现今基于深度学习的表格检测与辨认技术依然处于无限,大龄化和繁冗之中。从技术品质角度讲,晚期钻研大多数临时性,难以波及主观剖析。然而,在过来几年中,随着技术的一直成熟,许多钻研开发了和实现了各种深度学习模型,进步了表格检测与辨认技术的准确性和有效性。在普适表格辨认和检测中,深度学习算法是无利的,但它仍有挑战须要解决。将来钻研可能集中在强化表格检测和深度学习的运行速度,利用表格检测到事实世界的工作,灵便的解决新表格,更多地思考端到端办法以及学习式表格辨认。
参考文献:
- Kong L J, Bao Y C, Wang Q W and Li H K. 2021. Summary of table detection and recognition algorithms based on deep learning. Computer & Network,47(02):65-73
- Gao L C, Li Y B, Du L, Zhang X P, Zhu Z Y, Lu N, Jin L W, Huang Y S, Tang Z . 2022. A survey on table recognition technology. Journal of Image and Graphics, 27(6): 1898-1917.