现阶段,手机扫描正越来越多地进入到人们的生存中。随着扫描利用场景的一直拓宽,诸多细节的问题逐步露出,比方使用者在拍照扫描文档时,手指不小心“入镜”了,只能重拍;拍电脑屏幕时,画面上有一些黑白条纹,既不美观也影响内容辨认;拍完照片后发现文档很芜杂,扫描时须要手动叠加好几种图片解决计划,能力获得理想的成果……这些“糟心事”,现在被一个滤镜轻松解决了。
近期,合合信息旗下扫描全能王“智能高清滤镜”正式上线。该性能基于 AI 技术及智能扫描引擎,可自动检测图像中存在的问题并断定图像的优化形式,实现含糊、暗影、手指、屏幕纹等烦扰因素一键全解决。使用者无需思考拍摄角度、光源、背景,只有点击单拍、多拍、扫描等任意拍摄按钮,便可失去一张如原稿打印般清晰、平坦的图片。
扫描“一键到位”的背地,AI 在帮人“思考”图像问题 与传统的手机扫描流程相比,扫描全能王“智能高清滤镜”的亮点之一,便是让 AI 代替人去“思考”图片中须要解决的问题,并为用户主动抉择出最优解决计划,通过算法上的智能研判,达成多个问题一键解决的成果。
据合合信息扫描全能王事业部负责人曹超阳介绍,“智能高清滤镜”的智能研判次要基于精准的图像感知,来达成场景化的决策成果。在图像感知阶段,AI 通过深度学习模型进行图像特色获取,感知到图像中的光照、暗影、色彩和歪斜角度等特色并对应进行图像处理,例如去除手指产生的遮挡、感知到图像是过暗还是过亮,而后针对性地调整图像的亮度和对比度等。
扫描全能王“智能高清滤镜”的去摩尔纹解决成果展现 场景化决策即依据图像感知的后果,断定图像属于何种场景,并进行个性化的解决。例如,试卷、发票的图像特点不尽相同,“智能高清滤镜”可能迅速断定文档品种并进行解决办法决策,在办公文档电子化、教育材料解决、商务材料留存等波及文档解决的场景中具备广大的利用前景。
智能扫描引擎,让 AI 读懂图像与文字“智能高清滤镜”多项“黑科技”性能的实现,离不开智能扫描引擎 AI-Scan(简称“AI-Scan 引擎”)的反对。AI-Scan 引擎基于合合信息智能文字辨认、智能图像处理技术,对图像处理、文字辨认及版面还原进行全面优化,综合晋升扫描成果。
图像处理对于文档解决中所波及的文字辨认等后续流程十分要害,目前还存在着许多典型的痛点,最常见的就是“图像视觉改正”。现实生活中,书本等文档并不总是立体的,AI 在解决相干图片时须要进行“改正”。此外,因为拍摄角度和镜头畸变的问题,即便是立体的文档,拍摄后也可能呈现透视扭曲。扫描全能王采纳了基于深度学习的曲面检测和改正技术来进行解决,可能应答各种简单的曲面文档。
扫描全能王“智能高清滤镜”书本曲面改正解决成果展现 场景化决策即依据图像感知的后果,断定图像属于何种场景,并进行个性化的解决。例如,试卷、发票的图像特色不尽相同,“智能高清滤镜”可能迅速断定文档品种并进行解决办法决策,在办公文档电子化、教育材料解决、商务材料留存等波及文档解决的场景中具备广大的利用前景。
扫描全能王“智能高清滤镜”手指、暗影叠加解决成果展现 实现图像处理之后,如何从图片中正确提取所需信息,与文字辨认能力非亲非故。全球化过程的深入,让多语种辨认成为一项高频需要,也为文字辨认畛域带来了微小的挑战。多语种辨认的艰难点次要来源于不同语种之间的独特字符集、书写规定和语法结构间的差别,以及简单的文本状态和排版形式的影响。例如,阿拉伯语的书写方向是从右到左,而且同一字母在单词的不同地位有着不同的状态。对于这种语言,传统的文字识别方法往往难以应答;其余小语种如泰语和印地语,其书写零碎绝对简单,有时一个字符可能会呈现在另一个字符的上方或下方,是文字辨认必须解决的问题。
为了克服这些挑战,扫描全能王在 AI-Scan 引擎的反对下,采纳了一种联合深度学习和自然语言解决的全新办法,可能无效地解决不同语种的字符关联和程序问题。在服务寰球亿级别用户的过程中,扫描全能王对大量的多语种文本进行预训练,可能对寰球 41 个语种的文档进行辨认,满足了寰球超过 100 个国家和地区用户的办公、生存需要。“华盛顿邮报等媒体曾将扫描全能王称作‘手掌扫描仪’,因为这款产品实现了在低资源、性能低的挪动设施下高准确率、高效率、高稳定性的辨认体验。‘做小、做轻’是上一个阶段的工作,将来扫描会更多地与前沿技术的联合,进入智能化的时代。”曹超阳示意,在过来的十年里,扫描全能王是最早将图像处理、OCR、深度学习等 AI 技术综合使用的 APP 之一。将来团队将持续保持对 AI 底层技术的关注,用科技为寰球用户提供有价值的文档智能服务。