乐趣区

关于人工智能:OCR产业应用实战多类别电表读数识别方案详解

我国电力行业倒退迅速,电表作为测电设备经验了一般电表、预付费电表和智能电表三个阶段的倒退。在产业场景中,表的品种多达十几种,过来依赖人工抄表,老本很高。如果可能采集到大量电表图片,借助人工智能技术批量检测和辨认,将会大幅晋升效率。 本次飞桨产业实际范例库 开源电表读数辨认场景利用,提供了从数据筹备、技术计划、模型训练优化,到模型部署的全流程可复用计划,升高产业落地门槛。

⭐我的项目链接⭐https://github.com/PaddlePaddle/awesome-DeepLearning 所有源码及教程均已开源,欢送大家应用,star 激励~

基于深度学习技术

实现电表读数辨认

本场景要解决多类别电表辨认工作,从技术上须要对多种类别的电表表数和表号进行检测再辨认,从数据到模型面临着多重问题。

我的项目难点:

  • 在数据方面,电表品种多、数据少、拍摄角度多样且局部数据反光重大。
  • 如何从零标注电表数据,抉择何种标注软件可能最快速度构建数据集?
  • 技术路线的抉择也面临多方面的问题,例如是通过文字检测来反向微调,还是通过指标检测从零训练?

本我的项目将一一解决这些难点。

我的项目计划:

基于上述难点,飞桨开发者技术专家一直进行尝试,最终选用了飞桨文字辨认套件 PaddleOCR 中的 PP-OCR 模型进行了微调与优化,其检测局部基于 DB 的宰割办法实现,间接解决了电表数据中的歪斜问题,通过再造数据集来裁减辨认数据集,训练辨认模型。PP-OCR 模型通过大量试验,其泛化性也足以撑持简单垂类场景下的成果。

在数据标注工具上,应用 PPOCRLabel 实现半自动标注,内嵌 PP-OCR 模型,一键实现机器主动标注,且具备便捷的批改体验。反对四点框、矩形框标注模式,导出格局可间接用于 PaddleOCR 训练,标注效率显著晋升。

计划优化:

在优化方面,首先对 PP-OCR 模型的检测局部进行初步微调,而后通过对数据的进一步剖析,发现原始图像分辨率较大,进而调整 EastRandomCropData 的尺寸,放大输出模型前的图像尺度。通过 CopyPaste 数据加强解决数据量小的问题,并且依据理论状况调小学习率。

我的项目成果:

最终在评测数据集上从原先的 Hmeans=0.3 优化到 0.85。除此之外,本我的项目也尝试了一部分指标检测算法。具体的优化过程和具体解释,欢送大家关注直播!

微调前后比照

部署方面应用飞桨原生推理库 Paddle Inference 实现,满足用户批量预测、数据安全性高、提早低的需要,疾速在本地实现部署计划。

产业实际范例教程

助力企业逾越 AI 落地鸿沟

飞桨产业实际范例,致力于减速 AI 在产业落地的后退门路,缩小实践技术与产业利用的差距。范例来源于产业实在业务场景,通过残缺的代码实现,提供从数据筹备到模型部署的计划过程解析,堪称产业落地的“主动导航”。

  • 实在产业场景:与理论具备 AI 利用的企业单干共建,选取企业高频需要的 AI 利用场景如智慧城市 - 安全帽检测、智能制作 - 表计读数等;
  • 残缺代码实现:提供可一键运行的代码,在“AI Studio 一站式开发平台”上应用收费算力一键 Notebook 运行;
  • 具体过程解析:深度解析从数据筹备和解决、模型抉择、模型优化和部署的 AI 落地全流程,共享可复用的模型调参和优化教训;
  • 中转我的项目落地:百度高工手把手教用户进行全流程代码实际,轻松中转我的项目 POC 阶段。

精彩课程预报

为了让小伙伴们更便捷地利用电表读数范例教程,咱们邀请了飞桨开发者技术专家于 3 月 3 日 20:30-21:00 为大家深度解析从数据筹备、方案设计到模型优化部署的开发全流程,手把手教大家进行代码实际。欢送小伙伴们扫码进群,收费获取直播课和回放视频链接,更有机会取得笼罩智慧城市、工业制作、金融、互联网等行业的飞桨产业实际范例手册! 也欢送感兴趣的企业和开发者与咱们分割,交换技术探讨单干。

扫码报名直播课,退出技术交换群

退出移动版