图像识别作为深度学习算法的支流实际利用方向,早已在生存的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能批发柜中的商品辨认,这些工作背地的关键技术都在于此。
图 1 PP-ShiTu 利用于商品辨认成果示意(开发者利用展现)
然而实现理想的辨认成果并不是一件简略的事:
针对海量数据问题而言,如何实现一个通用的办法在不同的数据集中都有很好的表征能力?
不同物体间的差异可能极其渺小,即便是同种物体,也会受到外界烦扰出现不同状态,到底如何进行无效辨别?
辨认需要更新频繁,应用繁多的分类或者检测模型只能一直减少训练集重训模型,怎样才能升高开发成本,疾速跟上迭代步调?
PP-ShiTu 核心技术解读
针对以上技术难点,PaddleClas 推出的通用图像识别零碎 PP-ShiTu 均能够完满解决,它 不仅有高水平的特色学习能力 ,对新呈现的类别也能够在 不必从新训练算法的状况下,间接通过配置检索库的形式实现辨认。
⭐ 我的项目链接 ⭐
网页链接
PaddleClas 所有源码及教程均已开源,欢送大家应用,并 Star 激励~
这样的非凡能力,得益于 PP-ShiTu 引入 指标检测、度量学习、图像检索 等技术,并将 每个模块性能最大化,才构建成了对立、通用的图像识别零碎:
图 2 PP-ShiTu 架构示意图
主体检测: 不同于个别的指标检测,主体检测是将指标物体和背景辨别开来,可能无效缩小烦扰特色。PP-ShiTu 中所采纳的是指标检测模型 PP-PicoDet,不仅预测速度超快,精度上也达到了 SOTA,为后续的精确辨认打下坚实基础;
图 3 PP-PicoDet 在 COCO2017-val 上的 mAP 比照
特征提取: 作为图像识别零碎的重点工作,PP-ShiTu 是采纳 CPU 级轻量化骨干网络 PP-LCNet,并联合度量学习 arcmargin 算法,对高类似物体的辨别成果远超繁多模型,不仅准确率超过大模型 ResNet50,预测速度还能快 3 倍!再加上通过 18w 类数据集打磨的预训练权重,不必再费神抉择,一个模型就能够实现多场景笼罩。
图 4 训练数据及局部测试数据示例
向量检索: 不同于繁多模型间接输入类别信息,对于未知类别只有模型重训一个抉择,耗时又耗力。PP-ShiTu 引入向量检索,通过计算指标物体和检索库中图像的类似度来输入类别信息,一次训练长期应用,高效又便捷。
图 5 端侧新类别建设索引流程(开发者利用展现)
升级版 PP-ShiTu 欢送应用
时隔数月,PaddleClas 新版本 v2.3.1为大家带来了更加轻量化的 图像识别零碎 PP-ShiTu。外围性能点如下:
升级版 PP-ShiTu 大小仅 18M,完满反对挪动端需要
反对基于 C ++ 的服务化部署,部署效率大幅晋升
反对挪动端 Paddle Lite 部署教程,手机上也能轻松实现图像识别
图 6 手机辨认成果展现(开发者利用展现)
PP-ShiTu 的应用也是非常简略、不便,在实现环境配置后只需三步即可实现疾速体验:
第一步:下载 Inference 模型
第二步:构建索引
第三步:实现单张 / 批量图像识别
具体文档,请参考:
网页链接
更有残缺流程演示,可参考 AI Studio 我的项目:网页链接
共建开源生态
自 PP-ShiTu 公布以来,引起了泛滥开发者的宽泛关注。华东理工大学的高材生颜鑫,也是飞桨领航团的团长,率领团队基于 PP-ShiTu 开发了一套 智能购物平台零碎: 通过图像即可精准辨认顾客购买的商品,并返回残缺的购物清单及应酬价格,为智能货柜提供了十分好的视觉化解决方案。
链接指路:
网页链接
图 7 智能结算平台架构示意图
与此同时,咱们也力求为开源社区的凋敝作出贡献,心愿 PP-ShiTu 的算法自身以及优化思路,能够在给业界开发者带来更好网络的同时,也带来更多的算法优化启发,为中国的开源倒退奉献一份力量。
关上微信加好友,输出微信号【baidupaddle】增加经营小姐姐,增加胜利后,回复 暗号【c】,即可收到邀请官网交换群邀请,在这里您能够取得更高效的问题答疑,与各行各业开发者充沛交换,期待您的退出!
如果您想具体理解更多飞桨的相干内容,请参阅以下文档。
官网地址:
网页链接
PaddleClas 我的项目地址:
GitHub:
网页链接
Gitee:
网页链接
这么弱小、用心的我的项目,还不连忙给各位开发者一个 Star🌟的激励!