共计 2142 个字符,预计需要花费 6 分钟才能阅读完成。
9 月 5 日,美团视觉智能部公布了 YOLOv6 2.0 版本,本次更新对轻量级网络进行了全面降级,量化版模型 YOLOv6-S 达到了 869 FPS,同时,还推出了综合性能优异的中大型网络(YOLOv6-M/L),丰盛了 YOLOv6 网络系列。其中,YOLOv6-M/L 在 COCO 上检测精度(AP)别离达到 49.5%/52.5%,在 T4 卡上推理速度别离可达 233/121 FPS(batch size =32)。
GitHub 下载地址:https://github.com/meituan/YOLOv6。欢送 Star 珍藏,随时取用。
官网出品具体的 Tech Report 带你解构 YOLOv6:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications。
注:YOLOv6 系列模型均在训练 300epoch 且不应用预训练模型或额定检测数据集下取得,”‡“示意采纳了自蒸馏算法,”∗“示意从官网代码库对公布模型进行从新测评的指标。以上速度指标均在 T4 TRT7.2 环境下测试。
注:YOLOv6 系列模型均在训练 300epoch 且不应用预训练模型或额定检测数据集下取得,”‡“示意采纳了自蒸馏算法,”∗“示意从官网代码库对公布模型进行从新测评的指标。以上速度指标均在 T4 TRT7.2 环境下测试。
本次版本升级,次要有以下更新:
性能更强的全系列模型
- 针对中大型模型(YOLOv6-M/L),设计了新骨干网络 CSPStackRep,它在综合性能上比上一版的 Single Path 构造更具劣势。
- 针对不同网络,系统性地验证了各种最新策略 / 算法的优劣,综合精度和速度,为每类网络抉择适合的计划。同时将模型整体训练工夫缩小了 50%,极大地晋升了模型的训练效率。
- 引入自蒸馏思维并设计了新的学习策略,大幅晋升了 YOLOv6-M/L 的模型精度。
- 通过训练时 Early Stop 强数据加强及推理时图像 Resize 优化策略,修复了后期版本中输出尺寸对齐到 640×640 后精度损失的问题,晋升了现有模型的理论部署精度。
表 1 展现了 YOLOv6 与以后支流的其余 YOLO 系列算法相比拟的试验后果,比照业界其余 YOLO 系列,YOLOv6 在所有系列均具备肯定的劣势:
- YOLOv6-M 在 COCO val 上 获得了 49.5% 的精度,在 T4 显卡上应用 TRT FP16 batchsize=32 进行推理,可达到 233 FPS 的性能。
- YOLOv6-L 在 COCO val 上 获得了 52.5% 的精度,在 T4 显卡上应用 TRT FP16 batchsize=32 进行推理,可达到 121 FPS 的性能。
- 同时,YOLOv6-N/ S 模型在放弃等同推理速度状况下,大幅晋升了精度指标,训练 400 epoch 的条件下,N 网络从 35.0% 晋升至 36.3%,S 网络从 43.1% 晋升至 43.8%。
量身定制的量化计划
本次公布还集成了专门针对 YOLOv6 的量化计划,对重参数化系列模型的量化也有参考意义。该计划借鉴 RepOptimizer [1] 在梯度更新时做重参数化,解决了多支路动静范畴过大导致难以量化的问题,用 RepOptimizer 训练的 YOLOv6 模型能够间接应用训练后量化(Post-training Quantization,PTQ),而不产生过大的精度损失。
在这一根底上,咱们剖析了各层的量化敏感性,将局部敏感层以更高精度运算,进一步晋升了模型的精度。另外,咱们同时公布了针对 2.0 版本的基于逐通道蒸馏的量化感知训练计划(Quantization-aware Training,QAT),并联合图优化,YOLOv6-S 2.0 版本的量化性能可达到 43.3 mAP 和 869 FPS(batch size=32)。
注:以上速度指标均在 T4 TRT8.4 环境下测试。比照办法为 PaddleSlim [30]。
不同之处是 PaddleSlim 应用 YOLOv6-S 1.0 版本,咱们的量化计划利用于 2.0 版本。更详尽的对于量化部署实际的相干内容,近期会在美团技术团队公众号上进行推送,敬请期待。
齐备的开发反对和多平台部署适配
YOLOv6 反对检测模型训练、评估、预测以及模型量化、蒸馏等全链路开发流程,同时反对 GPU(TensorRT)、CPU(OPENVINO)、ARM(MNN、TNN、NCNN)等不同平台的部署,极大简化工程部署时的适配工作。更具体的教程指引请移步 YOLOv6 Github 仓库 Deployment 的局部。
相干论文
[1] RepOptimizer:Re-parameterizing Your Optimizers rather than Architectures
浏览美团技术团队更多技术文章合集
前端 | 算法 | 后端 | 数据 | 平安 | 运维 | iOS | Android | 测试
| 在公众号菜单栏对话框回复【2021 年货】、【2020 年货】、【2019 年货】、【2018 年货】、【2017 年货】等关键词,可查看美团技术团队历年技术文章合集。
| 本文系美团技术团队出品,著作权归属美团。欢送出于分享和交换等非商业目标转载或应用本文内容,敬请注明“内容转载自美团技术团队”。本文未经许可,不得进行商业性转载或者应用。任何商用行为,请发送邮件至 tech@meituan.com 申请受权。