乐趣区

关于深度学习:PaddlePaddleAI识虫目标检测调优分享与解析心得

AI 识虫较量

明确任务类型:指标检测

 给出图像,确定图像中虫子的地位和类别、置信度得分 

理解数据集:

 数据量:2183 张图片(训练集 1693 张、验证集 245 张、测试集 245 张)数据规模:中等(防止网络过拟合、数据加强)数据内容:![样本](/img/bVbL6CC)
工作级别:背景繁多,简略 

数据处理

图像增强

 图像增强的益处:减少数据量,人为制作不同场景下的图像,让网络习得更多特色,进步模型的泛化能力。因为 AI 识虫的数据集不大,思考图像增强。图像增强的罕用办法:1. 翻转(程度 + 竖直)2. 减少噪声
3. 旋转
4. 裁剪
5. 缩放 / 拉伸
6. 含糊(均值含糊、中值含糊)7. 改亮度
8. 对比度
9. 饱和度
10. 扭转色彩空间
11. 像素值的随机抖动
12. mixup(毁坏原始图像中的上下文关系,网络学习更鲁棒的特色)13. GAN 生成图像

罕用于数据加强的库:Augmentor、ImageEnhance 等

归一化、标准化

模型设计

指标检测网络:

 一阶段是指预测的同时做分类。如 YOLO-V3。两阶段是指:先提取图像中可能存在指标的潜在区域,不关注存在什么样的指标,存在即可;再对指标进行分类,调整预测框地位。如 Faster R-CNN。YOLO-V3 的 Backbone 是 DarkNet,Faster R-CNN 的 Backbone 能够是 VGG, ResNet 等;Faster R-CNN 的 RPN 网络工作原理,是在原始图像上密集滑动采样的形式确定 anchor,也就是卷积核中心点对应的预设好长宽的区域是否存在指标。
退出移动版