关于深度学习:PaddlePaddleAI识虫目标检测调优分享与解析心得

AI识虫较量

明确任务类型：指标检测

给出图像，确定图像中虫子的地位和类别、置信度得分

理解数据集：

数据量：2183张图片（训练集1693张、验证集245张、测试集245张）数据规模：中等（防止网络过拟合、数据加强）数据内容：![样本](/img/bVbL6CC)工作级别：背景繁多，简略

数据处理

图像增强

图像增强的益处：减少数据量，人为制作不同场景下的图像，让网络习得更多特色，进步模型的泛化能力。因为AI识虫的数据集不大，思考图像增强。图像增强的罕用办法：1. 翻转（程度+竖直）2. 减少噪声3. 旋转4. 裁剪5. 缩放/拉伸6. 含糊（均值含糊、中值含糊）7. 改亮度8. 对比度9. 饱和度10. 扭转色彩空间11. 像素值的随机抖动12. mixup（毁坏原始图像中的上下文关系，网络学习更鲁棒的特色）13. GAN生成图像罕用于数据加强的库：Augmentor、ImageEnhance等

归一化、标准化

模型设计

指标检测网络：

一阶段是指预测的同时做分类。如YOLO-V3。两阶段是指：先提取图像中可能存在指标的潜在区域，不关注存在什么样的指标，存在即可；再对指标进行分类，调整预测框地位。如Faster R-CNN。YOLO-V3的Backbone是DarkNet，Faster R-CNN的Backbone能够是VGG, ResNet等；Faster R-CNN的RPN网络工作原理，是在原始图像上密集滑动采样的形式确定anchor，也就是卷积核中心点对应的预设好长宽的区域是否存在指标。