AI识虫较量

明确任务类型:指标检测

给出图像,确定图像中虫子的地位和类别、置信度得分

理解数据集:

数据量:2183张图片(训练集1693张、验证集245张、测试集245张)数据规模:中等(防止网络过拟合、数据加强)数据内容:![样本](/img/bVbL6CC)工作级别:背景繁多,简略

数据处理

图像增强

图像增强的益处:减少数据量,人为制作不同场景下的图像,让网络习得更多特色,进步模型的泛化能力。因为AI识虫的数据集不大,思考图像增强。图像增强的罕用办法:1. 翻转(程度+竖直)2. 减少噪声3. 旋转4. 裁剪5. 缩放/拉伸6. 含糊(均值含糊、中值含糊)7. 改亮度8. 对比度9. 饱和度10. 扭转色彩空间11. 像素值的随机抖动12. mixup(毁坏原始图像中的上下文关系,网络学习更鲁棒的特色)13. GAN生成图像罕用于数据加强的库:Augmentor、ImageEnhance等

归一化、标准化

模型设计

指标检测网络:

一阶段是指预测的同时做分类。如YOLO-V3。两阶段是指:先提取图像中可能存在指标的潜在区域,不关注存在什么样的指标,存在即可;再对指标进行分类,调整预测框地位。如Faster R-CNN。YOLO-V3的Backbone是DarkNet,Faster R-CNN的Backbone能够是VGG, ResNet等;Faster R-CNN的RPN网络工作原理,是在原始图像上密集滑动采样的形式确定anchor,也就是卷积核中心点对应的预设好长宽的区域是否存在指标。