AI识虫较量
明确任务类型:指标检测
给出图像,确定图像中虫子的地位和类别、置信度得分
理解数据集:
数据量:2183张图片(训练集1693张、验证集245张、测试集245张)
数据规模:中等(防止网络过拟合、数据加强)
数据内容:

工作级别:背景繁多,简略
数据处理
图像增强
图像增强的益处:减少数据量,人为制作不同场景下的图像,让网络习得更多特色,进步模型的泛化能力。
因为AI识虫的数据集不大,思考图像增强。
图像增强的罕用办法:
1. 翻转(程度+竖直)
2. 减少噪声
3. 旋转
4. 裁剪
5. 缩放/拉伸
6. 含糊(均值含糊、中值含糊)
7. 改亮度
8. 对比度
9. 饱和度
10. 扭转色彩空间
11. 像素值的随机抖动
12. mixup(毁坏原始图像中的上下文关系,网络学习更鲁棒的特色)
13. GAN生成图像
罕用于数据加强的库:Augmentor、ImageEnhance等
归一化、标准化
模型设计
指标检测网络:
一阶段是指预测的同时做分类。如YOLO-V3。
两阶段是指:先提取图像中可能存在指标的潜在区域,不关注存在什么样的指标,存在即可;再对指标进行分类,调整预测框地位。如Faster R-CNN。
YOLO-V3的Backbone是DarkNet,Faster R-CNN的Backbone能够是VGG, ResNet等;Faster R-CNN的RPN网络工作原理,是在原始图像上密集滑动采样的形式确定anchor,也就是卷积核中心点对应的预设好长宽的区域是否存在指标。
发表回复