关于深度学习:PaddlePaddleAI识虫目标检测调优分享与解析心得

AI识虫较量

明确任务类型:指标检测

给出图像,确定图像中虫子的地位和类别、置信度得分

理解数据集:

数据量:2183张图片(训练集1693张、验证集245张、测试集245张)
数据规模:中等(防止网络过拟合、数据加强)
数据内容:
![样本](/img/bVbL6CC)
工作级别:背景繁多,简略

数据处理

图像增强

图像增强的益处:减少数据量,人为制作不同场景下的图像,让网络习得更多特色,进步模型的泛化能力。

因为AI识虫的数据集不大,思考图像增强。

图像增强的罕用办法:
1. 翻转(程度+竖直)
2. 减少噪声
3. 旋转
4. 裁剪
5. 缩放/拉伸
6. 含糊(均值含糊、中值含糊)
7. 改亮度
8. 对比度
9. 饱和度
10. 扭转色彩空间
11. 像素值的随机抖动
12. mixup(毁坏原始图像中的上下文关系,网络学习更鲁棒的特色)
13. GAN生成图像

罕用于数据加强的库:Augmentor、ImageEnhance等

归一化、标准化

模型设计

指标检测网络:

一阶段是指预测的同时做分类。如YOLO-V3。
两阶段是指:先提取图像中可能存在指标的潜在区域,不关注存在什么样的指标,存在即可;再对指标进行分类,调整预测框地位。如Faster R-CNN。
YOLO-V3的Backbone是DarkNet,Faster R-CNN的Backbone能够是VGG, ResNet等;Faster R-CNN的RPN网络工作原理,是在原始图像上密集滑动采样的形式确定anchor,也就是卷积核中心点对应的预设好长宽的区域是否存在指标。



评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理