关于图像识别:YOLOv1学习笔记

44次阅读

共计 766 个字符，预计需要花费 2 分钟才能阅读完成。

间接对 bounding box 的地位和置信度进行回归。

图片通过网络前向计算失去 S*S*(5*b+num_classes) 个输入，在 pascal VOC 数据集中，YOLOv1 采纳 S =7, b=2, 一共 20 类，所以 num_classes=20, 最初的输入为7*7*30，即每个格子预测两个 bounding box；
筛选出 bounding box 置信度 (confidence) 大于阈值的框（此时在 YOLOv1 中曾经过滤掉大部分）；
对筛选出的 bounding box 进行 nms（非极大克制）。依据业务不同要求，nms 的模式也可能不同，YOLOv1 中间接对所有 bbox 的 score 进行排序，在所有 bbox 中做 nms；而在要求召回较高的场景须要对每一类别离做 nms。

因为输入层为全连贯层，因而在检测时，YOLO 训练模型只反对与训练图像雷同的输出分辨率；
每个格子只能预测一个 bbox。当一个格子蕴含多个物体时，只能检出一个；
地位检测不精确。YOLO loss 函数中，大物体 IOU 误差和小物体 IOU 误差对网络训练中 loss 奉献值靠近（尽管采纳求平方根形式，但没有基本解决问题）。因而，对于小物体，小的 IOU 误差也会对网络优化过程造成很大的影响，从而升高了物体检测的定位准确性。

https://github.com/Howe-Young…

正文完

发表至：图像识别

2021-04-28

0

关于性能优化:性能优化不止是做技术