摘要:
yolov3 与 yolov2 相比,次要改良三个方面,对应论文的 2.2-2.4 三个章节,其余思维根本连续 yolov2:
1. 预测形式
摒弃了 softmax 预测的方法(因为发现对晋升性能没有带来帮忙),而是采纳了多标签多分类的逻辑回归层,解释一下我的了解,yolov2 的时候预测是用 softmax 实现的,其预测后果蕴含每个 grid cell 负责预测对应对象的每个类别的概率(比方 coco 数据集是 80 类,即有这个物体可能是这 80 个类别对应的概率,总和为 1,必然有最大概率值的那个,通过非极大值克制最初选出一个概率最大的那个类别作为后果),能够看出 yolov2 其实还是一个 gird 只能预测一个对象是一种类别,显然不适宜多标签的预测状况(比方预测的对象即是猫类别,也是蓝猫类别,这样的多标签后果),而且作者也提及 softmax 并没有为性能晋升带来帮忙,用多个独立的 logistic 回归(转为二分类问题)也能实现成果,而且能够解决多标签预测问题。
2. 预测模型采纳多尺度预测
最初预测后果会生成三种尺寸的特色图,由三个 yolo 层解决得来,别离是 $13*13,26*26,52*52$, 每个尺寸对应三个先验框,即三个先验框解决得出一个预测框,这样的目标是为了实现对不同尺寸物体的检测,特色越大的适宜检测小物体。
3. 改良了网络结构,darknet-53
网络结构图出处起源