摘要:本文将具体介绍Yolov3的网络结构相干内容。

Yolov3 网络结构

在博客“Yolo倒退历史及网络结构”中咱们曾经具体的解释了Yolov1的网络结构,并简要的提到了Yolov2与Yolov3对于网络结构的改良,本篇博客将具体介绍Yolov3的网络结构,内容比较简单。

Yolov3网络结构图

从图中能够看出,Yolov3次要有以下几局部组成:

  • 输出
  • 根底网络:根底网络是能够依据具体的需要抉择,作者原文用的是本人设计的:Darknet-53
  • YOLOv3网络的三个分支:Y1,Y2,Y3

网络部件介绍

DBL: 如图1左下角所示,也就是代码中的Darknetconv2d_BN_Leaky,是yolo_v3的根本组件。就是卷积+BN+Leaky relu。对于v3来说,BN和leaky relu曾经是和卷积层不可拆散的局部了(最初一层卷积除外),独特形成了最小组件。

resn:n代表数字,有res1,res2, … ,res8等等,示意这个res_block里含有多少个res_unit。这是yolo_v3的大组件,yolo_v3开始借鉴了ResNet的残差构造,应用这种构造能够让网络结构更深(从v2的darknet-19回升到v3的darknet-53,前者没有残差构造)。对于res_block的解释,能够在图1的右下角直观看到,其根本组件也是DBL。

concat:张量拼接。将darknet中间层和前面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会裁减张量的维度,而add只是间接相加不会导致张量维度的扭转。

YOLOv3网络的三个分支

多尺度检测-Y1

实用指标:大指标

门路:绿色线标注

输入维度:13×13×255

输入维度具体解释:13×13:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h和c(置信度);3:每个点预测3个bounding box。

多尺度检测-Y2

实用指标:中指标

门路:黄色线标注

输入维度:26×26×255

输入维度具体解释:26×26:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h和c(置信度);3:每个点预测3个bounding box。

多尺度检测-Y3

实用指标:小指标

门路:紫色线标注

输入维度:52×52×255

输入维度具体解释:52×52:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h和c(置信度);3:每个点预测3个bounding box。

点击关注,第一工夫理解华为云陈腐技术~