乐趣区

关于网络:小白学YOLOYOLOv3网络结构细致解析

摘要: 本文将具体介绍 Yolov3 的网络结构相干内容。

Yolov3 网络结构

在博客“Yolo 倒退历史及网络结构”中咱们曾经具体的解释了 Yolov1 的网络结构,并简要的提到了 Yolov2 与 Yolov3 对于网络结构的改良,本篇博客将具体介绍 Yolov3 的网络结构,内容比较简单。

Yolov3 网络结构图

从图中能够看出,Yolov3 次要有以下几局部组成:

  • 输出
  • 根底网络:根底网络是能够依据具体的需要抉择,作者原文用的是本人设计的:Darknet-53
  • YOLOv3 网络的三个分支:Y1,Y2,Y3

网络部件介绍

DBL: 如图 1 左下角所示,也就是代码中的 Darknetconv2d_BN_Leaky,是 yolo_v3 的根本组件。就是卷积 +BN+Leaky relu。对于 v3 来说,BN 和 leaky relu 曾经是和卷积层不可拆散的局部了 (最初一层卷积除外),独特形成了最小组件。

resn:n 代表数字,有 res1,res2, … ,res8 等等,示意这个 res_block 里含有多少个 res_unit。这是 yolo_v3 的大组件,yolo_v3 开始借鉴了 ResNet 的残差构造,应用这种构造能够让网络结构更深 (从 v2 的 darknet-19 回升到 v3 的 darknet-53,前者没有残差构造)。对于 res_block 的解释,能够在图 1 的右下角直观看到,其根本组件也是 DBL。

concat:张量拼接。将 darknet 中间层和前面的某一层的上采样进行拼接。拼接的操作和残差层 add 的操作是不一样的,拼接会裁减张量的维度,而 add 只是间接相加不会导致张量维度的扭转。

YOLOv3 网络的三个分支

多尺度检测 -Y1

实用指标:大指标

门路:绿色线标注

输入维度:13×13×255

输入维度具体解释:13×13:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h 和 c(置信度);3:每个点预测 3 个 bounding box。

多尺度检测 -Y2

实用指标:中指标

门路:黄色线标注

输入维度:26×26×255

输入维度具体解释:26×26:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h 和 c(置信度);3:每个点预测 3 个 bounding box。

多尺度检测 -Y3

实用指标:小指标

门路:紫色线标注

输入维度:52×52×255

输入维度具体解释:52×52:图片大小;255=(80+5)×3;80:辨认物体品种数;5=x,y,w,h 和 c(置信度);3:每个点预测 3 个 bounding box。

点击关注,第一工夫理解华为云陈腐技术~

退出移动版