YOLOv3: An Incremental Improvement

1、YOLO V3 Structure

YOLO V3 网络结构借鉴类似 ResNet(残差网络结构)和 FPN(Feature Pyramid Networks)网络结构方式。

残差网络:残差网络通过在网络中引入跳跃连接(shortcut connections)来构建残差块(residual blocks)。这些跳跃连接使得输入可以直接与输出相加,形成残差块的输出。这种结构可以缓解梯度消失或爆炸的问题,并提高网络的表达能力和训练效率,促使可搭建更深的网络结构。

特征金字塔网络:FPN 能够输出多个尺度的特征图,通过将不同尺度的特征图融合,使融合后的特征图同时具有高层语义信息和低层结构信息,显著提升了目标检测性能。

在这里插入图片描述

YOLO V3 三个基本组件:

  • CBL:由 Conv + BN + Leaky_relu 激活函数三者组成。
  • Res unit:借鉴 Resnet 网络中的残差结构,让网络可以构建的更深。
  • ResX:由一个 CBL 和 X 个残差组件 Res unit 构成。

other:

  • Concat:张量拼接,会扩充两个张量的维度,例如 26 × 26 × 256 和 26 × 26 × 512 两个张量拼接,结果是 26 × 26 × 768。Concat和cfg文件中的route功能一样。
  • add:张量相加,张量直接相加,不会扩充维度,例如 104 × 104 × 128 和 104 × 104 × 128 相加,结果还是 104 × 104 × 128 。add和cfg文件中的shortcut功能一样。

2、Darknet-53

YOLO V3 主干网络采用 Darknet-53 网络,从网络结构中可以知道,YOLO V3 网络结构没有池化层和全连接层,前向传播过程中,张量的尺寸变换是通过改变卷积核的步长来实现的

在这里插入图片描述

[COPY]
深入浅出Yolo系列之Yolov3&Yolov4&Yolov5&Yolox核心基础知识完整讲解
近距离观察YOLOv3
Yolov3可视化网络结构图
yolo系列之yolo v3【深度解析】
YOLO v3网络结构分析
https://github.com/thisiszhou/SexyYolo
【论文解读】Yolo三部曲解读——Yolov3
YOLOV3损失函数

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐