感受野基本概念

在卷积神经网路中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小。再通俗点的解释是,特征图上的一个点对应输入图上的区域

 

一个例子:

(1)两层3*3的卷积核卷积操作之后的感受野是5*5,其中卷积核(filter)的步长(stride)为1、padding为0。如图1。

ce65df52052e4844bfcb24d32017f245.jpeg

图1

(2)三层3*3卷积核操作之后的感受野是7*7,其中卷积核的步长为1,padding为0。如图2。

 

f5068514be9a446cb61c13916a27239c.jpeg

图2

计算公式:

感受野计算时有下面几个知识点需要知道:

1. 最后一层(卷积层或池化层)输出特征图感受野的大小等于卷积核的大小。

2.第i层卷积层的感受野大小和第i层的卷积核大小和步长有关系,同时也与第(i+1)层感受野大小有关。

3.计算感受野的大小时忽略了图像边缘的影响,即不考虑padding的大小。

关于感受野大小的计算方式是采用从最后一层往下计算的方法,即先计算最深层在前一层上的感受野,然后逐层传递到第一层,使用的公式可以表示如下:

gif.latex?%5Cfn_phv%20RF_%7Bi%7D%3D%28RF_%7Bi+1%7D-1%29xstride%20+Ksize_%7Bi%7D

其中,gif.latex?%5Cfn_phv%20RF_%7Bi%7D是第i层卷积层的感受野,gif.latex?%5Cfn_phv%20RF_%7Bi+1%7D是(i+1)层上的感受野,stride是卷积的步长,Ksize是本层卷积核的大小。 

感受野的几点总结

1.输出feature map上的一个单元对应输入层 上的区域大小

2.感受野的增速是直接和卷积步长累乘相关,想要网络更快速的达到某个感受野尺度,可以让步长大于1的卷积核更靠前,这样可以增加网络推理速度,特增图的分辨率会迅速变小

3.当有效感受野的区域能够覆盖全图时,这时的特征表达能力是最好的(有效感受野跟关注中间的内容)

 

 

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐