一 计算机视觉问题

比如图像分类,目标检测,图像风格迁移。
在这里插入图片描述
面对巨大的数据特征,我们需要运用卷积运算,由此引出卷积神经网络。
在这里插入图片描述

二 边缘检测

在这里插入图片描述
在这里插入图片描述
如何实现垂直边缘检测,利用卷积运算,对于66的目标,找到33的过滤器(核),对应元素相乘求和。如上图所示
在这里插入图片描述在这里插入图片描述

三 padding

对于nn的图片,用ff的滤波器进行卷积运算得到(n-f+1)*(n-f+1)的矩阵
出现两个问题 一个是输出缩小 另一个是丢失图像边缘信息。可以通过像素点的填充进行解决。比如图像边缘填充p 变为·(n+2p-f+1)
在这里插入图片描述
valid表示不填充 same表示填充p=1/2(f-1) 因此过滤器一般为奇数。

四 卷积中的步幅

在这里插入图片描述
当步幅为·s时 所得到的矩阵为{ 1/s(n+2p-f)+1,1/s(n+2p-f)+1} ,当商不是整数时,向下取整。数学和信号相关的教材将卷积运算定义为先进行镜像翻转,然后再对应相乘求和,深度学习中的卷积是互相关卷积运算,不需要翻转,为了方便统称为卷积运算。

五 三维图像上的卷积

图像与过滤器在通道数目上必须匹配。取决于过滤器的个数。
在这里插入图片描述

六 单层卷积网络实现

卷积神经网络特征之一就是避免过度拟合,当过滤器确定后无论输入图像多大参数数目就确定了。
在这里插入图片描述
在这里插入图片描述

七 池化层

最大池化
在这里插入图片描述
平均池化 适用于深度很深的神经网络
全连接层 指的是经过卷积层和池化层的矩阵全部展开,变成一维矩阵,类似神经网络全部与之相连接。
在这里插入图片描述
观察上表可以发现 输入层与最大池化层没有参数,卷积层参数不多,大部分参数都在全连接层,随着层数的增加,激活单元的数量逐渐减小。而激活形状则根据公式判断。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐