深度学习必读经典论文|ImageNet Classification with Deep Convolutional Neural Networks

这篇论文介绍了一种大型深度卷积神经网络（CNN），用于在ImageNet LSVRC-2010比赛中对1.2百万高分辨率图像进行分类，这些图像涵盖了1000个不同的类别。该网络在测试数据上实现了37.5%的top-1错误率和17.0%的top-5错误率，显著优于之前的最佳水平。网络包含6000万参数和650,000个神经元，由五个卷积层组成，其中一些后接最大池化层，以及三个全连接层，最后是一个10

paixiaoxin

1148人浏览 · 2024-12-16 16:32:45

paixiaoxin · 2024-12-16 16:32:45 发布

论文标题

ImageNet Classification with Deep Convolutional Neural Networks

论文下载

ImageNet Classification with Deep Convolutional Neural Networks下载

论文作者

Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton

内容简介

这篇论文介绍了一种大型深度卷积神经网络（CNN），用于在ImageNet LSVRC-2010比赛中对1.2百万高分辨率图像进行分类，这些图像涵盖了1000个不同的类别。

该网络在测试数据上实现了37.5%的top-1错误率和17.0%的top-5错误率，显著优于之前的最佳水平。网络包含6000万参数和650,000个神经元，由五个卷积层组成，其中一些后接最大池化层，以及三个全连接层，最后是一个1000路softmax输出。

为了加快训练速度，作者使用了非饱和神经元和高效的GPU实现的卷积操作。为了减少全连接层的过拟合，他们采用了一种称为“dropout”的正则化方法。此外，他们还在ILSVRC-2012比赛中提交了这个模型的变体，并取得了15.3%的获胜top-5测试错误率。

方法分点说明

1.数据集和问题规模：

使用了ImageNet数据集，包含超过1500万个标记的高分辨率图像，分为约22,000个类别。
特别关注ILSVRC-2010和ILSVRC-2012子集，每个类别大约有1000张图像。

2.网络架构：

网络包含五个卷积层和三个全连接层，最终输出通过1000路softmax进行分类。
卷积层使用了非饱和的ReLU激活函数，以加快训练速度。
网络设计中包含了多个新颖或不寻常的特性，如局部响应归一化（Local Response Normalization）和重叠池化（Overlapping Pooling）。