ILSVRC2015_VID数据集说明
occuluded></occuluded>表示物体是否被遮挡,如果为 0 表示图像中物体未被遮挡,为 1 表示当前物体被某些物体遮挡住。Data文件夹中存放的是对应视频和每帧图片:视频存放于snippets文件夹,snippets文件夹也分为test,train,val三个文件夹,存放对应视频格式(.mp4)。每帧图片分为test,train,val三个文件夹存放。每个snippet包括56~4
参考Bolg:ILSVRC2015_VID数据集详解_lighten-1996的博客-CSDN博客_ilsvrc2015
数据主页:ImageNet Large Scale Visual Recognition Competition 2015 (ILSVRC2015)
数据下载:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz
目录
3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets
一、基本信息
数据集包括3862 snippets用于训练,555 snippets用于验证,937 snippets用于测试。每个snippet包括56~458帧图像不等。
该数据集有30个基本类别:
n02691156 1 airplane 飞机
n02419796 2 antelope 羚羊
n02131653 3 bear 熊
n02834778 4 bicycle 自行车
n01503061 5 bird 鸟
n02924116 6 bus 公交
n02958343 7 car 小汽车
n02402425 8 cattle 牛
n02084071 9 dog 狗
n02121808 10 domestic_cat 猫
n02503517 11 elephant 大象
n02118333 12 fox 狐狸
n02510455 13 giant_panda 熊猫
n02342885 14 hamster 仓鼠
n02374451 15 horse 马
n02129165 16 lion 狮子
n01674464 17 lizard 蜥蜴
n02484322 18 monkey 猴子
n03790512 19 motorcycle 摩托车
n02324045 20 rabbit 兔子
n02509815 21 red_panda 红熊猫
n02411705 22 sheep 羊
n01726692 23 snake 蛇
n02355227 24 squirrel 松鼠
n02129604 25 tiger 老虎
n04468005 26 train 火车
n01662784 27 turtle 海龟
n04530566 28 watercraft 船只
n02062744 29 whale 鲸鱼
n02391049 30 zebra 斑马
二、压缩包详细结构
1.压缩包
![]()
2.压缩包解压后
![]()
3.ILSVRC2015包含3个文件夹Annotations、Data、ImageSets
Annotations、Data、ImageSets内首先都是一个VID文件夹:



以下全是VID文件夹内的结构
3.1 Annotations
Annotations为注解,主要是每帧图bbox的标注,有train和val两个文件夹:

所有的train类文件夹都被分为了0000,0001,0002,0003四个类别。
ILSVRC2015\Annotations\VID\train包含以下文件(全部文件):

每个类别中会以每单个视频为细分依据,命名前五位代表同一细分类别,后三位为具体个例。
ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000文件夹内包含以下文件(部分文件):

每个文件夹中存放的是一个视频序列中每一帧的对应信息,以xml文件格式存储。
ILSVRC2015\Annotations\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000内包含以下文件(部分文件):

000000.xml文件内容:每张图长宽像素值固定(1280 x 720),bndbox为对应目标的标注(xmin, ymin)(xmax, ymax)分别为左上角与右下角坐标。object表示一个跟踪对象,trackid表示当前跟踪对象的id,一帧可有多个object。<occuluded></occuluded>表示物体是否被遮挡,如果为 0 表示图像中物体未被遮挡,为 1 表示当前物体被某些物体遮挡住。
<?xml version="1.0"?>
<annotation>
<folder>ILSVRC2015_VID_train_0000/ILSVRC2015_train_00000000</folder>
<filename>000000</filename>
<source>
<database>ILSVRC_2015</database>
</source>
<size>
<width>1280</width>
<height>720</height>
</size>
<object>
<trackid>0</trackid>
<name>n01674464</name>
<bndbox>
<xmax>1050</xmax>
<xmin>323</xmin>
<ymax>428</ymax>
<ymin>216</ymin>
</bndbox>
<occluded>1</occluded>
<generated>0</generated>
</object>
</annotation>
ILSVRC2015\Annotations\VID\val包含以下文件(部分文件):

ILSVRC2015\Annotations\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

3.2 Data
Data文件夹中存放的是对应视频和每帧图片:视频存放于snippets文件夹,snippets文件夹也分为test,train,val三个文件夹,存放对应视频格式(.mp4)。每帧图片分为test,train,val三个文件夹存放。

3.2.1 snippets

ILSVRC2015\Data\VID\snippets\test包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\train包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015\Data\VID\snippets\val包含以下文件(部分文件):

3.2.2 test

ILSVRC2015\Data\VID\test\ILSVRC2015_test_00000000包含以下文件(部分文件):

3.2.3 train

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000包含以下文件(部分文件):

ILSVRC2015\Data\VID\train\ILSVRC2015_VID_train_0000\ILSVRC2015_train_00000000包含以下文件(部分文件):

3.2.4 val(部分文件)

ILSVRC2015\Data\VID\val\ILSVRC2015_val_00000000包含以下文件(部分文件):

3.3 ImageSets
ImageSets文件夹存放帧数文件的记录。
ILSVRC2015\ImageSets\VID\包含以下文件(全部文件):

三、如何下载数据集?
直接把地址粘贴到迅雷,就可以下载。
亲测可用,就是速度有点慢。
如果有其它更好的方法,欢迎在评论区留言。

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)