年代

数据集名称

内容特点

应用场景

2009

CamVid

包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框,数据集中包含了NYU Depth V2、Berkeley B3DO,适合于场景理解任务

道路场景

2009

SBD

包含725张图片,分别从LabelMe、PASCAL VOC等数据集中抽取而来。图片大多为户外场景类型,大小较为规整,每张图片至少包含1个前景对象

室外场景

2011

SiftFlow

收集了731个包含着102,206帧的视频作为实验数据库是LabelMe的数据集子集,图像主要包含着8种不同的户外场景

自然景观

2012

PASCAL VOC

含有20种类别,道路场景数据有着11,520张图片,包含着27,450个注释对象

道路行人车辆

2012

NYU Depth V2

主要提供了1449个RGBD图像的新数据集,其中捕获了464个不同的室内场景,并附有详细的标注,能够验证3D场景的提示和推断,实现更好的对象分割

室内物体

2013

KITTI

有389对立体图像和光流图、39.2 km视觉测距序列和超过200,000幅带有3D标注目标的图像组成,11个类别,包含了市区、乡村和高速公路等场景的真实图像数据,每幅图像中最多有15辆车和30个行人以及各种程度的遮挡

道路行人车辆3D模型

2014

PASCAL-CONTEXT

包含了10,103张训练图像的像素级别的标注,共540类

道路行人车辆

2014

PASCAL-Part

数据集中训练集和验证集共10,103幅,测试集9637幅。该数据集还为目标提供轮廓标注

道路行人车辆场景

2014

MS COCO

包括200 000个图像和8个图像实例,已经公开了5,000,000个对象实例,数据集中主要包括了室内场景和室外场景

室内室外的常用场景

2015

Cityscape

城市道路场景数据集,来自50个不同的城市街景记录的立体视频序列,包括20,000张弱注释图片和5000张的高质量的强注释的图片,涵盖了各种时间及天气变化下的街道动态物体

道路车辆、行人、街景

2015

SUN-RGBD

由4个RGB-D传感器获取而得,其中包含了10,000个RGB-D图像,比例类似于PASCAL VOC,整个数据集包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框,数据集中包含了NYU Depth V2、Berkeley B3DO,适合于场景理解任务

室内物体

3D模型

2015

ILSVRC

1400多万幅图片,涵盖2万多个类别,其中,超过百万的图片有明确的类别标注和物体位置标注

室内室外景观

2018

ADE20K

包含SUN和Places数据集的场景范畴,可视化目标,目前已有超过250个带有注解示例的目标,以及带有超过10个注解示例的部件

室内室外景观

2019

CityFlow

从10个路口提取的40个摄像头收集到的视频,是目前都市环境中最大规模的数据集,包含超过20万个目标框

道路场景