年代	数据集名称	内容特点	应用场景
2009	CamVid	包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框，数据集中包含了NYU Depth V2、Berkeley B3DO，适合于场景理解任务	道路场景
2009	SBD	包含725张图片，分别从LabelMe、PASCAL VOC等数据集中抽取而来。图片大多为户外场景类型，大小较为规整，每张图片至少包含1个前景对象	室外场景
2011	SiftFlow	收集了731个包含着102,206帧的视频作为实验数据库是LabelMe的数据集子集，图像主要包含着8种不同的户外场景	自然景观
2012	PASCAL VOC	含有20种类别，道路场景数据有着11,520张图片，包含着27,450个注释对象	道路行人车辆
2012	NYU Depth V2	主要提供了1449个RGBD图像的新数据集，其中捕获了464个不同的室内场景，并附有详细的标注，能够验证3D场景的提示和推断，实现更好的对象分割	室内物体
2013	KITTI	有389对立体图像和光流图、39.2 km视觉测距序列和超过200,000幅带有3D标注目标的图像组成，11个类别，包含了市区、乡村和高速公路等场景的真实图像数据，每幅图像中最多有15辆车和30个行人以及各种程度的遮挡	道路行人车辆3D模型
2014	PASCAL-CONTEXT	包含了10,103张训练图像的像素级别的标注，共540类	道路行人车辆
2014	PASCAL-Part	数据集中训练集和验证集共10,103幅，测试集9637幅。该数据集还为目标提供轮廓标注	道路行人车辆场景
2014	MS COCO	包括200 000个图像和8个图像实例，已经公开了5,000,000个对象实例，数据集中主要包括了室内场景和室外场景	室内室外的常用场景
2015	Cityscape	城市道路场景数据集，来自50个不同的城市街景记录的立体视频序列，包括20,000张弱注释图片和5000张的高质量的强注释的图片，涵盖了各种时间及天气变化下的街道动态物体	道路车辆、行人、街景
2015	SUN-RGBD	由4个RGB-D传感器获取而得，其中包含了10,000个RGB-D图像，比例类似于PASCAL VOC，整个数据集包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框，数据集中包含了NYU Depth V2、Berkeley B3DO，适合于场景理解任务	室内物体 3D模型
2015	ILSVRC	1400多万幅图片，涵盖2万多个类别，其中，超过百万的图片有明确的类别标注和物体位置标注	室内室外景观
2018	ADE20K	包含SUN和Places数据集的场景范畴，可视化目标，目前已有超过250个带有注解示例的目标，以及带有超过10个注解示例的部件	室内室外景观
2019	CityFlow	从10个路口提取的40个摄像头收集到的视频，是目前都市环境中最大规模的数据集，包含超过20万个目标框	道路场景