年代 | 数据集名称 | 内容特点 | 应用场景 |
2009 | CamVid | 包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框,数据集中包含了NYU Depth V2、Berkeley B3DO,适合于场景理解任务 | 道路场景 |
2009 | SBD | 包含725张图片,分别从LabelMe、PASCAL VOC等数据集中抽取而来。图片大多为户外场景类型,大小较为规整,每张图片至少包含1个前景对象 | 室外场景 |
2011 | SiftFlow | 收集了731个包含着102,206帧的视频作为实验数据库是LabelMe的数据集子集,图像主要包含着8种不同的户外场景 | 自然景观 |
2012 | PASCAL VOC | 含有20种类别,道路场景数据有着11,520张图片,包含着27,450个注释对象 | 道路行人车辆 |
2012 | NYU Depth V2 | 主要提供了1449个RGBD图像的新数据集,其中捕获了464个不同的室内场景,并附有详细的标注,能够验证3D场景的提示和推断,实现更好的对象分割 | 室内物体 |
2013 | KITTI | 有389对立体图像和光流图、39.2 km视觉测距序列和超过200,000幅带有3D标注目标的图像组成,11个类别,包含了市区、乡村和高速公路等场景的真实图像数据,每幅图像中最多有15辆车和30个行人以及各种程度的遮挡 | 道路行人车辆3D模型 |
2014 | PASCAL-CONTEXT | 包含了10,103张训练图像的像素级别的标注,共540类 | 道路行人车辆 |
2014 | PASCAL-Part | 数据集中训练集和验证集共10,103幅,测试集9637幅。该数据集还为目标提供轮廓标注 | 道路行人车辆场景 |
2014 | MS COCO | 包括200 000个图像和8个图像实例,已经公开了5,000,000个对象实例,数据集中主要包括了室内场景和室外场景 | 室内室外的常用场景 |
2015 | Cityscape | 城市道路场景数据集,来自50个不同的城市街景记录的立体视频序列,包括20,000张弱注释图片和5000张的高质量的强注释的图片,涵盖了各种时间及天气变化下的街道动态物体 | 道路车辆、行人、街景 |
2015 | SUN-RGBD | 由4个RGB-D传感器获取而得,其中包含了10,000个RGB-D图像,比例类似于PASCAL VOC,整个数据集包括了146,617个二维多边形和58,657个具有精确对象方向的3D边界框,数据集中包含了NYU Depth V2、Berkeley B3DO,适合于场景理解任务 | 室内物体 3D模型 |
2015 | ILSVRC | 1400多万幅图片,涵盖2万多个类别,其中,超过百万的图片有明确的类别标注和物体位置标注 | 室内室外景观 |
2018 | ADE20K | 包含SUN和Places数据集的场景范畴,可视化目标,目前已有超过250个带有注解示例的目标,以及带有超过10个注解示例的部件 | 室内室外景观 |
2019 | CityFlow | 从10个路口提取的40个摄像头收集到的视频,是目前都市环境中最大规模的数据集,包含超过20万个目标框 | 道路场景 |