【数据集】——NYU Depth Dataset V2简介_数据简介:
NYU-Depth V2数据集由微软Kinect的RGB和Depth摄像机记录的各种室内场景的视频序列组成。它的特点:

  • 1449张标注的RGB图片和深度图
  • 来自3个城市,464个场景
  • 407024张没有标注的图片
  • 每个对象都有一个类和一个实例号(cup1、cup2、cup3等),像实例分割

数据集有几个部分:

标签:视频数据的一个子集,带有密集的多类标签。这些数据也经过预处理,以填补缺失的深度标签。
Raw: Kinect提供的原始rgb、深度和加速度计数据。
工具箱:用于操作数据和标签的有用函数。

1. 标注的数据

【数据集】——NYU Depth Dataset V2简介_数据集_02RGB数据(左),深度图(中),分割图(右)

带标签的数据集是原始数据集的子集。它由成对的RGB和深度帧组成,这些帧被同步并为每幅图像标注了密集的标签。除了投影的深度图,我们还包括了一组预处理的深度图,其缺失的值已经用Levin等人的着色方案进行了填充。不像,原始数据集,标签数据集是提供一个Matlab .mat文件与以下变量:

  • names – Cx1 cell array of the english names of each class.
    C表示有多少个类别。
    打印出来<HDF5 dataset “names”: shape (1, 894), type “|O”>,类别标签:
  • instances : <HDF5 dataset “instances”: shape (1449, 640, 480), type “|u1”>
    用1449张图片
book
bottle
cabinet
ceiling
chair
cone
counter
dishwasher
faucet
fire extinguisher
floor
garbage bin
microwave
paper towel dispenser
paper
pot
refridgerator
stove burner
table
unknown
wall
bowl
magnet
sink
air vent
box
door knob
door
scissor
tape dispenser
telephone cord
telephone
track light
cork board
cup
desk
laptop
air duct
basket
camera
pipe
shelves
stacked chairs
styrofoam object
whiteboard
computer
keyboard
ladder
monitor
stand
bar
motion camera
。。。

总结

  • 有894个类别标签,用于语义分割还需要整理
  • 有1449张图片