图像数据标注概述
在深度学习领域,训练数据对训练结果有种至关重要的影响,在计算机视觉领域,除了公开的数据集之外,对很多应用场景都需要专门的数据集做迁移学习或者端到端的训练,这种情况需要大量的训练数据,取得这些数据方法有如下几种
- 人工数据标注
- 自动数据标注
- 外包数据标注
人工数据标注的好处是标注结果比较可靠,自动数据标注一般都需要二次复核,避免程序错误,外包数据标注很多时候会面临数据泄密与流失风险。人工数据标注特别是图像数据标注常用的标注工具从标注工具的软件属性上分类可以分为客户端与WEB端标注工具,推荐大家使用客户端标注工具或者离线的WEB端标注工具,在线的WEB端标注工具面临数据流失风险!请慎用!
十大常用工具
01
LabelImg
主页地址
https://github.com/tzutalin/labelImg
下载以后根据作者提供的安装指南即可安装,如果安装不上怎么办,不用这么麻烦,下面这个地址提供了直接下载的地址,下载预编译exe即可:
https://github.com/zhaobai62/labelImg
支持VOC2012格式与tfrecord自动生成!
强烈推荐,简单好用。
02
Labelme
主页地址
https://github.com/wkentaro/labelme
支持对象检测、图像语义分割数据标注,实现语言为Python与QT。
支持矩形、圆形、线段、点标注
支持视频标注
支持导出VOC与COCO格式数据实例分割
强烈推荐,实例分割都可以用它标注!
03
RectLabel
支持对象检测,图像实例分割数据标注
支持导出YOLO、KITTI、COCOJSON与CSV格式
读写Pascal VOC格式的XML文件
04
OpenCV/CVAT
官方主页
https://github.com/opencv/cvat
高效的计算机视觉标注工具,支持图像分类、对象检测框、图像语义分割、实例分割数据标注在线标注工具。支持图像与视频数据标注,最重要的是支持本地部署,无需担心数据外泄!
05
VOTT
官方主页
https://github.com/microsoft/VoTT
微软发布的基于WEB方式本地部署的视觉数据标注工具。
支持图像与视频数据标注
支持导出CNTK/Pascal VOC格式
支持导出TFRecord、CSV、VoTT格式
当前主要分支版本有V1与V2版本。
06
LableBox
官方主页
https://github.com/Labelbox/Labelbox
支持对象检测框、实例分割数据标注
WEB方式的标注工具
提供自定义标注API支持
纯JS+HTML操作支持
07
VIA-VGG Image Annotator
http://www.robots.ox.ac.uk/~vgg/software/via/
VGG发布的图像标准工具
支持对象检测、图像语义分割与实例分割数据标注
基于WEB方式的标注工具
可以下载运行部署在本地
特别之处,对人脸数据标注提供了各种方便的操作,人脸数据标注首选工具。
08
PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
图像语义分割与实例分割标注神器,交互式标注算法思想是基于OpenCV中分水岭算法实现。支持,可以直接下载编译好的二进制文件使用,下载地址如下:
https://github.com/abreheret/PixelAnnotationTool/releases
09
point-cloud-annotation-tool
https://github.com/springzfx/point-cloud-annotation-tool
3D点云数据标注神器
支持点云数据加载、保存与可视化
支持点云数据选择
支持3D BOX框生成
支持KITTI-bin格式数据
10
Boobs
https://github.com/drainingsun/boobs
专属的YOLO BBox标注工具,支持图像数据标准为YOLO格式
现在也支持VOC/COCO格式数据导出
基于WEB方式的标注工具
支持下载zip包本地部署
无需服务器端支持,直接浏览器支持打开boobs.html即可开始数据标注