目标检测数据集coco 目标检测数据集有哪些

转载

mob6454cc6df18d 2024-08-18 22:36:34

文章标签 目标检测数据集coco 图像识别 python 计算机视觉机器学习 文章分类 计算机视觉人工智能

@Author：Runsen

计算机视觉中具有挑战性的主题之一，对象检测，可帮助组织借助数字图片作为输入来理解和识别实时对象。大量的论文基于常见的目标检测的开源数据集而来，因此需要了解常见的目标检测的开源数据集

https://public.roboflow.com/object-detection

CIFAR-10

CIFAR-10 是一个综合数据集，由 10 个不同类别的 60,000 张彩色图像组成。该数据集包含 10,000 张测试图像和 50,000 张训练图像，分为五个训练组。

点击下面链接了解有关数据集的更多信息和CIFAR-10/100和 ImageNet 与 PyTorch分类的链接。

http://www.cs.toronto.edu/~kriz/cifar.html
https://github.com/bearpaw/pytorch-classification

COCO

MS COCO 是一个大规模对象检测数据集，它解决了场景识别中的三个核心分析问题。检测对象的非标志性场景（或非规范视角）、对象内的上下文推理以及对象的准确 2D 定位。

该数据集具有特定特征，例如对象分割、情境识别、超像素素材分割、150 万个对象实例、80 个对象类等。

点击下面链接了解有关数据集的更多信息和教程的链接。

https://cocodataset.org/#home
https://cv.gluon.ai/contents.html

LISA 交通标志检测数据集：

LISA 或智能安全汽车交通标志数据集实验室是一组包含美国交通标志的带注释的帧和视频。该数据集包括从不同相机收集的图像、47 种美国标志类型以及 6610 个边界上的 7855 个注释。LISA 分两个阶段发布，即一个有照片，一个有视频和图片。

点击下面链接了解有关数据集的更多信息和Kaggle 上 LISA 交通标志检测代码讨论的链接。

http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset/code

Open Image

Open Image 是一个包含大约 900 万张图片的数据集，这些图片带有图像级标签、对象边界框、对象分割掩码、视觉关系和本地化叙述。

该数据集包括 1600 万个边界框，用于 190 万张图像上的 600 种对象类型，使其成为当前最重要的具有对象位置注释的数据集。这些框基本上是由专家注释者手动勾画的，以确保效率和一致性。

Open Images 还授予视觉关系注释，指示相关关系中的对象对、对象属性和人类活动。

点击下面链接了解有关数据集的更多信息和基于Google Open Images 数据集的自定义子集构建卷积神经网络机器学习分类器。

https://storage.googleapis.com/openimages/web/factsfigures.html
https://github.com/quiltdata/open-images

ExDark

Exclusively Dark (ExDARK) 是一个独特的低光图像数据集，它提供了一组主要的图像，用于对低光分析工作进行基准测试，并将相互不同的专业领域集中在低光条件下，例如，图像理解、图像增强，物体检测等。

该数据集是 7,363 张低光照片的组合，从极低光条件到黄昏（即十个不同状态），12 个对象类别（与 PASCAL VOC 相关）在图像分类级别和局部目标是边界框上进行注释。

点击下面链接了解有关数据集的更多信息和使用 TensorFlow 的对象检测 API 实现了 Faster R-CNN 模型，以识别从 ExDark 数据集获取的图像中的对象

https://github.com/cs-chan/Exclusively-Dark-Image-Dataset
https://github.com/hmshreyas7/low-light-detection

DOTA

DOTA 是用于航空视觉中物体检测的海量数据集。可以练习开发和估计航拍照片中的物体检测器。图片是从各种传感器和阶段收集的。每张印刷品的尺寸从 800 × 800 到 20,000 × 20,000 像素不等，包括呈现各种比例、方向和图案的对象。

点击下面链接了解有关数据集的更多信息和在 DOTA 上训练的模型代码库的链接。

https://hyper.ai/datasets/4920

BDD100K

BDD100K 是独立多任务学习的驱动数据集。该数据集包含 10 个任务和 10 万个视频，用于估计自动驾驶图像识别算法的进展。

该数据集上的功能包括多目标分割跟踪、图像标记、道路目标检测、语义分割、车道检测、可行驶区域分割、实例分割、多目标检测跟踪、域采用和模仿训练。

点击下面链接了解有关数据集的更多信息通过提出FCN+LSTM 模型

https://github.com/bdd100k/bdd100k
https://github.com/gy20073/BDD_Driving_Model

VOC

PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集，这是一个监督学习的问题，训练集以带标签的图片的形式给出。这些物体包括20类

Pascal VOC网址：

http://host.robots.ox.ac.uk/pascal/VOC/

查看各位大牛算法的排名的Leaderboards：http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php

训练/验证数据集下载（2G）：host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

ImageNet

ImageNet是一个计算机视觉系统识别项目，是目前世界上图像识别最大的数据库。大约1500万张图片，2.2万类，每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。

其中，包括边界框的目标检测数据集，训练数据集包括500,000张图片，属于200类物体。

ImageNet数据集介绍以及下载链接：

http://www.image-net.org/

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：mysql复合索引字段倒序 sqlserver复合索引

下一篇：python工程编译为二进制 python会被编译成二进制

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯