目录

  • 1. 细粒度图像任务是什么
  • 2. 数据集




1. 细粒度图像任务是什么

【参考链接】:细粒度图像分类算法全解,附数据集总结!

在传统图像分类中,无论重要判别区域占整个图像的比重有多大,都会对整张图片一视同仁的提取特征,但在一些判别区域占图像比重较小的图片中,进行同样的处理时,大量不重要的信息被提取,增加了图像分类的难度,降低分类的准确度。因此引入“细粒度图像分类”,关注图像中细小的差别,实现更精确的图像分类

细粒度图像分类是在区分出基本类别的基础上,进行更精细的子类划分,如区分鸟的种类、车的款式、狗的品种等,目前在工业界和实际生活中有着广泛的业务需求和应用场景。

细粒度图像相较于粗粒度图像具有更加相似的外观和特征,加之采集中存在姿态、视角、光照、遮挡、背景干扰等影响,导致数据呈现类间差异性大、类内差异性小的现象,从而使分类更加具有难度。



2. 数据集

(1) CUB-200

CUB-200是细粒度图像分类领域最经典,也是最常用的一个数据库,共包含200种不同类别、11788张鸟类图像数据。同时,该数据库提供了丰富的人工标注数据,每张图像包含15个局部区域位置、312个二值属性、1个标注框 以及语义分割图像。

(2) Stanford Dogs

作为Stanford数据库的系列之一,该数据库提供了120种不同种类的狗的图像数据,共有20580张图,只提供标注框

(3) Stanford Cars

在对狗的不同类别进行构建后,Stanford团队又对车辆进行了详细的汇总和收集,提供196类不同品牌不同年份不同车型的车辆图像数据,一共包含有16185张图像,只提供标注框信息

(4) Oxford Flowers

Oxford团队构建的花朵数据库共包含102种类别,每个类别包含了40到258张图像数据,共有8189张图像。该数据库只提供语义分割图像 , 不包含其他额外标注信息。


(这个表格来源于参考链接,它说的不可乱用,就先截个图摆在这里看一下)

细粒度图像分类和粗粒的区别 细粒度图像检索_细粒度图像分类和粗粒的区别


相关竞赛

  • FGVC Workshop
  • Kaggle