如何制作一份高质量带标签口罩数据集，口罩数据集简单总结

原创

墨理学AI 2022-09-02 21:15:11 ©著作权

©著作权归作者所有：来自51CTO博客作者墨理学AI的原创作品，请联系作者获取转载授权，否则将追究法律责任

如何制作一份高质量带标签口罩数据集

口罩数据集样本--带标签（口罩数据 100 + 人脸数据 100）

带标签口罩数据集–maskSet4k Sample
口罩数据集：
因为国内口罩类型种类繁多，因此这里把凡是类似口罩形状能够完全掩面的图片均标注为带了口罩（mask）。
原始数据主要来源：
SCUT-FBP5500_v2.1--亚洲人脸；
明星工作照片（机场、发布会、运动场地）多为爬虫所得；
整合其他一些没有labels 的口罩数据集；
重新制作一份高质量带标签口罩数据集
我所做的主要工作（数据打标+精选）如下

 一：使用pytorch 版本 yolov5 进行二分类 mask 检测，首次模型训练15天，对数据打标；

 二：数据+标签，人工筛选

 三：打标数据更新数据集再次训练，提升模型精度

 四：二三步骤反复迭代 三次，最终得到 准确率（accuracy）高达 0.995 ，召回率 0.99 的检测模型；

 五：对数据标签的再次人工筛选，整理得到 maskSet4k 数据集；