1.摘要
该方法从人脸识别的效果影响因素出发,从理论上推导出人脸样本类间相似度分布与人脸图像质量高度相关,利用类内相似度分布和类间相似度分布之间的Wasserstein距离生成人脸图像质量伪标签。然后,利用这些质量伪标签进行无监督训练人脸质量回归网络,从而获得一个质量评估模型。大量实验表明,在各大人脸识别的基准数据集上,提出的SDD-FIQA方法在不同的人脸识别系统下,精度和泛化能力都达到目前最优水平。
2.背景介绍
目前人脸质量评估方法可分为两类,一类是通过人类视觉系统(HSV)定义质量指标(如KS-FQA),另一类是人脸识别效果直接决定质量分数(如FaceQnet)。为了保证非限制场景下人脸识别系统的稳定性和识别可靠性,大多数已有方法将样本embedding不确定性(如SER-FIQ)或样本对的相似度(如FaceQnet)作为质量分数。
作者认为大多数基于人脸识别特征的方法只考虑了部分的类内信息,却忽略了用于估计人脸图像可识别性的宝贵的类间信息。作者认为一张高质量的人脸图片应该与其同类样本相似而与类外样本不相似。因此提出一个新的无监督FIQA方法——融合相似性分布距离的人脸图像质量评价(SDD-FIQA, Similarity Distribution Distance for Face Image Quality Assessment)。
3.主体思路
针对目标样本,使用识别模型收集它的类内相似性分布以及类间相似性分布,计算两种分布之间的Wasserstein距离作为质量分数伪标签。最后,在Huber损失约束下训练一个质量回归网络,该方法可以在无真实质量分数标签的情况下准确预测人脸图像质量评分。
Step1:将训练数据遍历人脸识别模型,采集对应的类内分布和类间分布;
Step2:计算类内分布和类间分布的Wasserstein距离,并作为质量分数伪标签;
Step3:在Huber loss的约束下训练质量分数回归网络。
4.具体内容
在基于人脸识别效果对人脸质量进行评价的方法中,最重要的是建立图像质量与识别模型的映射关系。人脸样本类内-类间相似度分布为何与人脸图像质量高度相关?
从人脸识别效果来看,一张高质量的人脸图像更容易被识别正确,这表示它与类内的相似性距离较近,与其它类间的相似性距离较远。换句话来说,它的类内相似性分布与类间相似性分布距离较远。图像质量与类内-类间相似度距离如下图所示,低质量人脸WD距离较近,高质量人脸WD距离较远。
如关于何生成质量分数伪标签?
SDD-FIQA综合考虑了目标样本的与类内样本和类间样本的相似性,类内样本与类间样本的分布距离结果作为质量伪标签,作者使用WD(Wasserstein Distance)计算类内与类间的分布距离。
图中红点表示目标样本,绿点表示类内样本,黄点表示类间样本。类内相似性分布(Pos-Sim)与类间相似性分布(Neg-Sim)的WD距离为质量分数伪标签,质量分数结果如图中右侧所示。然后使用生成的质量分数标签训练质量回归网络。在训练过程中利用人脸识别模型进行知识迁移,提升质量回归模型的预测结果与识别的匹配度。去掉embedding和原来的分类层,添加一个FC层,采用dropout方式防止训练过程中过拟合,使用Huber loss回归损失函数训练质量回归网络。相比MSE,Huber损失对数据中异常值更具鲁棒性。
问题思考
基于人脸识别生成的质量分数与人主观感知结果相差大。
网络不够轻量化,可以试试mobilinet训练试试
感觉用于人脸识别方面,这个比较适合,因为就是以人脸识别网络的评价标准训练的,如果使用其他目的,不建议使用。