NIMA：Neural Image Assessment论文阅读笔记

原创

wx630c98f24f6b8 2022-08-30 09:56:04 博主文章分类：杂七杂八的 ©著作权

©著作权归作者所有：来自51CTO博客作者wx630c98f24f6b8的原创作品，请联系作者获取转载授权，否则将追究法律责任

NIMA：Neural Image Assessment论文阅读笔记_概率分布

与RankIQA一样，本文也是针对no-reference IQA任务进行研究的，本文的贡献在于提出了一种新的类型的方法来解决该问题。

predict the distribution of human opinion scores using CNN

由于人类对同一张图片的评价不总是都是一样的，每个人都有自己的品味，那么只是单一的回归质量分数会导致与实际的结果不会有多大接近。
基于这个想法，本文提出预测图片的质量评价概率分布，以人类对图片的质量评价概率分布为target，计算出EMD(earth mover's distance)-based loss，进行反向传播。
不用回归而用分类是因为根据相关文献指出基于分类的做法效果更好些，而这个分类也不是纯粹的相互独立地分类，因为类与类之间也有比较关系，而EMD-based loss就可以做到这一点。

NIMA：Neural Image Assessment论文阅读笔记_概率分布_02

简单解释下上述公式，p（ground truth）与p冒分别是人类评价图片质量的分数（分数总共为10档）概率分布和预测到的分数概率分布。
N为分数的档数，本文中设为10，r表示范数的类型，CDF是对概率分布的累加函数（例如概率分布为0.1,0.2,0.3,0.4，那么CDF(k) = 0.1，0.3，0.6，1.0，k=1，2，3，4）。

NIMA：Neural Image Assessment论文阅读笔记_概率分布_03