NIMA:Neural Image Assessment论文阅读笔记_概率分布

与RankIQA一样,本文也是针对no-reference IQA任务进行研究的,本文的贡献在于提出了一种新的类型的方法来解决该问题。

predict the distribution of human opinion scores using CNN

  1. 由于人类对同一张图片的评价不总是都是一样的,每个人都有自己的品味,那么只是单一的回归质量分数会导致与实际的结果不会有多大接近。
  2. 基于这个想法,本文提出预测图片的质量评价概率分布,以人类对图片的质量评价概率分布为target,计算出EMD(earth mover's distance)-based loss,进行反向传播。
  3. 不用回归而用分类是因为根据相关文献指出基于分类的做法效果更好些,而这个分类也不是纯粹的相互独立地分类,因为类与类之间也有比较关系,而EMD-based loss就可以做到这一点。

NIMA:Neural Image Assessment论文阅读笔记_概率分布_02

  • 简单解释下上述公式,p(ground truth)与p冒分别是人类评价图片质量的分数(分数总共为10档)概率分布和预测到的分数概率分布。
  • N为分数的档数,本文中设为10,r表示范数的类型,CDF是对概率分布的累加函数(例如概率分布为0.1,0.2,0.3,0.4,那么CDF(k) = 0.1,0.3,0.6,1.0,k=1,2,3,4)。

NIMA:Neural Image Assessment论文阅读笔记_概率分布_03

而最终一张图片的综合评价则是由分数概率分布的均值与标准差来决定的,均值代表了这张图片的质量分数,标准差代表了非常规程度。