ae机器学习模型 ae simulation_时域


星号then:视频/图像质量评价综述(三)zhuanlan.zhihu.com

ae机器学习模型 ae simulation_ae机器学习模型_02


3. 主观指标

3.1 ITU-R BT.500

(1). 双刺激损伤尺度(Double Stimulus Impairment Scale, DSIS)

受测者观看多个原始参考视频和失真视频组成的"视频对",并且每次总是先观看原始参考视频,然后观看失真视频。观测者对视频的整体印象进行评判,用定义的主观测度来表达评判,对失真视频的失真度进行评分。评分采用5分制失真测度。

(2). 双刺激连续质量尺度(Double Stimulus Continuous Quality Scale, DSCQS)

受测者观看多个原始参考视频和失真视频组成的"视频对",但与DSIS不同的是,原始参考视频和失真视频的显示顺序是随机的,并且受测者对每个"视频对"中两幅视频的质量都进行打分。为了避免量化误差,这种方法提供了一个连续的评分测度,但是为了与5分制的评分标准一致,它也被等分成5份,如图所示。在测试过程中,首先将测试视频对显示一次或多次,使受测者得到对视频的主观认识,然后再一次或多次显示视频对以进行记录评分。对于静止图像,每幅图像显示3.4秒、重复5次(最后两次用于评分)比较合适。对于时变的运动序列,每段序列显示10秒、重复2次比较合适。

(3). 单刺激(Single Stimulus Methods, SS)

以随机的形式显示多个测试视频,并且对于不同观测者,视频序列的随机显示顺序也不同。受测者只观看测试视频,对其质量进行打分。具体实现方式有两种:一种方法是SS(Single.stimulus),即不重复放映测试序列;另外一种是SSMR(Single Stimulus with Multiple Repetition),即把测试序列重复放映多次。最常用的质量评分测度是5分制,除此之外还有9分制和11分制,它们是5分制的扩展,可以提高评分的精度。

(4). 单刺激连续质量评估(Single Stimulus Continuous Quality Evaluation, SSCQE)

只显示测试序列(不显示参考序列),与上述几种采用较短独立序列段进行测试的方法不同,该方法选择的序列段持续的时间较长,最短为5分钟。受测者持续对观测序列进行评分,最后从一系列的打分中得到一个统计数据,得分不仅考虑分值的大小,还要考虑打分的时间。这种方法适用于视频质量具有时变特性的压缩系统,但是测试序列的选取对实验结果有较大的影响。因为DSCQS能表示视频间细微的质量差别,所以更适用于测试视频和参考视频质量差别不大的情况。而DSIS更适合评估特殊效应引起的视觉失真。由于人记忆力的限制,DSCQS和DSIS的评分会倾向于依赖最后10-20秒的视频质量,因此这两种方法不适合评估长的视频序列,这是它们共同的缺点。另外,DSCQS中参考视频的使用、序列的重复等测试条件都不同于实际的家庭观看环境,这给主观测试者进行准确评分带来了一定困难。SSCQE就是针对这一问题设计的,它能够较好的评估时变质量,但SSCQE评分与节目的内容关系很大,并且由于缺少参考视频,我们无法准确地对不同SSCQE实验的评分进行比较。

(5). 刺激-比较方法(Stimulus Comparison Adjectival Categorical Judgement, SCACJ)

在激励比较法中,显示两个图像或图像序列,由观察者给出一个指标,表示两个演示之间关系,在电视评价中采用了三种激励比较法。分别是形容词分类判断法,这些类别可以表明可察觉的差别存在与否(例如“相同”、“不同”),或者表明可察觉差别的存在与否和方向(例如“小”、“相同”、“大”);非分类判断法,观察者用一个数值表明一个评价对中各组成部分的关系;性能法,准备条件对时,让其中一个组成部分含有特定级别的某种属性(例如损伤),而另一个含有其他级别的该属性或不含该属性,请观察者决定哪个组成部分的该属性级别更高/更低,或决定哪个组成部分包含该属性;将性能的准确度和速度作为衡量条件对中各组成部分关系的指标。

(6). 同时双激励连续评价方法(Simultaneously Double Stimulus Continuous Evaluation, SDSCE)

该方法能够衡量较长序列的视频质量,衡量视频内容的代表性,以及衡量差错统计值。为了让再现的观看条件尽可能接近实际情况,在SSCQE中未采用基准。在需要评价保真度时,必须引入基准条件。SDSCE是以SSCQE为基础制定的,但在向被试显示图像的方式上以及在评分量表上有稍许变化。

3.2 ITU-R BT.1788

(1). 多媒体视频质量的主观评估(Subjective Assessment Method for Video Quality evaluation, SAMVIQ)

该方法中,观测者准许使用一个片段的若干个版本。当所有版本都经观测者评定后,可对之后的片段内容进行评估。不同版本可由观测者通过计算机图形接口随机选择。根据需要,观测者可以停止、评审并修改某个片段各个版本的评分。该方法包括一个显性基准(即未经处理的)片段,以及相同片段的若干个版本,这些版本包括经处理的和未经处理的(即隐含基准)片段。片段的各个版本都单独显示,并使用一个类似于在DSCQS方法中使用的连续质量尺度来评价。因此,该方法在功能上与利用随机访问的单刺激方法十分类似,但只要观测者想要观测,他就可以观测显性基准,这使得该方法类似于使用一个基准的方法。

SAMVIQ 质量评估方法使用连续质量尺度,以提供对视频片段内在质量的测量。各个观测者在从0到100评级的连续尺度上移动一个滑条,该连续尺度用5 个线性排列的质量项(很好、好、一般、差、很差)来注释。

3.3 ITU-T P.910

原理与框架:该标准全称为多媒体应用主观视频质量评价方法(Subjective video quality assessment methods for multimedia applications),描述了多媒体应用单向整体视频质量的非交互主观评估方法。从主观评测角度该标准描述了4种测试方法:

(1). Absolute category rating(ACR) 绝对种类评分;

(2). Absolute category rating with hidden reference(ACR-HR) 带隐藏参考的绝对种类评分;

(3). Degradation category rating(DCR) 损伤种类评分;

(4). Pair comparison method(PC) 成对比较法。

但该标准提到的两个指标很有参考意义:

空域感知信息(spatial perceptual information)计算是将视频中每一帧的亮度平面经过Sobel滤波,滤波器是用来提取并集中高频成分,将低频成分过滤掉,再对每一个像素求标准差,进而得到一个时间序列的空域信息,最后这个序列中的最大值用来表达场景内容的空域信息。如果SI值高,表示在一帧内有大量的细节信息,如果该序列是黑屏或者当图像轮廓较为模糊,SI指标会是0。


ae机器学习模型 ae simulation_lua_03


时域感知信息(temporal perceptual information)基于运动差异特征,即亮度平面相同位置的像素值之差,最后在整个时间域整个空间内标准差最大值用来表达场景内容的时域信息。画面中运动内容多的TI值更高。如果TI值高,表示场景发生改变频繁,如果是0表示测试序列是静止的。


ae机器学习模型 ae simulation_ae机器学习模型_04


虽然该ITU标准是用来主观打分的,但SI和TI这两个指标也可以用来做部分参考模型,即比较一下编码前后SI、TI变化情况,SI变化大,说明编码器丢失了很多图像细节纹理信息,TI变化大,说明编码器丢失了很多运动信息。但这种比较不能经过有损伤的传输系统,否则因数据包丢解码出来有马赛克的画面其SI或TI可能比原始图像还大。

星号then:视频/图像质量评价综述(五)zhuanlan.zhihu.com

ae机器学习模型 ae simulation_aerials标准测试图像_05