Gamma校正
问题:什么是Gamma曲线矫正?Gamma曲线矫正是什么意思?
Gamma曲线是一种特殊的色调曲线,当Gamma值等于1的时候,曲线为与坐标轴成45°的直线,这个时候表示输入和输出密度相同。高于1的Gamma值将会造成输出亮化,低于1的Gamma值将会造成输出暗化。总之,我们的要求是输入和输出比率尽可能地接近于1。在显示器、扫描仪、打印机等输入、输出设备中这是一个相当常见并且比较重要的概念。在计算机系统中,由于显卡或者显示器的原因会出现实际输出的图像在亮度上有偏差,而Gamma曲线矫正就是通过一定的方法来矫正图像的这种偏差的方法。一般情况下,当用于Gamma矫正的值大于1时,图像的高光部分被压缩而暗调部分被扩展,当Gamma矫正的值小于1时,图像的高光部分被扩展而暗调部分被压缩,Gamma矫正一般用于平滑的扩展暗调的细节。
图1 CRT显示器的亮度响应曲线图
图1显示的是一般CRT显示器的亮度响应曲线,可以看到其输入电压提高一倍,亮度输出并不是提高一倍,而是接近于两倍,显然这样输出的图像同原来的图像相比就发生了输出亮化的现象,也就是说未经过Gamma矫正的CRT显示器其Gamma值是小于1的。
没有经过Gamma矫正的设备会影响最终输出图像的颜色亮度,比如一种颜色由红色和绿色组成,红色的亮度为50%,绿色的亮度为25%,如果一个未经过Gamma矫正的CRT显示器的Gamma值是2.5,那么输出结果的亮度将分别为18%和3%,其亮度大大的降低了。
图2按图进行曲线补偿
为了补偿这方面的不足,我们需要使用反效果补偿曲线来让显示器尽可能地输出同输入图像相同的图像,所以这个时候显示器的输入信号应该按照图2所示的曲线进行补偿,这样才能在显示器上得到比较理想的输出结果。
图3理想状态下的曲线
一般的反效果可以直接被赋予存储在帧缓存中的图像,使之Gamma曲线呈非线性,也可以通过RAMDAC进行这种反效果补偿(或者说是Gamma曲线矫正)。这样我们就可以在显示器上看到同我们输入的图像接近的图像了(如图3)。当然图3所示的曲线只是理想状态下的情况,在实际应用中我们并不可能得到如此完美的曲线,所以不同的厂商之间所竞争的就是谁能做到最接近于这个效果。
显示器的gamma值是用于定义一个显示器的显示特性的数学方法,是决定显示器从黑色到白色的值。简单的说,当显示一个颜色从黑到白时(也就是0到1),显示器的电压也要随之变化,但这个变化不是线性的。因为显示器的物理特性决定了如果电压的变化是线性的,显示出来的亮度就不是线性的,这时,显示的亮度就会很暗。所以,为了保整显示出来的亮度是正常(线性)的,就需要对显示器的电压变化加以校正,这个值就是我们通常所说的gamma值。通常情况只有在调整HDRI图片时和在做动画渲染时会用到。
γ校正(Gamma Correction,伽玛校正):所谓伽玛校正就是对图像的伽玛曲线进行编辑,以对图像进行非线性色调编辑的方法,检出图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高图像对比度效果。计算机绘图领域惯以此屏幕输出电压与对应亮度的转换关系曲线,称为伽玛曲线(Gamma Curve)。以传统CRT(Cathode Ray Tube)屏幕的特性而言,该曲线通常是一个乘幂函数,Y=(X+e)γ,其中,Y为亮度、X为输出电压、e为补偿系数、乘幂值(γ)为伽玛值,改变乘幂值(γ)的大小,就能改变CRT的伽玛曲线。典型的Gamma值是0.45,它会使CRT的影像亮度呈现线性。使用CRT的电视机等显示器屏幕,由于对于输入信号的发光灰度,不是线性函数,而是指数函数,因此必需校正。
在电视和图形监视器中,显像管发生的电子束及其生成的图像亮度并不是随显像管的输入电压线性变化,电子流与输入电压相比是按照指数曲线变化的,输入电压的指数要大于电子束的指数。这说明暗区的信号要比实际情况更暗,而亮区要比实际情况更高。所以,要重现摄像机拍摄的画面,电视和监视器必须进行伽玛补偿。这种伽玛校正也可以由摄像机完成。我们对整个电视系统进行伽玛补偿的目的,是使摄像机根据入射光亮度与显像管的亮度对称而产生的输出信号,所以应对图像信号引入一个相反的非线性失真,即与电视系统的伽玛曲线对应的摄像机伽玛曲线,它的值应为1/γ,我们称为摄像机的伽玛值。电视系统的伽玛值约为 2.2,所以电视系统的摄像机非线性补偿伽玛值为0.45。彩色显像管的伽玛值为2.8,它的图像信号校正指数应为1/2.8=0.35,但由于显像管内外杂散光的影响,重现图像的对比度和饱和度均有所降低,所以现在的彩色摄像机的伽玛值仍多采用0.45。在实际应用中,我们可以根据实际情况在一定范围内调整伽玛值,以获得最佳效果。
今天有个朋友问γ校正的用处,这里简单说一下:
伽马校正最初是由于显示器的阴极现象管(也就是物理上所说的示波管的阴极射线版)的成像扭曲引起的,为了不使画面失真所以就用先特殊算法进行校正,此之谓γ校正。
γ校正的原理是修改显示系统的配色方案,本来显示系统输出的r g b电子枪线性的根据显存中的各个颜色值输出对应的控制电压,但是通过伽码校正可以把某个颜色值对应的输出电压调整高或调整低。达到校正显示系统色泽的目的。同时可以用软件的方法校正,就是对一副图片设定某个颜色的颜色值变换成新的颜色值的对照表,然后用新的颜色值取代原来图片中对应的颜色就行了呀。比如你先编写一个控制rgb各个分量对应关系的曲线调节器,在曲线调节器里面调整控制曲线设置原来颜色多少对应目标颜色多少,然后根据设定的关系,修改要调整色泽的图片每一个像素的颜色就可以了。
数学公式可以深刻和精确的把握一个概念,却不能表达概念的物理意义和本质含义,本贴试图摆脱数学公式的陈述和推导,用言语来解释gamma的本质含义。
1什么是gamma?
对于CRT显示器,输入电压信号将在屏幕上产生亮度输出,但是显示器的亮度与输入的电压信号不成正比,存在一种失真,如果输入的是黑白图像信号,这种失真将使被显示的图像的中间调偏暗,从而使图像的整体比原始场景偏暗,如果输入的是彩色图像信号,这种失真除了使显示的图像偏暗以外,还会使显示的图像的色调发生偏移。gamma就是这种失真的度量参数。对于CRT显示器,无论什么品牌的,由于其物理原理的一致性,其gamma值几乎是一个常量,为2.5。(注意,gamma=1.0时不存在失真),由于存在gamma失真,输入电压信号所代表的图像,在屏幕上显示时比原始图像暗。
2 gamma概念的演化
gamma本来是显示器的输出图像对输入信号失真的度量参数。
2.1 gamma概念的第一演化(系统gamma和显示器gamma)
由于存在显示失真,这样的图像不能应用,所以需要校正这种失真。上文讲到,对于显示器来说,gamma值是常量,不可改变,所以校正过程就只能针对输入的图像电压信号了。这种校正就是将正常的图像电压信号向显示器失真的相反方向去调整,既然失真使图像的中间调变暗,那么在图像电压信号输入到显示器之前,先将该电压信号的中间调调亮,然后再输入到显示器,这样就可以抵消显示器的失真了。
由于显示器的gamma值是常量,所以这种校正的幅度也是相对固定的,这种校正幅度的度量参数也叫gamma,这是gamma概念的第一次演化,为了区别这两种不同的概念,此处的gamma又叫做系统gamma(因为对图像电压信号的校正过程发生在电脑系统中),显示器的固有的gamma又叫做显示器gamma。
2.2 gamma概念的第二次演化
显示器gamma表示一种失真,系统gamma表示一种校正,这两者共同之处是都表示对原始信号的一种变换,所以gamma概念发展到这里,其一般性含义已经又两层含义,a表示对原始信号的一种变换, b表示这种变换的度量参数。
2.3 gamma概念的第三次演化(文件gamma)
既然gamma的一般性含义是对原始信号的一种变换,可想而知,文件gamma也一定表示一种变换,这是一种什么样的变换呢?
从宏观上讲,被照相机拍摄的物体的亮度是连续变化的,如果将亮度连续变化的被摄物体的图像转换成数字文件(计算机文件)时,无论用数码相机还是扫描仪,都要面临用离散的数值去近似表示连续的物理量的问题。具体来说,一个8位的二进制数字文件,如何编码才能比较精确的表示反差很大的一幅图像?
这要从人的视觉原理说起。人的眼睛感觉到亮度增加一级的时候,光强(光的能量)将增加一倍,同样,当人的眼睛感觉到亮度减小一级的时候,光强将减少一半。就是说,人的眼睛感觉到的亮度的成比例的线性变化,是由光强的倍数变化引起的。如果将一段连续变化的亮度从暗到亮等差分成a b c d e f g 七段,那么这七段亮度对应的光强不是1 2 3 4 5 6 7,而是1 2 4 8 16 32 64。打个数学比方,人眼感觉到的亮度是等差数列,而光强的物理实在是等比数列!为何如此,因为这样可以确保人眼即适应高亮度的阳光下的景物,又能在夜晚看清星光下的猎物,这是大自然的造化。
数码相机或扫描仪的感光元件,将会把光强变成电信号,然后由模-数转换器件转换成数字信号,继而再存储为数字文件。为了便于讨论,以黑白图像为例,一个黑白图片数字文件中每个象素用一个8位二进制编码表示,8位二进制编码只有256个量级,从0到255。就是说,一幅图片,最亮的地方用255表示,最暗的地方用0表示。这里有一个问题需要我们思考一下:比最亮处(编码255)暗一级的象素的编码值是多少?
答案是128,因为人眼感觉暗一级,光强将减小一半,这样感光元件的输出电压值将减小一半,从而模-数转换器件得到的数字值也是255的一半,即128。
依此类推,比最亮的象素(编码255)暗两级的象素的编码值是64,暗三级是32,暗四级是16,暗五级是8,暗六级是4,暗七级是2,暗八级是1。于是矛盾就出现了:
第一问题是,亚当斯将曝光区分为11个等级,这种8位二进制编码方法无法表示11个分区,只表示了9个分区,分别对应的二进制编码值是0-1,1-2,2-4,4-8,8-16,16-32,32-64,64-128,128-255。
更严重的是第二个问题,最亮的分区(128-255)占有8位二进制编码256个量级的一半量级资源,即占有128个量级,分别是128,129,130,……,253,254,255。而最暗的分区只占有8位二进制编码256个量级中的两个量级,分别是0和1,比最亮分区暗四级的分区只占有8位二进制编码256个量级中的8个量级,分别是8,9,……,15,16。这表明这种编码方法在最亮的分区中,表达的亮度细节非常的丰富,超过人眼的识别能力(人眼在亮处可以识别1%的亮度变化),可是在较暗的分区中,表达的亮度细节就少的可怜了,会出现马赛克!
所以需要对感光元件的输出的电压值在模-数转换时做一种变换,使得较暗的分区占有的二进制编码量级多一些,较亮的分区占有的二进制编码量级少一些,从而不至于使图像暗处出现马赛克,也使亮部占有的量级刚好满足人眼的最大识别能力。这样编码的数字文件可以较好的表示反差很大的一幅图像。文件gamma是表示这种变换的度量参数。Windows系统,WWW和sRGB规定文件gamma值为2.2。
2.4 gamma概念的第四次演化
a表示对原始信号的一种变换,泛指显示器gamma,系统gamma,文件gamma。
b表示这种变换的度量参数。
c 在不同的上下文环境中,会特指显示器gamma,系统gamma,文件gamma三个概念中的某个具体概念,注意领会。
2.5概念总结(四种gamma)
2.5.1 gamma
gamma在不同的上下文环境中,有不同的含义,一个意思是表示对原始信号的一种变换,另一个意思是表示这种变换的度量参数,还可能表示显示器gamma,系统gamma,文件gamma三个概念中的某个具体概念。
2.5.2 显示器gamma
是显示器的物理属性,固定的,不变的,不可校正的。显示器gamma在不同的上下文环境中,有不同的含义,一个意思是指显示器的输出图像对输入信号的失真,另一个意思是指这种失真的具体数值。
2.5.3 文件gamma
对一个给定的数码相片文件,按照相关标准规范,这个gamma是一个定值,所以无需对其校正。如果出于某种特殊需要,一定要改变某数码相片文件的gamma值,这种改变也不能称作“校正”,而是称作“变换”。
2.5.4 系统gamma
系统gamma所表示的变换,是计算机系统在读取了照片数字文件之后,在输出到显示器之前的一种变换,对于windows系统它存在于显卡中,是可调节的,可校正的。
3 在使用计算机处理数码相片时总要提到 gamma 校正,这里的 gamma 校正过程校正什么?
由于显示器 gamma 和文件 gamma 是固定不变的, gamma 校正过程是校正计算机的系统 gamma !, 使得显示器 gamma 、系统 gamma 、文件 gamma 三个变换的叠加为 1.0, 从而使最终显示器的图像和原始场景一样,不存在失真。
这就好比密码通信,文件 gamma 是加密过程,系统 gamma 和显示器 gamma 是文件 gamma 的一种反作用,是解密过程,最后看到的结果和原始信息一样。