郝旭东陈 锟
1.2.内蒙古广播电视台 内蒙古 呼和浩特市010050
伽玛(Gamma)是一个在影视行业经常谈论,但很容易被误解的概念。对影视制作来说伽玛就像空气一样无处不在,但常常被忽略。在电视行业,狭义的伽玛是伽玛校正的简称,是为校正显像管的非线性特性在信号源端对视频信号电平进行的非线性处理;在影视行业,广义的伽玛表示系统的灰度(亮度)特性,即拍摄、制作和显示系统的光-电、电-电、电-光转换特性。伽玛应用于所有电子影像设备,与分辨率无关。高动态范围(HDR)技术的发展,使长期以来潜伏在影视制作后台的伽玛走上了前台。
目前最常用的显示伽玛是电视行业的BT.1886和电影行业的DCI(数字影院倡导联盟),这两种伽玛都是用于标准动态范围(SDR)的。BT.1886的伽玛值2.4,峰值亮度100尼特(cd/m2),8-10比特,DCI的伽玛值2.6,峰值亮度48尼特,12比特。正在迅速发展的高动态范围(HDR)电视采用感知量化(PQ)和混合对数(HLG)两种伽玛,10-12比特,都是ITU-RBT.2100定义的。采用绝对亮度体系的PQ最高峰值亮度为10000尼特,PQ达到最高峰值亮度时动态范围10000%。HLG的动态范围1200%,ITU建议现阶段制作这两种伽玛的节目时使用峰值亮度1000尼特的HDR监视器。电影的HDR目前还没有确定统一的国际标准或行业标准,两个正在推广的企业标准分别是Dolby Vision和Eclair Color,Dolby Vision采用PQ伽玛,峰值亮度106尼特,Eclair Color的伽玛值为2.8,峰值亮度103尼特。除了上述几种用于广播、放映和分发的伽玛外,影视制作还使用柯达的Cineon以及与之类似的多种厂商定义的对数伽玛如Log C、SLog3、C-Log、V-Log、RED Log等,摄影机原始数据RAW和特技制作交换的OpenEXR也使用16比特线性伽玛。这些对数和线性伽玛只用于制作流程中的素材记录和文件交换等中间环节,与成品节目无关。
线性,就是信号幅度与表达的模拟量之间呈现等比例的线性关系,其特性为一条直线。非线性,就是信号幅度与模拟量之间的关系为非直线的曲线。线性是最简单、直接、方便的表达方式,例如音频信号就是线性的。电视的视频信号并没有采用与声音一样简单的线性表达方式,而是采用了非线性。原因很简单,因为显像管的特性是非线性的。
图1
在电视发展的初期,可以大规模商业应用的显示器件只有显像管(CRT),而显像管的原生电-光转换特性(EOTF,Electro-Optical Transfer Function)是非线性的。在拍摄端,摄像机成像器件的原生光-电转换特性(OETF,Opto-Electrical Transfer Function)是 线 性 的。为了正确地再现图像对比度(反差),需要使显示亮度与场景亮度呈现线性的关系。因此,必须在摄像机中对成像器件输出的线性信号进行“灰度预失真”的非线性处理,使其与显像管的灰度失真相反,以补偿显像管的非线性,使场景光与显示光的光-光转换特性(OOTF,Opto-Optical Transfer Function)是线性的,这就是“伽玛校正”。
显像管的输入电平与显示亮度之间呈现非线性的指数关系,这个关系中的指数就是显像管的伽玛(γ),不同显像管的伽玛值并不完全相同,平均值大约为2.2,这就是显示伽玛。从图1可以看到,指数特性的显像管灵敏度与输入电压相关,输入电压越低灵敏度越低,输入电压越高灵敏度越高,相同的电压变化,在高电平时产生的亮度变化比低电平时大得多。所有成像器件的光-电转换特性都是线性的,即γ=1,如果把线性的成像器件输出信号直接送给γ=2.2的显像管,包括拍摄和显示在内的系统伽玛就是γt=1×2.2=2.2。由于显像管的非线性指数特性,显示图像的暗部层次会被压缩而亮部层次被扩展,呈现的图像会出现反差很大的灰度失真,就像摄像机关闭了伽玛校正一样。因为显像管的γ=2.2,是指数特性,所以在摄像机端需要用1/γ=1/2.2≈0.45的对数特性进行校正,这就是拍摄伽玛,也称为摄像机伽玛。经过处理后系统伽玛γt=0.45×2.2≈1,场景与显示亮度呈线性关系。不妨假设一下,如果显像管的电-光转换特性也像成像器件一样是线性的,当初电视可能也会采用与声音一样的线性表达方式。因此,电视显示设备采用非线性,开始时是受制于显像管的非线性特性,是被动的。尽管开始时是被动的,但工程师们很快就认识到,这种“复杂”的非线性方式比“简单”的线性更合理。在模拟时代,传输电平是资源,线性就是平均地使用电平资源,非线性则是不平均地使用资源。摄像机端的伽玛校正对成像器件输出的线性信号进行了非线性对数处理,对数伽玛的特点是电平(亮度)越低分配的资源越多,电平(亮度)越高分配的资源越少,这相当于在传输前对信号的低电平部分进行了“加重”处理,在显示端显像管的指数特性对低电平部分进行了“去加重”处理,这种资源分配方式提升了系统的信噪比。人的视觉和听觉都不是线性而是非线性的对数特性,人眼观看的景物亮度越低灵敏度越高,亮度越高灵敏度越低。例如,在图像中噪波在所有亮度电平上是均匀分布的,但人眼只能看到暗部的噪波,而对同样幅度的亮部噪波则“视而不见”。假设传输信道的噪波电平是固定的,在传输/记录前对信号进行的对数伽玛校正提升了图像信号的暗部电平,显示端显像管的指数特性降低了暗部的亮度,这种处理对图像的暗部噪波起到了明显的抑制作用。利用人眼特性,非线性处理方式只需要线性方式一半的传输电平就可以达到相同的信噪比,或者说使用相同的电平资源时非线性方式能够达到的信噪比是线性方式的两倍。由于数字技术对信道噪波具有天然的免疫力,进入数字时代后传输和记录时噪波对信号的干扰问题不存在了,但仍然需要合理使用资源。与模拟时代的电平对应,数字视频的电平资源是量化比特代表的灰度阶。对数伽玛分配给暗部的灰阶多,亮度越高灰阶越少,这种非线性方式利用人眼特性提高了量化资源利用率。
从亮度动态范围的角度看,伽玛校正对亮度电平进行的对数处理相当于在传输或记录前利用人眼的特性对动态范围进行了压缩,而显示端的指数特性相当于对输入的动态范围进行了扩展,非线性伽玛校正的处理方式相当于把系统动态范围提高到了现有传输电平(量化比特灰阶数量)的2倍以上。
电视伽玛的初始目的是为了校正显像管的非线性。在现代显示系统中伽玛校正的作用已经不是校正显示器件的非线性,而是合理利用电平(量化)资源,压缩传输和记录的动态范围。伽玛校正利用了人眼的非线性对数特性,在人眼敏感的暗部使用了更多的电平(量化)资源,而在人眼不敏感的亮部使用较少资源。这种非线性处理方式符合人眼的特性,比线性传输、记录更合理,起到了用有限的电平资源再现更大动态范围的作用。如果没有非线性的伽玛校正,标清和高清电视广播采用8比特量化是不够的,至少需要9至10比特,因此,非线性节省了传输和存储资源。
图2
基于上述原因,目前电子影像显示设备的“默认”特性都是显像管伽玛。尽管从2000年开始显像管作为显示器件已经逐渐退出了历史舞台,但其特性却得以传承。所有显示设备的EOTF都必须模拟显像管的非线性指数特性,如液晶/等离子/OLED电视机、电视监视器、电脑显示器、DLP或液晶投影机、数字电影放映机、LED显示屏等,尽管这些设备中的显示器件原生特性都不是显像管伽玛。为了规范“显像管”的特性,确保这些不是显像管的显示设备具有相同的性能,2011年国际电信联盟(ITU)制定了ITU-R BT.1886技术标准,把“显像管”的伽玛定为2.4,这也是标准动态范围(SDR)显示伽玛特性的国际标准。在实际产品方面,所有显示设备的伽玛值都大于2.2,其中家庭电视机的伽玛为2.4-2.6,电脑显示器的伽玛为2.5-2.6,DCI/SMPTE标准的数字电影放映机伽玛为2.6,市场上没有任何显示设备产品支持γ=1的线性伽玛。因为显示设备都采用了非线性的显像管伽玛,所以线性的图像信号必须经过伽玛校正才能正常显示。
与电视一样,在胶片电影的制作流程中,拍摄和显示(放映)的胶片伽玛也都是非线性的。与电视摄像机相似,拍摄用的底片(彩色负片)也是伽玛值小于1的低反差对数特性,其伽玛值为0.6,与电视摄像机的伽玛值0.45相近,再现低反差负像。在胶片电影制作流程中,作为拍摄素材的底片经过光学曝光的接触复印后得到翻正(中间正片),翻正片是伽玛值为1的线性特性,只是把底片的负像转换成了正像并不改变伽玛值,因此翻正仍然是伽玛值为0.6的低反差图像。剪接后的翻正片再经过接触复印就得到了翻底(中间负片),与翻正片一样翻底片也是伽玛值为1的线性特性,因此翻底和底片一样仍然是伽玛值为0.6的低反差负像。翻底是用于印制发行拷贝的,用于放映的发行拷贝伽玛值为2.6至3,与显像管相似都是伽玛值大于1的高反差指数特性,印制低反差底片时可以得到放映需要的正常对比度图像。为了适应影院的黑暗观看环境和低亮度的投影图像,包括拍摄、制作和放映,胶片电影的系统伽玛γt=0.6×3≈1.8(放映拷贝伽玛为2.6时γt=0.6×2.6≈1.56),比电视的系统伽玛大,因此银幕上放映的图像对比度比实际景物大。由此可见,去掉胶片特有的正片、负片和不影响伽玛特性的中间片因素,胶片电影的拍摄和电视摄像机一样也是非线性的对数特性,放映(显示)和显像管一样也是非线性的指数特性。拍摄底片(彩色负片)采用对数特性的作用,是在记录时利用人眼的非线性对动态范围进行压缩,这样就能够用有限的胶片密度资源记录更高的亮度动态范围,因此在放映(显示)时发行拷贝必须用指数特性对压缩了的动态范围进行扩展。拍摄底片采用对数特性的第二个作用,是抑制多次复制使胶片乳剂颗粒噪波叠加造成的信噪比下降,这与模拟电视采用非线性伽玛校正提高信噪比的道理是一样的。拍摄时底片的对数特性为暗部分配了更多的密度资源,放映时发行拷贝的指数特性压低了暗部颗粒噪波的可见性。与无法改变的显像管电-光转换特性不同,通过调整感光乳剂配方和冲印工艺,胶片的感光特性既可以是非线性的对数和指数,也可以是线性的。因此,胶片的拍摄和放映采用对数和指数特性并不是被动的,而是主动的有意为之。
综上所述,胶片电影与电视殊途同归,都是利用人眼的对数特性,采用非线性伽玛合理利用资源,压缩传输和记录的动态范围,达到了用尽可能少的资源实现更高性能的目的。对比电影和电视,比较对数特性的低反差图像与指数特性的高反差图像之间的差别,可以直观地看到非线性伽玛校正如何在拍摄时压缩、显示时扩展动态范围,并在终端呈现正常对比度图像。从图可以看到,低反差的对数伽玛再现了更多灰度层次,但把很大的动态范围压缩到了较小的对比度范围内;高反差的指数伽玛扩展了动态范围和对比度但损失了灰度层次,这两种灰度失真的图像都不是正常的对比度。显然,传输和记录这种压缩了动态范围的信号比处理线性信号更节省资源。
图3
由于伽玛的非线性特性,显示伽玛(EOTF)与拍摄伽玛(OETF)必须匹配,伽玛不匹配时再现的图像会出现灰度和彩色失真。伽玛匹配的基本原则是显示伽玛的特性与拍摄伽玛相反,这样才能使系统伽玛(OOTF)为线性或近似线性。因此,用BT.709摄像机伽玛拍摄的图像应该用显像管伽玛显示,用PQ OETF拍摄或制作的图像必须用PQ EOTF显示。在BT.1886发布之前电视行业没有统一的显示伽玛标准,因为显像管时代显示伽玛主要取决于显像管自身的原生物理特性,不同厂商生产的显像管产品伽玛值并不完全相同,很难统一。显像管退出市场后为规范采用平板显示器件的监视器伽玛特性,ITU发布了BT.1886文件。BT.1886不但应用于高清与标清SDR电视监视器,还被民用电视机、电脑显示器、智能手机显示屏、投影机、LED显示屏等显示设备广泛引用。与显示伽玛匹配的是ITU-R BT.601、BT.709定义的拍摄伽玛,也被称为BT.601、BT.709伽玛,或摄像机伽玛。BT.1886发布前一般取显像管伽玛的平均值2.2作为显示伽玛的基准值,因此BT.601/709拍摄伽玛被定义为1/2.2=0.45。BT.1886的伽玛值为2.4,但BT.601/709的发布时间早于BT.1886,不可能更改,0.45拍摄伽玛(OETF)制作的图像用2.4的显示伽玛(EOTF)显示时,其系统伽玛(OOTF)等于0.45×2.4≈1.1,不是线性的1。
伽马值等于1时伽玛曲线是线性的,小于1为曲线向上凸的对数特性,大于1为向下凹的指数特性。采用BT.1886显示伽玛后系统伽玛(OOTF)1.1比1略大,显示的图像对比度比实际场景略大,出现了一点灰度失真。实际上观众不但接受而且喜爱这种反差比实际场景略大的图像,大部分人认为这种对比度略大的图像看起来更“通透”,清 晰 度 更 高。早 在BT.1886发布之前大部分电视机产品的伽玛值就已经是2.4或更大而不是2.2,其原因首先是新型显像管的伽玛值普遍大一些,其次是电视机厂商为迎合市场需求,在电视机的信号处理电路中对使用较小伽玛值的显像管进行了校正,使其总的电-光转换特性(EOTF)达到或超过了2.4,BT.1886把显示伽玛定义为2.4只是承认了这个现实而已。数字电影放映机的显示伽玛为2.6,比BT.1886的2.4大一些,用数字放映机显示为电视制作的图像时其系统伽玛γt=0.45×2.6=1.17,显示图像的反差比电视机大一些;反之,在电视机上显示为电影放映机制作的图像时由于其显示伽玛2.4比电影放映机的2.6小,显示图像的反差比电影放映机小一些。由于电视的显示伽玛与电影的制作伽玛不匹配,重现的图像会出现灰度失真,但误差不太大,一般应用时可以忽略,但对高质量节目来说这个误差是不能忽略的。因此,为电影制作的节目用于电视播出和发行时需要根据电视机的显示伽玛和色域制作专门的电视版。HDR电视与SDR的伽玛特性差别非常大,显示与拍摄伽玛不匹配时灰度和彩色失真要大得多。