薛璇
人眼和胶片对于光线的感知
人眼的视觉特性
在人眼的视网膜上分布着很多视锥细胞,视细胞能够将光学刺激转化为神经冲动。视细胞分为视锥细胞和视杆细胞,在人的视网膜内约含有600万~800万个视锥细胞,12000万个视杆细胞,杆状细胞对光线极为敏感,但不善于感知细节,除了对光谱的蓝光—端外,杆状细胞对其他颜色并不敏感,因此,杆状细胞的知觉叫夜视觉;锥状细胞数量少,敏感性更低,但能够更好的区分细节、颜色、形状和地位。因此,锥状细胞的知觉叫昼视觉。这就是为什么,夜晚我们看东西都是灰色的,月光是蓝色,因为杆状细胞在起作用,而锥状细胞失灵了。
日光的强光和夜晚微光之间的亮度相差10万倍,但人眼都能适应。人眼的明暗适应范围可以达到1:1000,则摄像机的最大容纳亮度比仅有1:30。人眼的这种亮暗适应能力,是任何仪器设备无法比拟的。这就是为什么,人眼可以看清楚亮暗的细节,但在摄像机里却看不到,就是因为电子感应芯片的亮暗适应能力不如人眼。相比而言,胶片最接近人眼,所以胶片总是看起来很柔和。
人类的视觉这个非常大的动态范围,这可能是一个具有“欺骗性”的数据。因为人眼如此大的明暗适应范围并不是一次完成的,眼睛可以感知到一个正常的光值范围大约20档(stops)。它有两种方式:首先,虹膜的打开和关闭就像镜头中的光圈一样,它还通过从光视觉(视锥细胞)切换到暗视觉(视杆细胞)来改变反应,最明显的例子就是人会在亮度差异过大的场景时,有一个适应的过程,但是也不可能同时看清最亮的亮部和最暗的暗部的细节。
动态范围
前文所述,人眼的这种亮暗适应范围在摄影上有一个专业名词叫动态范围(dynamic range),動态范围最早是信号系统的概念,一个信号系统的动态范围被定义成最大不失真电平和噪声电平的差。动态范围指定了一个动态信号在传递到给定系统或由给定系统产生时可以假定的可能值或可接受值的范围,通俗来讲,就是可变化信号最大值和最小值的比值。而在摄影领域,动态范围则是一个用于定义摄影机可以在多大范围内捕捉图像的影调细节的术语,也就是摄影机在单帧内可以记录的最亮和最暗影调之间的比率,拥有更大的动态范围意味着拥有更广的影调空间,就能尽可能地保留高光区和阴影区的信息。在光学领域动态范围一般由“档”(stops)来表示,摄影机采用的伽马曲线一般意义上被认为增加了摄影机的动态范围。
宽容度则是一个从胶片宽容度引申到数码相机的概念,宽容度指的是H&D曲线(胶片特性曲线,图1)上直线部分在横坐标上的投影范围,即宽容度定义为感光材料在摄影过程中按正比关系记录景物亮度反差的曝光量范围。类似胶片宽容度的定义,数码相机的宽容度是指传感器能够感光的最大光强与最小光强之比,一般认为,在摄影上动态范围与宽容度是可以通用的。
线性响应
如果“理想”胶片是真正线性的,那么曝光量每增加一次,密度就会增加一倍,即场景中的光量增加一倍,最终图像的亮度就会增加一倍。线性响应意味着总会有一些亮度范围超出了胶片的限制——场景中过于明亮的部分无法被记录,它们在胶片上显示为纯白色(在视频中,称之为白切割),没有细节,没有纹理。当然,场景中非常黑暗的部分也会发生同样的情况。由于许多场景的亮度范围超过了相机和显示器的能力,因此纯粹的线性响应会使场景的某些区域在极端情况下偏离比例。即使有最先进的新相机,这在电影摄影中也永远是个问题,毕竟即使是人眼也无法适应现实世界的亮度范围。
摄像机中的线性关系,意味着它们在输入(场景亮度值)和输出(像素亮度值)之间有一对一的对应关系,这只是意味着在转换过程中数据没有变化。对于场景中亮度级别的每一次变化,感光点的输出级别都会发生相应的变化,这似乎很理想。但是由于现实世界的亮度范围通常很大,所以当前没有传感器、监视器或投影仪能够适应如此大的亮度范围。因此,对可以记录和使用的亮度范围要有一定的限制。
胶片特性曲线
图1显示了胶片的响应曲线,主要呈现为S形,因为在胶片上,高光的化学反应会随着曝光量的增长而下降,也就是说,在曲线的某一点之后,图形不再是直线,增加越来越多的光线最终会产生越来越小的效果。这是因为乳胶膜中的银晶体饱和并停止反应。类似的现象也发生在阴影中(图1的左侧部分)。当感光材料在曝光过程中开始撞击银晶体时,由于银晶体对光的反应延迟造成的,乳剂不会立即产生反应,所以曲线会在一段时间内保持平坦,这会导致胶片曲线的趾部开始变平,然后慢慢向上弯曲,最终成为曲线的直线部分或中间调。在高光中,银晶体最终达到饱和点,随着越来越多的光子涌入,化学反应开始放缓,然后完全停止,最终成为了胶片特性曲线的肩部。
数字摄影中的伽马原理
胶片伽马(Film Gamma)和数字视频伽马(Video Gamma)
在胶片中,伽马是曲线中间(直线)部分的斜率。更陡的直线反映出来的图像对比度更大,Y值(图像亮度)随着X值(场景亮度)的每一个单位的变化而变化得更快。斜率比较小意味着像素亮度的变化速度比图像亮度慢,这会导致对比度较低的中间色调。
视频伽马则是一个幂函数,它可以是上升曲线或下降曲线,这取决于该值是否大于或小于1(伽马值为1将是一条直线)。在视频中,主要取决于X数量的电输入所产生的像素亮度,如果我们改变伽马,在相同的原始电信号下像素可以变得更亮或更暗。
显示设备的伽马设定
大多数早期的显示设备都是阴极射线管(Cathode Ray Tube)显示器,它有自己固有的伽马曲线,并且它们的红色、绿色和蓝色显示是非线性的,称为光电转换函数(OECF),它的平均功率函数约为2.4。
如前文所述,人类视觉以非线性方式感知亮度,它的伽马值约为0.42,刚好是2.4的倒数(1/2.4=0.42)。因此,图像工程师们在电视的早期发展就意识到,摄像机必须在前端安装伽马校正来补偿这一点。简而言之,摄像机上的伽马编码与CRT监视器的伽马特性相反,且两者相互抵消。
Rec.709
ITU-R Recommendation BT.709,简称Rec.709(或BT.709),Rec.709规范了包括颜色空间、伽马曲线、纵横比、帧率等工程细节。Rec.709是“所见即所得”,它被设计为显示相关(Display Referred),这意味着来自摄像头传感器的对比度范围被映射到标准对比度范围,以适应特定的显示设备。为了做到这一点,它将所有颜色值纳入一个相当有限的范围。Rec.709传递函数主要是幂函数曲线,但底部有一个小的线性部分,斜率还非常大,当相对光强接近0时,曲线接近垂直,这意味着将在场景的黑暗部分造成无限增益和噪声。从技术上讲,Rec.709只有五档动态范围。一些相机或摄影机有Rec.709输出,用于观看或记录,但是如果没有后期制作来进行色彩校正,那么就不是Rec.709的“所见即所得”,不过在专业的Rec.709显示屏上看,效果将会很不错。
数字电影摄影中的伽马控制
膝部控制
膝部控制調整在大多数相机中通常包括两个单独的调整:斜率和膝点。斜率是高光或膝部响应的角度,显然,较低的斜率意味着亮度的变化只是缓慢地改变图像的亮度,即低对比度。较高的斜率意味着图像亮度变化非常快,即对比度更高。这通常用于适应场景中的一些明亮高光,膝点控件允许摄影师选择斜率调整在曲线上的起始位置。
黑电平展宽
在趾部区域(阴影区域)使用类似的策略。不同的相机公司使用不同的术语,但黑电平展宽(Black Stretch)或黑伽马(Black Gamma)是该功能的典型名称。它会改变曲线下端的斜率,使其或多或少具有对比度。
HyperGamma/CineGamma/Film REC
仅仅改变斜率和拉伸膝部和阴影区域可以达到很好的效果,但毕竟这是一种有限的方法,可能会导致一些看起来有点不自然的图像。多年来,摄影机制造商提出了更复杂的方法来扩展摄像机的动态范围。摄影机制造商开发了几种不同版本的伽马编码,它们被称为HyperGamma、CineGamma、Video Rec、FILM Rec等,根据摄影机品牌的不同,不同的伽马名称有所不同,旨在扩展相机的动态范围。动态范围越大,曲线越平坦,对比度越低。
数字电影摄影中伽马的应用——RAW和Log
RAW
拍摄RAW格式也只是在Red One时代流行起来的,自从第一部RED摄影机问世以来,他们的色彩科学一直在发展,并提供了几种选择:RedGamma 2、RedGamma 3和Redlogfilm。这些是不同的配置文件,用于在设置时查看,以及在将RAW文件导入编辑或调色软件时进行转换,它们为成像提供了起点,并为后期制作过程提供了指导。
RAW简而言之就是在感光元件运作生成图像之前的数据信息,摄影机通过镜头来采集光线,并将光线解释计算后形成图像。而RAW视频是将相机在生成影像文件之前捕获到的还未解释计算的光,记录为1和0的数字文件。RAW的意义就在于代表了感光点的点数据,所以RAW没有办法用监视器看见。但这不代表RAW就不是视频,RAW是需要转换成视频才能看见和使用。
RAW数据是以线性记录的,虽然线性视频几乎不损失数据,具有非常高的后期空间,但是其也有很明显的弊端。除了在曲线的顶部和底部可能丢失数据外,线性视频还有另一个问题,就是它在每档使用比特数方面效率极低。造成的影响就是在动态范围的前四档会受到很大的影响,这也是“向右曝光”这一理念的由来。
Log
有一种解决方案可以解决这种效率低下的问题:Log编码。Log这种格式来源于胶片扫描系统Cineon System,系统将胶片扫描成与原始胶片密度相对应的 Log格式,这种方式是胶片转数码储存最优化的方式。虽然它只是一个带有扫描仪、工作站和激光胶片记录器的完整系统,但正是这种文件格式对图像制作产生了持久的影响。柯达的工程团队决定,胶片图像可以完全捕获在一个10位的Log文件中。它的目的是作为一种数字中间片(DI),而不是用于交付、CGI或任何其他用途。因为它起源于胶片,所以整个系统都参考了胶片密度数据。
Log在概念上与伽马类似,因为它降低了响应曲线的斜率,以扩展动态范围,从而在不造成白切割的情况下捕捉和记录亮度值。两者之间存在差异,Log不是对曲线应用幂函数,而是使用了对数曲线。对数函数的一个关键要素是,Y轴值的间距不均匀。对数曲线和幂函数曲线在绘制时看起来有些相似,它们的操作方式也很相似,但存在数学和结果上的差异,摄影机厂商和软件设计师可以利用这些差异,通过这些差异来实现特定的目的。
RAW和Log的关系
Log和RAW是完全不同的两种概念,然而,许多拍摄RAW的摄影实际上记录了Log编码的数据,在大多数高端摄影机中,传感器产生的数据(更高的位深度)比使用当前技术记录的数据要多。有些相机确实能够记录未压缩的RAW图像,然而,有时候拍摄条件不允许或是并不需要使用RAW记录,RAW会产生相当大的存储压力和处理压力,其他录制选项,Rec.709或P3,是一个宽色域的颜色空间,也是数字电影所倡议的和行业标准。
摄影机专有的LOG曲线
摄影机公司广泛使用LOG曲线来记录图像数据,每个制造商都设计了一个或多个Log编码方案,这是他们寻求更好的相机Log曲线方案。Arri使用Log C,RED有RedLogFilm,索尼使用S-Log,佳能相机使用C-Log,Panavision使用Panalog等。
ARRI的Log C
ARRI的Log C基于Cineon密度曲线,并与基于Cineon的LUT一起用于编译,其中的C即是Cineon。Log C曲线是场景的对数编码,这意味着在很宽的动态范围内,以档为单位测量的曝光与信号之间的关系是恒定的,每一档都会增加相同数量的信号。Log C曲线的整体形状与胶片的曝光曲线相似。然而,由于传感器和底片之间的根本差异,颜色特性仍然不同。
Log C不是一个单一的传递函数,它实际上是一组不同EI(曝光指数)设置的曲线。所有这些曲线都将18%中灰映射到代码值400。Log C曲线的最大值取决于EI值。原因就是,当降低一档曝光时,传感器将捕捉多一档的高光信息,由于Log C的输出值代表的场景曝光值,因此最大值需要更高。EI值高于1600的曲线(包括显示的EI 3200曲线)有一个额外的肩部,以将Log C编码的最大值保持在可用的输出范围内。在实施Log C编码时,改变El值不会改变动态范围。然而,它确实会影响总范围在中灰上方和下方的分布。对于可能需要适应高光或阴影中存在一些关键细节的场景的摄影师来说,这可能是一个有用的工具。
Alexa的曝光宽容度不会随着不同的曝光指数(El)设置而改变。大多数数码相机,在特定的El设置(通常称为原生EI)下具有最大的曝光宽容度。选择高于或低于最佳设置的El设置,有时会导致曝光宽容度损失惊人地大。Alexa的独特之处在于其14档的曝光宽容度在El 160到El 3200之间保持不变。
SONY的S-Log
S-Log有三个版本,S-Log1、S-Log2和S-Log3。因为S-Log的编码值从未达到黑白的极限,所以S-Log曲线看起来非常平坦,因为场景中的正常阴影值从来没有达到黑色的最小编码值,S-Log并不具有像ARRI一样的不同曝光指数都具有相同的动态范围的能力。S-Log3是一种动态范围为1300%的对数信号,接近Cineon Log曲线。
由于与普通视频拍摄相比,在Log拍摄中观看视频时,曝光更难确定。关于S-Log2的标准,18%的灰度是以32%的视频级别为基础拍摄的。在拍摄电影时,有几种检查曝光的方法,例如使用波形、斑马线显示和假彩色。FS5的s-Log2具有非常宽的14档的动态范围,对高光有很高的容忍度,并防止大多数白电平切割。如果使用实际的Log图像进行监控,可能会误以为要继续提高曝光率,因为由于Log拍摄对高光的高动宽容度,数据最终仍在直方图范围内。通过拍摄比标准亮度更亮的片段,然后进行后期处理时将其压暗,来确保噪声不明显。然而在这种情况下,动态范围将缩小。当然更好的方法是在拍摄时打开和关闭LUT以检查图像。