罗新艳
(中央电视台,北京 100859)
视频技术
4K影视制作输出打包方式与色彩管理
罗新艳
(中央电视台,北京 100859)
介绍4K技术在影视制作中输出打包方式与色彩管理的要点,并结合相关软件进行问题探讨。
数字院线文件包;超高清技术;数字电影;影视制作输出;打包方式;色彩管理
2014年巴西足球世界杯期间,索尼和国际足联利用4K(UHD,超高清)技术记录了赛场上的每一个难忘的瞬间,令人震撼的4K浪潮席卷全球。4K数字摄影机具有高帧率、宽色域、高宽容度等优势,在拍摄质量上已全面超越采用传统胶片记录电影的方式。目前,电影的数字中间片(Digital Intermediate,DI)制作和数字影院放映都支持2K和4K分辨率,大量的4K电影都是用35 mm或65 mm胶片拍摄后扫描成4K数据,再用4K数字中间片工艺制作。现在,部分厂家的某些型号数字摄影机在分辨率、宽容度、灵敏度和色域等关键性能上都已达到甚至超越了65 mm胶片的拍摄效果,实现了4K制作流程中最后也是最困难的拍摄环节的数字化,4K数字影视中间片制作流程已全面畅通。
DCP全称是Digital Cinema Package(数字院线文件包),是电影制作完成后,用于数字影院播放的文件包。对于目前以数字方式拍摄制作的电影来讲,制作流程(见图1)可以分为以下几步。
1.1 前期拍摄
采用数字摄影机,拍摄记录大于12 bit RAW格式的素材文件,并导出为DPX(Digital Picture Exchange,图片序列格式)、TIFF(Tagged Image File Format,标签图像文件格式)、OpenEXR(开放标准的高动态范围/高精度色彩的图形文件格式)等无损的数字中间片格式,同时可导出一版低码率文件用于粗剪。数字拍摄时,用两种方法可以得到低码率代理文件。第一种方法是,使用内置和外置的记录单元同时记录相同时码的高码率数字负片 RAW(原始数据)和低码率代理文件,高码率素材为16 bit直线或 10/12 bit对数伽玛(Gamma),低码率代理文件设置为 8/10 bit电视伽玛,这样就可以在计算机和监视器上看到正常对比度和彩色的图像。第二种方法是,数字摄影机用内置或外置记录单元记录高码率素材文件,在拍摄现场备份素材文件时用专用设备把所有素材文件转换成相同时码的离线编辑用低码率电视伽玛代理文件。
1.2 后期制作
获得数字中间片之后,后期软件中完成低码粗剪、套片精剪、调色、特效、合成以及混音的过程。整部影片制作完成之后,就可以制作数字信源母带(Digital Source Master,DSM)了,一般转换为无损16 bit TIFF图像序列或DPX序列,音频部分是24 bit 48 kHz/96 kHz的无损PCM文件。数字信源母带用来进一步制作影片的各种发行版本,比如影院、DVD等。其中的影院版,即数字院线发行母带(Digital Cinema Distribution Master,DCDM)。DCDM的技术规格由数字院线联盟(Digital Cinema Initiative,DCI)制定:
●2K级别:分辨率2 048×858(2.39∶1)或1 998×1 080(1.85∶1),24 f/s或48 f/s(支持3D,左右眼各24帧)
●4K级别:分辨率4 096×1 716(2.39∶1)或3 996×2 160(1.85∶1),24 f/s(不支持3D)
图像格式为16 bit无损TIFF序列,伽玛值为2.6,X'Y'Z'色彩空间,白点5 500 K,音频格式为24 bit 48 kHz/96 kHz无损PCM文件。
1.3 影院放映
由于文件存储空间过大,不便世界各地同时发布等原因,影院并不播放无压缩的DCDM文件,而是播放数字院线文件包(DCP)。DCP是一种数字文件集,用于存储和转换数字影像的音频、图像和数据流,采用MXF格式进行封装。其中,包含音频和视频流,以及XML格式的辅助索引文件,图像部分是将DCDM的无损图像序列以JPEG2000小波变换的方式进行有损压缩,依然采用X'Y'Z'色彩空间,色深降为12 bit,码率控制在250 Mb/s;音频方面不进行压缩,直接将译制后或者原版的内容打包至MXF容器中。MXF文件包中还含有压缩、编码和加密的数据流,以此来减少所需的大量存储空间和防止未授权使用。音频加密标准采用的是CBC模式中的AES-128 bit。
如图1所示,数字电影与电视节目的制作流程差异已经不大,只是在最后的输出及监看时略有不同。对于4K电视节目制作,并有影院播放需求的,由于目前的软硬件设备直接剪辑制作4K RAW文件,存在效率极低、存储空间占用过大等问题,因此,4K电视制作流程采用电影的粗剪、套片等流程,完成后最终输出4K DPX序列(相当于电影中的DSM版)。但略去电影流程中的DCDM这个没有必要在电视4K制作中出现的版本,直接使用软件将4K DPX序列打包为DCP文件。
3.1 码率
虽然DCI规定了4K的帧速率为24 f/s,但仍然有少数4K投影及DCP打包软件可以支持到最高4K 60 f/s。
实际上,DCI规定了DCP文件最大码率是250 Mb/s,这就造成了2K-24P和4K-60P的最大码率是一样的。而基本上全部打包DCP的设备或软件也遵循该规定,最大只有250 Mb/s码率的设定。这明显对于4K分辨率、高帧速率的影片存在着压缩比过大的问题,导致了画质有一定的降低,且降低的程度超出了DCI制定规范时的预估。
3.2 色彩空间的转换
色彩空间源于英文“Color Space”,也称为“色域”,建立不同维度坐标系统的色彩模型定义色彩范围,来表示某一色彩。一组编码值,如[0.506,0.266,0.266]本身是不足以指定一种颜色的,三个数字所代表的颜色在不同的色彩空间中是不同的。这些编码值必须由一个特定的颜色空间来解读。
色彩空间可分为两类:与设备无关的色彩空间,使用绝对数值还原色彩;与设备相关的色彩空间,对色彩的还原取决于具体的硬件特性。与设备相关的色彩空间依赖于某一特定的相机、投影机、打印机、显示器或其他装置本身的特性,发送相同的数字颜色代码值到不同的数字电影放映机以及电影胶片记录仪时将产生不同的颜色。
然而,设备的特征是可以描述的。特征描述涉及到按照绝对色度表精确地测量它们的响应。这样,特征描述提供了一种与设备相关和与设备无关的色彩空间之间转换的方法。sRGB(由惠普公司和微软公司开发的标准色彩空间,standard Red Green Blue)和AdobeRGB(由Adobe公司推出的色彩空间标准)本质上是与设备相关的虚拟空间,但特征描述文件将会使它们变得像与设备无关的色彩空间一样。
为了使特征描述持续有效,设备必须进行校准,包括调整装置的参数(如选择的基色、白点和Υ值),以达到预期的显示目标。这个过程必须周期性地重复,因为长期使用会导致器件的响应值产生漂移。
因此,DCI在数字电影编解码系统中改为采用 X'Y'Z'色彩空间(见图2)。CIE XYZ是由CIE(国际照明委员会)定义的与设备无关的加色制色彩空间,通常作为国际性的色彩空间标准,用作颜色的基本度量。而X'Y'Z'是对CIE XYZ进行编码后的一种色彩空间。
要获得X'Y'Z'数据,应先使亮度Y为亮度的绝对值对CIE XYZ进行调整。由于数字电影屏幕的参考白光亮度为48 cd/m2,而CIE XYZ中白光的亮度Y为1,因此调整系数为:k=48。使用这一系数对CIE XYZ的三个分量分别进行调整:
Xa=k·X, Ya=k·Y, Za=k·Z
再对上述Xa、Ya、Za分别进行归一化(除以52.37),伽玛校正(Υ=1/2.6)和范围扩展(扩展为12 bit的整数)后,得到X'Y'Z'分量,其中对X'分量的处理为:
X'=INT[4 095×(Xa/52.37)1/2.6]
当通过DCI Server(服务器)放映到银幕上时,数字放映机将X'Y'Z'空间又转换为DCI-P3规范的色彩空间。也就是说,无论给到DCI Server的是什么色彩空间的文件,数字放映机都会按照X'Y'Z'到DCI-P3来转换。例如,DCI Server中是ITU709或DCI-P3色域的文件,数字放映机就会将ITU709或DCI-P3色域认为是X'Y'Z'空间,然后进行一次到DCI-P3的转换。这就造成了颜色失真错误。
现在,很多影院数字放映机播放时支持将X'Y'Z'转换为ITU709,即无论给什么色彩空间的文件,都进行X'Y'Z'到ITU709的转换。但ITU709色域比DCI-P3还小,其作为比X'Y'Z'小得多的色域,在X'Y'Z'到ITU709转换时会造成3倍于ITU709原片的噪波。虽然目前对硬件产生噪波的抑制愈加成熟,但由于片源原因,绝大多数院线投影也都遵循DCI标准,设置为X'Y'Z'到DCI-P3。
从上述流程可以看出,4K电视制作流程中完成RGB色彩空间(ITU709和 DCI-P3都基于RGB空间)到X'Y'Z'色彩空间的转换是在打包软件中,而电影是在DSM到DCDM版本的制作中,使用后期软件完成的该颜色空间转换。
3.3 投影设备设置
目前,影院的数字放映机在完成X'Y'Z'到ITU709的转换时,有Limited Range和RGB Full Range设置。
实际上,由于4K电视制作流程中采用dpx(Digital Picture Exchange)无压缩制作输出,即文件中包含完整的0~255(以8 bit为例)的信息,因此就会出现如下结果:
(1)当投影设置为Limited Range(16~235)时:
影片里所包含的0~16级灰阶信息全部映射成显示设备的16灰黑,同理235~255映射为235白,就造成画面发灰发白、黯淡无光。
(2)当投影设置为RGB Full Range(0~255)时:0~255 全部范围显示灰阶输出正常。
在整个制作流程中需要色彩管理,以确保调色师在调色时看到的颜色与最终呈现在影院投影上的颜色一致。
在SMPTE RP 431-2: 2011 D-Cinema Quality-Reference Projector and Environment中提到了4种不同的P3色域及白点:P3 D55,P3 D61,P3 D65,P3 DCI WHITE。任何一种最终都可以使用。因此,在4K电视制作流程,最好的选择是D65,但最终需要和影院确认白点位置。表1列出了4K电视节目制作影院版时DCP各流程中涉及到的色彩空间。
表1 4K电视制作流程中各阶段的色彩空间
5.1 调整监视器
校色时若没有数字放映机和标准银幕作为图像监看,则需要按照不同需求来调整制作过程中的监视器:如院线最终呈现DCI-P3色域,则需将监视器调整为DCI-P3(Gamma 2.6,白点D65);如最终院线呈现为ITU709,则将监视器调整为ITU709(Gamma 2.2,白点D65)。目前少量厂家的4K(UHD)监视器已经支持DCI-P3色域,Eizo某些型号显示器也可设置为DCI-P3色域进行观看。
5.2 色域制作
一般的后期制作软件没有设置ITU709色域制作或者DCI-P3色域制作这样的选项,因为色域的呈现都是在监视器上观察到的,而后期软件只是输出给监视器电平。实际上,后期制作或调色软件处理时,都是按照最高16 bit/32 bit RGB方式来运算的,然后再转换为电平值输出给监视器。同样的输出电平,监视器如果设置不同的色彩空间,则颜色就不同。因此,后期软件本身处理没有色彩空间上的限制,但后期软件可以有“合法709”等视频指标的限制,是为了保障播出安全,该限制对颜色也有影响。
5.3 色彩空间的转换方法
后期编辑调色软件大多可使用LUT(Look Up Table,映射表)等来进行色彩空间的转换,但转换只是基本准确。
例如,最终院线需要DCI-P3色域,而高清播出版需要ITU709色域,则可采用以下几种方法。
(1)将监视器的色域设置为ITU709,在此环境下,调色师看到的颜色都是ITU709空间的,成片输出dpx时,可套用ITU709到DCI-P3的LUT,来进行颜色转换,将ITU709色域转换为DCI-P3色域。这样做的好处是,保证高清播出版颜色准确,院线版的颜色基本准确。
(2)支持DCI-P3色域的监视器,则可在P3环境下调色,调色师看到的颜色都是DCI-P3空间的,成片输出dpx时,不用套用任何LUT,直接输出,打包软件将色彩空间转为X'Y'Z'。院线播放时,又被数字放映机从X'Y'Z'转回DCI-P3,相当于DCI-P3到 X'Y'Z'到DCIP3。这样做的有利之处是,保证院线版准确,高清播出版则需套用DCI-P3到ITU709的LUT,颜色基本准确。
(3)为了色彩精准,分别在DCI-P3和 ITU709色域的监看环境下进行色彩校正,ITU709色域下的校正生成文件送高清播出,DCI-P3色域下的校正生成文件送到数字院线。
(4)采用Academy IIF-ACES流程
如图3所示,最大的三角形是Academy IIF-ACES(AcademyImage Interchange Framework- Academy Color Encoding Specification, Academy图像交换框架-学院彩色编码规范,是美国电影艺术与科学院为提高电影、电视制作质量提出的新一代制作标准)标准可显示的色彩。美国电影艺术与科学院引入IIF的目的是用更高的精度整合胶片与数字拍摄资源,消除不同图像格式转换时的彩色误差,在不同设备的流程之间提供改善的色彩管理,以高精度母版为基准支持胶片和数字电影、电视等多种发行方式。制定Academy IIF-ACES的主要原因是,Academy认为胶片已经不再是影视制作中的主要交换格式,数字设备逐步成为主要拍摄手段,而现有的图像和编码格式都是以电影或电视伽玛为基础制定的,难以满足高质量的模板制作标准;而IIF支持高宽容度、大色域图像制作,是超越现有电视空间、对数空间的线性空间。其实在IIF之前,工业光魔(Industrial Light and Magic)的Open EXR格式就已经开始使用16 bit直线伽玛,Open EXR格式也被ACES吸收,成为IIF标准的一部分。IIF的核心是用高精度16 bit直线伽玛与人眼可见色域相同的大色域制作母版,以保持最高精度的图像质量,然后再根据需求转换成符合电视空间或对数空间显示的图像文件。由于IIF工作在线性空间,因此在制作过程中必须使用LUT将线性空间转换成适合大多数监视器和数字放映机显示的电视空间,才能实现制作时的“所见即所得”。
ACES相当于一个“黑匣子”,将任何空间的素材都可转换为最广阔的ACES色彩空间,在此空间下进行制作,输出时再将ACES空间转换为所需颜色空间(ACES到P3,ACES到 ITU709,ACES到X'Y'Z',ACES到sRGB,等等)。其存在的意义在于建立了一个统一标准。ACES色彩空间超过人眼可视全部颜色范围,同样由于不可能有支持该空间的显示设备,所以,编辑调色时需要加载ACES到 ITU709的LUT,以便看到的是ITU709的颜色。否则,由于素材被转换至ACES空间,本来输出到ITU709显示器上看起来正常的电平值在转换过程中有了改变,再输出到ITU709监视器上就会有色彩偏差(同理,对于P3也一样)。但ACES的缺点是占用存储空间。因为按照ACES流程,任何素材都转换为16 bit线性来进行存储。
制作数字电影时,在ODT部分应选择ACES到DCIP3色域变换;而在制作4K电视节目时,应选择ACES到Rec2020色域变换;若是制作高清电视节目时,应选择ACES到ITU709色域变换。归档时为了保留素材的原始属性和尽可能多的元数据,最好在IDT转换后的ACES色彩空间下用Open EXR文件格式保存。
目前,打包及可播放DCP的主要软件包括以下几种。
DCP打包软件:CuteDCP、DCP Tool、easyDCP Creator、OpenCubeDCP、OpenDCP;
播放软件:dcpPlayer、easyDCP Player、Stereoscopic Player。
图4、图5是使用easyDCP、openDCP及Autodesk Smoke(Flame同)三种色彩空间转换方式得到的X'Y'Z'空间下的两组图像。
可以看到,使用以上三个软件进行空间转换,得到的结果只有极小差别,但并没有做到颜色完全一样。实际上,ITU709到X'Y'Z'虽是固定的计算公式,可有些打包软件为了提高效率,在空间转换上的算法并不一致。例如,某打包软件的算法描述如下:在逐像素转换过程中,除了RGB到X'Y'Z'空间的转换,在Gamma矫正运算上也会使打包效率降低。因此,该软件会判断“当前像素的R、G、B值与上一个像素的R、G、B值的差是否在设定范围内,若是,则将上一个像素的X'Y'Z'值替换当前像素的R、G、B值”,导致了这些软件结果的轻微差别。所以很多调色师会本着“所见即所得”的原则,部署院线的同型号数字放映机,让调色师对着银幕调色而不是监视器调色。
从电影由胶片转向数字的那一刻起,电影技术就与数字技术紧密相联。电影技术不再像过去一般发展缓慢,而是搭上了数字技术的火箭,以一种日新月异的新姿态冲击着业界人士的思维观念。过去电影一直以视听媒体高端产业自居,电影界与电视界之间泾渭分明,但在数字时代,两者在技术上的壁垒渐渐被打破,电影逐渐走下神坛,不用有大资金的支持也能制作电影。而且随着民用数字视听设备的不断更新换代,4K分辨率的投影设备及显示设备很快就会普及,老百姓坐在家中欣赏4K电影也指日可待了。
(编辑 张冠华)
Packing Mode and Color Management in Output of 4K Film and Video Production
LUO Xin-yan
(China Central Television , Beijing 100859, China)
The paper introduced the keypoint of packing mode and color management by DCP (Digital Cinema Package) outputing while producing film and video with 4K technology, and discuss some questions with some software.
digital cinema package; ultra HD technology; digital film; film and video production output; packing mode; color management
10.3969/j.issn.1674-8239.2015.06.011