张添一,李果夫
(1. 上海大学 上海电影学院,上海 200072;2. 上海理工大学 出版印刷与艺术设计学院,上海 200093)
1905年,北京丰泰照相馆拍摄了中国第一部影片《定军山》.自此,中国电影踏上了百余年的发展之路.在这百余年间,数以万计的老电影经历了来自保存环境(温度、湿度、灰尘、真菌等)、历史文化变迁和人为破坏(拉伸、划痕、手印等)等多方面的严峻考验[1].时至今日,影片《定军山》只能见于文字,被称为中国电影保存的“国库”——中国电影资料馆,馆藏年份最久的影片是1922年上海明星公司出品的3本故事短片《劳工之爱情》.纵观现存影片,大多存在退色、霉点、齿孔收缩、划痕及声道受损等不同程度的损坏问题.因此,为老电影胶片,尤其是磁底(negative,即电影原始底片)提供适宜的存放环境,同时对这些素材进行修复、清洁及其他相关处理成为了保护历史影像资料的必要措施.
随着科技的发展,“数字化”自20世纪末走进了老电影修复领域.物理修补、清洗电影胶片,配合数字化转换及保存,成为了当前国内外对老电影及各类历史影像资料保护的主流方式[1].2005年,由我国投资2.8亿,由中国电影资料馆主持的持续性重点项目“电影档案影片数字化修护工程”正式启动[2].截至2014年,我国完成数字化转换的影片有6000余部,精致修复经典影片约200部[3].但以现在的修复速度,仅修复中国电影资料馆的20000余部老电影就要1000多年.因此,在老电影胶片性状不断恶化的情况下,提高电影修复效率成为了电影修复工作需要克服的首要问题.
当前电影修复速度无法大幅提升大致出于以下两个原因: 一是从事电影修复的专业人员较少;二是在修复过程中需要人工干预的成分较多(如对噪声的人工分拣).电影修复作为一个综合性、跨学科的交叉工程,培养专业修复人员代价高、周期长,因此目前对能高效并准确地进行自动化修复的工具及相应算法有着急切的需求.本文介绍了当前老电影的声音修复过程,为智能系统的设计提供参考依据;同时对其噪声特点、分类及当前数字化噪声处理方式做了深入研究和总结,为智能算法的研究提供了必要的学习数据集和标注方案.
老电影声音修复的主要目的是将当前的声音恢复至尽可能接近电影拍摄时的声音.因此,在选择修复素材时,一般以磁底为最佳[4].选定修复素材后,电影的声音修复将经历胶转数(即老电影声音数字化)、数字音频文件确认和具体的数字化修复过程,流程见图1.
图1 老电影声音数字修复流程图Fig.1 Flowchart of digital soundtrack restoration for old films
在电影声音数字化之后,声音数字修复部门将拿到修复好的完整视频素材,以及每卷胶片数字化后的未修复数字音频文件.每部电影包含6到12段不等的单声道音频文件,每段时长约10min.需要注意的是,有少部分4声道(左、中、右、环绕)老电影[5],其音频素材包里的音频文件数量即为单声道电影的4倍.拿到数字音频文件后,声音数字修复人员需要先检查每个音频文件是否包含明显的由转速过快或过慢带来的变调等问题,若无明显变调、失真现象,即可建立该影片的修复工程文件,将所有音视频素材导入其中,开始数字修复工作.
声音数字修复的第一步是将音视频文件同步.无论对白还是音效,都要与视频一一精确对应.在此环节中,较常见的问题是同一段音频素材前面部分能够与画面对应,而后面部分由于声音素材越来越快,以至于无法与画面准确对应.该问题的解决方案是对同一影片的全部音频素材做参数相同的Time Stretching处理(以Pro Tools软件为例,使用Time Shift插件时,需设置为只改变音频文件长度,不改变音调).一般速率设定在99%到99.9%之间,需要视实际音视频素材情况而定.据上海电影技术厂专业修复人员介绍,整个音视频同步环节约占一般性声音数字修复工作时间的30%.另外,在这个环节中,每个音频文件前后由引导胶片(由于胶转数设备转轮间存在一定距离,为了能够兼顾固定胶片和完整转换素材,需要在每卷胶片的开头和结尾接入废旧胶片用于走带)带来的随机噪声和由胶片接头带来的小爆破噪声都将被一并去除.
声音数字修复的第二步是去噪.专业修复人员需要对老电影中可能会出现的高频嘶声、低频哼声、爆破声、咔嗒声等噪声做适度去除.在对声音不造成二次损伤的前提下,得到最接近原始状态的声音[6].所谓二次损伤,主要指由于操作不当或不够细致而导致的电影声音失真,声道数量错误等问题[3].音频素材去噪后,修复人员一般会通览全片,将在去噪过程中被误认为噪声去掉的有用声音信息还原.而对于本来在原声音素材中就缺失的声音信息,修复人员需要将缺失位置和缺失内容记录下来,方便以后通过重新翻录或拟音的方式将其补上.
声音数字修复的最后一步是频率补偿.由于去噪处理一般会对原声音素材带来音质损伤,因此专业声音修复人员会在去噪处理后,对影片的全部音频素材做相同参数设置的频率补偿处理,用于弥补在去噪过程中被过度降低的频段.
目前,关于去除老电影普遍存在的各类噪声问题,在国际上并没有很好的先例,在我国也没有相关方面的研究,普遍采用的降噪方法若遇到持续较大的电流声或频率与有用信息重叠的噪声,过度降噪会引发声音失真的问题.因此,在电影修复的过程中就产生了降噪与失真之间的权衡与取舍.中国电影资料馆修复专家的处理原则是在保证对白清晰度的基础上,酌情降噪,宁可保留,也不可造成二次损伤.上海电影技术厂的修复专家在去噪过程中也遵循着不以过度损伤音质为代价达到完全去噪目的的处理原则,坚持着“修旧如旧”的美学追求[7].修复后的电影对白清晰度和可懂度均有明显提高,同时又不失老电影的年代感和韵味,这与中国电影资料馆的修复专家的做法不谋而合.
我国所使用的电影声音修复工具与国外差别不大,设备方面也几乎是同步的[8].以上海电影技术厂老电影声音数字修复为例: 使用的声音数字修复平台为AVID公司的软件Pro Tools,当今国内外的电影声音制作基本都建立在该软件的平台上,利用该平台及安装到该平台上的软硬件效果器,音响师可以对音频素材做剪辑和音质处理,能够实现所有对一部电影在声音上的想象和创意;使用的主要去噪软件为iZotope的RX Audio Restoration & Repair Software系列插件,该插件中包含的De-noise、De-click、De-hum等工具在电影声音修复中使用率极高,主要用来去除背景噪声、爆破声、噼啪声和哼声等噪声.
本文以上海电影技术厂的电影声音修复资料为研究素材,分别从20世纪50,60,70,80年代的老电影中截取数十段噪声样本,结合上海电影技术厂对这些噪声的降噪建议,根据噪声的稳定性,对其进行分类梳理和声学特点分析.该研究为以后的自动化修复工具研发提供了一系列可靠、实用的噪声样本和人工标注数据集.
老电影中的背景噪声(background noise)以普通宽带噪声(broadband noise)、高频嘶声(high-frequency hiss)、交流电声(AC hum)及低频哼声(low-frequency hum)为最常见,此类噪声多贯穿电影始末.普通宽带噪声声压级不稳定,频带较宽,与有用声音信息频率重合,主要利用采样降噪De-noise的方式去除(De-noise插件主要用于去除背景噪声,如有一定音调的噪声和宽带噪声).交流电声的频率较分散,20Hz到20kHz均可能出现,音量较小,声压级较稳定,主要利用采样降噪De-noise和EQ(Equalizer)结合的方式去除.高频嘶声在声压级的稳定性上与交流电声相似,都较稳定.但与交流电声不同的是,高频嘶声的音量更大,频率一般集中在10kHz至14kHz.因此高频嘶声的主要去噪方法也是利用采样降噪De-noise和EQ结合,但有时也会利用De-hum工具来辅助去除谐波成分.低频哼声的频率多在100Hz到500Hz之间,音量较大,声压级较稳定.其降噪方式有两种: 一是利用采样去噪De-noise;二是先做去哼声处理De-hum,再去除与其同时出现的其他噪声(如噼啪声).以上4种噪声一般并不单独出现,而是组合出现,这就要求修复人员根据具体情况利用多种工具对背景噪声进行有效去除.下面列举4种背景噪声样本,并对其进行基础声学分析.
1) 高频嘶声 以上海电影制片厂摄制于1976年的《难忘的战斗》为例,详见表1中2016010201号噪声样本及图2.高频嘶声主要指图2(b)中放大的噪声部分,该噪声频率范围在11kHz至13kHz之间,由图2(b),(c)可见,12.4kHz处音量最大.该频带落在人耳可闻阈之内,即便是年纪较大或有轻微听力损伤的人仍能听到该频率范围内的声音.对此类噪声的一般处理办法是利用采样去噪和EQ去噪相结合的方式,在不严重损伤原声音素材的前提下适度去噪.
图2 《难忘的战斗》高频嘶声分析图组Fig.2 High-frequency hiss in Unforgettable Fight
2) 普通宽带噪声 以上海电影制片厂摄制于1981年的《阿Q正传》为例截取两段分别位于片头和影片中部,长度均为1s的噪声进行对比分析,见表1中2016010101、2016010102号噪声样本及图3(见第186页),图4(见第186页).在同一部影片内,背景噪声持续存在,虽不同位置的噪声频响曲线相似,但噪声能量稍有不同.从听感上对比,同一部影片内背景噪声的特点相同,但片头位置的噪声略大于影片中部的噪声.正是由于在影片不同位置的背景噪声音量不同,因此在降噪过程中需要对不同位置设置不同的降噪量,或对噪声较大的部分进行2次局部降噪.
图3 《阿Q正传》片头部分背景噪声分析图组Fig.3 Background noise at film title in The Real Story of Ah Q
图4 《阿Q正传》影片中部背景噪声分析图组Fig.4 Background noise in middle place of The Real Story of Ah Q
3) 交流电声 以上海电影制片厂摄制于1965年的《女司机》及1981年的《阿Q正传》为例,本文分别从两部电影中截取一段纯噪声样本(不含有用声音信息),见表1中2016010301、2016010302号噪声样本及图5,图6.这类噪声与之前介绍的两类噪声相比,音量较小但频带较宽,低频及中频部分在影片中将会和有用声音信息的频谱重合叠加.因此在修复此类噪音的过程中适合使用采样降噪,不适合用EQ对某频率点的所有声音元素做统一处理.另外,由图5和图6可见,在两部电影中都伴随着微弱的超高频噪声,频率点分别在12.5kHz和19kHz附近.因此,除采样降噪外,修复人员还常辅以EQ降噪,从而将高频噪声去除干净.由于这两段噪声均来自影片中的无声片段,且两部影片的年代不同、受损程度不同,却拥有相似的交流电噪声,在图谱的相近位置出现了相近的波形,因此可以推断此类噪声来自胶片数字化过程,而非影片本身.
图5 《女司机》交流电声分析图组Fig.5 AC hum in Driver Girl
图6 《阿Q正传》交流电声分析图组Fig.6 AC hum in The Real Story of Ah Q
4) 低频哼声 以上海电影制片厂摄制于1965年的《女司机》为例,截取一段低频哼声样本(含噼啪声,不含有用声音信息),见表1中2016010401号噪声样本及图7.这段噪声在100Hz和200Hz处低频哼声音量较大,并伴有噼啪声和交流电声.针对这类噪声处理办法有两种: 一是利用采样降噪De-noise;二是利用去哼声插件De-hum,根据噪声特点选择合适的谐波数量(number of harmonics)、Q值和去噪量等参数,将低频哼声去掉(2016010401号噪声De-hum去噪后的音频见2016110401号声音样本),然后利用De-click和EQ一一去除噼啪声和交流电声.相比于第1种去噪方法,第2种能够更有针对性的去除噪声,能够人为地减小对原声的损伤.
图7 《女司机》低频哼声分析图组Fig.7 Low frequency hum in Driver Girl
爆破声(pop sound)、咔嗒声(click sound)和噼啪声(crack sound)作为老电影中常见的脉冲型噪声(impulsive noise)可能会出现在影片的任何位置.由胶片接头产生的音量较大的爆破声[9],多出现在每段数字音频文件的片头和结尾位置,据统计,一般在00∶00∶11到00∶00∶15的位置.除此之外,由于影片条件不同,较大的爆破声有时也会出现在影片中部.在去噪过程中,若爆破声频带宽时间长,可以考虑直接将其剪掉,用相似的背景噪声补全.若使用去噪插件,则要注意此类噪声的(时间)宽度和去噪灵敏度参数的调节.若噪声宽度过窄,会导致遗漏某些噪声使之无法得到去除;若去噪灵敏度过高,会引发音量或音调的抖动问题.因此在实际去噪过程中,需要修复人员反复尝试对比,找到既能有效去噪又不对音质造成损伤的最佳值.而在有些影片开头结尾位置也会出现与爆破声相比音量更小,宽度更窄的咔嗒声.修复人员一般会利用De-click插件,使用中仍要注意对噪声宽度和灵敏度的参数设置.除以上两种噪声,还有以音量小,连续出现频率高为特点的噼啪声.对噼啪声的修复一般采用De-click插件,并将噪声宽度值调小,灵敏度值调大.与背景噪声类似,以上介绍的3种噪声很少单独出现,在同一片段内常常同时出现,并混有各类背景噪声.
下面分别举例3种脉冲型噪声样本,并对其进行基础声学分析.
图8 《林冲》爆破声样本图谱Fig.8 Pop sound in Lin Chong
1) 爆破声 以上海电影制片厂摄制于1958年的《林冲》为例,详见表1中2016020101号噪声样本及图8.此类噪声常出现在每卷胶片数字化音频文件的开头和结尾处,图8呈现的噪声出现在00∶00∶13.250处,读者亦可在表1中找到其他10个爆破声出现的位置.在老电影中,爆破声的呈现方式千差万别,无论是声压级,还是噪声时长都不尽相同.因此需要修复人员根据实际情况调整去噪插件中的参数.如图8中的噪声,可以选择直接将其剪掉,也可选择De-click插件单独对其去噪.
2) 咔嗒声 以上海电影制片厂摄制于1981年的《阿Q正传》为例,详见表1中2016020201号噪声样本及图9.去除咔嗒声一般也使用De-click插件,由于此种噪声可能出现在影片的任何位置,因此插件中的灵敏度值不宜过高,噪声宽度值也应比去除爆破声的参数小,以期避免对原文件的二次损伤.图9为《阿Q正传》第2卷胶片数字文件位于00∶08∶21.7至00∶08∶22.7的一段噪声及其去噪参数和去噪后的声音图谱.由图可见,咔嗒声已被去除,去除后的音频文件见2016120201号声音样本.另外,在去除咔嗒声的过程中,有时会出现软件误操作的现象[10],如关门声、脚步声等有用声音信息,以2016220201号声音样本(图10所示)为例,软件会将其误认为咔嗒声而去除.因此在对整个影片做De-click之后,修复人员一般会再认真地检查全片是否有误操作的地方,并将误操作处还原.
图9 《阿Q正传》咔嗒声分析图组Fig.9 Click sound in The Real Story of Ah Q
图10 《难忘的战斗》中的脚步声Fig.10 Footstep sound in Unforgettable Fight
3) 噼啪声 以上海电影制片厂摄制于1965年的《女司机》为例,详见表1中2016020301号噪声样本、2016120301号声音样本及图11.噼啪声在一段影片中出现频率较快,且每个噼啪声时间较短.因此在使用De-click对其进行去噪的过程中推荐在对原声不产生明显损伤的前提下,将灵敏度调大,噪声(时间)宽度调小来提高去噪效果.
图11 《女司机》中噼啪声去噪前后图谱组Fig.11 Crack sound in Driver Girl
修复老电影是一项长期且意义重大的文化保护工作,修复过程中面临的问题和挑战相当严峻.这不仅需要培养出更多专业人员投入到老电影的修复工作中,更是对科研人员从实用角度提出新的挑战,尽可能地研发出效率更高、准确率更高的去噪工具、频率补偿工具以及缺失声音片段的自动修补工具.本文不仅对当前老电影音频的人工修复过程做了简要的描述,为智能系统的设计提供了参考依据,而且从多部老电影中截取数十段噪声,对其进行分类梳理,并对这些噪声做了基础声学分析,为智能算法的研究提供了学习数据集和标注方案.
从本文的噪声样本中不难发现,不同噪声的去噪程度并不相同.在去噪过程中,理想去噪和不损伤原始音频素材很难兼得,需要修复人员认真反复权衡.这也导致了即便对同一段噪声做降噪处理,不同修复人员根据个人喜好,修复的结果也会有所差异,甚至差异较大,其主要原因在于老电影的声音修复并没有公认的可量化的评价标准.因此,针对中国老电影声音的一般修复和精致修复制定一套评价标准无疑是自动化修复工具研发工作亟待解决的问题之一.这一工作需要相关领域的学术圈与行业协会等部门共同协作完成,从权威角度对老电影声音的修复效果和修复工具的研发做出指导.
致谢: 本文为2016年度上海大学电影学高峰学科《浅析老电影的声音特点及其在电影声音数字修复中的作用》项目的成果之一.
[1] READ P, MEYER M P. Restoration of motion picture film [M]. Oxford: Butterworth-Heinemann, 2000: 83-84.
[2] 白晓飞.新技术形势下的影片数字化修护工程发展趋势研究 [J]. 现代电影技术,2012(4): 14-18.
[3] 贾艳婷.浅谈数字化修护影片的鉴定标准 [J]. 现代电影技术,2015(9): 44-47.
[4] CROCI S, AYDIN T O, STEFANOSKI N,etal. Advanced tools and framework for digital film restoration [J].JournalofElectronicImaging,2017,26(1): 011021.
[5] 李志永.档案影片声音素材的数字化修复 [J].现代电影技术,2011(7): 24-26.
[6] 左 英.论影片精致修复的工作流程 [J].现代电影技术,2009(1): 13-17,37.
[7] 吴 兵,董清爽.老电影数字化修复策略研究 [J].科技展望,2016,26(24): 320.
[8] 贾砚婷,闫 彦.影片数字化修复的工艺流程及未来发展方向 [J].现代电影技术,2014(7): 32-35.
[9] 白晓飞.浅谈电影声音修复技术 [J].现代电影技术,2008(2):49-52.
[10] BRUN E, HASSAINE A, BESSERER B,etal. Restoration of variable area soundtracks [J].IEEEInternationalConferenceonImageProcessing,2007,4(6): IV-13-IV-16.