姚国强 赫铁龙
电影声音是电影艺术的重要组成元素。尽管以苏联电影学派代表人物爱森斯坦、匈牙利电影理论家贝拉·巴拉兹以及德国电影理论家鲁道夫·爱因汉姆等人曾在历史的不同时间阶段对电影声音持有保留性甚至批评性的看法,但经过世界电影百余年的发展历程,声音的加入使得现代电影具备了讲述复杂故事的能力,完善了电影作为一种视听综合艺术的表现形式,并增加了电影的另一种维度——声音叙事维度,使电影具有更加丰富、多义的审美价值与表现空间。而不得不指出的是,声音如同画面一样,其录音制作手段、艺术表现方式及呈现效果与电影工业技术的发展呈现出了高度统一的关联性,且具有技术先导性的典型特征。换言之,录音制作技术的发展及变革直接地影响了电影声音的艺术表现力,也影响了电影声音在电影叙事表达时所起到的重要作用。随着数字技术、光导纤维技术、虚拟现实技术、人工智能技术以及5G超高速移动互联网技术的不断发展,电影声音无论从声音最初的录音拾取采集环节到中期的加工制作环节再到后期的影院还音环节都产生了极其显著的变化。如今,以杜比全景声(Atmos)系统以及虚拟现实(VR)声音技术为代表的新一代电影声音创作及录音制作技术极大地改变了电影的制作生态环境,在一定程度上代表了未来的电影声音的发展方向和录音制作手段。因此,对新一代在技术背景下的电影声音艺术创作及录音技术制作的发展进行学术理论研究,就显得尤为必要了。
1895年12月28日,卢米埃尔兄弟在法国巴黎卡普辛大街14号大咖啡馆地下室放映电影的举动被普遍视为电影的诞生。实际上,早在1895年之前,美国著名发明家爱迪生就与其助手迪克森共同发明了电影放映设备——活动视镜(Kinetoscope)以及与之配合用于拍摄电影画面的活动电影摄影机(Kinetograph)。此后,为了能够让观众在观影过程中听到声音,爱迪生团队后来还发明了一台装有圆筒留声机的活动电影放映系统(Kinetophone)。众所周知,爱迪生最早于1877年就已经发明了留声机,他从电话的受话原理中受到启发,通过将附着在金属圆筒上的锡箔作为录音介质发明出了世界上第一台留声机,为声音的记录做出了开创性贡献。然而,历史证明,爱迪生发明的电影系统并没有在日后成为主流。其原因主要包括两个方面,第一是相比于卢米埃尔兄弟的公开放映模式而言,爱迪生的电影装置每次只能由一名观众进行观看,这就大大限制了影片内容传播的效率,并且如若组织更多的观众观看时,就需要购置大量的放映设备,这与爱迪生致力于推广产品的商业考量不无关系。因此,在这场“个人独立观影模式”与“集体影院观影模式”之间的抗衡中,历史最终选择了后者。第二个原因是由于在电影诞生后的最初30年里,尽管电影技术从画面拍摄与声音录制方面都取得了长足的进展,但声音记录时长以及声音与画面之间的连锁同步技术一直没有得到有效的解决。爱迪生所发明的留声机无法充分满足长时间的放映,而声画同步这一技术问题直到20世纪20年代才得到了初步的解决。
1924年,美国西电公司(Western Electric)旗下著名的贝尔实验室发明了“维他风”(Vitaphone)电影同步录还音系统。在这个系统中,首先是将声音记录在一张以虫胶(shellac)为主要化学材料制成的唱片上,然后在电影放映的同时,通过一个特殊机构将胶片与唱片联动,实现声画同步的还音效果。
1926年,美国华纳兄弟公司推出了基于维他风电影同步录还音系统的电影《唐璜》(Don Juan)。这部影片中带有交响乐与音响效果,但却没有人物的对白。而在随后的1927年,该公司推出的《爵士歌手》(The Jazz Singer)则成为历史上第一部包含有人物对白的有声电影。
第二次世界大战结束后不久,以三氧化二铁(Fe2O3)磁粉或金属磁粉为基础化学材料的磁性录音技术极大地促进了电影录音技术的发展进程。此前,光学录还音系统的频率响应范围是在100Hz至7000Hz范围内,无法满足人耳所具有的20Hz至20kHz频率范围内的听音需求。因此,磁性录音技术的引入无论从频率响应还是动态范围上都极大地提升了电影录音和还音的技术质量,为电影声音的高保真化发展提供了极为有利的技术基础。
值得注意的是,在声音进入电影的初期,声音都是以单声道的形式进行还音的。而单声道的声音尽管能够体现出声音的纵深感,但由于只有一个点声源,故无法营造出符合人类双耳听音习惯的立体声场来。
1931年,英国EMI唱片公司的工程师艾伦·布吕姆莱因(Alan Blumlein)在与妻子看电影时发现当时的电影只有一个扬声器在发出声音,因此当银幕上的人物角色来到画面左右边缘时,他/她的视觉形象就与声音形象“分道扬镳”了。而为了使声音能够跟随银幕上的角色形象同时运动,布吕姆莱因在当年就提出了双声道立体声的技术构想,并于1933年在英国获得了专利。
1935年,这种基于立体声技术的、能够实现声音跟随画面角色形象同步运动的电影测试获得了成功。
为了进一步塑造更为真实可信的声音空间定位效果,从双声道立体声向多声道环绕声的发展和演进就成为了历史的必然。美国电影企业家华尔特·迪士尼从20世纪30年代早期开始研制多声道的录音技术,并于1940年随着电影《幻想曲》(Fantasia)的上映推出了一套特别的声音系统——幻想声(Fantasound)。这种声音的录制与还音系统包含有4个光学声轨,除了记录左、中、右声道的前面3个声轨外,第4个声轨记录的是前面3个声轨的音量控制信号。
20世纪50年代至60年代,多声道环绕声系统进入了快速发展期,多家国际厂商陆续推出了自己的环绕声系统;70年代以来,逐渐形成了以5.1声道(5个全频段的声道+1个超低音声道)为主要形态的多声道影院还音系统。其中,杜比(Dolby)多声道降噪系统的出现,很大程度上降低了磁性录音系统所存在的本底噪声,声音信噪比获得了极大的提升,使得声音音质得以大幅度改良,极大地丰富了声音的细节层次。因此,有学者甚至认为这是声音的第二次革命。
到了20世纪90年代,电影声音全面进入数字化时代。这时,以杜比SR·D(5.1声道)、DTS(5.1声道)和索尼SDDS(7.1声道)为代表的电影数字多声道环绕声系统成了当时电影录还音技术系统的主流技术。而其中杜比系统占据着最大的市场份额。虽然这三种数字电影声音制式已经能够在很大程度上为电影声音艺术的表达提供了足够的震撼感,但它们的扬声器的排列仍然是平面化的。
2012年,美国杜比公司推出了具有划时代意义的电影声音全景声(Atmos)还音系统,这套电影声音的录还音系统将电影声音带入了三维立体化的形态。因此,它的出现极大地改善了以往电影录还音系统只能在水平层面进行影院还音的技术模式。
2010年,我国的电影声音学者率先在国际上提出了“全维声”(“全维度环绕立体声还音模式”的缩写;All Dimension Surround Sound,缩写:ADSS),亦可称其为“全景化环绕立体声”(Panorama of Surround Sound;缩写:PSS)的新设想。其简要工作原理如下:在当下已在应用的电影声音数字5.1还音模式的基础上,在影院的天花板居中处再增加一个新的声道(顶置声道),用来播放自然界自上而下的各种声音,如天降大雨、直升飞机下降等从天上发出的声音;同时,在每个观众座椅的底部设置另外一个新的声道(底置声道),用来播放自然界自下而上的各种声音,如火山爆发、地震等从地下发出的声音,以配合3D数字电影中的故事需要。。
这个电影还音模式的提出要比2012年美国杜比公司推出的全景声系统早了至少有2年的时间。同时该全维声系统与全景声系统相比,真正的实现了在电影院内观影时,声音在观众的上下左右前后的空间里再现还音,由此我们称之为“空间声”。
图1.电影《玩具总动员3》剧照
20世纪80-90年代,随着数字技术的发展与成熟,电影院的声音还音系统也开始转向了数字化的新纪元。1987年,美国电影和电视工程师协会(The Society of Motion Picture and Television Engineers;简写:SMPTE)制定了电影院5.1声道环绕立体声系统的行业标准。其后,美国杜比公司率先于1992年推出了自己首个基于Dolby SR模拟技术的电影数字多声道环绕声系统Dolby SR·D(Spectral Recording·Digital),美国导演蒂姆·伯顿(Tim Burton)执导的影片《蝙蝠侠归来》(Batman Returns;1992)是首部采用这一录还音技术制作的电影。次年,美国DTS公司和日本索尼公司分别推出了DTS 5.1以及SDDS 7.1的电影数字多声道环绕声系统。其中,采用DTS 5.1系统制作的首部影片为史蒂芬·斯皮尔伯格(Steven Spielberg)执导的影片《侏罗纪公园》(Jurassic Park;1993)。此后,5.1声道的电影数字环绕声系统基本上成了后20年内国际电影院声音还音的主要制式。此外,杜比公司还分别于1999年以及2010年分别推出了Dolby SR·D系统的升级版Dolby Digital Surround EX以及Dolby Surround 7.1电影数字多声道环绕声系统。前者是在Dolby SR·D的基础上增设一个正后方环绕声道,使其变为6.1系统。此系统由杜比与美国卢卡斯影业旗下的天行者工作室(Skywalker Sound)共同研发。第一部用此技术录制的影片为乔治·卢卡斯(George Lucas)执导的《星球大战前传1:幽灵的威胁》(Star Wars: Episode I-The Phantom Menace,1999);而后者则是将正后方的环绕声道进行再度拆分,由5.1系统的两个环绕声道变为4个环绕声道。首部采用该技术录制的影片是2010年上映的是迪士尼与皮克斯联合出品的影片《玩具总动员3》(Toy Story 3,2010)。
可见,从最初的单声道、双声道立体声发展到Dolby SR 4-2-4模拟4声道,再发展到了Dolby SR·D与DTS的数字5.1环绕声声道,以及最终的Dolby Surround 7.1与Sony SDDS的7.1声道,现代电影院录还音系统中的声道以及扬声器数量上的逐渐增多已成为一个历史发展的必然趋势,类似于影院银幕尺寸的不断增大以及色彩丰富性的不断增强。因此,人们对于电影声音艺术品质的诉求与对于画面观感提升的诉求几乎是一致的,并没有出现在重视画面质量提升的同时而忽视声音技术质量的现象。
事实上,空间的维度自单声道向立体声转变的时候就已被引入了。立体声录音与还音技术借助人耳对声音响度、频率、相位等信息的综合判断从而实现了声音立体化的感知效果,使声源在由两个声道所重放的虚拟声场中能够进行定位和移动。而此前的单声道由于采用的是点声源的发声方式,声音始终来自中置扬声器的固定所在位置。因此,通过采用立体声技术进行电影声音的还音实际上已经在一定程度上实现了声音的空间化效果。而在后续的由2个声道的立体声到4声道的立体声再到主流的6个声道立体声的演变过程中,除了在影院后部增加声道以使观众能够接收到来自后方的声音信息外,其余的声道以及扬声器的增加只是对声场分区的细化而已,但其声场呈现的仍是在水平面进行平面化还音的特征,还不能算作是真正的“空间声”。因此,2012年美国杜比公司推出的全景声系统,可以说是世界上第一种已经能够达到量产的“空间声”电影还音系统。这套系统主要在两个方面进行了创新,第一是增加了顶置声道(Overhead Speakers),用以表现来自头部上方的声音;第二是将传统的基于声道(Channelbased)的声音处理工艺升级为基于对象(Object-based)的声音处理工艺。在传统的数字电影声音制作过程中,声音在空间中的定位主要依赖于较为有限的声道分布,虽然在大型影院中往往在侧后方墙面上会铺设为数众多的壁挂式扬声器,但由于声道上的限制,这些扬声器实际上只能还原来自两个环绕声道中的声音信号。因此,越大的影院其侧方和后方的声音定位感越不强。因为将相同的信号发送到更多的扬声器中会使声音产生平面化、区域化的呈现效果,从而降低声音的精确定位感。在杜比推出全景声系统后,基于对象的声音录制工艺成为更加面向未来的电影声音录音方式。这种录音技术通过使用空间化的声像编辑器(3D Panner)以及元数据(Metadata)实现了对声音的灵活化处理,能够在三维空间中较为准确地将声音进行定位,以获得更好的影院声音空间感,并且全景声系统最大能够支持64个声道的声音,这些增加的声道多数分配给了新引入的顶置扬声器以及侧后方扬声器,从而使得声音在空间中运动时的细腻感得到大幅度的提升,由此也使第一部采用全景声技术制作的影片《地心引力》(Gravity;2013)一举获得了当年奥斯卡金像奖中的最佳混音(Sound Mixing)与最佳音效剪辑(Sound Editing)两个奖项。
由此可见,目前的影院声音已全面进入一个全新的时代。除了美国杜比公司的全景声以外,德国的IOSONO公司推出了IOSONO 3D全息声音系统,比利时的Auro Technologies联合Barco公司推出了Auro 3D三维音频系统,美国的DTS公司推出了DTS:X临境音系统。而在这之后,得益于我国电影工业技术的发展与成熟,国内厂商也开始涉足多维度影院声音系统的开发之中。例如,中影股份、中国电影科研所及中广华夏影视科技有限公司共同研发推出了支持13.1声道的中国多维声,另一家本土企业中科雷欧则推出了基于面向对象技术的沉浸式音频系统Holosound,并研发了包括音频处理器、数模转换器、多通道数字环绕功放等一系列的配套产品。尽管国产多维声系统目前的银幕安装数量与美国杜比公司等行业头部企业仍存在着较大差距,但这些产品的出现标志着我国影视工业化水平的进一步提升,全面采用西方技术的格局已经出现了根本性的动摇。
因此,无论是以杜比全景声为代表的西方影院多维声系统,还是以Holosound为代表的国产影院多维声系统,从目前其宣传策略中可以看出,“沉浸(Immersive)”是当前影院还音系统的中心语汇与概念。然而,“沉浸”一词是否能够准确、充分地表达多维声的全部意义仍然值得探讨。《现代汉语词典(第五版)》对“沉浸”一词解释如下:“动词,浸入水中,多比喻处于某种境界或思想活动中。”本文认为,“沉浸”一词强调的是所处环境的一种包围感和边界感。一般来说,这个环境是由某种介质和边界建构的,如沉浸在一种美妙的气氛当中,或沉浸在某一特定的环境中,这在无形当中突出了介质和边界的存在及其重要性。而声音对于人的听觉来说应该是没有边界的。例如,人在室内房间中,既可以听到室内空间事物发出的声音,亦可以听到通过窗户和墙壁穿透进来的来自室外空间的声音,而来自室外空间的声音实际上可以说是没有边界的,既可以来自于地面,也可以来自于天空,甚至可以说它来自宇宙、来自于世界的尽头。因此,为了在形而上的哲学层面来实现对人类听觉无限性的描述,比较合理的做法是采用“空间声”(Spatial Sound)这个语汇。在《现代汉语词典(第五版)》中,对“空间”这个词的解释如下:“物质存在的一种客观形式,由长度、宽度、高度表现出来,是物质存在的广延性和伸张性的表现,如三维空间。”可见,空间是个可大可小、可有限亦可无限的学术概念。因此,用“空间声”这一概念来阐释新一代电影声音的呈现方式、内涵及其外延,就可以完美地对三维声音进行全面性的高度概括。
另外,“沉浸式”也并不能彰显新一代电影声音表现力的技术本质。实际上,早在20世纪90年代,Dolby SR·D、DTS、SDDS等胶片光学数字环绕声借助先进的编解码技术以及高品质的功放及扬声器技术已然能够提供给观众非常震撼的听音体验,尤其是通过LFE(Low Frequency Effect)超低频技术能够将电影声音中用于营造震撼感与厚重感的低于120Hz的低频元素进行专门的录制与处理,并输送到超低频扬声器中进行专门的还音,极大地提升了在激烈场景中的声音包围感和能量感,这实际上已然达到了现今一些厂商在宣传中对“沉浸式”的体验效果的描述。而以杜比全景声为代表的多维声系统,其主要是增加了能够发射垂直声音信号的顶置扬声器以及数量更多的环绕声道,这种在传播维度上的提升以及声音定位感、运动感等艺术表现力的增强实则与观众是否沉浸在一个完整的声音空间中并无直接关系。因此,这种差别是需要具体言明的。事实上,杜比全景声仍存在着较为明显的技术问题需要解决,即使该系统较为创新性地增设了顶置的声道,但通过实际考察便可得知,多数安装有杜比全景声系统的影厅中的顶置扬声器的指向角度只能指向影院的某个中央位置,亦即“最佳听音点”(Sweet Point)。而最佳听音点的存在必然导致坐在不同影院空间位置的观众所听到的声音效果是截然不同的。例如,坐在整个影院偏左位置的观众所听到的左环绕声道的声音信号会明显大于右环绕声道的声音信号,反之亦然。并且,在面积越大的影院中这种偏置效应就会越明显。这就与新一代影院多维声系统的所谓“沉浸”的概念是背道而驰的。因为观众会因为座位空间位置的差异而无法享受到最接近混录师精心制作的最佳声音效果,导致一种审美权力不平等问题的出现。尽管IOSONO试图用波场合成技术(Wave Filed Synthesis,简称:WFS)来解决影院中最佳听音点的问题,但遗憾的是该系统方案由于成本、施工难度等因素的影响,目前尚未能成为世界电影院声音还音技术的主流。因此,“空间声”才是真正可以描述新一代影院多维声音录制技术、还音系统以及感官诉求的一个较为准确的学术概念。
以杜比全景声为代表的影院空间声系统显然不是电影声音发展的终极形态,其发展与演变必将受到观影模式变革所引发的影响。当前,作为诞生于20世纪、兴起于21世纪信息科技时代的实用技术,VR(Virtual Reality;又称“虚拟现实技术”)正在全面地进入人们的日常生活之中。尽管现阶段的VR技术仍存在眩晕感强、影像分辨率低、佩戴舒适性差、内容生产效率低等方面的问题,但随着科学技术的不断进步与行业及资本的积极推动,VR必将与当年的计算机一样成为“次时代”(Next Generation)的一种生产与生活方式。
自1895年电影诞生以来,经过100多年的发展,电影画面技术经历了由黑白到彩色、由胶片到数字、由2D到3D影像的变革。现如今,3D/4K、6K甚至8K的超高清晰度数字电影拍摄及放映技术已为观众带来了无与伦比的视觉体验。
然而,电影技术的长期发展并没有改变一个根本的事实,即影像的边界是由银幕画框所决定的。一方面,画框的限制对于镜头作为电影最基本单位的确定以及景别、角度、运动方式等属性的确立起到了决定性的作用,其所产生的不同镜头之间的组接与排列使以蒙太奇效果为基础的电影美学得以建构和发展;另一方面,画框的限制却也让超出画框外的部分是完全黑暗的,画框侵犯了电影的叙事空间,进而造成画框和它所包容的对象之间以及镜头有限时间长度与所其表现内容之间存在着极为严重的对立。
很显然,VR技术是对上述限制的根本性突破,“画框”(Frame)的概念将被“视域”(Viewshed)的概所念替代。尽管视域对于观众来说仍然具有视觉上的局限性,但观众在观影实践中却被赋予了自由选择观察角度、方向与视点的权力。因此,可以通过无数个局部的选择和叠加来实现观众对于内容全局或全景的观照。
而声音的表现方式也必将随着VR技术提供的自主化观影方式而产生极大的变革。在传统多声道环绕声电影声音的录制中,录音师使用指向性传声器对演员的语言以及动效等声音元素进行拾取。而这些用单声道制式(Mono)拾取的声音元素在后期制作时会根据声源在画面以及画外中的位置,通过声像(Pan)选择技术来进行定位与运动方向的处理,从而营造出一种声音形象与画面形象高度吻合的现实逼真感。而环境音响则通过使用立体声传声器与5.1多声道传声器在拍摄现场进行拾取。通常,环境音响素材只是按照在现场录音时的传声器位置将声音发送到特定的环境音响总线(Bus)中。在同一场景中的画面镜头角度或位置进行切换时,环境音响的方位一般不会产生太大的变化,从而呈现出一种恒定、持续的状态。这种声音处理方式被称为基于声道(Channel-based)的录音及还音模式。而进入空间声电影声音时代,情况则发生了根本性的变化。在空间声技术范畴下,声音的制作及还音方式由基于声道的方式变为基于对象的方式。这一录音工艺大大提高了扬声器之间的播放分离度。因此借助在天花板位置增设的顶置扬声器,我们就可以通过专有的三维声像控制技术(3D Panning)使声音在一个三维声场中自由移动,从而使声音的空间运动真实性得到显著的彰显。
无论是基于声道技术的多声道环绕声还是基于对象技术的空间声,所依赖的都是“前期制作+后期放映”的模式,即通过声音制作人员对声音进行响度、频率、空间、方位、运动等方面的处理,并将这些编辑过程通过计算机音频工作站(DAW)中的自动化(Automation)功能进行存储,而后在影院播放时按照预先存储的信息以及声音在混录阶段确定的最终效果将声音还原出来。因而,这个声音系统并不具备交互的属性与维度,这一点与VR技术有着本质上的不同。在VR虚影当中,在视觉画框边界被打破的同时,声音也从一个预先设置的恒定的状态变为一种自由的、旋转的、互动的状态。因此,VR中的声音呈现效果将直接取决于观众在虚影场景中所处的方位和角度。所以,VR虚影中的声音效果是通过实时渲染(Realtime Rendering)的方式生成的。实际上,交互式声音的制作与设计并不是VR技术的专属,计算机游戏在很早之前就已经实现了声音在游戏场景当中的实时渲染和生成。例如,在某些第一人称的射击游戏FPS(First-Person Shooting)中,就需要游戏玩家通过脚步声及其余音响效果声的响度与方向变化来对其他玩家的位置进行研判。
然而,游戏中的这种交互空间音频技术只是空间声的初步应用,通常只能通过计算机模拟出响度、方向等几个基础性参数。因此,其所产生的听觉感受仍然存在机械感强、空间真实感欠佳的问题。而如果想在未来的VR虚影或交互影像中获得更真实感的声音效果,就势必要借助“头部相关变换函数”(Head Related Transfer Function,简称HRTF)以及“头部运动跟踪”(Head Motion Tracking)等技术来实现上述效果。事实上,英国SMYTH公司推出的用于电影空间声制作的Realiser A16全景声耳机渲染器就已然能够很好地实现空间音频的前期制作与后期还放了。它主要通过对“个性化房间脉冲响应”(Personalised Room Impulse Response;缩写:PRIR)、“双耳脉冲响应”(Binaural Impulse Response;缩写:BRIR)、“头部相关脉冲响应”(Head Related Impulse Response;缩写:HRIR)以及“房间脉冲响应”(Room Impulse Response;缩写:RIR)等若干技术参数的测量以及算法的运用,最终来实现通过头戴式耳机对空间声进行监听与制作的目的。这种个人化、灵活化、低成本化的空间声的制作模式具有与扬声器监听方位感几乎零差异以及排除了扬声器间信号串扰等问题的技术特性,大幅度降低了传统空间声制作的声学建构成本与录音设备的采购成本,势必会成为未来小规模VR虚影空间声制作的新形态。
1.技术问题
VR空间声音频当前还面临着诸多技术细节方面的问题。通过长期的观影实践,观众在标准影院的还音环境下已培养了一种听觉无意识,甚至是本能无意识,对以数字多声道环绕声为代表的声学重放环境熟悉且习惯。而VR虚影声音的交互属性,显然是对这种既有听觉经验的打破。一方面,传统影院采用扬声器设备对声音进行还放,而影院在进行声学设计与设备选型等方面都要遵循特定的行业标准。例如,具备杜比全景声放映条件的影院需满足杜比实验室关于频响曲线、声压标准等方面的条件指标。美国THX公司也同样提供影院的声学属性认证。这样做的目的是能使观众在不同影院中所欣赏和感受到的声音质量与效果具有最大的一致性。而对于VR虚影声音来说,目前最佳的还音模式则是佩戴耳机,而影院扬声器还音系统与耳机还音系统其实是有着极大的区别的。前者将声音信号通过空气粒子压缩的方式远距离、间接地传递给观众,而后者则是几乎零距离、直接地将声音信号馈入观众的耳朵中,这就会产生迥异的听觉感受。此外,影院中专门安装的超低音扬声器所发出的具有强烈震撼感的低频信号也是普通耳机所无法还原的,这就会导致声音制作人员精心制作的电影声音内容无法充分、完整地被观众所感知。而另一方面,除了语言、音响以外,音乐也是电影表情达意的重要听觉艺术元素。在传统电影中,经过先期录制的音乐在电影声音的编辑制作阶段以及混音阶段与其他的声音元素相混合,而音乐在前期录制阶段就会规定不同声部的声像位置,只有这样,经过混合制作的音乐在影院中最终还音时才会体现出后期制作时的声像位置关系。然而在VR虚影中,声场会随着观众头部的转动而呈现出旋转的状态,因此语言、音响等声源在空间中的位置就会随时改变。而处于固定状态下的音乐与处于动态变化中的环境声、语言、动效等声音元素就会产生非常明显的割裂感,从而将整个声音的完整状态分割成两个互不相容的声场,这势必会形成两个互相独立的声音叙事空间,使得传统电影中声画蒙太奇的音乐音响化、音响音乐化等视听语言技巧也将在VR虚影中无法得以有效运用。
2.美学问题
在现阶段,如果断然将VR虚影的声音表现形式视为未来电影艺术的终极发展方向具有盲目的牵强性。首先,VR音频将给传统电影美学的呈现带来困境。通过录音技术制作完成的电影声音作品是对极其广泛的单个声音素材和声音序列进行组合剪辑的艺术产物。为了制作特定长度的电影作品,电影同期录音师与拟音师等艺术创作人员需要录制和制作远比最终片长的播放时间长得多的声音素材。经过录音师对这些素材的选择、叠加和拼贴,最终形成观众能够聆听到的整体声音效果。而对于电影艺术而言,正是由于不同角度、景别、位置、方向、景深、色彩、运动等镜头相互之间的组接,以及声音上的叠加、拼贴、淡出与淡入、切出与切入等声音蒙太奇手法的运用才使得电影具有了丰富且深厚的艺术价值,才能较为充分、完整、紧凑地体现出导演等人员的创作意志。尽管传统电影声音创作属于一种线性的创作方式,但是通过对声音的细节化处理能够实现声音在时间上的连贯性和承续性,而时间实际上也是电影艺术性表达的重要维度之一。而过于自由化的VR虚影则使得电影原有的艺术性、最富有艺术意味的意蕴得以消解,或者说电影的思想深度和艺术密度由于观众主动性的介入而得以稀释。因为,观众在观看VR虚影时可随时打断VR虚影声音设计师所设计和制作的声音的连续性展现,从而使电影又回归到一种“杂耍”性质的原始本质。
VR虚影的声音制作与游戏声音制作类似,是将不同的声音元素安排、布置在整个叙事场景中的不同的空间位置。为了实现交互的目的,当观众接近场景中的角色或物体时才会触发声音的生成。因此,观众与虚影中的声音具有一种互动性、操作性的关系。本雅明曾指出:“电影是最具有可修正性的艺术品”。而进入VR时代,电影的这种可修正性无疑被进行了更大规模、更高维度的放大。因为在传统电影时代,对电影内容实施修正的主要是电影的制作人员,如导演、剪辑师、录音师和制片人等。但在VR虚影时代,观众亦加入了对影像内容实施修正的行列。他们通过交互、控制等方式实现了对内容文本的修改,从而使传统电影失去了“永恒价值”,成了某种独特技术程序的产物。
此外,在传统电影中,观众与文本之间保持的一种恒定的天然距离,也是观众对于电影艺术进行审美实践的重要因素。而在VR虚影中,这种距离感被打破,观众完全进入了叙事内容空间,因此审美模型也必然会发生根本性的变化。
在传统电影中,声音是通过艺术化处理从而与观众产生一种距离感。这种距离感可以通过布莱希特的“间离”(Verfremdung)理论进行合理的解读。“间离”概念的主要观点是观众应当与舞台上正在表演的戏剧节目之间保持一定的距离,观众对戏剧应当采取一种积极探讨和批判的态度,以真正理解戏剧所表现的真实感。这一理论也受到了本雅明的推崇。本雅明认为,布莱希特叙事剧中对间离技巧的使用,使观赏者“不是一开始,而是最后”才理解剧情。因此,本雅明认为布莱希特的叙事剧体现了现代艺术的典型特征:走向费解。而现代电影尤其是文艺片中的声音设计也体现出了这种费解化的创作特性,声音设计师会在声音创作的时候特意避开其原始的物质本性,转而使用一个与其原始物质特性出现偏差的、更具抽象性的声音来加以表现,用以引发观众对影片内容进行更为复杂和深刻的思考。这在表面上来看是一种声画蒙太奇——声画对位或对立的创作技巧,但从更深层次去理解,就不难看出这实际上体现了现代艺术的这种典型化特征。用俄国形式主义的理论来理解就是一种用于加强观众审美过程的陌生化原则。VR技术的引入使这种“不是一开始,而是最后才理解剧情”的审美过程得以解构,也使陌生化的理想无法实现。
VR虚影在2016年曾经历过一次爆发式的增长,其后由于技术、标准、内容等多方面的因素而出现发展放缓的趋势。目前,关于VR虚影是否会全面取代影院电影而成为新一代的主要观影模式尚处于探讨之中。在今后一段时间里,影院空间声的普及率将随着技术的进步以及成本的降低得到进一步提升。而传统数字5.1多声道环绕声由于技术成熟、成本低廉以及现有影院几乎百分之百的安装率等原因也将与空间声技术在使用中长期并存。
同时本文认为,尽管VR虚影还存在其自身发展阶段没能得到有效解决的各类技术问题,但相信随着超高分辨率柔性屏技术、超高速移动互联网技术以及计算机图形学等关键技术的不断突破,传统电影的影像生产方式以及观众观影欣赏方式一定会发生极大的变革,而声音作为电影和虚影中的重要视听元素也必将随着新技术、新形态所带来的全新影像观念而得到更好、更大的发展和提升。
【注释】
1姚国强、侯明.从“电影”到“虚影”:论虚拟现实导引的声画艺术变革[J],现代传播(中国传媒大学学报),2018(12):82.
2周传基.电影·电视·广播中的声音[M].北京:中国电影出版社,1991:216.
3姚睿.全维度环绕立体声(ADSS)——3D时代的数字声音设计[J].当代电影,2010(7):91.
4同3.
5空间声(Space Sound或Spatial Sound;缩写:SS)是在电影单声道和环绕声(水平层面的多声道)之后发展起来的一种新的电影声音还音方式。它与单声道(由一个声道还音)和环绕声(在水平层面上进行多个声道还音)有着极大的不同。空间声是一种能在放映场所全方位进行声音还音的新模式。它可以在所处空间位置的前、后、左、右以及上、下维度进行还音,而且声音的还音位置不受限制。因此,它能最大程度地再现人类所处空间中声源的所在位置,逼真地还原真实世界的听感。
6现代汉语词典(第五版)[M].北京:商务印书馆,2005:166.
7同6.
8[德]瓦尔特·本雅明.机械复制时代的艺术作品[M].王才勇译.北京:中国城市出版社,2002:13.