编译/朱慰中
(广东亚视演艺职业学院 电视制作系,广东 东莞 523710)
延时效果及延时器
编译/朱慰中
(广东亚视演艺职业学院 电视制作系,广东 东莞 523710)
阐述声频系统中的延时效果及其应用,介绍延时器的类型及其发展。
延时;声波;声源信号;梳状滤波效应;频率
延时器常常在音频系统内使用。在需要延时效果时,这种设备使用得当与否,关系到扩声效果的成败。本文关注在什么场合、如何使用延时器以及使用什么样的工具能够得到满意的结果,并介绍多款知名延时器。
众所周知,在20℃的干燥空气中,声波的传播速度并不快,其速度为343.2 m/s(1 126 ft/s)。这相当于声波传播1 km要用3 s,或是用5 s传播1英里。声波在不同空气密度中的传播速度有显著的变化,通常由于温度的差别所引起的变化要比实际大气压的差别引起的变化大。这些速度上的变化可以使声波从一种密度通过另一种密度时引起折射——犹如光线通过玻璃、水界面时所引起的那种折射。不用探究冗长繁复的方程式即可得出的结果是,在温度差别200℃时,将会引起12 m/s(或39 ft/s)的速度差别,这相当于约4 m(13 ft)的距离差。音频延时时间约为3 ms/m。声波在暖空气中的传播较快,当声波通过暖气团,而在暖气团上方带有一个冷气团时,将会把声波向上折射到冷却的空气中,反之亦然。就像几年前发生在英国Glastonbury音乐节的一种现象,由于大批热舞的观众身体散发出热量,围绕场地外围测得的声压级要高于观众区域内的声压级。
音频频段在343.2 m/s速度时的波长,在20 Hz时为17.16 m,而在20 kHz时缩短至17.2 mm——只要把声速除以频率即可得出波长。此外,不仅声速与温度有关,频率也与温度有关联。如果某一系统在室内22.50℃时产生一个1 kHz的驻波,当温度升高至33.60℃时,频率将会偏移18 Hz左右。这种温度梯度(或变化)在空调关闭的剧院内或在夏天的露天演唱会上是有可能发生的。当同时聆听某个声源信号和一个频率下移约12.5 Hz的拷贝声时,会听到类似“差拍”的声音,这种声音的声压级出现波动起伏有些像老式螺旋桨飞机飞过头顶时的那种声音。频移高出15 Hz时,则音调是被融合的,但声音粗哑刺耳。如果听者就坐在厅堂后座高处的包厢内,此处的温度要比舞台口音箱处高数度,听到的声音是来自某只延时的音箱以及某只舞台主音箱,那么两者之间所产生的频移将导致一种粗哑刺耳的声音。
低速的声波需要对声音加以延时。例如大型室外演出场所应用音箱塔作延时,或是对剧院内用包厢下的音箱做延时。不过,也有把延时时间设定在零点几秒或更长些,会使效果更为明显,有时,更短的数十毫秒的延时也会产生不寻常的效果,并使效果更为突出。因为人耳可以鉴别出低至7 μs的差别。人耳的响应比起在给定的时间间隔内所出现音频的变化较为迟钝;低于35 ms的延时可使人耳感知得以积累,人耳综合了在短时间区段内抵达室内表面的反射声,这就是为什么室内声响要比室外声响较强的缘故。
一般来说,低于20 ms以下的延时会引起声像漂移及声染色,因而会影响可懂度。非常短的延时会引起梳状滤波效应,这时两个音频波形相互叠加和抵消,使相互间引起干涉,产生一种看上去像梳子的齿状那样的频率响应。这种响应有时被音乐人用作一种效果,人们常称之为“镶边”声。
约在10 ms ~ 20 ms的延时被证实极为有用,因为可以产生优先效应,或称之为“哈斯”效应,这是以验证该效应的一人的名字命名(哈斯并不是惟一的验证者)的。延时与心理声学极为有关。人耳对声波波阵面到达时间上的差别极其敏感,人的双耳间距(约180 mm)可以让大脑鉴别出最接近声源的耳朵与远离声源耳朵之间的时间差——称之为“两耳时差”。究其要点,如果聆听者在一对音箱前聆听,那么,人耳将会对到达人耳的第一个声波波阵面的声音,也就是来自声源的直达声进行锁定。在规定的时间间隔内(人所共知的融合区),人耳不能把来自其他方向的声音当做独立的空间事件。
就此而论,当人们席坐在一对音箱前方的中央(例如坐在家中高保真音箱前),用相同的声压级播放单声道声音,那么声像将会游荡在一对音箱的中间的前方,也就是在人们的正前方。如果把送至一只音箱的信号逐步增加至1 ms的延时,那么声像将会从中心向未延时的音箱那里显现,直至增加延时达30 ms时,声像将会停留在那里。当把被延时的音箱的声压级提升时,出现了有趣的现象:在此期间,未经延时的音箱(仍然显现占支配地位的声源以及在那里出现声像)的声压级随之增加。直到大约有10 dB的差别时,声像才返回到实际被提升声压级的那只音箱上。如果家中有一套立体声音响设备,只要在一个声道内用一台延时器作试验,就可以验证。
这一现象在剧院内获得了极好的效果,因为这样能保证声音从演员所在舞台上准确地发出,观众不会感到是从音箱里发出的。如果一个剧场,在其舞台上方装有一组点声源音箱群(观众会认为声音是从演员那发出的),要在距舞台30 m处的一个包厢下方的音箱使用延时方式,则音响设计者通常把此音箱延时3 ms × 30 m=90 ms。这样会使听众注意到来自包厢下的声音,但并不明显(除非其声压级比舞台音箱强得多时)。在此基础上,再增加20 ms的延时,就将会把声像拉回到舞台口(也就是舞台上的演员那里),这样可使声压级增加到能充分地到达后排座位处。用更多的音箱和复杂的延时系统,有可能把围绕在观众席的声像移动到与演员的位置准确匹配。基于同样的原理,有时也在录音时把某种声音围绕着立体声声像本身作声像移动——这是一种少见的做法,却可以实实在在地“安排在混录中”。
在融合区内使用延时和单次反射有助于提高可懂度,并为心理声学提供有用的工具,超过35 ms ~ 40 ms的延时则可听到回声。如果有多次反射,那么那些延时的组合称之为“混响”——这在固定安装的扩声系统中通常是令人头痛的事,不过,对于音乐人和录音作品而言,却正是期望得到的效果。
1.3.1 模拟技术产品
早期的延时器不外乎使用弹簧延时线或模拟取样电子款式,基本上基于模拟滤波器制成。直到1980年才出现了数字款式。弹簧变形引用金属弹簧的字面意思命名,在它的一端振动,其振动取决于弹簧的张力和长度,稍后,在另一端传感器上产生振动。它们受到带宽的限制并易受物理干扰的影响(例如在其机箱顶部放上一大杯咖啡),但有其独特的质量。它们曾被许多歌手使用,对歌手的歌声加入稍许不同的色彩——甲壳虫乐队的约翰·列农就是一个显著的例子。弹簧混响独特的音色质量,及其在许多音乐风格历史上的重要性,促使国际音频技术学会(AES)一些会员利用现代DSP技术作为修饰声音的手段。探索弹簧混响产生的像虫鸣般的响应不是试图去产生弹簧的物理振动,而是研究如何使用参数模型来复制它们的声音,允许调节诸如延时时间、各类声响的频谱形状以及衰减比率等参数。
老式的模拟技术不仅受到弹簧和滤波器等的限制,磁带录音机也存在很大问题。在多声轨磁带录音机上,偏置录音与放音磁头曾是产生和声效果及“镶边”声等广泛采用的方法,“镶边”效果采用一种梳状滤波效应,用两条同样素材声轨在同步放音时,录音师用一个手指摩擦一个磁带带盘,使一条声轨相对于另一条产生轻微的相位差。
1.3.2 数字技术产品
在拥有廉价的闪存和DSP的今天,在设定延时、回声和混响时,只要按下某个按键,就可轻而易举地达到毫米级的精度。几乎所有的数字调音台,包括像Yamaha 02R或Soundcraft Si16那样的小型数字调音台在每条通道内均设有延时器——虽然可能只有100 ms或稍长些的延时时间。
Peavey、Rane、BSS、Symetrix、Biamp以及Bose等公司拥有功能齐全的DSP制成大量的延时器。尽管要耗用工作存储器,但是许多程序应用软件可用表头指示已有多少存储量用于延时,还有多少存储量可被利用。
DSP的导入——诸如Cobranet或EtherSound以及DSP本身等的数字音频的传送,通常是无需延时的,它们有内置的延时处理器,会使驱动处理器的数字时钟以实际速度运行,即大家熟知的等待时间。通常规定其总量(典型为5.25 ms)后就能从事工作,但是由模拟和数字组成的混合信号设备需要有一点规划。当然,延时器系统也是音箱处理的必要部分,可以确保来自双功放/三功放扬声器的信号具有一致的波阵面,需要特别注意,数字音箱处理器可能会引入不在计划内的延时总量。
在提到视频与广播时,延时器起到一种决定性的作用。不具有当地时间控制标记的视频信号源(例如远距离的信号源)要通过一台同步器,它需要用一帧视频来做有效的缓存,然后按照本地的同步锁相装置来释放那些帧,以此来提供同步——这一方法可以把任何地点的任何视频信号源组合在一起同步。然而按照传统方式,音频是以实时和未经缓存的方式到达的,因此,将会先于视频到达。一帧画面的延时并不显著,但是长长的传输链会有许多帧延时,这样就会出现音视频口形同步上的误差。
所以,此后就出现了用数字硬件处理的应用市场,且大多数用独立的延时器来解决这一问题。使用两条或四条通道的延时器并不复杂,大多数延时器是与其他的效果处理功能整合在一起的。
艾利斯MicroVerb4(见图1),广泛应用在较小的演播室。它提供200种立体声效果(外加100个用户自定义),其中包括混响、延时、合唱及“镶边”声等。要获得更多灵活性,MidiVerb 4可以使用它的32种效果算法的组合来产生稠密度、自然混响、浓烈合唱、“镶边”声、延时、定调效果以及多达3种同时产生的多重效果等。它共有256种内置程序,外加128种可由用户创建的效果,还有许多真实的立体声并行处理功能。如果想要有简易型,那么Nanoverb是一款只有1/3机身宽度的、使用24 bit DSP的处理器,它能提供超过20种延时、混响甚至还有旋转式扬声器模拟装置等效果。
雅马哈(Yamaha)SPX几乎与舒尔SM58传声器一样,近十几年来已经成为各类租赁公司和演播厅内的常备工具。其系列包括SPX90、SPX90II、SPX900、SPX1000 或SPX990(随之而来的是SPX2000,见图2)。它继承了来自前辈产品的标准接口及通用程序,而且还增加了先进的REV-X reverb算法及24-bit、96 kHz音频处理功能。它还提供更为灵活的具有五种可分配的LCD彩色背景光、操作锁定方式以及电脑编辑等功能的用户接口。
对于较为简单的延时、调制和混响效果来说,REV100具有99种预置效果,并能用前面板控制部件来输入所有的参数。可输入起始延时、混响时间、高频阻尼参数、输入电平以及干/湿平衡调节等。它能提供足够的用户存储器,可以让用户配置变成简单的存储及调用。
尽管贝林格(Behringer)在音频界曾一度名声不佳。不过,该公司的产品由于具有相当的坚实和可靠性以及很高的性价比,所以,在租赁公司或演播厅还能找到它的产品。近来,因为该公司集中关注模拟与数字产品的设计,使得一系列产品具有良好的性能。其在真实性及感知度方面所具备的质量,想必是获得Midas-Klark Teknik集团的星级品牌的原因。在效果器阵营内,Virtualizer Pro是其强项,目前的牌号为DSP2024P。它提供通用混响,典型的磁带回声,包括降噪器、压缩器和噪声门等的动态效果器,听觉心理学方面的增强器、激励器、滤波器、声音畸变器,以及含有和声器在内的放大器效果等一系列的效果。这些均使用71种效果算法,在48 kHz、24 bit的DSP上运行,而A/D和D/A转换用24 bit及64/128倍过采样,所以只有很小一部分质量受损。其处理能力可以在实时方式下同时用多种效果加以覆盖。除了DSP2024P以外,还有两种较小型的设备。Virtualizer Pro 3D型号功能更强,它可提供3D效果并能精确地仿真声学环境(使用“实时声音模型”技术)。Minifex FEX800是一款精巧的立体声多功能效果处理器,有16个预置,其功能包括混响、延时、合唱、“镶边”声、移相、旋转式扬声器、移调器以及多功能效果等。
图1 Alesis MicroVerb4效果器
图2 Yamaha SPX2000(上)和REV100产品
拥有更为先进的延时处理的TC电子公司开发了D-Two产品(见图3)——一种多节拍敲入旋律延时器。它具有一种音乐旋律节拍敲入特点——不仅在节拍上,而且实际旋律的模型按照指定的节拍和分部变奏来直接敲入(或称为量化),每次延时及旋律模型可以长达10 s时间。它使用24 bit的转换、DSP以及24 bit的存储器——有时不是所有廉价的处理器都能胜任这一工作。设备原理基于使用反馈回路的延时线。音频信号经由回路返回,故可得到重复。其延时/反馈的构架与普通的延时器产品有所不同,那些多次的重复是用许多的节拍敲入来产生,而节拍敲入不会返回到延时线上。这样就可以使延时器输出规定数量的重复次数,也就有可能把最后的节拍敲入返回到延时线上,从而产生一条完整的旋律音序,在反馈控制时旋律就被重复。
该公司的Fireworx效果处理器(见图3)有一系列可以利用的效果。除了有一个5段参量均衡之外,全部使用标准的反馈发送及返回、双路声调移调、噪声及无序声发生器、环形调制器以及六节拍敲入延时器等。它用一个8×8位置路由格来实现那些功能。用户把算法放在格栅的任何地方,则会根据位置把它们自动地用并联和串联的方法“连线”在一起。这是一种动态资源分配系统,可以监视已经使用了多少DSP容量以及算法是否可以在受到限制之前继续增加。当所需要的算法组合在格栅上被选定之后,则所有的编辑工具均可被利用,包括一个独特的修饰矩阵,能让用户动态地转换参数选择。
莱思康(Lexicon)为哈曼集团的一种产品品牌,在效果器处理方面已有较久的历史。早在1971年它即为首先实现数字处理的产品之一。它与其他的哈曼集团产品(例如声艺(Soundcraft)调音台合作开发了各种效果的处理,将一系列处理器的研发瞄准现场扩声或演播室市场以及用于数字音频工作站(DAW)的插件程序等。它的PCM 96(见图4)为两通道设备,配备有1 200个工厂预置效果,而且还可让用户在音频流程的一些补充点上加入多种方式的滤波器,以便更精确地修正混响。它还具有“无限量”的转换,可使混响连续运行,为创造独特的背景及声音效果提供了有用的工具。
莱思康还有一种新颖的房间算法(room algorithm),支持一种可供选择的回旋式混响。其反射模型可被方便地选定、缩放和均衡,所有这些可以同时通过音频,它们还能颠倒并与某个传统的混响相组合以便延长其衰减或为某种空间带来一种强烈的活跃度。该设备适用于录音棚,设备具有模拟输入/输出,也有AES/EBU、MIDI、以太网及火线接口,并且能为数字音频工作站用作一种插件程序。
莱思康的PCM91数字混响器则专注于流动演出使用,它具有老产品PCM 90的全部功能。新增的功能包括全部的AES/EBU和S/PDIF的I/O、双混响算法及新的具有动态三维空间的预置,供两通道或环绕声应用。所有双混响算法——共有10个双混响及5对立体声——以及预置为内置;早先在一张PC卡上可利用PCM 90。它有450个预置以提供真实世界的声音应用。
Sonifex这个名称使用了极为接近广播的同义词, 是少数仅制造延时器产品的制造商之一。在它的“红盒子”系列中共有三种延时器,设备内根本不设其他效果。该系列之一的RB-DS2(见图5)是一种立体声音频延时同步器,用于音频跟随视频再同步时的延时处理,例如其中有标准转换、传输延时、专用标志插入、视频屏幕高宽比转换以及网络延时等。它接受规格高至96 kHz、24 bit的数字音频信号,具有平衡模拟及AES/EBU数字两种I/O。它也可作为一台组合的A/D和D/A转换器, 这意味着模拟输入可以被延时而输出为AES/EBU数字信号,反之亦然。它可用作立体声延时器,当然也可以用作双路单声道延时器或只用作单声道延时器。它可作为一种标准,在96 kHz、24 bit下提供10.5 s的延时,在48 kHz、16 bit下提供42 s的延时。此外,它有一个内部精巧的闪存扩展器可提供2 GB的存储,可用来处理提供超过4 h的延时时间。这样能使某个节目跨越不同的时区进行播出,或者把某个广播节目延时1 h后作卫星播出。观察它的由来与发展,设备提供的延时时间可以被选用至取样、场、帧以及更为常用的毫秒级的延时。
Sonifex系列之二的RB-DD4是一种4通道的设备,它有该系列其他产品许多相同的特点,但它是专为4个单声道通道的配置而设计的,而且4个通道可以被链接在一起工作。与S/PDIF 和TOSLink接口的连通性得到增强,其数字音频输出可以与如下的任何一种输入同步:附加的AES/EBU参考输入、TTL字时钟的BNC输入、模拟/SDI视频馈入(如果使用附加的RB-SYA或RB-SYD板)或是本地的主时钟等。
图5 Sonifex RB-DS2延时器
该产品系列的另一种延时器为RBPD2,这是一种为直播节目播出应用的立体声音频延时器,它可以防止污言秽语等禁止播出的素材被直播播出。它装有一种自动音频延伸算法,允许在直播时有2 s ~ 55s的延时,同时在按下某个按键时仍能维持正确的音调。在小型闪存卡上播放预选的音频文件时,会将这种延时形成一种习惯。当节目完整后,音频延伸算法会精确无误地把延时缩减至零。
该设备提供从音频输出端删除任何不需要的素材的几种方法。一种是所谓的咳嗽功能,可以启用专用的前面板上的按键,使录制场所内出现的咳嗽声或设备的开关噪声等不被加入到输入端。还有一种在前面板上可以启用消除功能的按键,共有两种不同的方式:一种是用已经被缓存的预选总量的一部分音频加以删除;第二种方式是在小型闪存卡上播放预选的音频文件。当文件完成播放时,则延时时间等于文件的持续时间。此功能可以多次使用,可以实现组合延时以及一次延时用途,设备可以自动地开始重建原始的延时时间。作为最后一种方法,所有被缓存的音频在启用放弃功能时用按下并保持按键的方法而被丢弃。要返回到正常播出,延时器可以在按下一键后快速关闭。
贝尔数字音频公司像sonifex公司一样,拥有着相似的延时器市场,该公司也已有多年的历史,早在1980年就有BD80系列的产品,目前提供“7150”及“8150”。“7150”是一种立体声延时器,可以把立体声延时长达10.4 s(或260帧PAL制,或312帧NTSC制)。设有8种自定义设定,可被存储在存储器内并可在本地或通过逻辑输入遥控。能同时提供模拟及AES数字输出,因而也可作为模拟至数字或数字至模拟的转换器。AES输出可以与外部的AES参考输入相同步,是一种“比特精度”的方式,可以让AC3和杜比E信号延时。
“8150”是专门为音频与视频相同步而设计的一款延时器,为后期制作提供VT编辑及视频效果器的延时需求。考虑到视频延时可能是恒定的缘故,或在使用时并不需要经常更改延时。它有8个独立的模拟和4个数字AES I/O,此外还可以作为D/A或A/D转换器使用。每一对立体声延时线可根据场频不同(PAL或NTSC制)而从0~15场之间变化,在每一对立体声上装有输入电平控制、峰值LED指示灯以及AES锁定指示灯。
或许最为先进的延时系统要数英国Out Board电子公司制造的UK-TiMax(见图6)。该系统围绕DSP结构设计而形成一个延时矩阵,使各种声源相对于各种不同的输出进行延时,使拥有多只扬声器的大系统内能真正地、最大限度地利用小延时器的效果。最新的款式为TiMax2 SoundHub,它用16×16~64×64在2U内实现的I/O配置,同时还能提供参量均衡、网络化及区域控制,外加内置的多通道硬盘播放设备等。
随着延时矩阵DSP处理器技术的发展,还有一种用专用的PC机及苹果机软件提供显示控制即“控制域移动”功能,它能帮助音响设计师不是凭经验而是发挥创造性,在系统内对各种信号源至扬声器做独立的时间校准。
控制域移动的基础被TiMax称之为“声像清晰度”,它由音响设计师创造出在观察设置时提供一系列的相对电平,用扬声器距声像中心的距离来给出延时值。声像中心是一只“计时起点”扬声器,或是一种诸如人声或乐器声等的声源。给每一只声像中心的扩声扬声器安排延时时间,要使这些扬声器的输出被延时到主声源之后出现。
在软件内部有可能把输入声源拽回到声像清晰度中间,这样就有一种围绕空间做声像偏置的效果;这些声像移动可被记录并以逐点提示方式自动地回放。软件会连续地计算为获得本地色彩需要什么样的多级电平和延时值。然后指令硬件以实时方式去设置或稍稍移动这些值来获得静态的本地色彩或是活跃的声像偏置效果。
为在演出期间能处理所有这一切,可以用基于演出控制环境的简单易懂的演出清单来操控提示信号,提示信号可以被设置成来自MIDI、SMPTE、RS232 或一种内部的时间线那里的触发。要使演员们的无线传声器的声像完全自动化,TiMax Tracker(跟踪器)选项使用短距离UWB雷达围绕舞台跟随表演者,并连续不断地改变它们的矩阵变换的延时时间,以保持实时状态下的本地色彩。
图6 Out Board电子公司UK-TiMax延时系统
(本文编译自《lighting & Sound International》杂志2010年12月刊《The Effect of Delay》一文。)
(编辑 张 翔)
The Effect of Delay and Products
Translate/ZHU Wei-zhong
(TV Production Apartment, Guangdong ATV Professional Academy for Performing Arts, Dongguan Guangdong 523710, China)
The paper explained the effect of delay and its application in audio system, and introducted the style and development of delay.
delay; sound wave; source signal; comb fi lter; frequency
10.3969/j.issn.1674-8239.2011.03.004