□ 孙金艳 文海良
在现代的音乐制作中,音色是能够被使用到的所有原声、电声乐器的总和,其概念并不代表单一乐器,而是仅仅代表单一色彩的乐器演奏。例如,小提琴可以奏出的音色有拨奏、连奏、颤音等多种,通常都可以制作成数字的、虚拟的音色,供作曲家、编曲师在音乐制作的实践中使用。为了提高音乐制作的效率,各大合成器制造厂商与音源开发公司都不同程度地将人工智能技术应用到音色的制作与使用上。本文试图厘清人工智能技术与音色制作相结合的发展脉络,探析音色的人工智能化进程。
音色的智能形态最早可追溯到19世纪欧洲经历第一次工业革命后所发明的音乐盒、手摇风琴等,这也许是因为当时人们对延续了千百年的传统乐器演奏方式的厌倦,在经过周密的数学计算后把乐谱刻在一个卷筒上,在发条惯性动能的驱动下触发与其捆绑在一起的乐器演奏。虽然这种音乐盒只能演奏一两个乐句,但它的自发演奏行为与记忆功能在当时却足够引起人们的注意,这是乐器音色人工智能化的萌芽。
真正能够进行音色人工智能化的并不是具有物理属性的原声乐器,而是电子合成器,早期人工智能演奏的雏形就是步进器。1946年,美国音乐家雷蒙德-斯科特使用步进继电器、电磁阀、控制开关和16 个独立震荡器电路等装置组成了最早的模拟步进器,通电后能够自动演奏16个步进的节奏。虽然这台步进器因噪音太大而操控性与实用性不强,但它为音色的人工智能化开辟了新的道路,启迪了后来的电子工程师,并在此基础上开发出了更为实用的步进音序器。
步进音序器以步进(Step)为单位,早期一般以8 个或16 个分步为一个句子,现在可以扩展到32 个分步,但使用最普遍的还是16 分步。在早期模拟设备阶段,步进乐句的长度与数量都很有限,但后来的数字音序器弥补了模拟设备不能存储的缺憾,这也直接引导了多轨步进音序器的发展,如1971年,EMS 公司开发出世界上第一款名为“EMS Sequencer 256”的数字音序器,提供256 个步进以及3 个音轨。
现在,步进音序器在音色领域的应用主要表现在节奏制作与音色合成两方面。在节奏制作方面,步进音序器广泛地运用到鼓机上,不管是传统的硬件鼓机如罗兰的TR808/TR909,还是插件式鼓机如 FXpansion 的 Tremor,都是通过不同步进的智能演奏来编创新的鼓组节奏。在音色合成方面,步进音序由单一音高刻度的智能演奏模型演变为可进行不同音高智能演奏的琶音器,广泛应用于合成音色的制造。初级的琶音器只能进行向上、向下、自下而上、自下而上、随机等几种简单的步进音序演奏;后来的琶音器引入MIDI 音序的概念与方法,可以激活不同的步进,调节每一个步进上的音高,并由此产生比较复杂的智能演奏乐句,这就超越了早期琶音器简单而机械的演奏。
如果说步进音序器使鼓组音色获得了人工智能化的演奏,那么,现在的模版演奏就是使其他非打击乐器获得人工智能演奏的常见形式了。
所谓模版演奏,就是音色在制作时内置MIDI 演奏音序,使用时用键盘音符就可以触发MIDI 音序的演奏。在一定意义上来说,模版演奏是步进音序、琶音器的一种升级与进化,它与采样音色制作技术相结合,可以制作出与真人实录相同的演奏效果。
模版演奏技术率先在吉他、贝司、鼓组等流行音乐常用音色中得到应用,而后又推广到交响乐的音色中。最先推出具有模版演奏功能音色的厂商是Steinberg 公司,2002年它们推出了基于VSTi 技术的乐器插件虚拟吉他手(Virtual Guitarist),该音色内置25 套吉他手演奏模版,不但可以进行一键触发式的演奏,还可以自主编辑演奏模版,音色质量与演奏效果几乎可以与成熟乐手相匹敌。随后,Steinberg 公司又连续推出了虚拟电吉他手(Virtual Guitarist Electric Edition)、虚拟鼓手(Groove Agent)和虚拟贝斯手(Virtual Bassist),在音乐制作领域刮起了一股虚拟演奏手的风潮。这是人工智能与音色制作技术的一次大融合,丰富了音色制作的方式方法,使其他厂商纷纷效仿。在这之后,更多种类的虚拟演奏手乐器插件开始面世,比如Musiclab 开发的虚拟吉他手RealGuitar、电吉他手Real-Strat,ToonTrack 推出的虚拟钢琴手 EZKeys,Native Instruments 联合伦敦Abbey Road 录音棚推出的虚拟鼓手系列ABBEY ROAD | 70s DRUMS、ABBEY ROAD 80s DRUM 和Abbey Road Modern Drums 等。
在交响乐音色的人工智能化制作方面,Native Instruments 公司基于其在业界处于领导地位的采样器Kontakt的技术上,相继开发了多款用于交响乐配乐中使用的人工智能化演奏乐器。比如ACTION STRINGS 就可以用一键触发的方式获得弦乐快速断弓演奏的乐句效果;再比如SESSION HORNS,同样可以用一个和弦按键来触发在该和弦音上的铜管乐智能演奏。
模版演奏的智能化音色制作,可以实现音色短乐句的自动演奏,在实际的音乐制作中大大节约制作时间,并尽可能地获得更好的演奏效果,在某一个时期内是音乐制作的一大利器。但时间一长其弊病就难以隐藏了,核心的难题就是模版几乎是固定的,用一两次有点新意,但用多了音乐就失去了本该有的原创性。于是,新一代的音色工程师又开始在模版新意方面进行开发拓展,目前卓有成效的是在鼓组自动演奏方面,突出代表是Apple 在其音乐制作平台Logic 中自带的虚拟鼓手插件Drummer,为了避免内置鼓组节奏的刻板,将概率引入节奏的合成中,设立一个XY 轴板,四个边框分别是简单/复合、大声/柔和,操纵XY 轴板中的圆盘可以随意调节节奏形态,再根据个人的喜好确定节奏。
在步进音序、演奏模版的音色自动化技术之后,如果说还有什么技术能够引领音色制作技术的变革,那可能只有动作探测了。
动作探测源于多层采样音色制作技术。该技术是在采样音色制作中将多个不同演奏形态的声音样本叠加在同一个键位音符上,依靠不同的音符来触发这些不同的声音采样,以此来获得更丰富的乐器演奏。比如用C1 触发长音演奏样本、D1 触发跳音演奏样本、E1 触发强奏声音样本等。这是早期多层采样音色制作的原理。
随着计算机芯片处理能力的提升以及内存的扩大,将多层采样音色制作技术进行深化与细化,比如每一个键位不同的力度同样也可以触发不同的声音采样,由此制造出采样数更多、体积更大的音色。而在演奏时,通过分析演奏者弹奏MIDI 键盘时的力度与音符走向,可以触发与之匹配的声音样本,以此达到更细腻化的乐器演奏。这一技术的运用在弦乐类音色的制作中有着尤其实用的价值。因为弓弦类乐器的演奏技术很复杂,一直都是MIDI 音乐制作领域中音色表达的短板。比如连奏,在此之前是音色制作厂商都要刻意避开的技术黑点,但通过动作探测技术,可以提前分析演奏者的演奏意图,从而触发连奏的采样,如此一来,乐器演奏的表达性能就大大提升了。
使用动作探测技术制作的音色主要在弦乐器,如拉弦乐器小提琴、大提琴,拨弦乐器吉他等。现在市面上比较有名的成品音色有Best Service 的小提琴独奏音色Chris Hein Solo Violin 和古典尼龙弦吉他Ilya Efimov Nylon Guitar等,这些音色都具有演奏技法细腻、音色表达能力强的特点。
几十年来,音色的人工智能化进程从未停止其前进的步伐,目标只是为了实现更为便捷、高效的音乐制作。探讨音色的人工智能既可以普及我们在乐器音色智能演奏方面的理论,也可以使这些音色工具更好地为实际的音乐制作服务。