王 力,魏增来
(中国传媒大学 音乐与录音艺术学院,北京 100024)
随着计算机技术和数字音频的发展,在流行音乐的编曲和制作中,越来越多的音乐人使用MIDI键盘和采样音源进行音乐创作。采样音源研发的初衷,是希望通过对大量乐器进行声音采样的方式,从软件层面模拟出各种各样乐器的演奏音色和技巧,虽然采样音源无法取代乐器实录的效果,但它能够以极低的时间与经济成本,让音乐从业者只需要一台计算机和MIDI设备,就可以使用到专业录音棚中演奏各种昂贵乐器得到的采样,为音乐创作提供了更加广阔的发挥空间[1-2]。
最早的计算机音源可以追溯到1982年MIDI技术的诞生[3],其使得计算机音序软件可以对电子合成器音色进行控制,代表是搭载FM调频合成技术的Roland JX-3P和YAMAHA DX7合成器[3-4]。而采样技术最初的应用是从20世纪80年代末开始到21世纪初的硬件采样时代,如YAMAHA SY-99合成器便是集ROM采样回放、FM调频、RAM用户波形记忆于一身[5],此外还有AKAI公司的S6000采样合成器、专为计算机音乐系统设计的各种不带键盘的硬件音源,如Roland SC-55等。20世纪90年代后,可在计算机使用的软件采样合成器开始出现,如美国SeerSystem生产的软采样器Reality。21世纪初,美国NemeSys公司开发的软件采样音源Giga Sampler支持1 GB容量大型钢琴音色,拥有硬件合成器无法达到的音质[6]。21世纪初至今,计算机音乐进入了高速发展阶段,德国Steinberg公司的ASIO(Audio Stream Input Output)音频标准的推出,标志着实用计算机音乐软音源的插件时代正式开始了[2,7]。其中最具代表性的是Native Instruments开发的Kontakt采样器[8],具有强大的采样、编辑、回放与软件脚本设计功能[9],为许多大型采样乐器音源提供了引擎动力,用户还可塑造属于自己的采样音色。
钢琴作为一种击弦乐器,音色变化主要受演奏力度(Velocity)影响,与拉弦、吹管等富含较多人性化演奏技法的乐器相比易于生成效果真实的采样音源。当前,国外已有众多优秀的钢琴音源,如Spectrasonics推出的的Keyscape采样自YAMAHA C7大钢琴;Garritan推出的Abbey Road CFX Concert Grand采样自YAMAHA CFX音乐会钢琴。采样音源易于编辑,可单独对音色进行进一步的加工处理,因此其在音乐制作中已经得到了广泛的应用,但随着音乐制作领域的创作需求越来越个性化、风格化,现有的音源仍不能完全满足所有音乐制作人的需要,对自己有特定需要的乐器进行采样并制作音源可以很好地解决这个问题。
通过对研究领域内的文献及产品调研表明,现阶段主要存在以下亟待解决的问题:
(1) 钢琴作为结构相对复杂的乐器,音源听感效果不仅依靠采样录音技术,还体现在音源重放环节对乐器发声的建模。
(2) 目前对于完整钢琴作品的录音技术的研究已经较为成熟,但对于需要钢琴各部分结构声音独立采样的音源录音方法尚未有具体的理论研究。
(3) 市面上已有大量在售音源成品,只能以使用者的角度进行分析,无从得知音源的制作流程,同时其提供的可调整余地也较小,不能相对宽泛地按照自己所需求的功能进行调整。用户使用采样器,大多只停留在对已有的采样音源简单地进行整合的层面,国内尚缺乏具体完整地对真实乐器的采样与制作的研究。
鉴于此,本文提出了一套具体完整的对真实乐器进行采样并制作成软件音源的方法流程,基于Kontakt平台与KSP(Knownledge Service Page)脚本语言设计并制作了一款钢琴音源,深入探究钢琴采样音源的录音方法与制作方法,使采样音源从各方面还原了真实钢琴的听感。本研究可对未来钢琴及其他乐器采样音源的录音、制作与改进提供参考与帮助,以满足个性化软音源的需要。
对钢琴进行采样的目的是从软件层面对一架真实的钢琴进行还原,实现过程主要可分为采样和重放两个步骤: 首先在录音棚中尽可能全面地采制钢琴的声音,再通过软件将声音按照钢琴键盘顺序进行编辑、映射、逻辑功能设计,最终在弹奏MIDI键盘时即可实现钢琴声音的重放。
钢琴乐器主要依靠琴键牵动钢琴内部包着毛毡的琴槌,继而敲击钢丝琴弦,引起音板振动发出声音[10-11]。从声学构造上看,钢琴是一件复杂的乐器,由琴键、琴槌、琴弦、琴码、音板、踏板、弦钮、制音器等部分组成[12],每部分都会对音质产生影响,因此需要对钢琴中每个能够发声的部位分组采样,对按下琴键的不同力度也要进行分层采样。本文钢琴采样音源主要涉及以下几组声音:
(1) 普通音符采样,即不踩延音踏板时弹奏琴键发出的乐音,分3层力度;
(2) 延音音符采样,即踩下延音踏板时弹奏琴键发出的乐音,分3层力度;
(3) 延音踏板踩下噪音;
(4) 延音踏板抬起噪音;
(5) 离键音尾采样,即琴键抬起的乐音音尾;
(6) 离键噪音采样,即琴键抬起的机械噪音。
各组采样及触发条件如图1所示。
图1 钢琴采样音源及触发条件Fig.1 The piano sound source sampling and triggering conditions
采样的最终目的是实现用于音乐制作的乐器仿真重放,因此,将所有音频采制完毕后,我们还要提前规划其被编辑信号的重放过程,以遵循正确的钢琴发声逻辑。按下琴键后信号播放的流程图如图2所示,首先判断有无踩下延音踏板,若未踩踏板,播放音符采样,抬起琴键时,播放音尾采样和音尾噪音采样;若踩下踏板,则首先播放踏板踩下噪音,再播放延音音符采样,抬起琴键未松踏板时不播放任何采样,松开踏板时播放踏板抬起采样,再播放音尾采样和音尾噪音采样。按照以上逻辑可对演奏时钢琴的发声顺序进行正确的还原。
图2 音源采样工作流程Fig.2 Workflow of sound source sampling
本次钢琴采样音源的录制地点在中国传媒大学音乐录音棚,采样对象为录音棚内的Heintzman钢琴。
三角钢琴体积庞大,频率宽广,基频范围涵盖27.5~4 186 Hz[13],各频段辐射范围也不同,具有复杂的声学特性,且人耳听到的声音是由早期反射声和多次反射声构成[14],因此需要多方位设置传声器。本音源选定4组话筒位置,分别为演奏者位置、琴弦上方、琴侧及房间位置,音源使用者可以根据乐曲风格自由选择话筒位置及其组合,方便达到其想要的音色效果。具体话筒型号及位置信息如下:
(1) 演奏者位置
将话筒置于琴凳两侧,即演奏者所处位置两侧,高度与演奏者坐于琴凳的人耳高度一致。使用一对audio-technica AT4041小振膜心形指向话筒以AB制式拾音,如图3(a)所示,使用此位置可以很好地再现演奏者所处位置的声场。
(2) 琴弦上方
该位置将3只话筒置于琴弦上方20 cm处拾音,分别对应低音、中音、高音琴弦3个位置,使用3只audio-technica AT4049小振膜全指向话筒拾音,如图3(b)所示。本次录音在传统琴弦位置AB制式拾音的基础上添加了1只话筒,使得高低琴弦音色衔接更加自然,并可捕捉更多细节,得到明亮、透彻、声场宽广的钢琴音色。
图3 话筒及拾音位置Fig.3 The placement of microphone and polar
(3) 琴侧拾音
此处为古典音乐钢琴演奏常用拾音位置,将话筒置于钢琴侧边1.5 m位置,位于钢琴音板与琴盖打开所成角度的平分线上,使用1对Neumann U89大振膜全指向话筒以AB制式拾音,如图3(c)所示。此位置的钢琴音色含有一定的房间混响,可以得到较为温暖、具有空间感的钢琴音色。
(4) 房间内远距离拾音
此处话筒主要录制录音棚的房间反射声与混响声,作为音源的辅助话筒,使用时需叠加其他话筒位置的采样。将1对audio-technica AT4041心形指向话筒置于房间后方,指向后墙,间距约1 m,高度约2.5 m,采用AB制式拾音,如图3(d)所示。
依据上文所述采样内容,按照以下步骤依次录制:
(1) 连接系统,1—9号话筒共9路输入同步录音。
(2) 从最低音演奏至最高音,每个琴键手指按住不松采样15 s,音符间距5 s,使用秒表计时,不间断录制,以弱(p)、强(f)、中等(mp/mf)的顺序,依次录制3层力度的采样。
(3) 踩下延音踏板,重复步骤(2)。
(4) 不按琴键,踩下延音踏板,录制机械噪音1个;抬起延音踏板,录制机械噪音1个。
(5) 琴键抬起的音尾采样: 不踩延音踏板,以中等力度(mp/mf)从最低音演奏至最高音,每个琴键按下2 s后以中等速度松开,录制88个琴键抬起后的乐音音尾。
(6) 琴键抬起的制音器机械噪音采样: 不踩延音踏板,按某一琴键,待琴弦停止振动后,以中等速度抬起琴键,录制制音器机械噪音1个。
将采样完成的音频进行分割,普通音符和延音音符采样分别并轨4个位置的话筒为立体声采样,音尾、离键噪音和踏板噪音由于电平较小,只并轨拾音最清晰的琴弦上方位置的3支话筒采样。然后进行降噪、音高修正、响度标准化等预处理操作,在Kontakt采样器中将其编组,汇总全部采样文件及其信息如表1所示。
表1 采样信息及编组Tab.1 Information of sampling and grouping
音色设计的主要流程如图4所示。
图4 音色设计的流程Fig.4 Workflow of sound design
4.2.1 采样映射与触发
采样映射指将上文所述采样音符映射到使用者演奏音源时对应的琴键与踏板触发条件。
首先进行Group 1—8的音符映射。本次采样共分为88个音符,每个音符对应3个力度层,Note on触发。经弹奏与实验,确定力度层次与MIDI力度值的对应范围如表2所示。
表2 采样力度映射表Tab.2 Table of sampling velocity mapping
然后进行Group 9—10的离键采样映射。每个琴键对应一个采样文件,不区分力度,Note off触发,每个采样映射至88个琴键,力度值为1~127。Group 10为离键噪音采样。由于每个琴键释放噪音基本相同,因此将该采样文件同时映射到所有琴键,Note off触发,力度值1~127。
最后是Group 11—12的踏板噪音映射。Group 11—12含有1个踏板踩下和1个踏板抬起噪音,分别为sustain(MIDI CC64)开启和sustain关闭触发。
4.2.2 采样调制
4.2.1节完成了采样与音源组件的映射,但得到的数据并不能直接用于演奏,需在Kontakt中根据演奏者的演奏技法对采样进行调制,以达到真实钢琴的演奏效果。
(1) 音符采样(Group 1—8)
首先进行振幅包络调制。采样的Attack、Hold、Decay由采样本身决定,不进行改变,为避免松开琴键时音尾采样产生截断,设置释放时间(Release time)tR=70 ms。此外,演奏时还需根据使用者的演奏力度设定力度调制,即采样幅度随着力度值而改变。
为保证音符力度自然过渡,音符采样映射时加入了基于真实表情技术(Authentic Expression Technology,AET)的变体滤波器,核心内容是用1个具有高分辨率的快速傅里叶变换(Fast Fourier Transform,FFT)滤波器,通过对采样频谱分析得到其重要的频率响应,并抓取其频率响应特征来创建各力度下样本的独有特征[8-15],建立力度变体层(Morph layer),在弱力度采样与强力度采样间使用力度变体滤波(Velocity morph filter)的方法来实现不同力度间的音色自然过渡。图5为中央C中力度(mp,tR=61~110 ms)与强力度(f,tR=111~127 ms)力度采样间力度变体滤波器示意图,(a)、(b)、(c)、(d)、(e)分别代表tR=61、70、105、115、127 ms时的变体滤波曲线。
图5 力度变体滤波示意图Fig.5 Schematic diagram of velocity morph filter
(2) 离键采样(Group 9—10)
松开琴键的音尾声音大小主要和松键时刻的音符声音大小有关,因此受到演奏力度和演奏时长两方面影响。首先,添加力度调制,与Group 1—8方法相同;其次,添加按键时间调制,先通过按键计时器Release Trigger设定离键时间范围,再添加调制器,根据Release Trigger Counter计算的按键时间长度调制采样幅度,如图6所示,上方曲线为力度调制,音量随力度增加而增加,下方曲线为按键时间调制,音量随按键时间增加而减小。
图6 力度调制Fig.6 Velocity modulation
(3) 踏板采样(Group 11—12)
踏板本身没有力度变化,因此无需进行调制。
4.2.3 信号路由
调制完成后,将信号送至图4所示输出总线(Output bus)备用。信号路由分为话筒位置和组别两个维度,首先按照演奏者位置、琴弦上方、琴侧、房间4个话筒位置(即Group 1、5、9,Group 2、6、10,Group 3、7、11,Group 4、8、12)信号混合,分成4路送至BUS 1—4。其次按照4.2.3节采样类型(Group 1—8、Group 9—10、Group 11—12),分成3路送至BUS 5—7备用。
完成音色设计相关工作后,可利用Kontakt KSP脚本语言设计音源的功能和界面,制作完成的音源界面如图7所示。
图7 钢琴音源界面Fig.7 Interface of the piano instrument
由于该音源为采样音源,总容量达到了10 GB以上,为节省加载等待时间,在功能界面上设计了采样加载控制模块。采样加载控制分成两部分设计,使用KSP语言的purge_group函数控制采样加载。第一部分控制不同麦克风位置采样加载。在UI界面设置4个开关,分别分配至演奏者位置话筒(Group 1+Group 5)、琴弦上方拾音话筒(Group 2+Group 6)、琴侧拾音话筒(Group 3+Group 7)、房间拾音话筒(Group 4+Group 8)。第二部分控制不同类型采样是否加载,在UI界面设置3个开关,分别控制音符采样(Group 1—8)、离键采样(Group 9—10)和踏板采样(Group 11—12)。给相应开关分配purge_group函数,控制不同组的加载。
如图4所示的BUS 1—6设置电平控制旋钮,分别控制4个麦克风位置及离键采样电平,同时设置总电平控制旋钮控制,用于调节音源输出的总音量。使用KSP语言中的$engine_par_volume函数对旋钮分频音量实现控制。此外,在电平控制旋钮的下方还设置了M/S控制开关,将对应组别的disallow_group与allow_group函数分配给M、S开关以控制每组总线的静音与独奏。
在电平控制模块上方,设置声像控制旋钮,以便用户独立调整每个输出总线的声像。使用KSP语言中的$engine_par_pan函数给对应旋钮分配声像控制功能,同时设置声像默认值为0(中央位置)。
音源界面对每组总线均设有立体声电平显示单元,以便用户方便地观察每组总线输出的电平大小以及声像位置。对6组总线分别分配KSP语言中的ui_level_meter控件以显示电平,如图7所示。
不同的钢琴音符包络可以适应不同的乐曲风格,设置包络控制可以使用户方便地塑造个性化的钢琴音色。设置2个旋钮分别控制Attack、Release参数。其中Release在4.2.3节已设置默认值为70 ms。将2个旋钮分配$engine_par_attack、$engine_par_release函数即可实现音头与音尾的时间控制。
设计完成后,音源可载入DAW(Digital Audio Workstation)软件用于音乐制作。为了探究音源制作效果,本章将阐述音源音质评价实验及实验结果。音质评价主要分为两个部分,为音色质量评价及音色分辨实验。由于目前钢琴音源的应用范围主要为流行音乐,因此音质评价实验选取均为流行音乐的钢琴伴奏,使用涵盖低、中、高大部分音区,能够尽可能充分体现本音源音色质量的副歌片段。本次听感评价共有10名被试参与,均为录音相关专业学生,受过良好的听音训练。
依次给被试挂载3款音源并播放相同曲目,分别为Kontakt Factory Library钢琴音源、Garritan Abbey Road CFX Concert Grand(下文简称为Garritan CFX)钢琴音源和本文制作的钢琴音源。曲目为若干流行音乐钢琴伴奏片段。使用李克特量表法,被试从清晰度、丰满度、空间感、悦耳度、音色真实度5个维度进行打分,尺度为1~9,音色评价为盲听实验,所有片段随机编号,研究者与被试事先均不知道播放何款音源。
将被试打分数据平均后汇总后如表3所示。
表3 音质评价的得分Tab.3 Score of sound quality evaluation
由表3可知,被试对于本文制作的钢琴音源除清晰度以外,其余维度均领先于Kontakt Factory Library钢琴的,各维度得分与Garritan CFX钢琴的接近,均在7分左右,可以看出本文制作的钢琴音源各方面音质较为均衡,听感较优。
其中,本文制作的钢琴音源在空间感和音色真实度的得分最高。其使用了4种空间位置、9支传声器拾音,且含有远距离房间声拾音位置,用户可以自由调整不同位置处的电平比例,与其余两款钢琴音源相比包含了更多的空间信息,带来了较好的空间感。同时,4种位置的传声器从多角度还原了三角钢琴各部位的声音细节,形成了较高的音色真实度。此外,市面在售的钢琴音源大多为音乐会三角钢琴,经过精心调整,具有丰满圆润的音色,而本文制作的钢琴音源采样自未经过整音的中小型家用三角钢琴,含有机械噪声,其音色相比音乐会钢琴音源更加粗糙,更加接近人们日常使用的钢琴,与前者相比听众更加熟悉,音色真实度更高。
从整体得分来看,由于Kontakt Factory Library钢琴音源为节省采样空间,存在较多且多个键位共用一个采样的情况,依靠音频升降调实现音高变化,因此听感不佳,整体评分较低。Garritan CFX钢琴为在Abbey Road录音棚采样的雅马哈9尺三角钢琴,制作精良,音色调制偏古典,对古典钢琴音乐的表现力更为丰富,而本实验选曲为流行音乐,导致其制作的音源在一些维度的评分略低于本文制作的钢琴音源,因此该实验结果表明演奏流行音乐条件下,本文制作的钢琴音源有着较佳的音质水平。
在对钢琴采样之前曾使用录音棚钢琴实录《东风破》钢琴伴奏。因此本实验选取10段《东风破》钢琴伴奏节选(其中含有5段录音棚实录音乐与5段挂载音源的MIDI演奏音乐),被试判断是否为采样音源演奏。音色分辨实验也为盲听实验,所有片段随机编号,研究者与被试事先均不知道播放的是采样音源演奏还是钢琴实录。统计每名被试在10段音乐中辨别出采样音源的数量,结果如表4所示。
表4 音色分辨实验结果Tab.4 The results of sound resolution experiment
可以看出,有5名被试全部判断正确,表明其可以清晰地分辨出采样音源和实录钢琴的音色。5名被试判断正确率小于50%,表明其不能分辨出采样音源和实录钢琴的音色。综合所有被试的作答,本次实验综合正确率为68%。虽然实验样本较小,不具有广泛的统计意义,但由于被试均为受过训练的专业人员,因此实验结果在一方面表明本文制作的钢琴音源和真实钢琴录音在听感上还存在着一定差距,另一方面由于一些专业被试也无法准确分辨采样音源与钢琴实录的音色,因此表明本文制作的钢琴音源对钢琴演奏也同样起到了一定的还原效果。
根据5名全部判断正确的被试的反馈,本文制作的钢琴音源与真实钢琴录音的差距主要体现在如下几点:
(1) 音源的低频较为浑浊,真实钢琴录音的低频清晰;
(2) 由于只有3层力度采样,音源的力度过渡不如真实钢琴录音自然;
(3) 真实钢琴录音的声场真实自然,具有临场感,采样音源的声场不够自然,推测可能由于音源演奏是对每个采样音符的简单叠加,破坏了原有的空间信息;
(4) 音源的音尾处理不如真实钢琴录音自然,推测可能由于在真实钢琴演奏时音尾的发声是由手指离键的速度和状态决定的,而音源无法对这种状态进行如此细致的还原;
(5) 音源演奏的底噪会随着音符数量的增加而增多,可能是因为采样每个音符时都会含有底噪,当音符叠加时,底噪也会叠加,导致噪声越来越大,而真实钢琴录音不存在这个问题。
本文给出了一套完整的钢琴采样音源的设计与制作方法,通过对中国传媒大学音乐录音棚的三角钢琴进行全方位的声音采样,基于Kontakt平台与KSP脚本语言根据钢琴乐器发声原理进行声音设计,最终实现了一款可真实重现钢琴演奏效果的钢琴音源。本文详细介绍了三角钢琴音源采样方法与录音方法,然后重点阐述了将采样信号制作成为钢琴音源的方法,包括采样编辑、映射、逻辑控制以及界面和功能设计方法,希望为未来采样乐器的录音、制作与改进提供参考与帮助,最后使用制作完成的音源进行了音质主观评价实验,对音源制作的质量进行较为全面的评价,对比了采样音源与真实钢琴录音听感的不同之处。