高 楠
(中国传媒大学 音乐与录音艺术学院/传播声学研究所,北京 100024)
电声产品最终要服务于人们的听觉,因此,除了对其声音质量的客观测试外,主观音质评价也是必不可少的。主观音质评价所采用的节目源包含各种声音信号,方便厂商对电声产品和系统进行音质提升与改进,也利于用户对电声产品和系统的认识与评价。
“为了确保在不同时间、地点进行主观声音评价的结果具有一致性和可比性,就需要采用一套统一的标准节目源。”[1]中国电子科技集团公司第三研究所(简称“三所”)曾在1989年制定了《电声产品声音质量主观评价用节目源编辑制作规范》GB 10240—88,随后根据此标准在1996年推出了《电声产品声音质量主观评价用节目源》[2]国家标准 CD版(以下简称“1996版标准节目源”),2017年又推出了一套《声音质量主观评价用节目源标准样品》GSB16-3451—2017[3](以下简称“2017版标准节目源”)。2017版标准节目源相比1996版标准节目源主要有以下几大区别:(1)1996版的无消声室录音,2017版的都是消声室录音;(2)1996版的共26个节目段,2017版的共66个节目段;(3)1996版的采用磁带模拟录音,以44.1 kHz/16 bit的CD数字格式储存,而2017版的采用96 kHz/24 bit的数字播放机储存和模拟格式输出;(4)2017版都是由知名演奏家使用上乘的乐器录制而来的,质量更出色。
在消声室环境下录制的2017版标准节目源也称之为干信号,但在实际使用中,不是任何情况下都要使用干声信号作为声源。在不熟悉的环境下,采用干声源或许更合适,如音乐厅、歌剧院等工程的声学验收和音质鉴定等。但在主观评价监听扬声器时,“使用消声室录音也有以下问题:(1)在消声室这种很不自然的环境中,演奏者不可能‘自然’地演奏;(2)演出的声音也是不自然的,评价人员从一开始就不可能判断哪个扬声器放声显得更‘保真’些。”[4]“评价厅堂的扩声系统,除用原声测试乐曲(或语言)外,还要有加有少量录声混响成分的音乐、语言录声和粉红噪声来测试。”[5]另外,由于干信号不包含空间信息,也不太适合用于评价电声产品和系统的低音空间感和立体声临场感等特性。因而,只采用干信号的2017版标准节目源也是有一定局限性的。
在熟悉或标准监听的环境下,对电声产品的音质以及电声系统的立体感、频响和动态特性等的评价,是完全可以使用非干声源的信号,所以1996版标准节目源延用了二十多年。国际上EBU推出的《用于主观评价声音质量的录音材料:EBU-SQAM光盘》(Sound Quality Assessment Material-Recordings for Subjective Tests: User’s handbook for the EBU-SQAM compact disk)EBU-TECH 3253[6](简称“SQAM”)也早已广泛应用于国内外各类电声产品和系统的测评中。
笔者借鉴国内外相关的节目源制作标准和经验,对照2017版标准节目源,采用公开出版录音作品为音源,编撰了一套同样符合相关国家标准,且可用于普通电声产品的测试、听音实验和音响工程调试等的声音质量主观评价用节目源(以下简称“自编节目源”)。该套自用节目源将给厂商和用户提供更多的参考和选择,且公开出版的节目源并不唯一,在遵循相关国家标准的基础上,可以根据实际需求同类替换,使用灵活、方便。
目前,中国已颁布并实施的有关声音评价用主观节目源的国家标准主要有以下几个标准:
《收音机、录音机听音试验》GB/T 9375—1988;
《电声产品声音质量主观评价用节目源编辑制作规范》GB 10240—88;
《扬声器听音试验》GB/T 12058—1989;
《厅堂、体育场馆扩声系统听音评价方法》GB/T 28047—2011;
《声音质量主观评价用节目源标准样品》GSB 16-3451—2017等。
《收音机、录音机听音试验》GB/T 9375—1988[7]中,对节目源内容的规定包括:
a. 语言:男、女声;
b. 音乐戏曲:包括钢琴曲、弦乐、管弦乐、打击乐、电子乐、民乐、男女声独唱、合唱、戏曲等;
c. 自然声;
d. 粉红噪声。
对节目源质量的规定包括:时间为20 s ~40 s,动态、频响和失真应高于被听机器的技术指标,节目源无明显音质缺陷。
《电声产品声音质量主观评价用节目源编辑制作规范》GB 10240—88[8]中,对声音质量主观评价用节目源内容的规定主要包括:
a. 语声:男、女声普通话朗读;
b. 声乐:男、女声独唱、无伴奏混声合唱(或童声合唱)和戏曲;
c. 器乐:西乐(钢琴、弦乐、管乐、打击乐及合奏)、民乐(唢呐、笛子、箫、二胡、扬琴、琵琶等典型民族乐器独奏和合奏)和电声乐器;
d. 其它:钟声、火车声、虫鸟鸣声、汽笛声等。
对节目源质量的规定包括:底噪尽量低,质量真实、自然,且立体声定位准确等。
《扬声器听音试验》GB/T 12058—1989[9]中,对节目源的建议是:至少5种不同特点的节目源,一种要有男声语言,另一种为用最强音演奏的丰满的交响乐曲,其它可以是西乐、民乐、戏曲、自然声和重放声级很高的通俗音乐。
《厅堂、体育场馆扩声系统听音评价方法》GB/T 28047—2011[10]中,对节目源的要求包括:语声、声乐、器乐和效果声。节目源的编辑与制作要求是在短混响和近距离条件下录制,有少量乐器组合演奏的片段。
《声音质量主观评价用节目源标准样品》GSB 16-3451—2017[11]中,节目源包含了语声、声乐、器乐、打击乐和大钟。
综合各个标准中对节目源的规定,可以得出节目源包含四大类:
a. 语声:男、女声普通话朗读;
b. 声乐:男、女声独唱、伴奏混声合唱和戏曲;
c. 器乐:西乐、民乐;
d. 其它:钟声、火车声、自然声等。
另外,往往还有用于调整和检查的信号。所有节目源应该尽量保证自然、真实和平衡。节目源总体质量要求主要包括:频响不窄于40 Hz~18 000 Hz、动态不小于80 dB、乐句完整、立体声定位准确、环境噪声足够低等。
国际上有关声音质量主观评价用节目源的行业标准主要包括:
AES专业音频推荐标准《扬声器的主观评价》AES20—1996(r2002);《声音质量主观评价》ITU-R BS.562.3(1990年);《包含多通道声音系统的音频系统中小损伤的主观评估方法》ITU-R BS.1116-1(1997年);
《用于主观评价声音质量的录音材料:EBU-SQAM光盘用户手册》EBU-TECH 3253(2008年)等。
AES专业音频推荐标准《扬声器的主观评价》(AES recommended practice for professional audio - Subjective evaluation of loudspeakers)AES20—1996[12]中,对节目源的建议主要有:(1)采用数字格式,方便传输和保持稳定性;(2)应包括原声乐器和男声语声。最好还包括男声、女声的独唱,以及合唱;(3)节目源应该反映足够的频响、动态、时间和空间等特性去完全的测试音响系统;(4)测试信号为可选项,可用于发现潜在的问题;(5)建议使用商业录音作品或同类材料。
《声音质量主观评价》(Subjective assessment of Sound Quality)ITU-R BS.562.3[13]和《包含多通道声音系统的音频系统中小损伤的主观评估方法》(Methods for the Subjective Assessment of Ssmall Impairments in Audio Systems Including Multichannel Sound Systems)ITU-R BS.1116-1[14]都明确建议,使用的节目源为EBU根据CCIR的562号建议《声音质量主观评价》在1988年所发布的第一版 SQAM[15]。2008年EBU发布了第三版SQAM,对节目源做出了详细的介绍,其节目源共70段,类型包括:
a. 校准信号和人工电子信号;
b. 语声:英语、法语和德语的男女声朗读;
c. 声乐:男女高低音独唱和合唱;
d. 器乐:西洋独奏乐、管弦乐和交响乐,以及流行乐。
其中,语声是在短混响时间录音棚内采用单点近距离传声器拾音;西洋独奏器乐是在混响时间为1.6 s录音棚内采用AB立体声拾音制式在距离乐器1 m~2 m之间录音;其它西洋管弦乐、交响乐和声乐等都节选自已发行的CD。
除上述国际标准外,SONY、PHILIPS、DENON、JAS和CBS等各国企业和组织也相继推出过自己的测试节目源[15]。
基于以上标准的内容,结合1996版和2017版标准节目源的特点,考虑到普通电声产品和系统的特点和实际需求,在遵守相关版权规定的前提下,以公开出版录音作品为来源,编辑以下的节目源,形成一套自编节目源,作为实际音质评价之用。该套自编节目源遵循国内的相关国家标准,也符合国际主流行业标准,在种类和数量上也胜于绝大多数国际企业和组织所推出的节目源。
所有节目源均可从各种发行渠道(如网上)找到,在获取无损节目源后只做节选片段的剪辑,未做任何其它处理,保证原本节目源的声音特性。剪辑的原则主要是参考了各项标准中对乐句、时长、频响和动态等的要求,即尽量展示一个完整的乐句;时长基本控制在半分钟至一分钟之间;尽可能完整的体现人声和器乐应有的频响范围;尽可能反映最大的动态部分。用户在根据此原则自行编辑所需节目源时,并一定要遵守相关的版权规定。
该套自编节目源包含语声、声乐、器乐和其它共四大类60首节目段,详见表1。
表1 自用节目源清单
在编辑节目源时,节目源尽可能采用了近些年录制的质量较好的版本,尽量选择知名演奏者的录音棚专辑,尽量节选完整的乐句。同时,考虑到过高的采样率和量化位数在实际应用中必要性,且不利于传播和应用,因此该版节目源格式都为44.1 kHz/16 bit的WAV无损文件格式,该格式是实际应用中的通用格式。
续表1
续表1
续表1
总的来讲,笔者所推荐的自编节目源在种类、数量、曲目以及时长等方面都与1996版和2017版标准节目源保持高度一致,包含各类人声(语声、清唱、独唱和合唱)和中外器乐(独奏、协奏和合奏),品类充实,较为充分地展现了人声及器乐的频响、动态与音色等特性,满足对各类电声产品和系统的主观评价使用。