从骨笛到人工智能音乐

2023-06-22 14:07:19韩宝强
艺术学研究 2023年2期

【摘 要】 从事音乐科学研究,必须知道该学科的基本属性,是艺术科学?是社会科学?还是自然科学?中西方文艺理论都曾涉及人与自然、主观与客观的和谐统一,这些观点对认识音乐科学的基本属性有很大的启发。19世纪欧洲工业革命的兴起,为“心物”关系研究提供了实证条件,费希纳通过大量实验找到了主、客观之间的量化关系;亥姆霍兹则用实验方法探明了音乐的内在规律。最早的音乐技术皆与乐器制作有关,从石制乐器、骨笛到编钟,再到管弦乐队的发展,人类从不吝惜用最好的技术来满足听觉审美需求。随着科技急速发展,音乐科学与音乐技术的边界已变得模糊不清。当前的人工智能音乐追求所谓“端到端”技术风格,很容易千篇一律;作曲家的创作过程本质上是主、客观不断交互的过程,其中蕴含着多年积累的经验和技巧,以及骤然迸发的创作灵感,人工智能很难学到。而音乐永远是主观的艺术,无论技术发展到何种程度,音乐科技研究都应以人的听觉感受为本,传统音乐、电子音乐、未来的人工智能音乐乃至机器人音乐都应如此。

【关键词】 音乐科技;音乐科学;音乐技术;骨笛;人工智能音乐

引言

从中文字面上理解,“音乐科技”完整的意思应为“音乐科学与技术”,对应的英文应该是music science and technology,但英文文献中常见的词汇却是music technology,并不包含science,一些国外大学的专业目录经常使用的也是Music and Technology(音乐与科技)。笔者曾问过国外同行music science与music technology的区别,他们说music science一般指用科学原理分析、解释音乐现象的学科,等同于系统音乐学(System Musicology);music technology则多指技术性、实践性较强的音乐专业。笔者分析认为,系统音乐学发源于欧洲,主要包括基本乐理、乐律学、音乐声学、音乐心理学、乐器学以及作曲技术理论(不含创作)等,其特点是用科学实证方法研究音乐的基本属性和规律,这意味着系统音乐学本身就具有较强的艺术与科学的双重属性。德语中的“音乐学”(Musikwissenschaft)一词就是音乐(musik)与科学(wissenschaft)两个单词的合成体。

我国的教学体制将系统音乐学学科一分为二,作曲技术理论部分被划归作曲系,其余皆被划归音乐学系。音乐学系因主要承袭音乐史学、民族民间音乐和音乐评论的研究传统,社会科学色彩比较浓厚;而作曲系一般以音乐创作为中心,通常不太重视研究技术理论的科学内涵,这些都导致系统音乐学原有的科学属性被整体弱化。近年来,为赶上国外音乐科技的发展速度,国内很多音乐院校组建与音乐科技相关的院、系和专业,此举对解决我国音乐科学研究长期“贫血”的问题有一定帮助,然而新专业往往偏重技术和制作,忽视了音乐科学层面的理论建设,因此中国音乐理论体系的科学短板依然存在,在技术层面也很难拿出具有自主版权的成果。

受邀撰写此文,笔者主要依据的是多年从事律学、音乐声学和乐器学研究与教学的工作经验,包括2011至2017年在中国音乐学院组建、管理音乐科技系过程中积累的一些心得,希望能对刚进入或准备进入音乐科技领域的同学、同行有所帮助。另外需要说明的是,鉴于我国较少使用“系统音乐学”一词,为表述清晰,笔者用“音乐科学”指代那些属于系统音乐学的学科,用“音乐技术”指代技术性和实践性较强的学科(如音乐制作、录音、乐器工程等),二者重叠时使用“音乐科技”。

一、音乐科学发端于对心物关系的探索

从事音乐科学研究,必须要知道这个学科的基本属性,是艺术科学?是社会科学?还是自然科学?在没有出现音乐科技专业之前,从事音乐科学研究的人通常来自两个领域:音乐领域或科技领域。不同的知识背景肯定会影响人看问题的角度:有音乐背景的人习惯以主观感受为中心,强调音乐的主观性;有科技背景的人更相信仪器,一切以客观数据为依据。笔者认为,在这个问题上要特别重视汉代《礼记·乐记》中的一段话:“音之起,由人心生也。人心之动,物使之然也。感于物而动,故形于声。声相应,故生变;变成方谓之音。”[1]此言明确告知我们音乐具有主观和客观双重属性,主、客观之间有规律的互动和变化才形成音乐。这一观点虽产生于汉代[2],但在今天仍可作为认识音乐科学属性的座右铭。它与老庄所崇尚的“天人合一”观点也有某种契合之处:“天”可类比为《乐记》中的“物”,“人”即《乐记》中的“心”,当“心物合一”的时候,才能产生美妙的音乐。

西方音乐科学理论的原点在古希腊,作为哲学家兼数学家的毕达哥拉斯经常思索音乐与数学的关系,其理论的独特之处在于,他把宇宙、人和音乐三者的关系都用整数比来表达,并推测所有行星轨道间存在协和的“天体和音”,只因人类缺乏听到这些“天体音乐”的能力而无法欣赏。毕达哥拉斯对音乐的具体贡献是提出了建立在简单整数比基础上的五度相生律理论,该理论至今仍被音乐界广泛使用。

从《乐记》的“心物论”、老庄的“天人合一”到毕达哥拉斯的“天体音乐”,这些观点都涉及人与自然、主观与客观的和谐统一,对认识音乐科学的基本属性帮助极大,启发性更强。只是限于古代的生产力和科技水平低下,这些宏大想象和理论假说只能留待后人给予验证。

19世纪欧洲工业革命的兴起,不仅促进了人类生产力的发展,也给“心物”关系研究提供了实证条件。在此背景下,医学出身的德国哲学家兼物理学家古斯塔夫·西奥多·费希纳(Gustav Theodor Fechner,1801—1887)首先通过大量实验找到了主、客观之间的量化关系。他在1860年出版的《心理物理学纲要》(Elemente der Psychophysik)中,用一个简明的公式将多年辛勤实验的成果展现给世人,即S=KlgR(S是主观感觉强度,R是客观量强度,K是常数,lg是常用对数符號)[3]。该公式表明:主观感觉量与客观物理量之间是一种对数关系,当主观感觉量按算数级增长时,相应的客观物理量以指数级增加。以音高感知为例,当我们主观感觉上听到国际标准音高A时,其对应的客观物理量是频率为440Hz的振动(Hz代表每秒钟的振动次数)。高1个八度时,其对应的频率要乘以2(440×2=880),高2个八度要乘以4(440×4=1760),高3个八度要乘以8(440×8=3520),依此类推[4]。

人耳对音量的感知也符合费希纳定律,譬如目前我们常用的衡量音量大小的“分贝”(dB,用来表示声压级的单位)与所对应的物理量声压也是对数关系:分贝=20log10(p/p0)(公式中,p代表被测发音体的声压,p0代表介质的基准声压,空气的基准声压为20微帕)。根据公式可知,若空气中发音体(客观量)增加1倍,声压级(主观量)只增加6分贝。具体以小提琴为例,假设1把小提琴的平均音量为40分贝,2把小提琴的演奏音量则约为46分贝,4把小提琴约为52分贝。假设大型管弦乐队拥有32把小提琴,其全奏时的总音量理论值约为70分贝。

费希纳定律不仅适用于听觉和视觉,还适用于嗅觉、温感和压感等感知系统,在哲学、心理学、美术学和音乐学领域都产生了巨大影响。费希纳在研究过程中甚至付出了健康的代价,为获得视觉实验的第一手资料,他的眼睛受到太阳光的灼伤,但他依旧对自己的理论创建感到自豪,他说:“巴别塔因工人们语言混乱而无法建成,而我的心理物理学之塔则因无懈可击而永存于世。”[5]

然而费希纳定律后来还是被一些实验证明存在局限性,即当客观刺激量超出一定强度范围时,相应的主观感受会出现偏差。以音高感知为例,当振动频率超过中、高音区时(约在大字组至小字三组之间),人的感知就会出现异常;音量感知的情况也与之类似。这种情况属于音乐中大量存在的非线性现象,即客观量输入与主观量输出的不对等性,主要由主观听觉系统生理结构的复杂性所导致,而这也是音乐科学研究中特别值得注意的问题。

二、音乐科学的成熟

来自对乐音结构的探索

费希纳的研究虽然没有在音乐领域产生直接影响,但引发了另一位德国科学巨匠投身于音乐声学感知研究,并由此对近代音乐科学的发展产生了深远影响,他就是著名生理学兼物理学家赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz,1821—1894)。亥姆霍兹较为突出的贡献包括:用自制的共鸣器验证了复合音中泛音的分布以及泛音与音色之间的量化关系;通过对耳蜗的生理解剖,创立了音高识别的“竖琴说”;通过实验证明拍音对主观协和感的影响并提出相关量化理论。

对音乐研究者而言,亥姆霍兹最傲人之处是展示了如何用巧妙的实验方法来探明音乐的内在规律。常言道“耳听为虚,眼见为实”,音乐就属于看不见摸不着的“虚体”,亥姆霍兹所处的时代,并没有今日常见的电子测量手段,甚至没有电力供应,那么他是如何打开音乐“黑匣子”的呢?通过阅读他的《论音的感觉—音乐理论的生理学基础》(On the Sensations of Tone: As a Physiological Basis For the Theory of Music)可知,他主要采用了费希纳的心理物理学实验模式,即通过精确控制物理变量来观察、记录主观感知量,由此获取声波中的所有信息。亥姆霍兹超越费希纳之处在于,他用自己设计的工具—亥姆霍兹共鸣器(图1),探测到了不可见的声音。这种研究模式不仅极大地推进了音乐声学、音乐生理学和音乐心理学的研究,还为欧洲的系统音乐学发展奠定了更为坚实的科学基础。享誉世界的音乐学家施通普夫(Stumpf,1848—1936)、里曼(Riemann,1849—1919)和霍恩博斯特尔(Hoenbostel,1877—1935)等人都曾受到亥姆霍兹的影响,他们将亥姆霍兹的研究模式完整地继承下来并应用于和声学、比较音乐学和民族音乐学研究中。

如果说费希纳率先以实证方式打开了连通主、客观世界的大门,那么亥姆霍兹则让音乐科学走向成熟。有意思的是,音乐研究只是亥姆霍兹的“副业”,他主要是因在“能量守恒定律”(他是重要贡献人之一)、“亥姆霍兹速度分解定理”、“亥姆霍兹自由能”和“亥姆霍兹方程”等方面的贡献而赢得了国际科学界的尊重。当然,亥姆霍兹的某些音乐理论在今天看来也存在一定缺陷,如音高辨识方面的“竖琴说”、协和感知方面的“拍音说”以及音色感知方面的“泛音列说”等[6]。这或许从另外一个角度说明,较之纯粹的数理科学,音乐科学研究由于有主观因素的参与,其复杂度和困难度更高,研究结果被质疑、补充和进一步完善的概率也更高。

三、欧洲音乐科学

对中国音乐理论的影响

研究音乐科学有何意义?它对中国音乐能产生哪些影响?对此,可用前面提及的两位人物的经历,以及他们的研究对中国音乐所产生的影响,来加以说明。

作为亥姆霍兹科学思想的崇拜者,施通普夫坚持以实证主义的观念全身心地投入对乐音和音乐感知的深入研究:他与霍恩博斯特尔等人合作建立了著名的柏林音响资料馆,专门搜集整理东南亚、太平洋沿岸各国(包括中国)[7]和美洲印第安人的音乐;他还与霍恩博斯特尔和英国工程师兼音乐学家埃利斯(Ellis,1814—1890)等人共同创立了比较音乐学(Comparative Musicology),从音响比较的角度对不同民族的音乐进行形态学研究;随后,又在比较音乐学基础上加入文化背景元素研究,将其发展为当今拥有广泛影响力的民族音乐学(Ethnomusicology),这一学科对中国民族音乐研究的影响有目共睹。

同样作为亥姆霍兹研究模式的继承者,里曼则专注于将乐音、音程听感研究与欧洲古典音乐联系在一起[8]。他归纳总结的“功能和声体系”对音乐教学和创作都产生了深远影响。中国学界最为熟悉的斯波索宾和声学体系的内核基本上都源自里曼的研究。基于对自然泛音列和音级理论的认同,加之斯波索宾和声学教材的普及,功能和声理论对中国音乐创作和分析理论的发展所起到的作用既广泛又深远。然而随着比较音乐学和民族音乐学的兴起,里曼体系在中国、印度、印度尼西亚爪哇岛以及阿拉伯国家和地区的民族音乐面前,包括面对欧洲晚期浪漫派的音乐時,往往出现理论“失灵”的情况。

中国音乐家很早便从听感角度意识到,用功能和声体系配出的民族音乐与东方音乐风格不符。很多作曲者也曾尝试通过各种变通方法解决这一问题,譬如构造非三度叠置和弦结构、增加附加音、根据民族调式调整和声功能序进等。以“民族调式和声体系”命名的专著出版了很多,但总体上看,都无法取代功能和声体系的霸主地位,各类音乐入学考试的内容中居于主导地位的依然是旧有的欧洲体系。

其实,欧洲系统音乐学体系“失灵”的情况不仅存在于基本乐理和功能和声体系,也存在于曲式分析、复调、配器法等学科中。仔细分析理论“失灵”的原因,笔者认为大致可归为两类:第一,使用者没有从基本原理角度完整地掌握理论精髓,而仅仅机械照搬其中的实例来解决本民族的音乐问题,自然无法获得满意的结果。比较典型的情况是照搬西洋配器法为民族管弦乐队配器,尽管同类乐器的发声原理一样,但东方与西方乐器在音域、泛音列、响度范围、起始瞬态等方面依然存在较大差异,若原样移植,其音响效果肯定大相径庭。第二,限于历史条件,有些东方的音乐知识和规则在欧洲音乐学体系中根本就不存在,譬如中国古代常用的金石乐器(即编钟、编磬)在西方配器法教科书中根本找不到相对应的乐器,而这些板振动乐器又与管弦乐器的发声原理截然不同,其配器规律只能由我们的配器法教师在科学原理基础上自行加以归纳总结。

总体而言,引进欧洲系统的音乐学理论,还是对推动我国音乐理论建设产生了不可抹杀的积极作用,对于其中不适用于中国音乐的部分,则应依据科学原理分析个中原因,对症施药,不断进行优化总结,唯有如此,才能最终建立起适用于中国民族音乐的理论体系。

四、音乐技术与音乐科学的关系

尽管音乐技术专业出现在大学招生目录中的时间并不长,但音乐技术实际存在的历史应远长于音乐科学(系统音乐学)的历史,这符合所有科技发展的规律—发现、实践在先,理论归纳在后。

最早的音乐技术皆与乐器制作有关。考古发现表明,早在旧石器时代晚期,人类就开始用石头制作乐器。在德国乌尔姆以西的岩洞中发现了多种骨笛,距今约43000年的骨笛是用长毛猛犸象的象牙制成(图2),距今约35000年的骨笛是用秃鹫的尺骨制成(图3)。

20世纪80年代,在河南贾湖发现的骨笛制作更精良、音乐性能更优异(图4)。从笛身的刻痕和打磨得圆滑规整的音孔来看,早在9000年前,华夏先民的乐器制作技术已达到相当高的水平(图5)。贾湖骨笛是用丹顶鹤的尺骨或腿骨制成。早期人类常用鸟类骨头制笛是因为鸟骨有个共同特点,就是鸟骨中空(为获得更多氧气),很适合用来制作吹奏乐器;但鸟骨质地较硬,制作乐器时首先碰到的困难,便是必须找到比它还坚硬的钻孔材料。考古人员发现,贾湖人用于钻孔的材料为石英石(在贾湖地区也发现了石英石矿脉),其硬度恰好比鸟骨高一级。制笛的钻头有多种,较大的用于钻通骨管,较小的用于钻音孔,钻头最尖锐处仅约2毫米(图6)[9]。

研究音乐技术的发展历史,会发现一个有趣的现象:人类从不吝惜用最好的技术来满足听觉审美需求,石器时代如此,青铜时代更为显著。曾侯乙编钟可谓达到当时世界乐器制造技术的巅峰(图7),从制模浇铸到锉磨调音(图8),即使在科技水平已远超2000多年前的当今时代,仔细观察编钟的各种制作细节,仍会被当时工匠的高超技术所折服。

18世纪中叶后,欧洲借助领先的工业技术,以及通过亥姆霍兹、里曼等人在音乐科学理论方面的深入研究,其乐器科技水平得到大幅提升,良好的音准、音量控制,合理、科学的结构设计,不仅促进了管弦乐队的发展,也为音乐表演和音乐教育普及等提供了很好的基础条件,同时间接推动了西洋音乐在全球范围的推广。这一史实提示我们,弘扬本民族音乐,应重视自己乐器的精良程度,而要实现这一点的前提就是重视音乐技术研究。

如果说在亥姆霍兹的时代,尚能区分出音乐科学与音乐技术的不同;那么随着当今科技的急速发展,以及信息的无延迟传播,音乐科学与音乐技术的边界已变得模糊不清。从事音乐科学理论研究的人必须了解前沿技术的发展状况,从事音乐技术的工程师也要关注最新音乐科技理论的研究进展。在中国音乐学院音乐科技系成立之初,为达到让学生在科学与技术领域协同发展的目标,学院在专业设计上有意识地设立了1个偏基础理论的专业—“音乐声学”,1个兼顾理论与技术的专业—“乐器学”,2个偏重音乐应用技术的专业—“电子音乐”和“录音与扩声”。事实证明,这种培养音乐科技人才的模式更有利于培养出被社会认可的复合型音乐科技人才[10]。

五、音乐科技研究者应重视艺术判断力和主、客观交互能力的培养

当今,用人工智能生成的音乐已应用于很多商业公司的视频配乐中,这既可以节约制作成本,还避免了知识产权纠纷。但由此也引出一些新问题,比如人们最关心的是人工智能是否会代替作曲家?在笔者看来,要回答这个问题必须有一个前提条件:那就是要代替哪种类型的作曲家?如果要代替低水平的作曲家(或应称作曲人),答案是有可能。实际上,在人工智能出现之前,类似技术就已经存在,譬如一些软件将常用的作曲规则编入程序,只要随便写条旋律,软件就能自动配好和声和其他乐器声部,包括打击乐。若前提条件是要代替高水平作曲家,笔者认为从逻輯上讲根本不可能,因为音乐作品的水平高低是由人而不是人工智能来判断的,而人作出判断的前提是具有艺术判断力,目前再强大的人工智能神经网络也不具备艺术判断力。

通常衡量作曲家水平高低的标准之一,就是看其作品的体裁和风格是否多样化,绝对不能是千篇一律的。即便为影视作品作曲,也要按照剧情要求在情绪和节奏变化上做精心设计。但当前的人工智能追求所谓“端到端”的技术风格,即在音乐生成过程中不用人工参与,很容易产生千篇一律的感觉,这样的音乐即便免费、高产,也难以成为人们听赏的对象。人工智能无法取代高水平作曲家的另一个原因是,作曲家的创作过程本质上是主、客观不断交互的过程,主观想象的音乐要通过客观(乐器)进行表达,接着主观根据接收到的客观音响对作品及时进行分析、判断和修改,这个交互过程中蕴含着作曲家多年积累的作曲经验和技巧,更包含脑海中骤然迸发的创作灵感,而人工智能若想掌握这个交互过程,不啻让工程师放弃编程改学作曲。

笔者曾就德国用人工智能技术续写贝多芬《第十交响曲》一事写过文章,研究了这个国际化的人工智能团队续写《第十交响曲》的创作过程[11]。通过分析发现,在整个团队中,人工智能只负责生成大量贝多芬风格的音乐片段,接下来的所有工作都由音乐家接手:由研究贝多芬音乐的专家负责将片段拼接成完整的旋律并补充和声、对位,最后由作曲家完成配器。换言之,人工智能在整个续写过程中只提供了大量可能性,最终完成作品还要靠人的艺术判断以及把控主、客观交互的能力。

这里再用笔者制作高音质半导体收音机的例子,来说明主、客观交互能力培养对音乐科技研究的重要性。20世纪六七十年代,少年的我忙于给别人攒半导体收音机,慕名而来者皆因我的收音机音质好—在当年的单声道时代,这就达到听觉审美的极高境界了。而这“音质好”背后有多种因素的支撑:我会在电源电路中增加一个去耦电容以滤掉交流噪声,在输出电路中增加旁路电容以消减过多的高频信号,最重要的是有主觀听觉参与其中。因为当时我除了攒收音机还喜欢拉小提琴,因此对收音机音质有较高的判断力,能够通过调整每个元器件的数值来保证每台机器的音质。如果把组装半导体收音机视为音乐技术的一个缩影,可以从中看清这样一个道理:音乐永远是主观的艺术,无论技术发展到何种程度,音乐科技研究都应以人的听觉感受为本,传统音乐如此,电子音乐如此,未来的人工智能音乐、机器人音乐也必然如此。

结语

从43000年前旧石器时代的骨笛,到今天遍布世界每个角落的网络音乐,可以清晰地看出,音乐科技正在以指数级的加速度向前发展。展望音乐科技的未来走向,笔者只能说出一个想法,就是会有更多的可能和更多的交叉,然而再多的可能与交叉,也改变不了荀子当年在《乐论篇》中对音乐本质的界定—“夫乐者,乐也,人情之所必不免也”。

责任编辑:赵轶峰

[1] 郑玄注,孔颖达疏:《礼记正义》卷三十七《礼记》,阮元校刻《十三经注疏》,中华书局1980年版,下册,第1527页。

[2] 关于《礼记·乐记》的作者和成书年代,学界主要有两种观点:其一,认为作者是战国时期的公孙尼子;其二,认为作者是西汉河间献王刘德、毛生等人。参见薛永武:《〈礼记·乐记〉研究》,光明日报出版社2010年版,第2页。本文采用出自西汉河间献王刘德及毛生的观点。

[3] 参见Gustav Theodor Fechner, Elemente der Psychophysik (Leipzig: Breitkopf and Hartel, 1907). 心理物理学的主要研究模式是在精确控制客观刺激变量的同时,记录人的主观感受,通过大量数据分析二者之间的对应关系并以量化的形式表达,该学科由费希纳首创。

[4] 费希纳本人并未从事音乐感知方面的研究,本文所述旨在解释定律的普适性。

[5] 转引自Thomas D. Rossing, The Science of Sound (Addison-Wesley Publishing Company, 1990), 70.

[6] 参见韩宝强:《音的历程:现代音乐声学导论》,人民音乐出版社2016年版,第22—33、45—72页。

[7] 中国艺术研究院音乐研究所的金经言曾在音乐研究所保存的资料中,搜集到杨荫浏先生本人于20世纪20年代演唱的昆曲《琵琶记》录音,录音策划人正是霍恩博斯特尔。参见金经言:《关于杨荫浏先生演唱的一段昆曲录音》,《人民音乐》1999年第11期。

[8] 参见[德]贝塞勒:《近代音乐听赏问题》,[德]克奈夫等著《西方音乐社会学现状—近代音乐的听赏和当代社会的音乐问题》,金经言译,人民音乐出版社2002年版,第1—4页。

[9] 参见河南省文物考古研究所编著:《舞阳贾湖》上卷,科学出版社1999年版,第358页。

[10] 这一点可以从毕业生的就业情况得到证明,大部分学生毕业后都能找到与音乐科技相关的工作,其中不乏在高校从事音乐科技教学工作或在知名信息公司从事音乐科技研究工作。

[11] 韩宝强:《人工智能续创贝多芬第十交响曲带给我们的启示》,《南京艺术学院学报(音乐与表演)》2022年第1期。