机遇与风险:在人工智能与音乐产业之间

2023-02-24 09:53张丰艳汤盛涵
人民音乐 2023年11期
关键词:人工智能音乐

张丰艳 汤盛涵

成算法和大模型等技术的问世和不断更新迭代, 计算机理解并解决问题的能力呈现指数级增长。从2010 年初深度学习的问世至今,人工智能已经走向以多模态技术、预训练大模型为科技基础的生成式人工智能(AIGC)时代(2.0 时代)。AIGC指通过人工智能训练模型来生成全新的与训练数据相似的内容,与1.0 时代只能对已有数据进行判断和预测的分析式AI 相比,通用性和智能性更强的AIGC 在人们生活的各方面已经成为不可分割的一部分,同时也深深地嵌入音乐产业链的各个环节之中。音乐产业的每一次变革都与科技发展息息相关。2023 年5 月,“AI 孙燕姿”作为一位被调教出的人工智能歌手,受到了来自社会各界的广泛关注和讨论,AIGC 与音乐行业的结合仿佛向大家宣告了音乐产业另一个时代的来临。

音乐产业可根据不同领域的发展特性分为核心层、关联层和拓展层,在以往的相关研究中,较多将重点放在人工智能对音乐产业构架中单一层面的影响,而人工智能在音乐产业上中下游均发生着新范式的改变。在AIGC 快速冲击现实的当下,音乐产业该以何种姿态来面对? 在音乐行业瞬息万变的形势之中,我们应该如何自处? 人工智能与音乐行业的结合又将导致何种问题和挑战的出现? 这些都是亟须讨论与解决的问题。

一、音乐产业中的人工智能

人工智能技术飞速发展,其对音乐产业链的各个环节都产生着潜移默化的影响。音乐产业的核心动力是音乐创作, 人工智能除了对音乐创作产生直接影响外,还重塑着音乐产业核心层、关联层等领域的形态。通过研究音乐产业的上中下游,从供给端、传播端和消费端分类总结人工智能的痕迹,可以宏观展现人工智能对音乐行业的渗透与革新。

(一)多样与民主:AIGC 与产业供给端

不管是今年5 月“出圈”的“AI 孙燕姿”还是歌手陈珊妮于3 月份发行且在AI 界和音乐界均引起热烈讨论的AI 音乐作品《教我如何做你的爱人》,以及4 月份国外匿名网友Ghostwriter 利用歌手Drake 和the9Weeknd 的声音训练AI 模型并生成歌曲《Heart on My Sleeve》的事件, 都传递出一个讯息:音乐产业的玩法已然更加多样,且出现了新的音乐供给主体———虚拟歌手。而放眼国内外,除了歌手的声音可以被人工智能复制与调教,音乐的创作者更是可以通过人工智能软件在极短的时间内生成无数“全新”的、“不可预测”的音乐作品,这些软件大多有着效率高、耗资少、门槛低的特点,在音乐产业供给端成就一派“民主化”的景象。

1.多样化

“AI 孙燕姿”等代表了虚拟歌手的新兴趋势,这对音乐产业具有重要的意义。同样,经求证,这种热度极高的AI 翻唱背后依靠的是以歌声转换(Singing9Voice9Conversion,SVC)为基础的生成式人工智能技术,通过将“现存音色”与“目标歌曲干声”输入训练模型进行调教与音色转换,最后产出现存音色的声学作品。目前主流的音色转换模型是“SO-VITS-SVC”, 其源于2021 年6 月出现的“VITS”开源项目。 “VITS”是韩国研究者提出的一种可以实现“文生音”的语音合成模型。作为发布于今年3 月份的改良版,“SO-VITS-SVC” 可以将原始音频转化成目标音色,同时也有着比“VITS”更低的应用门槛、更少的数据需求以及更快的转化速度。AI 虚拟歌手的出现扩大了音乐创作的可能性,增加了音乐供给的多样性,不仅可以为大众的个人音乐兴趣降低门槛,也可以通过二度创作来使音乐翻红、增添新的生命力,甚至有着用现存音色合成数字生命,为人类心理抚慰作出贡献的广阔前景。

供给端的多样化还体现在AIGC 与音乐创作结合的不可预测性上。不管是音色转换模型,还是现有的其他生成式人工智能模型与软件,AIGC 始终有着可解释性较低的情况。这种类似黑箱操作的特点让人类目前对AIGC 的信任度有所保留,但是也正是其导致了人类不可预测的音乐效果的产生。如Holly+Herndon 的专辑《PROTO》里的作品“Godmother”中经过AI 人声训练而变成Beatbox 的打击乐声一样,这个有着奇异细节的声响如同一个新的声音景观。“音色转换模型是喜怒无常的,音质是不稳定的,它们对输入的反应是不可预测的。”这种不可预测性提供了让音乐创作者摆脱疲惫的音乐创作习惯的路径,也让多样化和不落窠臼的音乐的出现变得更加有可能。

2.民主化

基于深度学习技术的人工智能的特点是收到的数据量越多、种类越丰富,规模就会越大,解决问题的能力也会越来越强。这种特点导致人工智能相关的软件也百花齐放,且日渐完善。如美国音频制作软件iZotope 已经将AI 集成到他们的多功能混合工具Neutron<4 等产品中, 这个插件会监听整个音频,分析声音之间的关系并提供自动混音,音乐创作者可以根据自己的需求进行不同方向的调整;有的AIGC 的工具则为一些工作程序提供了自动化的处理,如智能母带处理公司LANDR 提供人工智能自动化的母带处理,相比于外包或雇用专业母带工程师可以大大缩减成本;甚至被称作“创意助理”的AIVA 音乐生成模型, 用户从12 种预设风格和作品参数中进行选择就能免费生成一段古典乐或者交响乐作品。人工智能技术可以让每个人都拥有自己的定制音乐工具箱,从像设置压缩器这样的细节到完成整个混音这样的分散任务,AI 都可以胜任,成为普通人身边的随身音频工程师,让每个人都可以无需复杂的动手过程和学习程序便可以运用简单的软件获得自己想要的作品。通过深度学习,AI 可以擅长各种技术任务,这些技术任务一直被视为工作中的重要组成部分。人工智能让音乐产业供给端资金需求和应用门槛都变得更低的同时,又将工作效率变得更高。

(二)智能与虚拟:AIGC 与产业传播端

人工智能对音乐产业传播端的参与与革新首先体现在音乐信息的智能收集与分发上。一般来说,狭义的音乐信息是由一系列相互关联且具有深远含义的音乐符号构建而成, 它们能够传递出一个完整的艺术信息;广义的音乐信息涵盖了如音乐媒介、音乐作品所有者以及歌迷的喜好等各种实际的数据。在收集音乐信息的过程中, 人工智能不仅可以采集如节奏、歌词、音高等音频特征的本体信息,也可以對音乐外在载体、用户偏好信息等进行采集。

1.智能化

伴随着AI 的进步,计算机变得有能力收集和提炼数字音乐平台上的各类歌曲资讯, 例如歌曲评价、听众点赞次数以及用户的喜好等。另外,音乐数据收集也包含了对音乐版权信息的自动跟踪流程。利用区块链技术和人工智能的融合,我们可以轻松地确定一首音乐作品的版权所有者,且能够对音乐版权交易的行为以及信息的更改进行自动跟踪。

音乐信息收集与分发的智能化将直接导致音乐流媒体平台的智能化转型。数字音乐流媒体平台利用AI 算法,结合用户的行为偏好和兴趣意愿等因素,通过描绘和复制用户的行为模式,实现了人群偏好的精确定位和歌曲的有针对性推送。例如,网易云音乐通过播放列表使用检测及分析应用将播放列表中的每首歌曲按播放次数、跳过次数和保存次数进行细分,通过跟踪音乐播放列表的整体情况分析音乐听众的年龄范围、性别、地理区域,针对不同听众画像推送针对性的音乐内容。此外,人工智能技术飞速发展的当下,智能化的数字音乐平台正在逐步实现对传统音乐传播把关人的功能替代。通过数字音乐平台的筛查和过滤机制,传统的音乐传播把关人得以摆脱繁琐的数据搜集任务,这不仅减轻了他们的工作负担,也提升了他们的专业水准和公正度,同时也防止了他们在做出决策或者处理信息时混入的个人审美偏好和自身的主观想法。

2.虚拟化

人工智能对音乐产业传播端的革新还体现在演出领域上。通过人工智能技术,虚拟偶像出现在了人们视野当中,并日益扩大其影响力。2021 年央视春节联欢晚会上,中国首个虚拟歌手洛天依的亮相大幅提升了虚拟偶像的大众认可度和接受度,《达拉崩吧》《权御天下》这些作品已经在众多的网络媒体上获得了广泛的观看与推广。除此之外,我们也可以看到诸如言和、乐正龙牙、征羽摩柯、墨清弦、乐正绫这样的虚拟歌手,随着开放AI 的发展也逐渐走进大众视野。AIGC 发展至今,虚拟偶像领域的各方面发展都更加地成熟。2023 年,尼日利亚音乐制作人Eclipse/ Nkasi 和他的制作团队利用ChatGPT 程序及其他人工智能工具, 仅用了三天时间和500 美元完成了一张含9 首曲目的专辑,而如果用传统的专辑制作方式,需耗费长达3 个月的时间以及数千美元。Nkasi 团队利用ChatGPT 自动生成歌詞和歌曲标题,音乐家自己负责修改部分歌词以适应专辑主题, 团队利用人工智能工具将Nkasi 录制的人声转换为专辑中的“虚拟歌手”Mya/Blue 的声音。从声音技术操作的方面来说,虚拟偶像与虚拟歌手存在显著区别:虚拟歌手更类似于“AI 变声器”, 通过歌声转换技术(Singing/Voice/Conversion,SVC)来转换音色;而虚拟偶像则是运用歌声合成技术(Singing/Voice/Synthesis,SVS),通过采集大量的人类声音样本制作成音源库,通过设定参数调用库里的声音,就可以产出人类歌唱的效果,“捏造”出新的声音。对于处在音乐产业传播端的演出行业来说, 虚拟偶像在IP 产业领域以及以广告代言、周边售卖、演唱会、直播活动为主的偶像产业领域都有着极大的发展潜力。

(三)音乐产业全链条融合:AIGC 与产业消费端

人工智能与音乐产业消费端的结合出现与生产端、传播端融合的特性。随着人工智能技术的深度应用, 音乐用户不再像过去那样被动地接受,而是自身都有机会成为创作者、传播者、消费者,并基于人工智能可以一站式变现, 成为消费端的受益者。一方面,在人工智能技术驱动下音乐传播效果得到进一步提升。在音乐文化的推广过程中,用户能够借助于人机交互的方式, 充分利用自身的优势,从而获取和分享最新的资讯,并在这一过程中发挥出“意见领袖”的角色;另一方面,实时音乐用户行为数据的智能化集取可有效实现对音乐内容的个性化定制生产,满足用户的个性化需求和建立用户集结机制,使得用户能够更迅速、更直观地了解自己的音乐文化圈子,从而有效地激发消费者的音乐需求,实现价值的转化,推动音乐产业链的高效整合。

目前很多平台上都出现了粉丝“自制”音乐的趋势,且此类粉丝加工过的歌曲在网络上出乎意料地受到短视频的青睐。无论是对歌曲去除鼓、放慢或加快速度,还是添加混响等操作,都可以看出如今的消费者正变得更加大胆和积极地参与音乐消费,且消费已然成为创作的代名词。除此之外,技术的增长也能起到推波助澜的作用,如AIVA 和Boomy这些基于人工智能而运营的平台, 不仅能让用户“在几秒钟内做出一首原创歌曲, 即使以前从未做过音乐”,更能直接与Spotify 进行联动,让使用者实现变现。像AIVA 和Boomy 这样的工具只不过是未来发展的一个缩影,目前这些技术能够替代人类劳动力的论调还难以立足,但是已经不可小觑。

二、顾虑与隐患

人工智能与音乐行业的结合给社会带来了众多惊喜,但未雨绸缪必不可少。AIGC 的蓬勃发展究竟是AIGC 为音乐产业新时代带来的第一缕光辉,还是给音乐市场以至于国际相关行业敲响的警钟?

(一)“AI茧房”导致音乐产业“金字塔”循环受困

创作成本更低的人工智能技术介入音乐创作,可能意味着今后给予音乐创作的资金支持更加有限,甚至造成严重的后果———业内大量使用“罐头音乐”,让更多音乐人才迫不得已离开音乐产业。产业的发展需要推陈出新,大量人才构成了金字塔厚重的底座,人才没了,也很难出现金字塔尖的杰作。从短期来看, 靠此前沉淀下来的作品库来训练AI,AI 能创作出还可以听的作品,音乐版权成本仿佛在降低;但从长期来看,人类的灵感才是成就人类文明的关键,音乐产业收入无法支撑最核心的创作人才的生存发展,会导致行业的创作人才流失,这是人类艺术杰作的损失。所以当法律在支持AI 发展的同时,也理应保护自然人的创作和收益,这样才不会抑制人类的创作动力。浪潮创作人论坛的圆桌会议中,时萧楠在“浪潮创作人论坛”的圆桌讨论中认为:“知识产权的背后是对于行业的经济逻辑的保护,要保护的是这个行业中的每个个体的创造性付出。”至于个人的创作被用作AI 训练,是属于合理使用范畴还是属于侵权,各国也在讨论中,美国甚至为此专门召开了听证会。不过可以肯定的是人类的音乐领域经过漫长的沉淀和发展,目前音乐产业的语料库还算充足,也可以凭由AI 的不可预测性来制造出短期内新鲜的音乐;但是音乐产业核心创作力的发展如果因为人工智能的便利而就此停顿,那么可以设想,音乐语料库用尽的那一天,便是音乐产业循环崩塌的那一天———就如同被关在茧房中的人,如果再也不能呼吸到新鲜空气,久而久之便会有窒息的风险。

(二)声音克隆诱发版权问题与犯罪风险

AI 与音乐行业的结合还可能导致版权归属、伦理道德等原则性问题,诱发违法犯罪。人工智能可以通过技术十分方便地将声音进行克隆和转移,另作他用。如果将人声克隆视为一种新的采样形式,那么目前正在国际社会上出现的情况会让人想起采样文化根源上的不公正。几十年来推动舞曲发展的世界闻名的采样, 比如被采样最多的音乐TOP10中排名第一的“Amen,Brother” 和排名第三的“Think”,这些鼓的演奏者从未因其作品的影响而获得任何报酬⑥;而最近热议的“AI 孙燕姿”也引发了大家对于版权归属和权利边界的讨论。如在5 月份的“第八届音乐产业高端论坛”上,郭春飞律师便指出孙燕姿被侵犯的是“对声音享有的人格权”,声音人格权属于民法典中规定的类似肖像权的一种保护方式; 索尼音乐娱乐全球数字业务总裁丹尼斯·科克在采访中也表示了其对人工智能合成语音技术被大规模用于覆盖歌曲和试图取代艺术家的潜力而感到严重担忧。不难想象,人工智能在处理人声方面的技术也将面临类似的侵犯人身权利的版权问题,且其问题只会随着AIGC 对大众的普及与技术门槛越来越低而变得日渐严重。

除了版权归属问题,声音克隆也有诱发违法犯罪的风险: 人工智能控制声音的能力逐渐增强,许多模拟人声进行违法犯罪的情况需要着重关注,如电信诈骗等。目前音乐产业各方也有在行动起来,环球音乐曾多次强调生成式AI 的发展将引发的版权问题, 并在有人使用旗下艺人Drake 的声音制作歌曲并走红后, 第一时间要求平台下架了歌曲;美国唱片业协会(RIAA)还联合数十个音乐行业组织成立了新的行业联盟“人类艺术运动”(Human6Artistry6Campaign), 监督AI 的使用和开发不侵犯到人类文化和艺术;2023 年11 月,YouTube 发布新规,要求创作者必须标注是否在视频中使用生成式AI 工具,否则将对其进行处罚。同时,对于使用了生成式AI 工具创作的视频,YouTube 会在平台中添加明显标签以提示观看的用户。

总而言之,在产业界拥抱新技术并赋能内容创作的同时,我们需要加快理论和规则层面思考和回应的步伐,科学解决人工智能可能带来的内容行业利益失衡问题,并在“AI 模型研发者”“目标音色歌手”和“被翻唱歌曲权利人”之间构建版权领域应有的智力劳动合理回报机制以及制定出台相关严格的法律法规,以应对电子诈骗等违法犯罪分子层出不穷的手段。

三、渗透与接纳:在人工智能与音乐产业之间

不论人工智能将带来多么大的发展阵痛,人工智能和包括音乐产业在内的各行各业相结合是必然趋势,只有适应潮流、拥抱时代,才能坚韧不拔,生生不息。

(一)人工智能的渗透与深度互嵌

人类趋利向好、寻求便利的本能促使着工业革命向前推动,由科技发展导致的生产力的发展也不会因为人们的恐惧和疑虑而停止。同时,我们也可以从前三次工业革命的历史中窥见,新的技术出现确实会挤压陈旧生产方式的生存空间,但是在生产力增加、产能过剩的情况下,人类也会不断创造出新的职业来释放产能。在腾讯研究院主办的“仲夏六日谈2023”嘉宾访谈中,中国社科院新闻与传播研究所副研究员孙萍提出,在历史脉络当中,工作和技术之间是越来越绑定的关系,它们的深度互嵌是越来越紧密的。不同的时代有不同的技术变迁,而工作也会随着技术的变迁出现不同的形态。如在巨型计算机的年代,很多“最早版本的软件工程师”做的工作是拆卸安装晶体管; 当计算机变得轻便化,就出现了打N銀<瞢_tN銂字员;等计算机能做的事情越来越多之后,就出现了office 软件的使用者。

汽车的出现虽然淘汰了大多数马夫, 但是也出现了职业司机; 当AIGC可以胜任音乐产业中许多人工角色的大部分工作,也相应会出现精通发布指令、调教人工智能混音、监测人工智能录音等更需驾驭门槛,效率也更高的职业岗位。TME 企业发展高级总监王璇在采访中表示,“如果看到效率和带来的价值都显著提升, 一定会有间接或者直接的商业应用场景产生。”技术对生活的渗透越来越深,并且在逐渐改变生活形态以及我们对于生活的某些想象。

(二)音乐产业的接纳与积极拥抱

各大音樂平台、唱片公司积极和人工智能技术相适应和结合,中国如今向着科技发展道路一路高歌猛进的态度也不容改变,如在今年9 月的新时代推动东北全面振兴座谈会上, 习近平总书记指出,要“积极培育未来产业,加快形成新质生产力,增强发展新动能”。新质生产力的提出,进一步为以科技创新推动产业创新、以产业升级构筑竞争优势指明了方向。在国外,格莱美声称“音乐行业已在担忧中接纳AI 音乐”,格莱美主办方CEO 兼总裁Harvey5Mason5Jr.曾在采访中表示,“虽然对于AI 的未知影响有些犹豫和担心,但我完全知道这必然会成为音乐行业、艺术圈乃至整个社会的一部分”。

不过,虽然人工智能可能会给我们带来更惊喜的素材,人类的主观能动性却仍决定着生成的结果如何与他们的创作愿景相匹配。音乐人的创作需求和痛点始终是音乐科技发展的重要源头,就像陈珊妮在发布AI 歌曲时感受到的那样,“技术人员和产业实际工作者必须有联结”, 不管AI 如何发展,都始终需要人类创作者去定义一个任务目标和终极的远景。未来的音乐产业工作者需要以更高的视角和以全局的心态来观察,如何在保持自己人类灵感和判断力的同时,学习使用人工智能的工具为自己提供更大的便利。历史大潮,浩浩汤汤,科技发展的齿轮不会停息,而避免被齿轮碾压的最好方式便是拥抱潮流,接纳时代。

陈积银、贾超然《ChatGPT 技术对国家安全领域的挑战与应对策略研究———基于传播学的分析视角》,《青海社会科学》2023 年第3 期,第127 页。

赵志安、胡舒雅薇《新图景与新路径:科技创新与融合时代的中国音乐产业———2020 第七届音乐产业髙端论坛综述》,《人民音乐》2021 年第2 期,第82 页。

王铉、雷沁颖《人工智能对中国音乐产业链的渗透与革新》,《现代传播》2019 年第12 期,第131 页。

尚影、韩超、吴克伟《基于分离对比学习的个性化语音合成》,《计算机工程与应用》2023 年第22 期,第159 页。

曹建峰《迈向负责任AI:中国AI 治理趋势与展望》,《上海师范大学学报(哲学社会科学版)》2023 年第4 期,第7 页。

佟雪娜、杨倩莉《人工智能时代音乐传播的变革与应对》,《传媒》2021 年第17 期,第91 页。

Yike9 Guo,Qifeng9 Liu,Jie9 Chen,Wei9 Xue,Henrik9 Jensen,Fernando9Rosas,Jeffrey9Shaw,Xing9Wu,Jiji9Zhang,Jianliang9Xu,《Pathway9 to9 Future9 Symbiotic9 Creativity》,arXiv:2209.02388[cs.AI],https://arxiv.org/abs/2209.02388,查询时间:2023 年10 月13 日。

解学芳、贺雪玲《元宇宙视域下AI 虚拟偶像产业的技术可供性演变机理与革新路径》,《艺术百家》2023年第1期,第49 页。

赵大卓《如果AIGC 时代必将到来, 音乐人该做些什么? 》,载“新音乐产业观察”公众号,https://baijiahao.baidu.com/s?id=1776285173992179194&wfr=spider&for=pc,查询时间:2023 年10 月11 日。

IFPI《2023年全球音乐报告》“人工智能正在定义它在音乐中的地位”,采访参见第19 页,查询时间:2023 年10 月11日。

腾讯研究院《工作大变革———人工智能冲击下的就业思考》, 载“腾讯研究院” 微信公众号,https://mp.weixin.qq.com/s/l3fh6BENbEmxJ_canycy2g,查询时间: 2023 年10 月11 日。

張辛欣、严赋憬《第一观察|习近平总书记首次提到“新质生产力”》, 载人民网2023 年9 月12 日,http: //politics.people. com.cn/n1/2023/0912/c1001-40075615. html,查询时间:2023 年10 月12 日。

万翛《格莱美制定新规则,音乐行业正在接受AI? 》,载“音乐先声” 微信公众号,https://baijiahao.baidu.com/s?id=1769730428421780939&wfr=spider&for=pc,查询时间:2023 年10 月11 日。

张丰艳中国传媒大学音乐与录音艺术学院教授

汤盛涵中国传媒大学音乐与录音艺术学院硕士研究生

(责任编辑张萌)

猜你喜欢
人工智能音乐
我校新增“人工智能”本科专业
奇妙的“自然音乐”
2019:人工智能
人工智能与就业
音乐从哪里来?
数读人工智能
下一幕,人工智能!
下一幕,人工智能!
音乐
音乐