人工智能在数字音乐中的应用

2015-10-09 20:33曾奕凡高军晖
科技资讯 2015年18期
关键词:人工智能数字音乐

曾奕凡++高军晖

摘 要:该文讨论了人工智能在数字音乐中的多个应用,并对当前的技术成熟度做出分析,最后对人工智能在数值音乐中起到的作用做出总结,并展望未来的发展方向。

关键词:人工智能 数字 音乐 旋律识别流行预测 创作进化树 音乐情绪

中图分类号:TP18 文献标识码:A 文章编号:1672-3791(2015)06(c)-0043-02

人工智能(Artificial Intelligence)是20世纪中后期兴起的一门学科,属于计算机科学的范畴之内。它的主要目的是让机器能够学习知识并且运用学到的知识来解决问题。换句话说,就是让机器能够拥有人类的思维方式。人工智能在近三十几年来取得了飞跃性的进展,并且在众多领域都得到了应用,例如机器人,互联网,模式识别等。不仅仅如此,人工智能在数字音乐中甚至都有十分重要的应用。数字音乐(Digital Music)是以数字的形式储存的音乐,它们可以被音乐编辑软件任意的创作,编辑,播放,拥有传统唱片所没有的灵活,快捷。正因为如此,人工智能在数字音乐中有了用武之地。该文将主要讨论人工智能在数字音乐中的四个应用,分别是旋律识别,预测音乐是否流行,描绘音乐进化树以及心理疾病的音乐治疗。

1 人工智能在数字音乐中的应用

1.1 旋律识别

旋律识别的基本原理来自于模式识别(Pattern Recognition)。模式识别是指计算机通过数学方法来判定数据是否属于已存在的模式之中并对数据进行适用于该模式的处理。模式识别的价值在于让机器通过已有的知识应用在新的数据上,让计算机拥有解决问题的能力。旋律识别就是把现有的旋律作为一个模式,储存在计算机中之后,给计算机听一段新的旋律,让其判定是否与已知的旋律匹配,来达到识别音乐的目的。现在许多软件中的“听歌识曲”功能都来源于此。

准确的旋律识别需要精密的算法,而这也是专家们研究的方向。王峰、张雪英、李炳男[1]对和弦识别进行了研究。和弦识别是音乐调式分析和自动标注的基础,同时在分析音乐的结构和旋律方面有着非常重要的作用。结合音乐理论和信号处理知识,提出一种基于MPCP(Mel Pitch Class Profile)特征和CRFs(Conditional Random Fields)模型的和弦识别方法。利用短时傅里叶变换(STFT)对音乐信号进行时频变换,定义了一种新的MPCP特征,最后用CRFs对和弦进行识别。实验结果表明,提出的方法在识别率上由于其他方法,具有一定的潜力[1]。胡颖、田丽红、王峰[2]全面总结了音乐和弦识别领域所取得的主要研究成果,重点介绍了音乐特征的提取,和弦识别等方面采用的各种智能分析处理方法,并对该领域中存在的主要困难和将来的发展方向提出来一些看法。旋律识别是人工智能在数字音乐中非常有前景的一个应用,将会为数字音乐的智能化做出巨大贡献[2]。

1.2 预测音乐是否流行

用计算机预测音乐是否流行可以通过数据挖掘(Data Mining)来实现。

据the next web报道[3],英国的音乐发现软件Shazam曾在2012年夏季预测过夏季将会流行的音乐榜单。Shazam怎样得出这样一个榜单?答案很简单:挖掘数据资源。每天有两亿用户使用Shazam的同时会生成七百万条标签,所以Shazam对流行音乐趋势的把握总是走在我们的前面。这些数据也可以用来预测音乐流行趋势。

对音乐流行趋势的预测可以帮助人们更好的跟上当前音乐的流行风向标,让人们能够听到最时髦的音乐。

1.3 音乐创作的进化树

音乐的进化树在音乐风格的研究中非常重要,因为它能梳理出某个艺术家的音乐风格或是某种音乐流派的发展趋势。人工智能使得计算机能够通过特殊的算法来分析出某种音乐的进化树。Joe George和Lior Shamir[4]使用了一种自动化的定量分析法来分析一些流行音乐专辑之间的相似度。他们的算法能够让计算机将每首歌转换为类似二维频谱的视觉图片。这张图能够显示歌曲声波变化的频率、形状以及纹理。接着,该算法通过比较声音的“频谱”来对不同的歌曲进行分析与排序,最后利用统计学方法对两首歌曲进行相关性分析。他们对披头士(The Beatles)的歌曲与专辑的相关度进行了分析,并画出了树状图,见图1。图1中,歌曲以及之间的连线长短表示它们的相似度,距离越长,相似度越低,反之亦然。

该算法分析出了《Please Please Me》出自披头士的第一张专辑《With the Beatles》,它也正确地指出了披头士不同时期的专辑顺序。它同时显示,披头士的这些早期的歌曲和晚期的歌曲,比如“Abbey Road”是截然不同的。虽然《Let it Be》是披头士发行的最后一首歌曲,但实际上这首歌比《Abbey Road》录制的更早。也就是说,尽管打乱了发行日期,他们的算法仍可以根据歌曲的特征,从而正确地识别出歌曲创作的顺序。不仅如此,他们还分析了U2,ABBA,Queen等其他著名乐队,都基本正确地排列出了专辑和歌曲正确的时间顺序。

在他们的另一篇论文中,他们把目光转向了对不同音乐流派之间相似度以及不同的音乐家与音乐流派间关系的相似度进行了分析[5]。通过与上文类似的方法,他们成功地分析出了音乐流派之间的关系以及以流派为标准的音乐家之间的关系。这些进化树都大大促进了学者们对音乐发展历程的研究。

1.4 音乐情绪与音乐治疗

丹尼尔·鲍林(Daniel Bowling)等人[6]研究音乐与情绪的关系。音乐何以通过琴弦来表现或欢快或悲凄的主题?一场振奋人心的演说往往配以激昂的大调乐曲,其鲜明的节奏,流畅优美的旋律,常常蕴涵着某种自得其乐的情绪在其中,如著名的G大调弦乐小夜曲。而在另一些场合,如要对一位颇受人们爱戴的逝者致以哀挽的悼词时,舒缓、婉约的小调乐曲无疑是最好的选择了,人们也可以在小调曲营造的凄切氛围中尽情地表达自己的哀思。很显然,要让音乐烘托出某种气氛,与彼时彼刻所处的场景以及所发生的事是密不可分的。

那么,为什么大调音使人欢欣雀跃,而小调音令人沉痛哀伤呢?这是音乐史上一个非常古老的问题。为了揭开这层神秘的面纱,美国杜克大学(Duck university)神经学家丹尼尔?鲍林(Daniel Bowling)及其同事对大调音和小调音在7500首西方古典乐曲和芬兰民歌中的分布作了统计。结果发现,小三度音(minor thirds)占小调曲中音符总数的15%,而在大调曲中仅占不到1%。

近年来,有人用人工智能的计算方法对各种音乐标注心情或情绪。Emokit公司在互联网上建立一个平台,提供音乐来匹配用户的情绪,使用户产生感官上的共鸣。他们通过穿戴设备获得用户的语音、面部表情、心率等体征的数据来识别情绪,在理想情况下准确率达到80%。

2 结语

人工智能所带来的模式识别,数据挖掘,聚类分析等等技术已经在数字音乐中有了重要的应用。在数字音乐产业日渐蓬勃的今天,人工智能未来必然会在音乐领域发挥更加重要的作用。

参考文献

[1] 王峰,张雪英,李炳男.基于CRFs和MPCP特征的和弦识别研究[J].计算机工程与应用,2011,47(18):198-200.

[2] 胡颖,田丽红,王峰.音乐和弦识别算法综述[J].科技情报开发与经济,2010(26):149-152.

[3] ANNA HEIM. Music discovery service Shazam leverages its data to predict this summers music hits[EB/OL](2012-5-31).http://thenextweb.com/media/2012/05/31/uk-music-discovery-app-shazam-leverages-its-data-to-predict-this-summers-music-hits/.

[4] George J, Shamir L. Computer analysis of similarities between albums in popular music[J].Pattern Recognition Letters, 2014,45(11):78-84.

[5] Joe George, Lior Shamir.Unsupervised analysis of similarities between musicians and musical genres using spectrograms.Artificial Intelligence Research,2014.

[6] Bowling D L,Gill K,Choi J D,et al. Major and minor music compared to excited and subdued speech.[J].Journal of the Acoustical Society of America,2010,127(1):491-503.

猜你喜欢
人工智能数字音乐
2019:人工智能
人工智能与就业
答数字
数读人工智能
数字看G20
下一幕,人工智能!
音乐
成双成对
数字变变变
音乐