电脑先是可以画画,然后又可以写出一本书,现在又能写歌了。
最近,在伦敦西区的艺术剧院,借助大数据技术,由电脑创造的音乐初次公演。电脑程序通过对大量成功音乐的研究、分析、学习,寻找出其中的范式。这其中需要海量的数据分析,数据源包括百老汇数据库、维基百科以及其他的在线资源。研究团队还通过问卷调查等形式,收集了许多线下数据。
这首曲子或许并不会火,但却是大数据在音乐领域的又一次有益尝试。以当下的技术水平,大数据尚难以对音乐创造环节带来颠覆。正如阿里音乐董事长高晓松所说,目前创作和互联网关系不是很大,但互联网提供的人和人的平台,是对创作和发行有相当大的影响。
如果你对此持有怀疑态度,微软的Bing成功预测2015年格莱美奖项的案例或许能让你信服。
2015年格莱美颁奖,Bing预测大热的英国创作型歌手Sam Smith最有可能获得年度制作、年度歌曲以及最佳新人奖。结果Bing不负众望,Sam Smith意料之中获得最佳新人奖,凭借《Stay With Me》斩获年度制作及年度歌曲奖,此外《Lonely Hour》还获得了最近流行演唱专辑。
Bing的预测,基于全球用户的搜索数据。数字唱片公司DigSin首席执行官杰·弗兰克曾表示,大数据技术不是要把人的因素抹去,而是最大程度地呈现人的因素——受众的反应。“这恐怕是音乐史上最平民化的时刻,”他说。
不久前,阿里音乐联合阿里云的一项尝试佐证了这一观点。工程师通过将阿里音乐平台上的用户行为数据与社交网络数据、新闻资讯数据等结合,借助阿里云“数加”上的大数据工具,预测哪些音乐人会成为下一个音乐巨星。
工程师介绍,用户在音乐平台上收听、分享、收藏音乐的行为,以及在社交网络、视频网站、贴吧论坛上做出关注、评论、转发、点赞等动作,反应了对音乐人的喜好程度。
但收集所有人的意见并作出判断,并非易事。阿里音乐的工程师介绍,该项目仅每天要处理的阿里音乐平台数据就达到了100TB,更不用说海量的外部互联网数据。
全球大数据技术的飞跃为这一设想的实现提供了基础。在过去的5年里,全球大数据计算性能实现了超过21倍的提升。2011年,Tritonsort排序100TB数据需要8274秒;到2015年,阿里云的MaxCompute只需要377秒。
大数据基础技术的提升,为各种“妄想”提供了可能。美国的House of Blues开始采用一种独特的算法去安排“拼盘明星巡演”。 BBC基于音乐雷达软件Shazam提供的数据,在全球4900个城市中找到了拥有相同音乐品味的“孪生”城市。
音乐是连接世界的一个通用媒体,而大数据则是解开它潜力的钥匙。看来,音乐行业的这场大数据革命,已是如火如荼。