基于要素特点和需求分析的音乐识别软件服务设计研究

2018-11-19 11:55余森林唐旻圆

设计 2018年20期

余森林　唐旻圆

摘要：文章以音乐识别软件作为研究对象，对该类别产品的服务设计进行分析研究。通过对此类软件产品的比较、分析和较为详尽的测评，获得一些有效的数据信息。文章详细探讨了音乐识别软件的要素特点，分析了用户需求，展望了音乐识别产品向语音识别的方向转型的趋势，并指出功能导向型的设计方式正在在逐渐向服务导向型设计在过渡，这一转变，是为了引起用户通产品之间更多的情感共鸣。

关键词：服务设计音乐识别语音识别

中图分类号：TB47 文献标识码：A

文章编号：1003-0069（2018）10-0131-03

引言

互联网的全面覆盖改变了信息的搜索方式，智能手机的出现造就了新的音乐聆听方式，音乐识别软件出现是由于音乐APP的大热。音乐识别软件一直以准确、快速的识别深受用户喜爱，软件除了识别功能外，还为用户在使用过程中提供了独一无二的情感体验。“微电子、智能化等信息技术的广泛应用为信息社会变革提供了技术基础，社会整体性进入可持续发展、数字化联系、智能化产品和交互性沟通为特征的状态”。

一、音乐识别软件的要素特点

音乐APP使用便捷，在线曲库曲目数量庞大，受到了大多民众尤其是年轻人的欢迎。随之而产生的音乐识别软件也发展迅速，如今几乎每一款音乐APP都会提供“听歌识曲”的服务。当人们听到未知的曲目时，会很自然地掏出手机打开音乐识别软件对音频进行识别，这类软件的出现，简化了搜索的过程，大大提高了搜索效率，“形成了具有号召力的生活方式和服务”。

主流的音乐识别软件有三款分别为Track ID、Shazam以及SoundHound，这三款软件的工作原理基本相同，都是用户通过手机的录制曲目片段，然后将其通过软件上传至各自的数据库进行搜索和匹配，再将匹配的结果发至用户。不过实际上，音乐识别软件的识别原理并非真的“聆听”，而是识别该段曲目的特征节奏，并在软件对应的音频库里找出对应的曲目。

Track ID曾是索爱手机内置的音乐识别软件，2006年11月，索尼爱立信公司推出了首款Walkman手机W830c，这也是第一台内置音乐识别软件的手机。索尼公司在此款软件上并未进行衍生产品的开发，始终将其音乐识别功能放在首位，力求准确地识别出每一次用户搜寻的音频出处。Shazam最初需要通过拨打热线（美国地区）并保持通话状态来获取音乐片段，随后用户将收到短信，其中包含曲目名称和艺术家姓名。Shazam做到的不仅是音乐识别，还能够识别电视节目和广告，并能够根据用户的搜索内容提供相关的信息（限美国地区）。SoundHound公司除了开发展音乐识别软件外，又设计了Houndify和Hound两款软件。Hound的用途与Shazam的衍生功能相似，能够通过对用户的搜索习惯的分析，向用户他们推荐类似的节目。Houndify是一款智能语音识别产品，致力于构建一个大型的在线AI會话平台，这也是语音识别技术发展的新趋势。

笔者对三款产品进行了测试，发现它们之间还是存在一些差异，测试过程中，将会对每首曲目进行三次识别，识别成功将标记为“√”，识别失败将标记为“×”，识别错误将标记为“*”，具体数据详见（如图1）（注：进行对比时，手机放置在距离音响20cm处，每首曲目播放时音量一致。另，一旦识别成功，无论是否满三次，均将不再继续识别。）

从图片的数据中，我们可以清晰看到：Shazam具有最高的识别能力，几乎做到了全部准确识别，而SoundHound的识别准确度低于另外两款软件，Track ID介于两者之间。三款软件均未成功识别《金句Medley》这首曲目，并且对于纯音乐的识别能力都较弱。由于Track ID的开发公司索尼曾于2008年6月2日收购了Gracenote，所以曲库曾经更为全面。但索尼却于2013年12月把Gracenote的所有权售予美国第二大报业集团美国论坛公司（Tribune Company），所以，在三款软件各自的曲库数量基本持平的条件下，识别度准确率却未能在同一水准。

互联网环境下，数据爆炸式的增长，传统的储存与访问的方式，已经无法满足互联网发展的要求。“‘云是网络的一种形象化的说法，被看作是互联网的基础服务资源，如服务器的硬件、软件、数据和应用服务的集中和统一，这些资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用量付费”。音乐识别服务可以说是一种云服务，“云服务并不仅仅只是大服务器集群，其强调开放生态，参与共享，跨界融合，从本质上重塑了用户认知，消费方式和商业模式”。

音乐识别软件所呈现的“产品+服务”模式是产品设计的一种新思路，是设计由实体产品转向“解决方案”的最佳代之一。软件既具备实用到功能，又能为用户提供与众不同的服务体验，“以人为核心的服务设计在生产与消费中越来越重要”。

二、音乐识别软件的用户需求分析

音乐APP的出现，“培养”了民众用手机听音乐的习惯，随之产生的音乐识别软件，让手机作为音乐播放产品的功能更加完整。要“培养”民众使用音乐APP和音乐识别软件的习惯，首先要充分了解用户的“服务性心理”，“服务性心理指用户对基本功能满足意外人性化、个性化需求的心理情感特征，进而才能使用户和产品之间的交互产生情感共鸣。信息社会里的个人消费既关注外形，更注重物品带来的心理满足”。追求好的情感体验意味着对于设计师也提出了新的要求，设计的重点应该放在产品设计对民众的社会生活所带来的影响上。电子行业发展迅速，新奇的产品不再能激起消费者的购买欲望，用户更关注的是产品使用过程中能否获得更好的体验。迄今为止，大家已经探讨了太多的功能和应用，但都敌不过产品带给用户的直观感受和情景体验。

三款产品均为免费软件，虽然Shazam和SoundHound都提供付费版本，但功能上区别不大，只是屏蔽了多余的广告信息。音乐识别软件的关键特征是操作简便和识别准确，三款软件在进入主页面后，都只需按下页面中的主按钮就可以进行曲目录制并搜索，识别结束后，还会提示用户是否要关注该首曲目的演唱者。（如图2）软件会记录用户的搜索历史，并进行分析，以便向用户推荐类似风格的曲目。SoundHound和Shazam已经可以无缝对接Apple Music、Spotify和YouTube，可以将识别的曲目一键添加入音乐列表，便于用户试听和下载。利用手机的定位功能，软件会标记用户发现这首歌的位置，还可以看到周边使用该软件的用户正在搜寻或聆听的音乐。

三款软件均可将曲目及其相关信息分享到微博、Facebook等社交平台，无形间也为软件起了到宣传作用，两全其美。这符合了移动互联网时代用户的分享和社交需求，在社交平台里音乐不但能够彰显个性，而且还充当了人与人之间沟通的桥梁（如图3）。

在这个追求个性、实现自我的年代里，产品的个性化设计已经成为潮流，产品的卖点也早已不拘泥于技术上的新潮，还需要满足更多消费者个性化的潜在需求。音乐播放产品早已走过了硬件主导的阶段，进入了“硬件+软件+服务”的阶段，产品的造型设计、技术创新和功能开发都离不开服务系统设计的“统领”，这些也都是企业想要获取可观利润必须要考虑到的。

世界环境与发展委员会曾下过定义，“人类社会的可持续发展只能以生态、环境和自然资源的持久、稳定的支承能力为基础”。音乐识别软件无需制造和生产实体的工业产品，符合了可持续发展观的最基本原则。作为由传统的，以产品生产经济为基础的工业经济，转变为以服务为基础的服务型经济的代表之一，音乐识别功能成为了几乎每一位音乐爱好者的选择。所以，音乐识别软件是最为人们所熟知、使用频率最高的符合服务设计规范的产品之一。

现在音乐识别软件的主要功能是记录用户的使用行为，并进行分析，向用户推荐出符合用户偏好的音乐。音乐识别软件需要满足的不仅是用户对搜索功能的需要，还需满足用户额外的心理需求，并“积极鼓励和引导新的价值观和消费理念”。除去音乐本身对心灵所带来的疗愈作用，如何满足用户的社交需求、如何将曲目信息进行精简的归纳整理等，都是设计师在设计之初就需要考虑到的。电子产业发展迅速，仅靠高新技术和酷炫外型不再能够打动消费者。评价一件产品的好坏与否，除了产品本身制作精良以外，更应当注重的是对用户生理、心理、行为和文化认知等因素的了解与分析，然后根据分析设计出一套操作起来简洁高效的系统，这套系统同时也能够为企业带来可观的“盈利”，这才能算得一件好的产品。这里的盈利不仅局限于经济利益，“好的设计不仅应考虑商业回报，还应当实现社会、环境和文化价值”。

三、音乐识别软件的服务设计前景展望

随着SoundHound公司旗下Hound软件的推出，Shazam对于电视节目的识别与推荐的功能也不再独特。许多的音乐APP例如QQ音乐、虾米FM等都推出了“听歌识曲”的功能，功能单一的音乐识别软件已经走向式微，Track ID因其作风保守，已于2017年9月15日不再提供服务。随着民众对于电子设备依赖，是语音识别成为了当今的热点的重要原因之一。2015年6月，SoundHound公司上线了他们的新产品Houndify的安卓内测版，音乐识别只是该公司迈出的第一步，他们一直以来所专注于研究的是语音识别和对自然语言的处理，Houndify就是用来解决人类对于语音助手的更大需求（如图4）。与其类似的智能语音识别产品还有苹果Siri（HomePod）、Google Home、三星bixby、亚马逊Alexa（Echo）和我国自主研发的Rokid等。音乐识别正在逐渐地向语音识别进化、转变，语音即将成为未来人际互动的主要形式。

笔者认为，智能语音识别产品是由音乐识别软件发展而来的。音乐识别软件在支持精确识别的同时也是可以提供模糊识别功能的，模糊识别指的是，例如：在识别未知歌曲时，软件上会显示“请哼唱出歌曲旋律”，这样，即使是不知名的歌曲仅凭用户哼唱出大概的旋律，也会有很大几率通过软件识别出歌曲。然而，市面上现存的音乐识别软件均已将“模糊识别”的功能移除，仅支持精确识别，因为“模糊识别”功能已经被移植入了智能语音助手里，例如：当用户向智能语音助手询问一个不确定的地名时，智能音箱会根据用户所在地区，尽可能准确地向用户提供该地点的相关信息，这与音乐识别软件的“模糊识别”如出一辙。

由音乐识别转型过渡到语音识别助手这一趋势，这正是企业“力求将处在大的商业环境中与设计相关的诸多因素进行整合，并创造出新型‘商业模式的整体解决方法”。如今，智能语音助手出现了一种新的发展，虚拟的智能语音助手逐渐实体化，例如Echo、Rokid以及Google Home，这种新兴的智能音箱成为了科技界和设计界重点关注的产品。这类产品不再是对传统音箱的功能更新，真正吸引人的产品所带来的新型人机交互模式，这是一种操作系统和产品形态的组合，更是“产品+服务”的一种全新模式。这一服务性的转变，将围绕着用户的需求不断变化。音乐识别只是未来大型的AI会话平台所迈出的第一步，让语音识别产品能够真正服务于人类，做到将生活中的琐事化繁为简，将语音识别的功能可持续地发展下去，才是研发者和设计师最终的目的。

目前智能語音识别产品还处于非常早期的阶段，未来将会有更多该类型的产品走入民众的生活，因此需要对产品的功能与服务进行进一步的升级，才可以发挥更大的作用。持续将服务创新的理念和方法融入智能语音识别产品的设计策略，并不断进行更为深入的研究和探索，对于该产品的发展是必不可少的。

结语

现代社会人与物、人与人、物与物之间的联系达到了前所未有的紧密。数字时代，互联网拉近的不仅仅是人与人之间的距离，更使得虚拟体验与硬件产品之间彼此交融。科学进入了综合性的发展，跨学科的融合创新为设计提供了新的思路虽然音乐识别软件受到多数用户的欢迎，但这种仅支持音乐识别、分享和下载的产品若不根据用户需求作出改进终将遭到淘汰。产品设计逐渐由功能型设计转向服务型设计，产品设计的趋势“是以物质产品为基础，以用户价值为核心的全过程设计”。产品设计已经超越了对于物化产品的关注，而进入了系统设计的范畴，只有将产品的服务系统设计逐渐完善，才能够真正地将设计从以产品为中心转变成为以人为中心，做出真正可持续的产品。