刘冉(通讯作者) 李秋敏
(成都信息工程大学 四川成都 610103)
随着信息技术的进步及群众娱乐需求的不断提高,流媒体服务呈现出蓬勃发展的态势。尤其是音乐流媒体,它已经颠覆了传统的音乐产业。相比于过去,如今音乐消费者无需通过下载音频文件来获取音乐,而是通过网络或移动应用程序访问高质量的音乐。简单便捷的属性使得音乐流媒体服务越来越受欢迎。根据国际唱片业协会(IFPI)《2023年全球音乐报告》,在2022年,全球音乐销量连续第八年增长,其中流媒体总收入增长11.5% ,这使得流媒体在整个音乐市场的份额达67%,处于主导地位。放眼全球市场,美国的销售份额保持世界第一,日本稳居第二,往后相继是英国和德国。中国排名第五,跃居全球音乐流媒体服务的第五大市场。音乐流媒体服务在中国具有巨大的发展潜力。国际市场上,Spotify、YouTube音乐和亚马逊音乐等各种服务不仅引领当前的全球音乐产业,而且还在激烈争夺市场主导地位。国内市场,腾讯音乐和网易云音乐共占据市场份额的九成以上,其中腾讯音乐的竞争优势明显。音乐流媒体服务通过佣金或订阅费来盈利,消费音乐的客户越多,该服务获得的收入就越多。所以,各大音乐流媒体服务平台正不断地创新营销策略以达到吸引更多客户的目的。
市场需求拉动模式创新是获取竞争优势的一个有效途径。企业通过识别和解决用户需要,优化产品,获得利润增长。如何精确识别客户偏好,了解影响客户满意度的因素,成为解决问题的关键。关于音乐流媒体客户满意度的研究,A.H.Kaur和S.Gopinathan通过问卷调查的方式收集数据,使用偏最小二乘(PLS)法检查和分析研究模型中的关系,旨在调查信息质量、系统质量、服务质量和可信度对马来西亚音乐流媒体用户满意度的作用;D. Wulandari、U. Suhud 和 U. Purwohedi通过结构方程模型(SEM)证实了易用性、享受和娱乐对满意度有着积极且显著的影响;刘义理、朱茂然和胡莼通过分析用户行为轨迹来构建用户音乐偏好模型,为提高音乐推荐的满意度提供了新思路;吴海金、陈俊提出了一种融合分类与协同过滤的情境感知音乐推荐算法,提高个性化推荐的性能。
通过对文献进行梳理,笔者发现已有研究对于音乐流媒体服务满意度的研究主要集中在问卷形式和推荐算法的优化方面,很少有人尝试使用大规模的社交媒体数据来评估音乐流媒体服务。随着Web 2.0的发展,使用社交媒体的用户越来越多,用户之间的互动留下了大量数据。本文旨在利用社交媒体的文本数据,采用主题建模、情感分析和IPA分析从关注度和满意度两个方面对用户关注的要素进行深入分析,为音乐流媒体服务的改进提供借鉴。
数据来源:华为应用市场,App store,应用宝中爬取的QQ音乐、酷狗音乐和网易云音乐软件的用户评论。
数据预处理:(1)对评论数进行删除重复值处理,得到有效评论数10447条;(2)利用jieba库进行分词、词性标注;(3)以哈工大停用词词库为基础,结合实际情况构建停用词词典。
文本特征提取旨在从文本数据中提取关键词,以此来表示文本信息。本文提取了前20个TF-IDF值最大的词语,结果如表1所示。
表1 词频统计和TF-IDF值排名前20的文本特征词
根据TF-IDF值的计算可知,TD-IDF值最大的前20个词语分别为:音乐、喜欢、版权、广告、软件、会员、歌曲、不错、好听、非常、没有、听歌、VIP、希望、音质、垃圾、不能、很多、现在、推荐。词频统计的结果与TF-IDF值计算的结果有所差异。例如:版权、广告在TF-IDF值排序中的位置相较于词频统计的排序位置更靠前,说明用户在享受流媒体服务时看重版权、广告的因素。
为了能够更直观地对评论数据有大致了解,可以绘制用户评论的词云图。如图1所示。
图1 用户评论词云图
通过词云图可以看出音乐、会员、听歌、版权、广告、歌曲、软件、播放等词语出现的频率较高,大致了解到用户较为关注音乐流媒体服务的会员特权、版权丰富度、播放体验等。
文本特征提取和词云图的可视化可以让我们了解用户在享受音乐流媒体服务时所关注的因素,但对因素之间的联系我们却无法辨识。为了探究各因素之间的联系,我们使用ROST CM6软件对预处理后的文本数据进行社会网络和语义网络分析,结果如图2所示。
图2 共线语义网络图
由语义网络图可知,“音乐”在语义网络中与其他词汇连接较为紧密,属于核心特征词。此外还有一些重要节点,例如“歌曲”“软件”“广告”“版权”“功能”“手机”等。与“广告”相关的特征词,包括“垃圾”“恶心”“功能”“难看”等表明用户对插播广告的行为很厌恶,与“软件”相关的特征词有“版权”“垃圾”“广告”“功能”“手机”等,表明用户使用音乐软件时,比较关心软件的功能、版权及适配性等。
利用python中的snownlp库计算评论数据的情感得分,评分在[0,1]之间,本文将得分为0~0.5的评论划分为负面评论,得分为0.5~1的评论划分为正面评论,结果如表2所示。
表2 情感分析结果
LDA是一种主题生成模型,包含文档、 主题和词汇三层结构,主要用于对文本潜在主题进行挖掘。本文利用余弦相似度来确定最优主题个数,得到的结果为最优主题个数5,如图3、图4所示。
图3 LDA主题数提取
通过LDA分析可以得到5个主题并且主题所包含的特征词,本文提取了10个特征词,解释各主题的含义分别为:个性化服务、会员服务、价格计划、曲库丰富程度、技术服务,如表3所示。
表3 主题特征词汇
IPA分析法由Martilla和James在1997年提出,模型以重要性(关注度)、绩效表现(满意度)为出发点,构建二维坐标系,对影响用户满意度的因素进行评估分析。两个指标的均值将坐标系分为4个象限。其中第一象限:优势区,第二象限:保持区,第三象限:改进区,第四象限:弱势区。本文通过构建IPA模型来探究5种因素对服务满意度的影响情况,并通过象限图进行可视化。
构建IPA模型,需要考虑两个因素,即关注度和满意度。关注度的衡量标准为某主题在评论中出现的频数,满意度为各主题中正面评论的占比。结果如表4、图5所示。
图5 IPA分析结果
表4 5种因素的关注度和满意度
根据IPA的分析结果,可以得到以下结论:
(1)优势区满意度评价。
会员服务和曲库丰富程度因素处于优势区,说明用户认可会员服务,对曲库中的歌曲数量满意度较高。其中会员服务出现的频次为2583,满意度为0.711,曲库丰富程度出现的频次为2635,满意度为0.757。由此可知用户对曲库的关注度和满意度都略高于会员服务,且在五种因素里排名第一。
(2)保持区满意度评价。
技术服务处于保持区,关注度为1473,满意度为0.553。其中关注度在5种因素里排名末位,满意度位居第三。说明用户对于软件的更新、升级、播放的流畅度等较为满意,需继续保持。
(3)改进区满意度评价。
个性化服务和价格计划位于改进区内,说明用户重视这两种因素但满意度不高,急需改进。价格计划的满意度为0.324,在5种因素中排名最后,表明用户对服务的收费价格不满意,认为花费偏高,性价比不高。个性化服务方面,用户满意度为0.395,略高于价格计划,但满意度依旧处于较低水平。说明音乐流媒体平台不能精确识别用户的听歌偏好,导致个性化服务满意程度低。
针对以上IPA分析的结论,本文给出以下建议:
一是优化推荐算法,提高识别用户偏好的精准度。
音乐流媒体服务提供方应提高个性化服务的质量,能够准确地根据用户的偏好推送其感兴趣的内容。
二是制定合理的定价方案,吸引更多的付费用户。
价格因素是影响服务满意度的重要因素,因此音乐流媒体服务提供方应重视付费价格,改进营销模式,在提高服务满意度的同时争取利润最大化。
三是发挥现有优势,改进技术。
音乐流媒体服务提供方应继续发挥服务优势,对技术问题,例如软件的更新、升级等加以改进。
本文基于应用市场上QQ音乐、酷狗音乐、网易云音乐的评论数据,对音乐流媒体用户的关注热点及其满意度进行分析。使用词云图、语义网络分析进行文本特征提取,计算情感得分,对文本数据进行情感分析,利用LDA主题分析挖掘潜在主题,在此基础上,构建IPA模型对主题进行进一步研究。研究表明:用户对音乐流媒体服务中的个性化服务和价格计划满意度不高,针对个性化服务,音乐流媒体服务提供方需要提高识别用户偏好的准确度,使推荐的内容能够迎合用户兴趣。关于价格计划,音乐流媒体服务提供方则可通过改变营销策略、制定合理的收费标准来解决。