基于社会网络分析的知识付费产品负面在线评论研究
——以喜马拉雅为例

2020-01-16 05:38严春燕
天津商务职业学院学报 2019年6期
关键词:特征词课程内容负面

严春燕

江苏开放大学,江苏 南京210036

一、问题提出

知识付费是一个有着特定含义的概念,知识付费所涉及的知识, 不是一般意义上的知识,知识付费虽也是为内容付费,但不同于为娱乐性内容而付费。自2016 年以来,知识付费用户规模从2015 年的0.48 亿人增长至2018 年的2.92 亿人, 市场规模从2015 年的15.9 亿元增长至2018 年的165.8亿元,知识付费产业呈爆发式增加。 但是,随着公众对知识付费产品新鲜感的降低,用户在使用知识付费产品过程中对内容的辨别和筛选能力逐渐提高,越来越需要知识的生产者创造出优质的产品以满足用户的需求。 对于众多的知识付费产品,消费者的用户体验, 不同知识付费平台的产品内容和质量以及存在问题具有重要的研究价值。

现有文献关于知识付费的研究主要集中在商业模式、消费者行为、付费意愿等方面。 严建援等通过对“得到”和“知乎”平台的商业运营模式进行探索性案例研究,得出订阅型在线知识付费商业模式的构成要素与主要特征。 张帅等通过半结构化访谈,提取了影响用户在线知识付费行为的7 个主要因素, 并从中发现个体需求为最重要因素,信息质量是影响知识付费的关键。 杨昕雅等研究发现:兴趣动机、感知有用性、感知易用性、 学习能力以及消费能力为喜马拉雅FM 用户付费行为的主要影响因素。卢恒等从抵制的视角研究语音问答社区用户知识付费意愿的影响因素。 然而,关于知识付费评论研究较少,涉及的研究也仅仅是针对评论数量的研究。 如,蔡舜等对知识付费产品销量的影响因素进行研究发现,价格对知识产品销量有负向影响,但是当产品评论数量足够多时,价格对销量的负向影响减弱。 刘齐平等以“在行网”为例,通过用户评论数据,分析用户持续使用行为及其影响因素。 本研究从负面在线评论的角度出发,对知识付费产品的负面在线评论文本内容进行深入分析,探索知识付费产品的现状以及存在的问题,并提出相关的建议。

二、研究设计

(一)研究方法

本研究采用内容分析法和社会网络分析法对负面评论文本内容进行分析。 目前,内容分析法已广泛应用在社会科学研究各个领域,多应用于政策和旅游行业分析,也有学者将该方法应用于评论文本的分析。相比于问卷调查方法, 内容分析法在一定程度上克服了传统数据搜集准确性低及不利于开展大规模调查的缺陷。 现有的评论文本分析领域已有很多学者将内容分析应用于消费者行为分析、情感分析等。 社会网络分析法是分析系统内各因素间关联度以及各因素对整个系统影响程度的方法。 也常用于评论文本的挖掘分析。 本文首先提取负面在线评论文本中的高频特征词,进而对这些高频词汇进行细致的归纳, 再使用社会网络分析法对负面在线评论进行深入分析,挖掘知识付费中存在的问题。

(二)数据来源

为了保证样本数据的完整性和代表性,综合考虑知识付费产品的分类、课程名称、销量、用户评分、评论数量、评论内容等信息, 本研究于2019 年9 月分别选取喜马拉雅平台的“人文”“历史”“个人成长”“商业财经”“外语”五个模块的课程,采集了销量排名前20 的课程评论内容作为研究样本。 共采集100 门课程的概况数据,并获得3.8 万条在线评论数据。 用户只有在收听喜马拉雅知识付费课程规定时长后才能对课程进行评论, 确保了评论内容能反映用户的真实情况。 课程评价的满分是5 分,用户对课程给出低于满分的评价, 说明该课程存在改进的空间或未达到用户的预期或需求。本文筛选了所有课程评价低于4 分的在线评论信息,经过初步筛选,共获得有效负面评论数据2759 条。

(三)研究步骤

1. 数据清洗。 整理负面在线评论文本,减少噪音数据干扰, 包括删除无用评论和有用评论中的无效信息。 本研究挖掘的是关于知识付费产品负面评论中反映的问题。首先,对过于简单的评论,如“差”“很差”等文本无法反应具体问题的评论直接剔除;其次,剔除评论文本中存在明显与主题内容不相关的无效评论;最后,剔除评论文本中所有的数字、标点符号、空格以及撰写评论时加入的表情符号。 最终得到评论文本为纯文字的文本数据, 筛选得到可用评论1878 条,共计6 万余字。

2.分词选词。使用GooSeeker 对样本评论进行自动分词。将每一个分词对照对应的样本数据进行人工选词, 根据词频出现频率,从高到低筛选出有意义的高频特征词。过滤如“这个”“那个”“怎么” 等常见的介词、连词、助词等词语。 手工补录被切断出现频率高的词汇,最终得到负面在线评论关键词。

3. 编制高频特征词汇表与绘制语义网络图。 在软件分词的基础上,对负面在线评论进一步人工归类。 首先,将含义相似,用词不同的词汇归入同类因素。 如“教材”“文稿”“材料”“资料”等属于学习资料。 根据同义词组, 将高频词汇表中的同义词进行合并计算处理, 整理出负面评论高频特征词表。 然后,将高频词汇进行分类汇总,总结归纳知识付费产品高频特征词, 对知识付费产品存在问题进行分类。最后借助Ucient和NetDraw 工具,结合高频词汇对知识付费产品负面在线评论文本进行社会网络分析。

三、数据分析

(一)样本描述分析

本研究共收集有效负面评论样本1878条。 从课程类别来看,“个人成长”“历史”“人文”“商业财经”“外语” 类课程的差评率分别是7.67%,3.95%, 5.34%, 21.87%,7.26%。 “商业财经” 类课程的差评率高达21.87%, 而 “历史” 类课程的差评率为3.95%,“个人成长”“人文”“外语”类的课程差评率均在10 个百分点以内。

首先,商业财经类课程标题的关键词主要集中于“投资”“商业”“实战”“销售”“赚钱”“理财”“创业”等,收听该频道的消费者学习知识付费产品获利的动机较为强烈。其次,关于“人文”类课程,“哲学”“故事会”“国学”等关键词出现的频率较高,说明人文类课程的知识主要集中在哲学、 文学领域。 再次,关于“个人成长”类课程,“训练”“管理”“高效”“心理”“时间”“沟通”“计划”等关键词出现频率较高, 说明该类课程知识主要集中于管理学和心理学领域。 再次,“历史”类课程“中国”“历史”“资治通鉴”“百家讲坛”“史记”等关键词出现频率较高,说明消费者对经典历史名著及历史类节目较为感兴趣。 最后,“外语”类课程“英语”“口语”“日语”“发音”“阅读”等关键词反映出消费者对于英语基础学习的需求。 以上可以看出,评论样本的内容分布得较为全面。

(二)词频分析

词频能够反映某一词语在整个文件或语料库中的重要程度。 一般而言,词语的重要程度与其出现的频次呈正相关。 通过对喜马拉雅平台5 个类别课程负面在线评论的文本进行分词, 并通过词频分析整理得到评论中的高频特征词。 通过对知识付费产品在线负面评论高频词汇以及对应的样本评论数据分析, 将高频词汇反映的问题进行分类归纳,见表1。

从表1 中高频词的占比可以看出,知识付费的负面在线评论中的关注点主要集中在五个方面,分别为:课程内容(49.77%),社交需求(19.08%),主讲人(16.41%),课程收费(7.98%)和教辅需求(6.76%)。

表1 负面在线评论高频特征词分类

关于主讲老师,引发消费者负面评论的主要有以下几个方面:首先,主讲人的表达有8 个特征词被提及了98 次, 占总次数的4.95%, 喜马拉雅是以音频类的课程为主,消费者会更多地关注主讲老师的声音是否好听、普通话是否标准、讲课是否具有感染力等方面;其次,主讲老师的才能有8 个特征词被提及了102 次, 占总次数的5.15%,在音频授课的过程中主讲老师的思维、水平、逻辑、经验等方面都通过语言表达体现出来;最后,主讲人分析有7 个特征词被提及了125 次,占总次数的6.31%,消费者在学习课程的过程中, 更希望听到主讲人对知识点进行深入的分析, 这就需要主讲老师对于相关问题和领域具有专业的水准。

关于课程内容,消费者发表负面在线评论最多, 有54 个特征词被提及了1163 次,占总次数的39.26%。首先,知识付费产品并没有像在线课程一样有较为清晰的知识脉络, 主讲老师在课程设计的时候并不能考虑得非常周到。 同时喜马拉雅平台在课程音频的分类上也并不像在线课程一样提供相应的支持, 而是使用了直线排列播放的模式。 因此直接导致消费者在课程内容分类、课程内容体系不完整、课程内容重复方面给出了负面在线评论。 其次,目前大部分知识付费平台,都是以用户内容生成为主,对于知识付费产品, 并没有较为统一的产品质量标准, 对于知识付费产品的生产者也没有统一的准入标准。 所以出现了课程音频质量不佳、课程形式不规范,课程内容更新慢等问题。 最后,订阅型音频类知识付费产品形式单一,传播方式只有语音。 知识付费对产品的设计、主讲老师本身的学识、授课技巧等方面要求较高, 因此负面在线评论中也出现了内容不充实、内容枯燥、课程深度不够以及课程前后质量不一等问题。 此外,知识付费产品打破了互联网知识免费获取的用户习惯, 消费者对于商业化的推销等方式存在抗拒心理。

互联网环境下,消费者的社交需求非常高,因此在负面在线评论中,提到关于交流群的问题最多。 有7 个特征词被提及了387次,占总次数的19.08%。对于教辅的需求也同样比较高, 有15 个特征词被提及了101次,占总次数的4.68%。 因为是订阅型音频课程, 消费者更希望能有在线的教学资源提供, 如主讲老师授课的讲义以及对学习过程中问题的反馈等。

产品的价格,一直是消费者关注的焦点,在知识付费产品中依然适用, 有10 个特征词被提及了158 次,占总次数的7.98%。由于消费者对于知识付费产品没有明确预期,且知识付费产品是虚拟体验型产品,价格的衡量因人而异。 所以关于知识付费产品的价格,出现了较多的负面在线评论。

(三)语义网络分析

为了进一步了解高频特征词所反映问题之间的内在联系, 本研究对知识付费产品的负面在线评论所反映的问题进行了深入分析,构造共现高频问题矩阵,绘制社会网络图。 绘图之前,合并所反映问题的高频词词频。 具体结果如图1 所示。

负面在线评论中与知识付费产品内容相关的词频占比高达49.77%, 知识付费产品的内容问题几乎占了一半。通过对共现高频词矩阵与社会网络图的分析,发现课程内容的更新相关问题,有3 个特征词被提及了226 次,占总次数的11.91%。 共现问题组“课程内容更新慢—内容不充实”(20),“课程内容更新慢—主讲人分析”(12)“课程内容更新慢—音频时间较短”(12),“课程内容更新慢—收费过高”(12)出现频次较高。 消费者反映的课程内容更新较慢,可以看出知识付费产品的消费者具有一定的学习动机和目的,希望课程内容更加充实、授课时间更久,更希望听到主讲老师的分析。知识付费产品的价格高,消费者对于知识付费内容的期待也同样高,消费者对课程更新速度也更加敏感。 内容不充实的相关问题,有11 个特征词被提及了250 次,占总次数的10.35%。 共现问题组“课程内容前后质量不一—内容不充实”(21),“音频时间较短—内容不充实”(21),“商业化推销—内容不充实”(16)出现频次较高,商业化的广告推销,音频时间较短以及内容质量差异大都会给消费者造成知识付费课程内容不充实的感受。

图1 负面在线评论高频问题共现社会网络图

负面在线评论中与社交需求相关的词频占比为19.08%,共现问题组“课程交流—课程资料”(43),“课程交流—主讲人才能”(18),“课程交流-处理课程反馈”(17)出现频次较高, 消费者在学习过程中迫切需要交流的场景为获取课程资料, 对主讲人存在的问题及课程存在的相关问题得不到反馈,信息的交流反馈不通畅,会引发消费者的不满, 知识付费产品不仅仅是单纯的一次性消费品, 知识付费产品的售后维护也很重要, 建立有效的沟通渠道和机制能够保证知识付费产品市场的健康有序发展。

四、研究结论与建议

本文以喜马拉雅平台作为数据来源,对“个人成长”“历史”“人文”“商业财经”“外语” 五个模块的课程负面在线评论进行了深入研究。 使用内容分析法对评论进行高频特征词挖掘和分类并绘制了语义网络图。 综合前文特征高频词、共现词组分析了知识付费产品存在以下问题并提出建议。

1. 在知识付费产品的内容方面发现问题最多, 目前大部分的知识付费平台以用户内容生成为主, 消费者集中反馈的问题主要集中在课程内容更新慢、内容不充实、音频时间较短、课程形式不规范、商业化推广严重、质量前后不一致等。 用户在消费前没有明确预期,缺乏可参考的质量标准。 因此, 有必要建立知识付费产品的内容准入机制、知识商品评价体系。

2. 知识付费产品的消费过程就是学习的过程,消费者在学习过程中需要交流,与此同时, 消费者加入学习群的需求也非常强烈。 知识付费消费者渴望拉近与主讲人之间的距离, 渴望通过知识付费产品的消费与其他学习者建立联系。 知识付费产品具有社交价值, 在知识付费产品的设计中应该充分考虑到知识付费产品的社交属性,建立有效的社交通道。

3. 喜马拉雅平台的内容以实用技能与人文课程为主, 主讲人很多在大众中有一定知名度,如知名媒体人、大学教授、创业者、公司高管等。 负面在线评论主要集中在主讲人的表达、才能以及分析。 订阅型知识付费产品为以音频的方式为主, 对主讲老师本身的学识、授课技巧等方面要求较高。知识付费产品的创作及制作需要更为专业的第三方课程设计和制作服务团队支持,包括负面在线评论问题比较集中的教辅,更需要较为专业的课程团队保证售后的服务,提供有效的用户反馈服务。

4. 消费者习惯了在互联网免费获取知识,对于知识付费并没有完全接受,任需要优质的知识付费产品和时间来对消费者的习惯进行培养。 目前知识付费产品的定价大多都是“卖知识”的一方根据制作成本、预期利益等“设定”出的价格。 知识付费产品具有经济、传播和教育多重属性,价格应当由价值决定。价值定价更加注重产品对用户的价值,也就意味着营销让位于真正的知识, 价值定价能够真正有效吸引知识付费产品的生产者创作出更优质的知识内容。

猜你喜欢
特征词课程内容负面
基于“课程内容六要素”的绘本文本解读路径探析
基于类信息的TF-IDF权重分析与改进①
水彩画课程内容与教学体系改革的必要性
一种面向财务文本分类的TF-IDF改进算法
析课程内容 谋教学佳策——“数的认识”模块知识的教学思考
负面清单之后的电改
基于改进TFIDF算法的邮件分类技术
OPEN:一个基于评论的商品特征抽取及情感分析框架
正面的人和负面的人
涉及商业伦理的负面事件