魏 娟
(南京信息工程大学管理工程学院,江苏 南京 210044)
随着网上购物的普及和Web 2.0 的发展,购物平台和社交网站产生了大量的用户生成内容,这些海量内容包含了用户心理和行为数据,以及对产品或服务的使用体验。 大数据驱动的智能制造科学与方法体系正在形成,数据驱动的研究方法在效率和客观性方面有其独特的优势,对海量在线评论的智能分析引起了诸多领域研究人员的关注。 通过文本挖掘,提取用户需求、用户满意度、情感倾向、评论生成意愿、产品设计改进思路等。 贾丹萍等以手机产品评论为例,结合感性工学理论和情感分析,有效地获取用户感性需求;在线评论中蕴含消费者对产品的关注点,冯坤等使用LDA 模型提取在线评论中的主题,以此作为顾客满意度的影响因素;陆蔚华等从用户在线评论数据中提取出用户需求,将其与产品特征相对应,基于数据驱动的产品智能优化设计方法,通过聚类算法和多目标遗传算法来优化产品设计。 通过情感分析可以计算用户对产品属性的关注度和满意度,同样可以挖掘出用户不满意的产品特征,杨程等基于评论大数据提出了产品设计改进方法。 因此,从海量评论数据中提取出用户关心的产品特征和属性显得尤为重要。 本研究使用TextRank 算法提取出用户关心的产品属性,并根据专业领域的相关知识对产品属性进行分类;采用基于情感词典匹配的方法,获取用户在产品属性层面的情感倾向,并对情感得分较低的评论内容再次分析,挖掘哪些因素导致了消费者的不满意,为消费者购买决策和企业产品设计改进提供决策支持。
大多数B2C 电子商务网站的产品评论包括评论者、评论内容、会员星级以及评论时间等,使用Python 获取相应产品的评论数据。 高质量数据是文本挖掘和数据分析的前提,因此,必须对数据进行预处理,包括数据清洗、文本去重、去停用词、分词以及词性标注。 使用Python 对文本进行简单的符号处理,对比两行数据是否完全相同;引入停用词字典,匹配评论内容中的停用词进行删除;数据清洗和去重之后,采用Jieba 分词工具进行分词和词性标注。
产品属性在评论中一般体现为名词或名词短语。 完全机器的产品属性提取方法,只考虑词频等信息,可能会出现许多无意义的名词或名词短语,不能精确筛选出产品自身的属性。 Jieba 分词提取关键字有两种方式——TF-IDF 算法和 TextRank 算法。 TF-IDF 算法是通过词频提取关键词,缺陷是过滤的停用词有限,而且需要人工处理标点符号和数字。 TextRank 算法是一种基于图排序算法,来源于谷歌的PageRank 算法,利用局部词汇之间的关系(共现窗口)对后续关键词进行排序,直接从文本本身提取,TextRank 算法提取关键词的步骤如图1所示。
图1 TextRank 提取关键词的步骤
本文使用Jieba 分词进行分词和词性标注,通过TextRank 算法进行词频统计,提取出名词以及名词短语集合,并计算权重,人工识别产品属性并进行分类。
W
为1;②搜索句子,将情感词典与句子中的词语匹配,查找句子中出现的第一个情感词,记录对应的权值W
;③匹配否定词词典,搜索情感词前出现的否定词,假设否定词的个数为n
,赋予否定权值为(-1);④搜索情感词的程度副词,匹配程度副词词典对应的权重W
;⑤按计算公式(1),计算情感得分并用score 记录;⑥搜索下一个情感词,重复以上步骤,进行求和运算,得到最终句子的情感分值。式中,W
代表初始权重,W
代表程度副词的权重值,W
代表情感值的权重值,n
代表否定词的个数,k
代表句子中共有k
个情感词。本研究通过八爪鱼数据采集软件,对京东商城笔记本电脑的商品评论数据进行简易采集,选择四款价格相近的笔记本电脑进行评论内容以及产品属性的比较,笔记本电脑的型号及评论数分别为华硕飞行堡垒(990 条)、联想拯救者 Y7000(1217 条)、惠普暗影精灵4(993 条)以及戴尔G3(991 条),采集的内容包括会员、评价星级、评论内容、评论时间等,并将其保存为.xlsx 文件。
数据预处理包括数据清洗、分词和词性标注。首先,清洗数据,处理噪声数据、填补缺失值以及纠正数据中的不一致。 用Python 语言清洗数据中的标点符号,并进行文本去重,分别剩余798 条、991条、854 条和833 条评论内容。 其次,利用停用词字典匹配的方法去除停用词。 最后,使用Jieba 分词工具,将商品评论数据导入Python 中,对数据进行分词和词性标注。
对预处理后的评论数据进行词频统计。 由于产品属性往往是名词或名词短语,因此,统计评论数据中出现的所有名词,并计算相应词频,得到部分名词的权重排序,如表1 所示。
表1 名词权重排序(部分)
对四款笔记本电脑分别提取权重排名前100 的名词,对这些名词进行人工识别。 同时依据笔记本电脑领域的专有名词,筛选出产品属性,并对这些属性进行分类,结果如表2 所示。
表2 产品属性分类
构建专业领域的情感词典,计算四款笔记本电脑评论语句的情感得分。 对比发现,大部分评论语句的情感得分在120 以下,因此,剔除离群点,以免歪曲大多数消费者的真实评论。 将情感得分的最高值设置为120,然后,计算出每款电脑的平均情感得分。 四款笔记本电脑的平均情感得分依次为:19.97073(惠普暗影精灵4)、15.73094(联想拯救者Y7000)、13.70823(戴尔G3)和13.20322(华硕飞行堡垒)。 由此可以看出,消费者对惠普暗影精灵4 的情感得分要明显高于另外三款,联想拯救者Y7000排在第二位,略高于剩余两款。 在同等价位下,消费者对惠普暗影精灵4 更为满意。
将各款电脑的情感得分按降序排列,分别绘制出变化趋势图,如图2 所示。
图2 情感得分变化趋势图
从图2 可以看出,情感得分变化趋势在30 分左右从陡峭趋于平缓。 因此,为了深入对比四款产品情感得分的分布状况,将分值划分为30 分以上、20~30分、10~20 分、0~10 分以及 0 分以下,并绘制条形图,如图3 所示。 其中,条形图中的数字代表四款产品评论的情感得分对应五个等级的数量,例如:148 表示联想拯救者Y7000 相关评论的情感得分在30 分以上的评论数、138 表示该款产品评论的情感得分在20~30 分之间的数量,以此类推。
图3 四款笔记本电脑情感得分对比图
依据情感词之和计算每一条评论的情感得分,其中,消极情感词可能被积极情感词所中和,再加上电商平台会对差评进行过滤,因此,负向情感得分(0 分以下)的评论相对较少。 采用主观划分的方法,将评论划分为两大类:积极评论(10 分及以上)和消极评论(10 分以下)。 从图3 可以看出,华硕飞行堡垒和戴尔G3 的情感得分分布较为一致, 10 分以下的评论占评论总数的45%;相对其他产品,联想拯救者Y7000 的0 分以下的评论占比最大,且30分以上的评论占比也较高,消费者对该产品的评价不一致,好坏互现;惠普暗影精灵4 的评论情感得分主要集中在10~30 分,且差评较少。 综上所述,消费者对惠普暗影精灵4 的积极评价最多,认可度最高。
为了详细对比四款产品的特征属性,依据已构建的产品属性类别表,绘制出各产品评论中提及这些属性的评论数量对比图,如图4 所示。
图4 各属性的评论数量对比图
从图4 可以看出,消费者关注的产品属性排序为:性能、质量和配置、服务、外观、性价比和便携性。①性能。 评论中提及次数最多的是笔记本电脑的性能,选择的四款产品都是游戏本,消费群体主要集中在追求高性能的办公族或游戏党,运行速度、处理器、开机速度等性能指标是消费者最关注的属性。②质量和配置。 性能、质量和配置会影响消费者的使用体验,运行噪声、做工质量、散热情况、护眼屏幕设计、键盘鼠标等质量和配置也是消费者较为关心的产品属性。 ③服务。 与线下实体店不同,线上购买无法体验实物,遇到各种问题也难及时解决,所以物流、售后、客服态度等服务也是消费者关心的重要环节。 ④外观设计。 在性能、质量和配置相差不大的情况下,外观设计能吸引消费者的目光。 相对传统游戏本,联想拯救者Y7000 比较轻薄,惠普暗影精灵4 窄边框设计出众,华硕飞行堡垒的金属拉丝处理形成视觉冲击感。 ⑤性价比和便携性。 本研究中性价比和便携性是提及次数较少的两类属性,这与已有研究结果存在差异。 原因如下:首先,随着消费水平的不断提高,消费者不再过分追求性价比,而是更加关注笔记本电脑的性能、质量等产品属性;其次,选择的四款产品是游戏本,其主要特征是高性能、厚尺寸和大重量,游戏本一般是放置在家中,不需要外出携带,所以消费者对便携性的关注相对较少。
可以依据各属性的评论情感得分深入比较消费者对四款笔记本电脑的青睐程度,如图5 所示。
图5 各属性的情感得分对比图
从图5 可以看出,除了便携性,惠普暗影精灵4和联想拯救者Y7000 全部领先其他两款电脑;虽然惠普暗影精灵4 中的评论中提及性价比和服务的数量较少,但是这款产品在两类属性的情感得分表现尤其突出;联想拯救者Y7000 在质量、性能、外观、配置上领先其他产品,但存在部分极端评论(情感得分在0 分以下),导致联想拯救者Y7000 的平均情感得分低于惠普暗影精灵4。
由评论中提及属性的数量可知,消费者较为关注的是笔记本电脑的性能、配置和质量等属性,在这几个方面表现最好的是联想拯救者Y7000。 但是,不同的消费者有不同的需求,追求性能、配置和质量的消费者可以考虑购入联想拯救者Y7000,而追求性价比、售后服务的消费者可以考虑购入暗影精灵4,在便携性上表现最好的是戴尔G3。 相对其他三款产品,华硕飞行堡垒的表现不是太突出。
笔记本电脑行业竞争日益激烈,生产厂商想在市场取得一席之地,必须时刻关注消费者的需求和意见。 综上所述,消费者比较关注性能、质量和配置三类产品属性。 因此,提取这三类属性的评论内容,对其中的负面评价进行详细分析,有助于给商家优化产品提供些许建议。
为了保证产品属性情感得分计算的准确性,本研究提取了包含产品属性的评论分句,对产品特征词及描述词进行记录和识别,从负面评论中筛选评论分句。 而负面评论也会包含正向情感词,所以评论分句的产品属性情感得分不能完全真实地反映产品的缺陷。 基于情感词典匹配的方法运行速度慢,提取出的分句多,用来判断哪些产品属性需要改进不够准确。 因此,这里采用Python 中的snowNLP 工具重新计算负面评论分句的情感得分,计算结果如表3 所示。 提取出分值小于0.5 的分句,然后筛选出特征词,进行观察和分析。 具体分析结果如下:①戴尔G3。 质量方面:风扇、温度、噪声和散热等质量属性提及较多,表现为“风扇声音大”“温度过高”和“散热不好”等;性能方面:主要集中在开机、系统等几个属性词的描述,主要是因为戴尔G3 预装的win10 系统,有一些用户使用不习惯;配置方面:主要涉及鼠标、键盘等产品属性,因为没有赠送鼠标和电脑包,键盘没有键盘灯。 ②华硕飞行堡垒。 质量方面:消极评论同样集中在温度、散热这几个属性词的描述上,主要为“散热效果不好”“温度过高”,但是相对戴尔G3,风扇声音不大;性能方面:该款产品没有发现过多问题,同样是预装的win10 系统使用感不佳。 ③惠普暗影精灵4。 存在游戏本共有的问题:散热不好、运行时温度过高。 ④联想拯救者Y7000。 这款电脑没有过多的短板,散热、噪声问题在负面评论中也没有被过多提及。
表3 评论内容分句情感得分(部分)
通过挖掘负面评论中涉及的主要产品属性,综合消费者的需求和意见,生产厂商可以从以下方面对产品设计进行优化:游戏本共有的问题是散热不好、风扇声音大以及运行温度高,而这正是消费者较为关心的质量问题。 因此,建议生产厂商在提高笔记本性能的同时,对其散热和风扇噪声问题进行改进。
在线评论不仅反映了消费者的使用体验,还隐含了他们对产品的期待与需求。 从产品在线评论中可以提取出用户最为关心的产品属性特征,计算产品属性的情感得分,挖掘产品的优缺点,一方面,可以根据消费者需求进行个性化推荐,另一方面,能够给生产厂商提供产品设计优化的建议。
本研究收集京东商城四款笔记本电脑的在线评论,利用TextRank 算法对文本中的名词及名词短语进行统计,挑选排名前100 的名词,并参考相关专业知识,将笔记本电脑的产品属性分为七类:质量、性能、配置、性价比、服务、便携性以及外观。 运用基于词典匹配的方法和snowNLP 工具对评论内容和产品属性进行情感分析,结论如下:
第一,平均情感得分从高到低依次为:惠普暗影精灵4>联想拯救者Y7000>戴尔G3>华硕飞行堡垒。 遍历评论内容,统计包含各类产品属性的评论数量,挖掘出消费者关心的产品属性分别为性能、质量和配置、服务、外观、性价比和便携性。
第二,根据消费者的不同需求进行个性化推荐,在对比的四款产品中,关注质量、性能和配置的,建议购买联想拯救者Y7000;偏爱性价比和服务的,则建议购买惠普暗影精灵4;注重笔记本电脑的便携性的,则推荐购买戴尔G3。
第三,通过识别负面评论中的产品属性,发现游戏本普遍存在过分追求性能,而导致风扇声音大、散热效果不好的问题。 游戏本的消费群体不再过分关注性价比,因此,生产厂商在提高产品性能的同时,可以适当增加成本,用于优化产品的散热和降低噪声。
本研究在实证分析过程中仍存在需要改进的地方,具体概括为:①每条评论的效用值不同,计算产品属性的情感得分时应该考虑每条评论的效用值;②文本去重的方法不够严谨,没有完全过滤掉一些重复度较高而且无意义的评论;③每个分句可能涉及不止一个属性,以分句的情感得分作为某个产品属性评价值的方法不够严谨。