陈可嘉 夏瑞东 林鸿熙 赵 政
(1. 福州大学经济与管理学院, 福建福州 350108;2. 莆田学院商学院, 福建莆田 351100)
随着顾客对企业的要求不断提高,企业需要根据市场动态迅速调整自身策略,积极改进自身产品质量和服务水平,才能在激烈的市场竞争中脱颖而出。特别在电子商务环境下,越来越多的顾客愿意在网上发表和分享自己对产品或服务的看法,这些在线评论反映了顾客的真实想法,具有数量多、产生快、格式多样、数据长短不一等特征。有效利用在线评论可以帮助企业准确地了解市场动态变化,为企业的决策提供参考依据。
满意感常被定义为顾客在购买产品或使用服务时一切消费感知的总和。(1)Hsiao C.H.,Chang J.J.,Tang K.Y., “Exploring the influential factors in continuance usage of mobile social Apps: Satisfaction, habit, and customer value perspectives” ,Telematics & Informatics,vol.33,no.2(2016),pp.342-355.不同地区的顾客在购物或使用服务时对于消费的体验不尽相同。企业若忽视顾客需求的地区差异,对不同地区采取同一策略,那么顾客整体的满意感可能会下降,而这又将进一步影响产品销量。然而,传统的顾客满意感测度方法具有数据获得困难、不够精确、耗时耗力等缺陷。在线评论则能够从顾客需求的角度探索顾客满意感测度的创新机会。(2)Zhang N.,Zhang R.,Pang Z.L.,et al., “Mining express service innovation opportunity from online reviews”, Journal of Organizational and End User Computing,vol.33,no.6(2021),pp.1-15.利用在线评论分析顾客满意感的地区差异,具有重要的研究意义和商业价值。
中文研究使用“顾客满意”“顾客满意度”“顾客满意感”等表达满意感这一术语,而英文表达“customer satisfaction”并没有“程度”的含义。(3)由丽萍、王嘉敏:《基于情感分析和VIKOR多属性决策法的电子商务顾客满意感测度》,《情报学报》2015年第10期。因此,本文认为使用“顾客满意感”这一表述较为适当。传统对顾客满意感的研究大多采用问卷调查、电话访谈等方法(4)Almohaimmeed B., “Pillars of customer retention: an empirical study on the influence of customer satisfaction, customer loyalty, customer profitability on customer retention”, Serbian Journal of Management,vol.14,no.2(2019),pp.421-435.(5)Peng Y.J.,Li J.X., “The effect of customer education on service innovation satisfaction: the mediating role of customer participation”, Journal of Hospitality and Tourism Management,vol.47(2021),pp.326-334.(6)Wangwacharakul P.,Medina S.,Poksinska B.B., “Cross-cultural comparability of customer satisfaction measurement-the case of mobile phone service providers”, International Journal of Quality and Service Sciences,vol.13,no.2(2021),pp.236-252.,但满意感是一种心理上的主观感受,受访者的回答往往受到预设问题的限制。而在电子商务环境下,在线评论则是顾客自发情感的真实体现,利用在线评论映射顾客满意感具有独特的优势。
目前对于在线评论的研究主要集中于探讨如何获取有用的在线评论,以及如何有效地管理和利用在线评论等。(7)Niu R.H.,Fan Y., “An exploratory study of online review management in hospitality services”, Journal of Service Theory and Practice,vol.28,no.1(2018),pp.79-98.(8)谢秋逸、周年兴、轩源、马小宾:《基于百度AI开放平台的北京市共享住宿顾客满意度及需求层次研究》,《南京师大学报》(自然科学版)2021年第1期。(9)Lee J.H.,Kim Y.Y., “Online reviews of restaurants: expectation-confirmation theory”, Journal of Quality Assurance in Hospitality & Tourism,vol.21,no.5(2020),pp.582-599.(10)Yin H.,Zheng S.,Yeoh W.,et al., “How online review richness impacts sales: an attribute substitution perspective”, Journal of the Association for Information Science and Technology,vol.72,no.7(2021),pp.901-917.而通过在线评论获取顾客满意感的研究,又往往需要用到文本挖掘技术。Ahmad使用文本挖掘技术,探究了顾客满意感与品牌措施效果之间的关系。(11)Ahmad A., “Evaluation of the relationship between brand measures and customer satisfaction by using data mining techniques”, Journal of Intelligent & Fuzzy Systems,vol.33,no.4(2017),pp.2451-2462.Duverger和Wang通过贝叶斯优势层次模型,捕捉了顾客满意感的相对重要性。(12)Duverger P.,Wang X., “Capturing relative importance of customer satisfaction drivers using Bayesian dominance hierarchy”, Cornell Hospitality Quarterly,vol.59,no.1(2018),pp.39-48.Sanchez-Franco等根据获得的酒店评论,使用朴素贝叶斯算法进行评论的分类以划分顾客满意感。(13)Sanchez-Franco M.J.,Navarro-Garcia A.,Rondan-Cataluna F.J., “A naive Bayes strategy for classifying customer satisfaction: A study based on online reviews of hospitality services”,Journal of Business Research,vol.101(2019),pp.499-506.Markoulidakis等在进行顾客满意感分析时,使用KNN、SVM、朴素贝叶斯、人工神经网络、卷积神经网络等多种机器学习算法进行了测试。(14)Markoulidakis I.,Rallis I.,Georgoulas I.,et al., “A machine learning based classification method for customer experience survey analysis”,Technologies,vol.8,no.4(2020),pp.76-97.Yakubu等挖掘了顾客评论的情感分数,引入基于多基因遗传规划的模糊回归方法,建立了顾客满意感模型。(15)Yakubu H.,Kwong C.K.,Lee C.K.M., “A multigene genetic programming-based fuzzy regression approach for modelling customer satisfaction based on online reviews”,Soft Computing,vol.25 (2021),pp.5395-5410.冯坤等提出了一种基于在线评论和随机占优准则的顾客满意感测评方法。(16)冯坤、杨强、常馨怡、李延来:《基于在线评论和随机占优准则的生鲜电商顾客满意度测评》,《中国管理科学》2021年第2期。
从上述相关研究可以看出,目前基于在线评论挖掘顾客满意感的研究大多侧重于如何提取顾客满意感、顾客满意感是如何对顾客行为产生影响以及如何利用顾客满意感来评价企业策略实施效果等,而少有研究着眼于顾客满意感的地区差异。针对上述问题,本文在对在线评论进行产品特征提取的基础上,综合运用文本情感分析和贝叶斯层次模型,对基于在线评论的顾客满意感地区差异进行探讨。
图1 基于在线评论的顾客满意感地区差异分析方法流程
本文提出的基于在线评论的顾客满意感地区差异分析方法主要分为以下三个阶段:第一阶段为产品特征提取,第二阶段为文本情感分析,第三阶段为贝叶斯层次模型构建及分析(图1)。
对于网上获得的在线评论,首要工作是从在线评论里提取出产品特征。
WordNet是目前较为常用且有效的针对英文语料进行分词标注的工具(17)Zhao F.Q.,Zhu Z.Y.,Han P., “A novel model for semantic similarity measurement based on wordnet and word embedding”, Journal of Intelligent & Fuzzy Systems,vol.40,no.5(2021),pp.9831-9842.,而产品特征主要以名词的形式存在于在线评论中。因此,本文借助WordNet对在线评论中出现的每一个单词进行分词标注,把其中频繁出现的并且标注为名词的单词认定为产品特征。
但在使用WordNet时需要注意,一些频繁出现的停止词(如it等)以及在线评论中常用的名词(如problem等)不可能是产品特征,需要进行人工剔除。此外,还需要考虑到两种常见的情况。第一,同一产品特征常常用不同的名词来描述,例如“battery” “charge”等都是用来描述电量这一特征。第二,有些词汇例如“app” “apps” “application”等是同一个单词的不同表述形式。对于上述这些情况,需要构建人工同义词表,把这些词汇认定为描述同一产品特征的词汇。
在借助WordNet提取出产品特征之后,接下来的工作是对在线评论进行文本情感分析。本文采用两步骤文本情感分析方法(18)Xu X.,Li Y., “The antecedents of customer satisfaction and dissatisfaction toward various types of hotels: A text mining approach”, International Journal of Hospitality Management,vol.55(2016),pp.57-69.,即先进行主客观判断,接着再对判断为主观的语句进行积极消极的情感倾向分析。
先对在线评论进行主客观的判断。对主客观的判断,可以借用公开数据集里已经人为分类的在线评论作为训练样本来构造朴素贝叶斯分类器。如果一条语句被判断为客观,那么该语句中的观点则被认为是中立的,不带有情感色彩。相反,如果一条语句被判断为主观,那么该语句中的观点则被认为是带有情感倾向的。
在提取出主观语句后,需要再构造一个朴素贝叶斯分类器来判断语句中蕴涵的情感倾向是积极的还是消极的。这里可以使用Cnet.com网站上的在线评论来构造训练样本。Cnet.com网站上的在线评论包含优点、缺点以及正文三部分,其中优点、缺点部分蕴含了顾客积极或消极的情感倾向,但其本身多为短语,并非完整的语句,不能直接用作训练样本。而其正文部分语法结构较为完整,可以考虑借助产品特征把优点、缺点部分中蕴含的情感倾向映射到正文评论里,并以此作为训练样本。具体做法:若正文语句中提及的产品特征出现在优点部分,则该语句蕴含的情感倾向就可以认为是积极的;若正文语句中提及的产品特征出现在缺点部分,则该语句蕴含的情感倾向就被认为是消极的。同时注意到同一产品特征可能同时出现在同一条在线评论的优点、缺点部分,导致对正文中涉及该产品特征的语句无法进行积极消极的划分。为了不影响分类的准确性,需要把这类无法确定情感倾向的语句从训练样本中剔除。
将在线评论的情感倾向作进一步统计分析,可以得到不同地区的顾客满意感。但不同地区可获取的样本数量有所不同,有的地区样本数量较多,有的地区样本数量较少,导致不同地区顾客反馈分析的可靠程度可能并不一致。因此,为了消除因单个地区样本数量过大或过小而造成的影响,不同于传统频率学派中参数是固定不变的观点,本文借鉴贝叶斯学派的思想,认为参数(不同地区的顾客满意感)也服从某种概率分布,并从多任务学习的角度,构建贝叶斯层次模型来估计不同地区顾客对不同产品特征的满意感。
假设在M个地区中,θi,k为地区i的顾客对产品特征fk表示满意的概率(满意感)。那么,在地区i中,Ni,k个顾客里有xi,k人对产品特征fk表示满意可用二项分布表示,见公式(1)。
xi,k~Bin(Ni,k,θi,k)
(1)
在对θi,k进行参数估计时,有两种常见的估计方法。一种认为每个地区的θi,k互相独立,互不影响,但这样实际上损失了部分信息,使得估计结果不够准确;另一种则是假定所有地区的θi,k都一样,但这种假设过于极端,完全抹去了地区间的差异。本文则采用贝叶斯学派的思想,认为不同地区的θi,k并非固定不变,而是服从某种概率分布。假设不同地区的θi,k都服从同一个贝塔分布,见公式(2)。
θi,k~Beta(ηk)
(2)
那么在参数ηk=(αk,βk)的贝塔分布下,不同地区顾客对不同产品特征的满意感分布可以视为上述二项分布和贝塔分布的一个联合概率分布,见公式(3)。
(3)
这样,θi,k的估计结果既充分考虑所有地区的样本信息,又能很好地保留各个地区的差异。
需要特别注意的是,若把ηk视为一个常量,那么不同地区间的θi,k则是条件独立的。因此,本文把ηk看作一个未知的变量(隐藏变量),这样就可以给p(θk)再加上一个先验,见公式(4)。
p(θk)=p(ηk)p(θk|ηk)
(4)
那么整个联合概率分布就可以写成公式(5)。
(5)
在构建了上述贝叶斯层次模型的基础上,可以采用马尔可夫链蒙特卡罗方法(MCMC)对ηk、θi,k进行参数估计,再取θi,k的期望值对顾客满意感的地区差异进行对比分析。(19)Yao Y.,Stephan K.E., “Markov chain Monte Carlo methods for hierarchical clustering of dynamic causal models”, Human Brain Mapping,vol.42,no.10(2021),pp.2973-2989.
图2 顾客频繁提及的手机产品特征词汇云
本文采用爬虫软件从Cnet.com网站上抓取了关于苹果、三星、诺基亚等手机品牌的在线评论,共2684段。Cnet.com网站上的在线评论包含优点、缺点以及正文三部分。在产品特征提取阶段,本文借助WordNet对其优点、缺点部分,进行分词标注,保留其中被顾客提及频率在50次以上的名词,剔除其中与手机产品特征无关的名词(如it,phone,problem等),最终得到102个表示手机产品特征的词汇,如图2所示。
在得到上述产品特征词汇的基础上,通过构建人工同义词表,把表示同一产品特征的词汇进行合并。表1展示了合并后顾客提及频率最多的五个产品特征组。从中可以看出,屏幕、电量、相机、触控、应用软件等是最受顾客关注的产品特征。事实上,当下最热门的手机产品无一不是在上述这些方面做到了最好。一个大屏幕通常是手机吸引顾客的第一要素,然而大屏幕常常意味着高耗电,这就导致屏幕和电量这两组产品特征被顾客一起提及的频率最高。
表1 提及频率最多的五个产品特征组
本文选取目前具有代表性的康奈尔影评数据集(Cornell movie-review datasets)中主客观在线评论各5000条作为训练样本,构造用于判断语句是主观还是客观的朴素贝叶斯分类器。接着,按照上文论述方法使用Cnet.com上的在线评论构造训练样本,得到2703条情感倾向为积极的语句和2684条情感倾向为消极的语句,并以此构造用于判断语句中情感倾向是积极还是消极的朴素贝叶斯分类器。
在构造完上述两个朴素贝叶斯分类器之后,本文利用爬虫软件从Amazon.com网站上抓取对苹果、三星、诺基亚等手机品牌的在线评论,共获得9541段评论,剔除地区值缺失的评论,最终得到2763段评论。但Amazon.com上的在线评论多为段落,而每个段落中又常常会涉及多个产品特征,顾客对不同产品特征的情感倾向并非一致,若对整段评论进行文本情感分析则显得不够精确,因此需要把段落评论按照“.”“!”“?”等句末符号拆分成语句。这些2763段评论拆分成语句,共95458条。接着运用上述训练好的两个朴素贝叶斯分类器进行文本情感分析。部分结果如表2所示。其中,标记为“objective”的语句,是评论者的客观性评价;标记为“subjective”的语句,是评论者的主观性评价;标记为“positive”的语句,是评论者的积极性评价;标记为“negative”的语句,是评论者的消极性评价;如果一条语句没有提及任一产品特征则标记为‘—’。
表2 文本情感分析结果示例
本文采用MCMC方法对上文构建的贝叶斯层次模型的参数进行估计,通过R编程实现,并以屏幕、电量、相机、触控、应用软件这五个顾客最频繁提及的产品特征组为例,进行对比。
表3是五组产品特征的顾客满意感分布参数ηk=(αk,βk)的估计结果。标准误都比较小,表明使用的样本能够较好地代表总体,估计效果较好。
图3至图7展示了95%置信度下,美国六大地区对这五组产品特征的顾客满意感(θi,k)区间估计结果。从中可以直观地发现,对于每一组产品特征,无论是区间估计的上下限还是期望值都因地区的不同而有明显的差异。这意味着美国六大地区顾客对屏幕、电量、相机、触控、应用软件等产品特征的满意感具有明显的地区差异。
表3 ηk=(αk,βk)的参数估计
图3 95%置信度下对屏幕的顾客满意感区间估计
图4 95%置信度下对电量的顾客满意感区间估计
图5 95%置信度下对相机的顾客满意感区间估计
图6 95%置信度下对触控的顾客满意感区间估计
图7 95%置信度下对应用软件的顾客满意感区间估计
图8 顾客满意感期望值地区差异对比
图8和表4则对这五组产品特征的顾客满意感期望值进行了地区差异对比。
实验结果表明,美国六大地区顾客对触控和相机的满意感普遍较高,而对屏幕、电量、应用软件等的满意感则较低。这说明目前顾客对手机触控和相机功能最为满意,而屏幕、电量、应用软件等则离顾客的期望还有一定距离。与此同时,美国中西部地区(0.3458)、西部地区(0.3418)、西南部地区(0.3458)的顾客对手机电量的满意感都较低,而新英格兰地区(0.3988)、中部地区(0.3803)、南部地区(0.3850)对手机电量的满意感则相对较高。一个合理的解释可能是由于美国中西部地区、西部地区、西南部区域以草原、山脉、沙漠、大湖居多,且城镇较为空旷,居住在该地区的人们户外活动时间较久,因此对手机电量的要求较高。而新英格兰地区、中部地区、南部地区大城市居多,人们的外出活动时间相对较少,手机充电较为方便,因此该地区人们对手机电量的要求相对较低。则各厂商可制定相应的差异化战略。
表4 顾客满意感期望值地区差异对比
顾客对特定产品和服务的满意情况存在地区差异。通过在线评论准确地挖掘出不同地区的顾客满意感,具有重要的研究意义和商业价值。不同于传统的问卷调查方法,本文提出了基于在线评论的顾客满意感地区差异分析方法:在对在线评论进行产品特征提取的基础上,采用情感分析技术从中挖掘出产品特征级别的顾客情感倾向,使获得的信息更加真实有效;为了尽量减少不同地区样本数量差异的影响,构造了贝叶斯层次模型对挖掘出的情感倾向进行统计分析。
从实验结果来看,屏幕、电量、相机、触控、应用软件等是最受顾客关注的产品特征。不同地区顾客对触控和相机的满意感均较高,而对屏幕、电量、应用软件等的满意感则较低。因此厂商在对手机进行设计时,可以优先考虑对屏幕、电量、应用软件等满意感较低的产品特征进行改进,从而更好地满足顾客需求。此外,美国中西部地区、西部地区、西南部地区的顾客对手机电量的满意感明显较新英格兰地区、中部地区、南部地区低。厂商则可以据此在不同地区制定差异化的营销策略,从而满足不同地区顾客的相关需求。
本文的研究对象是“在线评论”,主要限定在电子商务领域,但本文提出的模型和方法仍然可以通过适当的调整,应用到更多情景。此外,文本情感分析技术是进行在线评论挖掘的基础,如何更有效地对在线评论进行文本情感分析也是下一步的研究方向。