田依林 黎盈盈 滕广青
关键词:在线负面评论;商品类型;有用性;分层回归;主成分分析
随着信息技术的飞速发展,网络购物逐渐取代传统购物成为大众消费的重要渠道。根据国家统计局发布的数据.2018年度前5个月,我国电商网上零售总额达到32 691亿元,同比增长30.7%,其中第一季度电商对消费增长的贡献率为85.34%。为满足社交传播互动的需求,电商网站为消费者发表购物体验提供在线平台,使商品评论传播范围突破时空的限制从实体社交圈发展到虚拟网络。同时,京东、淘宝等网站采用等级制度和积分反馈机制鼓励消费者发表在线评论以解决虚拟网络的信任危机。然而,在线评论质量参差不齐、内容信息零碎,消费者很难从浩瀚的评论中寻找到最有价值的信息,还会受到“马太效应”的影响。根据信息传播方向的差异性,可将在线评论划分为正面和负面两类。尽管在线负面评论的数量一般仅占总评论数的5%,但却属于高诊断性信息,能够大大缩减在线用户的时间成本,获得更多关注度。近年来大量研究从负面情感强度、负面评论感知、负面评论(属性)表述客观性、商家回复等评论质量和用户卷入度分析在线负面评论有用性的影响因素,并证实商品类型(搜索型、体验型)对在线负面评论有用性具有调节作用。但未能基于商品类型分析消费者信息需求的偏好与特点的差异,有针对性地筛选评论中更为重要的影响因素。基于此,本文在现有成果文献的基础上,构建分层回归模型(Hierarchical Regression Model)验证消费者在购买决策过程中在线负面评论信息接受与采纳的影响因素的理论假设,进而对比在商品类型调节作用下不同影响因素的作用程度,具有一定的理论与实践价值。
1文献综述及理论假设
在线负面评论有用性相关研究主要采用机器学习和情感分析等方法对影响因素及其有用性展开。本文将在线负面评论影响因素归纳为形式特征、内容特征、文本特征和反馈特征。
1.1在线负面评论形式特征与有用性
作为一种新的信息承载体系.在线评论以文本、图片、追加评论、发布时间等形式向消费者传递信息。附加图片是消费者对商品属性、品牌信任、情感极性等进行信息加工的重要途径,ChengYH等利用精细加工可能性模型(ElaborationLikelihood Model.ELM)的中心和边缘路径证实对于消费者而言在线评论中发布的图片区别于商家和广告提供的信息,更具说服性和可靠性,但缺乏专业性。Deng L等指出图片在视觉上正向刺激消费者情感反应并影响决策行为。图片作为诊断型信息对初始有用性评价影响显著。根据在线评论发布时间形式,可分为初次评论和追加评论。初次评论是在确认收货后,对客服服务、快递物流、商品基本质量属性等的外部感官判断。为给阅读者传递更有价值的信息,淘宝、京东、亚马逊等网站提供追加评论的渠道让消费者分享更为具体的使用体验和感受。追加评论与初次评论之间存在一定时间间隔,根据差异性可分为:1)与初次评论同向。即肯定初次评论,并对初次评论中提及的缺陷进一步完善。2)与初次评论反向。即否定初次评论,通过一段时间的使用后对初次评论进行修正。目前绝大部分研究主要针对初次评论,很少涉及追加评论。王翠翠等运用眼动追踪技术分析消费者对追加评论主观认知过程中的影响因素,证实消费者对时间间隔较长评论的有用性感知与关注程度更高。因此,在线评论的时效性对消费者决策起着至关重要的作用。Miao Q等把发布天数作为衡量评论有用性的指标.提出了在线评论具有时效性。在线评论时效性是指评论发布时间和消费者阅读评论时间的差值,时效性越强,二者之间的差值越小。单初等采用因子分析方法证实在线负面评论发布越及时,评论的有用性越大,搜索型商品的评论时效性与有用性呈正相关。根据信息选择理论,消费者在时间渐变因素的影响下,会更倾向于优先浏览关注度较高并能够提供商品原始色彩、质感、使用效果等感官体验的最新信息,因此提出以下假设:
H1:图片数量对在线负面评论的有用性具有正向影响。
H2:追加评论对在线负面评论的有用性具有正向影响。
H3:发布天数对在线负面评论的有用性具有正向影响。
1.2在线负面评论内容特征与有用性
在线负面评论的内容特征分为商品属性、语义特征、会员等级、表述客观性等方面。在线负面评论包含主观情感的表达.消费者需从中获取与商品质量、功能、价格相关的属性词或其近义词做出购买决策。Otterbacher J从亚马逊评论数据中提取属性词,利用因子分析方法证实商品评论屙l生词数量对在线负面评论有用性具有正向影响。严建援等采用回归模型分析京东商城、亚马逊和当当网的在线评论数据.证实商品属性词与评论有用性成正相关关系。但郝媛媛等基于影评数据得出相反的结论。此外,受到评论发布者性别、职业、文化水平、收入、网购经验、居住地、语言综合能力等个人属性及阅读者习惯和认知差异的双重影响,相同信息有用性发挥的效度不同。张艳丰等以亚马逊手机在线评论为例,通过K-means聚类方法构建过滤用户在线评论的有用性分类模型,验证了语义特征与负面评论有用性呈正相关。会员等级或购买履历是阅读者对负面信息可靠性判断最直观的参考依据,高等级会员在评论中被认为能够发挥“意见领袖”的作用.但Uma R K等和Racheda P等的研究表明,由于存在认知差异.会员等级越高反而会使在线负面评论有用性降低。相关研究选取不同类型的商品作为研究对象,结论存在差异。负面评论的商品属性词能够体现客观性,且评论发布者购买经验丰富,评论内容更具说服性和权威性,有利于消费者做出购买决策。因此提出以下假设:
H4:商品属性词数量对在线负面评论的有用性具有正向影响。
H5:会员等级对在线负面评论的有用性具有正向影响。
1.3在线负面评论文本特征与有用性
文本内容包含消费者对所购商品物流、客服、质量等方面的态度,内容信息越丰富,在线负面评论的有用性越强。杨朝君等指出10个字以上的负面评论才能详尽描述商品的瑕疵、样品与实物的差距等实质性信息。但Racheda P等则认为文本长度对在线评论有用性的影响不大。Lineberry QJ等的研究则表明过长的评论观点比较分散,容易偏离主题,不便于理解。Huang A H等指出文本长度对评论有用性影响存在一个临界点,一旦超过144个字数,就会加大阅读者的认知负荷,不仅有用性变得不显著,甚至会产生负向影响。消费者会根据在线评论文本内容对正面、中立、负面等情感极性做出等级格式转化。但受社会化因素的影响,情感极性并非單纯的数量化评分能够完全体现,从而导致在线负面评论等级的有用性研究结论存在较大差异。Mudambi S M等指出对于电影、视频游戏等体验型商品来说,极端负面评论过于主观,有用性较低,而中立评论因包含客观因素有用性更强。但Racheda P等基于在线评论感知可信度研究模型证实由于极端负面评论包含如消费者之前对品牌的态度、评论者评级的偏差程度等人为因素,所以有用性最高。受消费者选择性心理以及认知匹配等主要表现形式影响,评论等级是先决条件.而篇幅较长的负面评论被认为能够充分表达消费者的负面情绪,从视觉上吸引阅读者优先查看,会加深或改变原有态度。因此提出以下假设:
H6:文本长度对在线负面评论的有用性具有正向影响。
H7:极端负面评论(1星)对在线负面评论的有用性的正向影响最大。
1.4在线负面评论反馈特征与有用性
本文将反馈特征定义为消费者对在线负面评论的参与度.具体反映为商家回复和消费者回复的次数。在线评论机制中的评论回复功能提升了参与度,让阅读者深入了解商家对负面评论内容做出的解释,郑春东等指出商家针对高质量的负面评论做出合理解释能够取代在线评论造成的负面效应,有效引导阅读者信息接受和选择的认知过程。评论回复体现为消费者之间、商家与消费者之间的双向互动.回复数量较多的负面评论往往更易受到关注.从而增强负面评论的有用性,因此提出以下假设:
H8:回复次数对在线负面评论有用性具有正向影响。
1.5商品类型对在线负面评论有用性的调节作用
商品类型分成搜索型商品和体验型商品,受商品类型特点的影响.在线负面评论的文本表达形式、内容和特征存在差异,同时消费者也会将商品类型作为评判评论有用性的前提条件。消费者对搜索型商品的认知取决于商品的型号、规格、工艺等能够基本反映商品功能性特点的客观信息;而对体验型商品的认知则取决于消费者主观经验,更愿意关注在线评论中涉及主观经验和个性化使用效果的内容,尤其是负面感受。因此,本文将商品类型作为调节变量,探讨影响因素在不同类型商品中的不同作用程度。
由于影响在线评论有用性因素非常多,在研究过程中难以实现影响因素的全面覆盖,学者们大都基于研究对象和方法选择相对显性的影响因素组合,如商品特征词数量、情感极性、发布天数、会员等级、文本长度等对在线负面评论有用性进行分析。研究所选用的影响因素组合不同,会导致有用性判别存在差异,比如中立情感或极端负面情感对不同类型商品的作用度尚未形成统一结论。此外,针对追加评论和图片数量等形式特征的相关研究较少。因此,本文根据上述理论假设,以商品类型作为调节变量,以京东商城4种商品的在线负面评论作为研究对象,选取图片、追加评论、发布时间、商品属性词数量、文本长度、会员等级、回复次数、评论等级等8个影响有用性的因素组合,模型框架如图1所示。
2研究方法
2.1数据采集
本文分别以京东商城(WWW.id.eom)销售的iPhone、iPad、白酒和面膜4种商品作为搜索型商品和体验型商品代表,对影响在线负面评论有用性的影响因素进行比较。采集的数据包括商品名称、发布日期、图片、商品评论、追加评论、会员等级、回复次数、评论等级和有用性投票数等,时间跨度为2011年2月26日至2018年8月6日。采用网站中与商品在线评论对应1星、2星和3星评分等级的评论共计80873条,其中获得有用性投票评论为18119条,搜索型商品和体验型商品占比为71.80%和28.2%。具体统计结果如表1所示。
表1对不同评论等级的负面评论获得有用性投票的数量及比例情况进行初步统计,等级为2星的较弱负面评论比例最少(搜索型6.07%,体验型3.93%),远远低于1星的极端负面评论比例(搜索型76.97%,体验型84.54%)和3星(16.96%,11.53%)的中立评论比例,呈V型分布,这与以往多数研究的分析结果一致,可初步判断假设H7成立,极端负面情感评论(1星)有用性更高。
2.2研究变量
研究模型共包括10个关键变量,评论有用性通过收集评论的有用性投票加以测度。调节变量为商品类型,因变量为有用性投票,自变量由4个部分构成:形式特征、内容特征、文本特征和反馈特征评论者个体特征和评论内容特征。形式特征包括图片数量、追加评论和发布天数;内容特征包括属性词数量、会员等级;文本特征包括文本长度、评论等级;反馈特征包括回复次数。
所有变量均使用京东商城在线负面评论的真实客观数据。有用性投票和图片数量为实际值;追加评论根据有无分别记为1和0:发布天数是采集日期与该条评论发布时间的差值;商品属性词数量比是负面评论中提及商品属性词的个数与总属性词之比:会员等级采用网站会员等级作为代理由高到低转化为数值1~6;文本长度是评论的字符总数;评论等级采用网站上评论等级作为代理指标,1星记为1,2星记为2,3星记为3;回复次数是在线评论回复数与总回复数之比;商品类型为虚拟变量,搜索型记为0,体验型记为1;发布天数和文本长度参考Ghose A等的研究采用字符數常用对数形式,各变量释义详见表2。
2.3模型设定与分析方法
本文基于以上理论假设,通过逐步添加形式特征、内容特征、文本特征、反馈特征等变量,建立在线负面评论有用性影响因素分层回归模型来验证理论假设,详见式(1)~(5)。
2.4分析方法
本研究采用内容分析法(Content Analysis)获取商品高频属性词。在线负面评论属性词数量比以评论文本中提及商品属性词数与总属性词数的比例为测度指标,例如面膜包括味道、补水、透气等商品属性词。通过ROST CM6对评论文本进行分词、去停用词、提取行特征值、过滤高频词。为保证科学性,根据普赖斯高低词频分界公式:
计算结果中,iPhone、iPad、白酒、面膜的高频词阈值M分别为57、32、34、20,通过人工过滤后,建立高频特征词矩阵。以面膜为例,高频特征词矩阵如表3所示。
在线负面评论商品屙l生词数量比可以体现消费者对商品特征属性的关注程度,商品属性词比值越接近1,用户关注度越高。在确定商品属性词数量比和各类研究变量数值之后,首先采用分层回归对在线负面评论有用性不同影响因素进行分析。模型1检验形式特征对在线负面评论有用性的影响,模型2在模型1基础上加入内容特征影响因素,模型3在模型2基础上加入文本特征因素,模型4在模型3基础上加入评论反馈因素,模型5验证商品类型的调节作用。在验证理论假设的基础上,采用主成分分析法(Principal Component Analysis,PCA)对在线负面评论的形式特征、内容特征、文本特征和反馈特征等不同影响因素进行降维处理,在保持原有数据信息特征的基础上对不同类型商品影响因素的重要程度进行排序。
3分析与讨论
3.1描述性统计分析
为呈现在线负面评论等级与在线负面评论有用性之间的关系,将自变量与不同类型商品的评论等级进行离散化分类:以0.5为分界值将评论分为“有用”和“无用”两类。各变量描述性统计分析见表4,其中,变量VIF(方差膨胀因子)都小于2,说明不存在多重共线性。
3.2分层回归模型结果分析
采用分层回归法,逐步添加变量对在线负面评论影响因素模型进行分析.验证理论假设是否成立。随着自变量的增加,值(0.0232,0.0288,0.0377,0.2303,0.2406)逐渐增大,说明模型的拟合效果有所提高.模型整体拟合以及标准化参数估计结果详见表5。
3.3影响因素有用性比较
分层回归模型证实商品类型的直接作用明显(t=14.96,p<0.01),说明消费者会根据搜索型或体验型商品对在线负面评论有用性做出不同判断,同时,商品类型作为间接因素会调节其他影响评论有用性的因素与评论有用性投票之间的关系。变量较多往往会导致数据之间有一定的非线性弱相关关系,反映信息重叠。因此,本研究采用主成分分析法在保持原有数据信息特征的基础上对不同类型商品影响因素的重要程度进行排序。
分别对搜索型商品和体验型商品的原始数据进行z-score标准化处理,KMO(Kaiser-Meyer-Olkin)值分别为0.805、0.802,适合采用主成分分析法。其中,搜索型商品和体验型商品前3个主成分累积贡獻率分别为86.70%和87.08%,说明提取了85%以上的数据原始信息,各因素公因子方差排序详见表7。
表7显示搜索型商品和体验型商品影响因素公因子方差排序结果存在明显不同.对于搜索型商品.消费者在购买前可以通过电商平台获取详细商品描述和图片等属性信息,比如手机、电脑等生活必需品,因此在线负面评论中的附加图片、商品属性词和发布时间等影响因素在消费者信息接受过程中对决策的有用性影响较小。相反,评论等级、回复次数和长度等因素发挥的有用性最大(公因子方差=0.849,0.809,0.807),说明等级越低的负面评论,商家或消费者参与度越高,对负面情感说明解释的信息量越大,不仅能吸引消费者重视,也更具有说服力。
体验型商品受本质属性影响.消费者能够获取的信息相对有限,因此描述越详细越容易获得感官体验的文字内容、客观描述和附加图片打破了评论时效性的限制,而作为一种价值体现成为影响评论有用性的关键因素(公因子方差=0.879,0.869,0.861),比如附加面膜体验图片可以让消费者直观感受使用效果、真实商品品质,无疑为购买体验型商品提供了决策依据。相比搜索型商品,评论等级、回复次数等因素发挥的作用并不明显,说明体验型商品消费者面对商品的负面评论时,能保持理性态度,做出客观决策。
4结论
本研究除了验证以往研究中影响在线负面评论有用性的某些变量的作用外,还增加了图片、追加评论等影响因素,从形式特征、内容特征、文本特征、反馈特征等4个维度出发,采用分层回归模型探索不同因素组合对在线负面评论有用性的影响。在证明商品类型具有调节作用的同时发现,随着模型变量的增加,作为自变量的影响因素会发生交叠效应,强势影响因素会逐步稀释或放大其他较弱因素的有用性。
在线负面评论受商品类型影响,对消费者信息接受和购买决策产生的有用性存在差异。本研究有助于购买不同类型商品的消费者快速甄别对自己有用的评论,节约时间成本。通过对搜索型和体验型商品影响因素的重要程度进行排序发现,各类影响因素的作用度截然不同。购买搜索型商品时应寻找包含详尽描述的极端差评,并仔细阅读商家解释和用户回复,有利于消费者对商品做出客观判断。在购买体验型商品时,为消除极端评论带来的主观态度造成的负面影响,消费者应选择有图有真相、且客观的评论内容。
本文的局限性在于仅选取了4类产品分别作为搜索型和体验型商品的代表,因为在线负面评论中包含的有用性投票数据量较少,研究时采用了归类,未对产品进行逐一分析。在今后的研究中,可以加入不同类型但品类相同的数据。此外,受样本来源网站评价机制的影响,在追加评论的处理上,仅分析了是否包含追加评论与在线负面评论有用性之间的关系,而未深入分析追加评论间隔时间、追加评论与初次评论情感一致性或差异性对在线负面评论有用性的影响,这也是后续研究的重点方向。