张艳丰 李贺 彭丽徽等
摘要:[目的/意义]针对我国在线用户评论习惯,探索用户评论行为对评论时间的影响作用因素,对电子商务运营商探究用户评论行为规律及探索潜在用户评论时间偏好具有重要的潜在商业价值。[方法/过程]基于TAM模型抽取在线用户评论行为时间特征规律研究的影响因素并构建模型,通过抽取消费者购买行为和评论行为的时间间隔为时间序列,通过多元线性回归模型进行假设验证。[结果/结论]通过对在线评论数据的实例验证,本文所构模型能够很好地发现在线用户评论行为对评论时间的影响作用关系,对消费者评论行为的时间特征规律发现和预测具有辅助作用。
关键词:TAM模型;用户;在线评论;评论行为;时间特征;影响因素
DOl:10.3969/j.issn.1008-0821.2019.01.008
[中图分类号]G252.0;G202 [文献标识码]A [文章编号]1008-0821(2019)01-0060-10
在线用户评论是在线消费用户在电子商务平台上发表的对产品或服务的使用体验和质量评估。第三方平台不仅提供电商企业整体评价端口,同时用户在电商平台进行购买和评论行为的同时,电商平台也记录了消费者的行为时间轨迹,通过时间记录的在线用户评论为潜在消费者提供了真实购买和使用信息来源,不同时间内评论内容关注的重点各不相同,电子商务用户作为经济人,其在线评论的时间特征必然折射出其内在特质,不同评论行为特征表现的消费者通常具有不同的时间行为习惯,通过时间记录的用户特征规律分析,能够为企业、平台和厂商提供不同时间段的商品购买、评论信息规律,同时也是用户行为分析和商品推荐的重要渠道。
目前通过量化方法针对在线评论时间维度的研究还很少。Jin L等通过实验研究发现消费者偏好受在线用户评论发布时间点的影响,近期评论对及时购买力决策更有吸引力,而长期评论对用户的远期购买决策更具影响力;Tirunillai S等综合多家公司和市场的产品评论数据,使用无监督LDA来抽取与消费者满意相关的关键潜在维度,通过动力学分析跟踪这些维度重要性随着时间的变化。在国内,龚艳萍等等基于水平理论的实证研究得出结论,当新产品预告与发布时间较长时,用户常发表针对产品核心属性的评论,而间隔较短时,则发表针对产品次要属性的评论;汪涛等基于归因理论,通过探索了购买时间与评论时间的时间间隔如何影响用户对体验型及物质型商品的感知有用性;胡常春等通过实验验证了追评的有用性感知显著高于初评,但追评的有用性感知受时间间隔和产品类型调节。
大数据环境下,如何针对我国在线用户评论习惯,探索用户行为的时间规律及影响评论时间的影响因素具有一定的理论创新性,对电子商务运营商探究用户评论行为规律及探索潜在用户评论时间偏好具有重要的实践意义。
1理论基础
本研究以美国学者Davis提出并应用于信息系统领域的技术接受模型(TAM)为理论框架,TAM是在理性行为理论(Theory of Reasoned Ac-tion,TRA)和计划行为理论(Theory of Planned Behavior,TPB)基础上发展而来的,国内外诸多学者将技术接受模型(TAM)作为在线评论分析的理论模型框架,Hsu C L等、Lee G等以及尹英姿、晏芳都基于TAM模型进行了在线用户评论的相关研究,证明TAM的应用不仅局限于信息系统领域,同时在市场营销、用户行为研究等领域也同样具有很好的解释效果。模型要素关系
消费者对在线评论的接受和采纳程度是在线用户购买意向与购买行为的主要前因,而在线用户评论有用性感知、在线用户评论情感感知和其他外在因素直接影响消费者是否接受评论意见。基于此,在线用户评论行为的时间特征可以通过技术接受模型的因素来度量。提取TAM模型的感知有用性、使用态度和外部因素感知3个因子变量作为评论时间特征的影响因子。其中,外部因素通过会员等级、星级评价、点赞数量和语义深度4个方面内容展现,这4个方面是影响用户购买意向的重要因素,是评论阅读者能够直接量化的特征因子;在线评论的感知有用性因素以用户综合评价后的评论质量表示;评论的使用态度因素反映用户的使用情感,在评论文本中以情感词进行表述。外部因素、感知有用性和使用态度这3个因素是技术接受模型的重要因素,同时也是用户使用行为的直接或间接前因要素。
2在线用户评论行为时间特征影响因素模型
本研究基于TAM模型抽取在线用户评论行为时间特征规律研究的影响因素,通过抽取消费者购买行为和评论行为的时间间隔为新的时间序列,时间间隔越短时效性越强,时间间隔越长时效性越弱,评论的时效性反映了用户购买、评论行为的时间规律,通过对评论文本内容的挖掘,探求评论时间与评论行为内容之间的隐性规律发现。
2.1外部因素
本研究将评论阅读者能够直接量化的特征称之为外部因素,参考前人研究成果与在线用户评论特征,从会员等级、星级评价、点赞数量和语义深度4个方面内容进行阐述。
1)会员等级。会员等级直观反映了在线用户网络购物经验,对于评论阅读者,在对评论进行决策筛选时,往往更倾向于信任等级高的用户评论内容,因此,高会员等级的用户在评论中的“引导作用”较为明显,通常起到“意见领袖”的作用。
2)星级评价。多数电子商务网站都开通了星级评价入口,消费者可以对购买体验进行1~5分的评分,星級越高,表示此次购物过程的满意度越高,通过对星级评分的统计、查阅,可以直观看出商铺消费者满意度的等级比率,星级评价是影响企业网络口碑的重要参考标准之一。
3)点赞数量。在线评论有用性投票(点赞数量)是指评论能够获得其他浏览用户的认可程度。很多网站会以点赞或投票的方式进行有用性评价,浏览评论用户一般通过投票、点赞的形式对有用信息进行评价,也可以进行在线回复,围绕此评论信息进行在线互动。一般来说,有用性投票数越高的评论对产品的描述更贴近用户实际使用情况,真实性和有用性越强。
4)语义深度。Mudambi S M等的研究发现,评论的字数对于评论的有用性影响是正相关的。评论字数越多,评论长度越长,其中对商品及其服务的描述可能就越详细,这种详细的描述对于其他消费者而言,能够在很大程度上减少购买决策时的不确定性,从而增加评论的效用。
2.2评论有用性
在线用户评论内容可以长期積累并存储在电子商务平台,为消费者提供海量有用信息源,但是由于网络的匿名性和用户评价成本等因素的影响,并非所有的评论都具有参考价值,有些评论者会不负责任的随意书写评论内容,从而生成大量无用评论和虚假评论充斥其中,使得在线用户评论质量良莠不齐,产生信息过载的压力,大大增加了有用信息的搜索成本,干扰了用户对商品评价的判断,降低决策效率和误导决策判断。基于信息经济学理论,信息和不确定性关系紧密,有用性高的在线评论内容就是为了及时、有效地消除消费者的不确定性,减少购买决策风险,提高消费者的决策效率和决策效果,这构成了评论有用性影响因素模型的逻辑起点。
2.3评论情感态度
消费者在进行商品评论阐述时会根据消费感知和使用体验来进行客观评价,在评论内容中往往会使用诸如“不错”、“喜欢”、“一般”等情感词体现消费者的情感倾向,情感词汇前经常通过“很”、“非常”、“特别”等修饰词来修饰情感强度,表示疑问或感叹情感时会通过“?”和“!”等标点符号进行语气加强,当评论内容中出现较多情感词汇时,证明评论情感比较丰富,能够为消费者提供较多有价值的参考信息,当评论内容具有较多正面情感词汇时,能够促使消费者做出购买行为,而当评论内容具有较多的负面情感词汇时,将使消费者放弃购买选择,因此,情感修饰词和情感词汇能够有效增强评论效用,有效增强消费者的购买决策辅助。
3在线用户评论时间特征影响因素模型构建
3.1外部因素对评论时间的影响
在线评论网站采用各种激励手段来鼓励消费者发布评论,优质、有效评论可以得到相应的积分奖励,因此,大部分会员等级高的用户是通过积极、迅速发布评论来提升会员等级的目的,会员等级高的用户也在日常的电子商务活动中形成了主动、及时发布评论的习惯,会员等级显示了用户参与评论的积极性,对在线用户评论的时效性产生积极的影响,即高等级会员用户发布评论时间间隔较小,低等级会员用户发布评论时间间隔较长。因此本文假设:
H1a:会员等级正向影响在线用户评论的时效性。
星级评价代表用户的情感极性,诸多消费用户通常不写评论内容,而直接给星级评价来代表用户情感,因此电商企业十分关注用户对星级评价的鼓励,会以各种方式鼓励消费者及时对产品和服务做出评价,并且对五星好评的用户采取一定的激励措施,一般会对及时给五星好评用户给予返现和优惠鼓励,诸多消费者也会在收到货物的同时习惯给五星好评。因此本文假设:
H1b:星级评价等级正向影响在线用户评论的时效性。
点赞数量是经过一定的时间积累而成的大多消费者认同的有用评论,点赞数量越多,对于购买后及时给出客观评价评论者的观点支持,从时间维度上,及时的评论才是有价值的,否则长时间未评论的购买评论失去了参考的时效性,对其它用户购买决策的参考意义将减少,因此本文假设:
H1c:点赞数量正向影响在线用户评论的时效性。
语义深度是在线评论字数,评论用户根据购买的服务体验和使用经历来阐述评论内容,一般经过一段时间的使用后的使用经历和经验评论的描述越详细,会阐述详细的使用感受,优点和缺点的详细说明都是需要使用时间的积累,短时间内很难有具体详细的使用感知,因此本文假设:
H1d:语义深度正向影响在线用户评论的时效性。
3.2评论有用性对评论时间的影响
发布一条对消费者有用性强的“富信息评论”内容需要从购买、使用、服务、售后等各阶段的时间积累,因此,如果一条有用性高的评论内容最好包含所有商品的相关内容,那么评论生产者会通过一定时间的使用情况来进行评论行为,以帮助其他消费者进行鼓励消费推荐或避免错误购买决策,不论是鼓励购买还是谨慎提醒,都要进行一定时间的使用经验积累。因此我们做出如下假设:
H2:评论质量负向影响在线用户评论的时效性。
3.3评论情感强度对评论时间的影响
消费者的情感极性可分为正面情绪和负面情绪,消费者在网络平台分享观点和经验时,会通过不同的情感词和情感修饰词来描述产品特征的情感态度,当用户对产品的满意度高时,评论内容多为正向情感;当消费者对产品或服务不满意时,评论内容会呈现针对不同产品特征的负面情感。在线评论的正面情感和负面情感在评论时间上具有一定的差异性,一般负向情感是消费者难以忍受的并且急于进行评论分享,以宣泄情绪和提醒购买,因此,我们提出如下假设:
H3:评论情感强度正向影响在线用户评论的时效性。
3.4概念模型
基于以上分析,本文基于TAM理论框架提取指标要素,以在线评论外部因素、感知有用和使用态度3个指标作为自变量因素,以评论时间序列为因变量,构建在线评论时效性影响因素模型如图2所示:
4在线用户评论时间特征影响因素实证分析
4.1样本选择与数据获取
本研究选择京东商城(www.jd.com)手机类典型商品的在线评论文本为数据源,通过Python语言编程爬取对应字段进行存储。在平台选择上,京东商城是我国著名的B2C电子商务平台,用户购买力稳定在20%以上,具有一定的用户群体以及代表性数据,在商品选择上,本文选择在统计中商品销售前4的商品类型进行分析,具有商品上的代表性,对爬取的评论内容进行初级的清洗和去重后,抽取7083条评论进行分析,京东商城在线评论抓取页面与字段示例如图3所示:
该页面展示了丰富的评论属性,包括用户ID、购买时间、评论时间,追评时间、评论文本、点赞数量、评论数字评分和会员等级等内容。
4.2相关变量说明及测定
根据图2中的在线评论时间特征影响因素模型,结合图3爬取的评论属性,将评论集合表示为C,对于评论集中的第i个评论表示为:Ci∈c,(i=1,2…,|c|),各变量测定指标如表1所示:
在上述变量中,评论时间、会员等级、星级评价、点赞数量、语义深度和评论情感都能从在线用户评論内容中直接量化获取,而评论质量是复杂的用户综合评价感知,需要借助一系列综合评价算法和文本挖掘方法获得。
4.3数据描述性统计
通过对各指标属性的量化统计,各指标要素字段的基本描述如表2所示:
表2中给出个会各属性指标的基本数据统计信息,下面对各个属性的分布情况进行统计介绍和可视化分析。
4.3.1“购买—评论”时间间隔
“购买—评论”时间间隔序列Ci(PR)时模型中的因变量,针对每一条评论进行时间计算,“购买—评论”时间间隔Ci(PR)的计算公式为:Ci(PR)=Ci(RT)-Ci(PT),根据爬取的内容确定时间天数范围,以天数为时间单位,“购买—评论”时间间隔分布情况如图4所示:
可以看出大多消费者习惯在20天内完成评论行为,超过40天进行评论的比率相对较少。
4.3.2会员等级
根据京东的会员等级统计分布情况,统计方法为将会员等级从小到大排序分为7个等级,分别为1等级用户为注册会员和铁牌会员,因为这两类数量均较少,所以将其合并处理;2等级用户为铜牌会员;3等级用户为银牌会员;4等级用户为金牌会员;5等级用户为钻石会员;6等级用户为PLUS会员;7等级用户为企业会员,图5给出了数据集中各个等级的用户分布情况。
可以看出中间等级3、4、5、6级别的会员比例最多,而极高和极低的用户比率相对较少。
4.3.3星级评价
星级评价的统计方式按爬取评论中用户对产品的星级评分进行统计,星级评价在一定程度上也代表用户的情感倾向,其中1星和2星代表负面情感,3分代表中性情感,4星和5星代表正向情感,星级越高,满意度越高,因此根据星级评价的5个标准,确定星级评价的分布情况如图6所示:
可以看出整体上星级评价的5星评价数量比率较高,2星、3星较少,呈现出典型的J型分布,这与Hu N等学者的研究结论具有一致性。
4.3.4点赞数量
在线评论点赞数量是指评论能够获得其他浏览用户的认可程度。很多网站会以点赞或投票的方式进行有用性评价,浏览评论用户一般通过点赞的形式对有用信息进行评价,也可以进行在线回复,围绕此评论信息进行在线互动。一般来说,有用性投票数越高的评论对产品的描述更贴近用户实际使用情况,真实性和有用性越强,评论点赞数量分布情况如图7所示:
4.3.5语义深度
在线用户评论语义深度是指在线评论对有用性内容属性描述地详细程度。一般认为较长评论对产品和服务的描述比较细致,通常包含更为全面、详细的信息内容。通过统计每条评论的字数,字数越高其语义深度越高,将各条评论字数统计排序后如图8所示:
4.3.6评论质量
在线评论有用性是在线评论对网购消费者的购买决策是否有帮助的一种主观感知,能够在购买决策过程中为用户提供有效的商品认知,减少不确定性,为用户的购买决策提供帮助,参考文献对在线评论质量的计算方法,对在线评论有用性进行评估后的分布情况如图9所示:
4.3.7评论情感
情感表达强度是评论中用户所表达的情感显性程度。评论者在发表评论时,不同的情感倾向评论所使用的情感表达强度是不同的,因此可以通过情感词的情感强度来表征情感表达强度。另外也可以各种通过特殊关键词(如“啊”、“呢”、“唉”等),或特殊符号(如异化的标点符号、表情符号等)和特殊句式(如反问句、疑问句、感叹句等)来量化。情感表达强度越大,评论价值越高,情感频次统计如图10所示:
4.4在线用户评论时间特征影响分析的结果
4.4.1数学模型构建
本文采用线性回归分析方法对评论时间序列影响因素进行建模分析,线性回归是基于因变量y和x自变量的线性函数关系,如公式(1)所示:
根据回归方程的拟合曲线可以得到在线评论时间序列时间变化影响因子和预测未来发展态势,并且线性回归方法建模步骤简单,计算量小,能够清晰地表明规则的整体走势。在图2的模型框架基础之上,使用数据建模回归分析的方法来分析在线评论行为对评论时间的影响因素。在进行回归分析前需进行相关性分析,根据评论属性指标的数据特点,大部分评论数据是结构化数据范围,例如星级评分是1~5,会员等级变量是1~7,因此本文采用线性回归方法进行模型构建,从“购买—评论”时间间隔序列构建的回归模型如下所示:
4.4.2变量间相关性分析
为了预防出现多重共线性,首先通过相关性分析来验证变量之间的关系,采用Pearson相关系数进行相关性检验,检验标准为:若显著性检验概率值P小于0.05则变量显著相关,P值为正表示因素正相关,P值为负表示因素负相关;若P值大于0.05则表示变量间没有显著相关性。将本文各指标数据购买评论时间间隔Ci(RT)、会员等级Ci(舰)、星级评级Ci(RA)、点赞数量Ci(SC)、语义深度Ci(咂)、评论质量Ci(QU)、评论情感Ci(SE)导入R语言,由于时间间隔Ci(RT)、语义深度Ci(TE)、评论情感Ci(SE)是计数数据,变量的分布状况呈现出偏态分布,因此对这3个变量进行了对数变换的平滑处理,使其服务正态分布适用于线性回归分析,为了避免在对数计算中出现0的状况,本文使用log(RT+1)来替代RT,使用log(TE+1)来代替TE,使用log(SE+1)来替代SE。使用R语言中的Pairs函数显示变量间的相关变量多面板散点矩阵,如图11所示:各指标间相关分析结果数字化显示和相关性如表3所示:
从样本因素相关性实验数据分析结果看出,大多变量都是彼此显著相关的(p<0.05)。但除变量Time外,变量相关系数均较小,最大相关系数是0.523(Useful和Members的相关系数),其他不同独立变量之间的相关系数小于O.4(相关系数排序第二大的值是Useful和Emotion之间的相关系数值为0.35)。以Time为衡量标准,除Word外,其他因素与Time的相关性均显著相关,Star、Mem-bers、Emotion、Praise、Useful对Time的相关系数分另0为-0.128**、0.312**、0.560**、-0.029*、0.399**,Word对Time的相关系数较小,为0.01,显著性概率p>0.05,相关性不明显。综上,Star、Praise对Time有显著负向影响,Members、Emo-tion、Useful对Time有显著正向影响,其他相关变量间相关系数极小,相关性不明显,同时自变量间不存在多元线性关系。
4.4.3回归分析结果
通过多元线性回归模型分析,使用SPSS软件辅助,在线用户评论时间特征影响因素计量模型的回归分析结果如表4所示:
模型容差值大于0.6,且VIF均小于2,说明变量间无多元共线问题。同时,DW为1.634,自变量没有显著相关性,各自变量及截距的显著性均小于0.05。因此,回归方程、截距及回归系数具有统计学意义。这些变量R2值为0.373,在37%左右的程度上解释了评论的时效性。显著性方面,Praise(p=0.059)与Words(p=0.639)显著性p值大于0.05,Star(p=0.000)、Members(p=0.000)、Emotion(P=0.000)、Useful(p=0.000)显著性p值均小于0.001,模型中从评论中抽取的特征变量都对log(TI+1)有着显著意义的影响。最终确定的标准化方程如下:
综合表4及公式(5)可以看出:
1)会员等级与时间间隔序列的相关系数为0.148,显著性为0.000,呈现出一定的正相关作用,表明不同等级会员用户,随着等级的升高,发布评论的时间越快,等级越高的用户评论及时性越高。其中可能的解释为:具有较高会员等级的消费者对网购和评论行为具有一定经验积累的用户,由于电商平台对积极评论的激励,会员等级高的用户经常进行网购和在线评论行为,形成了一定的及时评论习惯,而具有较低会员等级的消费者可能属于偶发网购行为,对评论的积极性也不高,除非电商特别提醒或者在使用过程中具有较强的情感波动,才会进行偶发评论行为,因此低会员等级会员评论的及时性较差。因此,假设H1a得到支持。
2)星级评价与时间间隔序列的相关系数为-0.081,显著性为0.000,呈现出弱的负相关作用,表明星级评价越低,评论的时效性越高,即一星或二星的差评评论的“购买—评论”时间间隔较短,因为一星评论用户通常对质量、服务或物流不满意的情绪较大,一般会及时地做出评论行为。而电商一般会鼓励用户及时给予好评进行返现和其他方式进行激励,对于部分消费者起到一定的激励作用,但是从本研究数据来看,依旧有大量消费者对这种激励持谨慎态度,五星好评评论数量明显多于其他星级评论数量,较于其他星级数量,五星好评的时间分布也趋于分散,因此相关系数为-0.081,相关性较小,其他星级呈现出较明显的负相关性,因此,本文检验结果与H1b假设相反。
3)点赞数量与时间间隔序列的相关系数为-0.029,显著性p<0.05,具有微弱负相关作用,即点赞数量多的评论一般是相对时间间隔较短,但在回归分析中,Praise的显著性为0.059(p>0.05),因此点赞数量与时间间隔序列的相关性模型构建不成立。可能的解释为存在大量点赞量的少数评论影响“购买—评论”时间间隔的相关关系。而大量评论则是没有点赞量的用户评论,因此很难用数理模型量化两者间的相关关系.而且同时也说明仅以点赞量来衡量在线评论有用性的方法是有很大局限的,大数据环境下,存在大量被埋没的非常有用的零点赞用户评论,所以,点赞数量对时间间隔序列的影响作用不能用模型量化,因此,假设H1c被拒绝。
4)语义深度与时间间隔序列的相关系数为0.01,显著性p>0.05,相关性较弱,并且在回归分析中,显著性为0.639(p>0.05),因此语义深度与时间间隔序列的相关性模型构建不成立。可能的解释为本文以评论字数来量化语义深度,而各个用户的评论行为存在差异性,各个时间内的用户评论字数不存在线性相关关系,同时,存在大量短文本评论,对评论时效性的相关关系产生相关性影响,这与点赞数量对时效性的影响作用相同,都存在大量相同因素对其他少量因素的影响作用,因此,语义深度对评论时效性的影响作用不明显,相关性也较弱,假设H1d被拒绝。
5)评论质量与时间间隔序列的相关系数为-0.399,显著性为0.000,具有较强的负相关作用,表明评论质量高的评论一般的时效性较弱。即在购买后较长时间发表评论有用性较高。可能的解释为购买后很短时的评论一般为商品外观、服务与物流等方面消费者比较关注的内容,在购买后第一时间发出的评论用户冲动评论情绪较高;而购买后长时间评论的内容对使用感知和售后服务有更清晰地认知,从而使优质评论内容大多时效性较弱。因此,假设H2得到支持。
6)情感強度与时间间隔序列的相关系数为0.654,显著性为0.000,具有较强的正相关作用,表明情感强度越强,越趋于在购买后很短时间内发表评论。可能的解释为:用户对产品和服务具有较高的正向或负向情感时,通常倾向于及时做出文本评论表达满意或差评情感。尤其是消费者对所购产品和服务有不满意的负向情感时,大多消费者都会通过及时进行评论的方式进行情感倾诉和文字表述,一方面用来倾诉使用和购买感受,表达内心的不满;另一方面警示潜在消费者的谨慎购买。评论情感的表达通过对购买经历的描述和产品的介绍,使潜在消费者更加了解商品特征和使用感受,因此,假设H3得到支持。
综合以上假设验证结果,表5给出了本文所有检验假设的最终结果。假设H1a、H2、H3得到支持;H1b与原假设相反;假设H1c、H1d被拒绝。
5结论
本研究基于TAM理论提出在线用户评论时间特征影响因素,提出从外部因素、有用性因素和情感因素构建在线用户评论行为对评论时效性影响因素模型的研究思想,以京东商城手机评论为数据源进行统计分析与模型验证,为深入开展在线用户评论行为时间特征规律的研究提供了新的理论视角。通过回归分析方法对提出的理论影响因子进行回归模型构建,使用SPSS和R软件对变量间相关性进行分析、可视化处理以及多元线性回归模型影响因素分析检验,构建标准化回归方程模型。
根据回归模型验证结果分析,得出以下结论:①等级越高的用户评论及时性越高,用户等级对评论的时效性存在正向影响;②星级评价越低,评论的及时性越高,星级评价对评论的时效性存在负向影响;③点赞数量对在线用户评论的时效性的影响作用不显著;④语义深度对在线用户评论的时效性的影响作用不显著;⑤评论质量负向影响在线用户评论的时效性;⑥情感强度越强,越趋于在短时间内发表评论,情感强度对评论的时效性存在正向影响。
挖掘在线用户评论时间特征的影响因素,对于消费者有助于挖掘用户评论规律,根据其他用户的消费体验来消除或减少商品的不确定性。对于企业能够有效分析时间序列阶段的网络口碑传播效应,有助于提高企业的商品竞争力和服务能力,为生产厂商和电商企业的产品和服务提供参考建议。