柯苗
福建水利电力职业技术学院,福建 永安366000
从2019年2月28日中国互联网络信息中心发布的第43次《中国互联网络发展状况统计报告》中可以看到,截止2018年12月我国网民规模达到8.29亿,较2017年同期增长3.8个百分点,网络购物用户规模达6.10亿,年增长率为14.4%。在我国电子商务依旧高速发展的今天,电子商务信用评价体系的不完善在很大程度上影响了电子商务的健康发展,因此,如何构建较为完善的商品评价模型便显得尤为重要。
在线下购买商品的顾客,可以零距离接触需要购买的商品,而网上购物时人们获取的商品信息一般来源于以下三个渠道:商品参数信息、商品图片和买家评价。商品参数信息和图片大多都经过卖家美化,真实性不强,因此,有效的信用评价体系能更加客观地反映商品信息,对买家决定是否购买显得尤为重要。据数据显示,82%的买家在下单前会看其他买家的评价,并以此作为是否购买的依据。
1.评价等级较为简单
就淘宝网而言,目前现有的评价等级分为:好评+1分,中评+0分,差评-1分,三个简单的评价等级设置很难反映购买客户的真实想法,一个商品的好坏无法通过好中差准确细致的反映出来,就会出现顾客对此商品整体满意但是对部分小细节有些不满,而不满的小细节又不是这个顾客特别在意的地方,不至于给中差评而给了好评的情况。对于看此评价而决定购买该商品的顾客来说,或许不是特别完善的小细节正是他在意的地方,而这个评价对他的购买决策就出现了偏差的现象。而淘宝网的三项DSR评分,只是从商品描述相符、物流服务、服务态度三个方面,给了买家1-5分的打分选择,这个评分方式较为笼统。例如买家给描述相符打了1-4分,是哪里不符合商品描述,一个赤裸裸的数字,既不利于卖家对商品的改进也不利于买家选择商品时的参考,若遇到一个恶意差评的买家,一个1分的差评,此项DSR评分需要7个以上买家的5分才能抹平。因此,这个评价方法具有许多不合理性。
2.现行的评价规则存在漏洞
在淘宝网现行的评价规则中,买家收获15天后,若买家还未评价则系统自动默认好评,其实买家未评价很多时候有几种原因:第一,买家来不及评价;第二,买家由于自身原因甚至来不及使用本商品而无法对此做出评价;第三,买家对商品有些许的不满或商品存在质量问题,但因懒得找麻烦不想退货而不进行评价,还有一些特殊的原因导致买家未自主评价而系统为其做出了默认好评。除了默认好评外,对于中差评,淘宝还给了48小时协调处理时间,48小时内中差评未显示给所有用户查看,这也造成了不少卖家通过返现、电话骚扰等方式来诱导买家修改中差评。因此,淘宝网平台的好评率高达98%以上。
3.平台忽视买家信用问题
淘宝网存在着这种状况,有些买家由于利益驱使或其它某种目的,而对某种商品进行恶意差评,这不仅损害了卖家的利益,也从一定程度上影响了其他买家的判断,不利于信用评价体系的健康发展。
购物网站的刷单现象屡禁不止,因此,对提取的原始数据进行清洗有很大的必要。评论数据清洗基于以下两个规则。
第一,从买家的角度进行清洗,每天同一个买家最多在店内同类商品中评论一次,此原则为了杜绝一个账号多次刷评行为,如图1所示。
图1 同一账号多次评论
第二,从评论内容的角度进行清洗,剔除极度相似或相同的评论内容,此原则是为了杜绝卖家使用多个账号进行刷评而对评价体系构建的最终结果产生影响。
评论数据的清洗整理能有效地提高买家评论的可信度,同时提高构建信用评价体系的客观性与真实性,虽然没办法删除所有的刷单评论数据,但是在清洗中依据一定的规则,对买家通过评价来比较同类商品仍然具有重要的意义。
如何从一条简短的评论中提取买家所要表示的情感单元,需要进一步规范词语的抽取规则。首先,可以将单句评论以词的形式分解,将词分解为:褒义词、中性词、贬义词、程度词、转意词,如表1所示。
其次,将提取出来的词语做一个分数的设定,褒义词+1分,中性词0分,贬义词-1分,程度词+2分,转意词-1分,每一句的评论使用以下的分值计算公式:
(褒义词+中性词+贬义词+……)*程度词*转意词=商品情感得分
从表1的评论例句中,可以得出表2的单句评论情感分值。
基于以上的情感单元词分值,本文先将情感单元分为以下五个等级,非常满意:情感分值≥2;满意:0<情感分值<2;一般:情感分值=0;不太满意:-2<情感分值<0;非常不满意:情感分值≤-2。
最后,规范整个评论的情感分值,由于买家评论是由一条及以上单句评论组成,那么,整个评论的情感分值就是每个单句的情感分值相加,在计算情感分值的同时,还应当找出每句话的评论主题,再单独提取该主题的情感得分,能更加清楚看到该商品细节上的优劣。整体评论情感分值如表3所示。
表2 单句评论情感分值
从上文中的情感分值分布可以看出,将一个商品的评价细化,通过买家的文字性评价提取商品的情感分值,在这个基础上构建新的信用评价体系,才能更好地体现产品的具体信息。而好评、中评、差评的现有评价等级和DSR评分,容易让买家在卖家的“五分好评返现”活动、怕退换货麻烦、觉得给差评也没有多大意义、卖家态度很好而忽视商品的本身等原因,给好评或者DSR五分,而且,目前的信用评价体系几乎无法体现同类产品的差异化。具体如表4所示。
1.提取主题模型—LDA模型介绍
LDA模型是一种文档的主题生成模型,它可以从大量的评论数据中找出潜藏的主题信息,也就是买家所关心的商品属性,从而制定出更为完善的商品评价指标。
以某买家的一段评论为例,“电脑打开运行快,顺畅,打游戏不卡,金色的屏幕很好看,保护膜也漂亮,卖家很有耐心,很热情”。LDA模型通过分析大量评论后找出词与词之间的关系,最后确定词对应的主题,之后将这段话分为三个主题:性能,外观,服务,在“性能”的主题中包含运行快、顺畅、不卡,在“外观”的主题中包含好看,漂亮,在“服务”的主题中包含耐心,热情。简单来说,LDA模型可以把一起出现频率较大的词语找出来,再确定他们围绕的主题。LDA模型公式如下:
p(word|doc)=p(word|topic)*p(topic|doc)
2.信用评价体系流程图
表3 整体评论情感分值
表4
综合以上所述及结合“LDA模型”的应用,本文得出以下信用评价体系流程图,见图2。
图2
淘宝网现行的好中差评,并未有效地激励商家去提高商品质量和服务,而是一味追求好评率来维持品牌或者网店形象。本文建议淘宝网不再体现买家好评率等信息,而是通过买家的文字评论,找出主题,在每个主题下给出一个平均情感分值的体现,买家的文字评论在一定程度上会体现其对此类产品需求或者改进建议等。主题的分值体现也能让商家对商品的优劣性和大众接纳程度一目了然,从而根据商品主题体现的劣势去完善,做到真正的以用户需求为导向去生产产品,提供真正所需的服务。
文字评论的另一个重要意义在于,真正发展商品的内容营销,大量的文字评论通过分类聚合后形成一条完善的产品检测线,其有较高的可信度。
取消平台15天未评论自动好评机制,保留买家永久自主评价权。首先,对购买商品进行使用评价,本身就是买家的权利,平台自动代替买家默认好评无形中剥夺了买家的此项权利。其次,15天未评论自动好评存在许多不合理性,例如购买的是某件电器或数码产品等非快消品,15天完全不能判断商品的质量好坏,还有后期的售后服务,也需要一个比较长的时间才能体现。意向购买顾客从15天内的评论完全不能判定此商品的质量、售后好坏,只能通过百度贴吧等评论去查找此款产品的口碑,因此,淘宝的评价对意向购买顾客来说没有任何决定性的参考价值。
上文提到的不刻意体现卖家的好中差评,只是用情感分值来体现商品主题得分,因此,修改中差评功能就不再有意义,取消此项功能,也能让评价更加具有真实可信度。
目前,淘宝平台的买家好评率只有卖家后台可见,其他买家在下单前浏览的评价页面不可见,为避免恶意评价给买卖双方带来利益的损害,应在评价页面展现买家好评率。此做法有以下两个好处:第一,从一定程度上遏制同行故意差评的恶性竞争;第二,意向购买客户通过评价买家的好评率可自主判断此评价的真实程度。