基于在线评论主流特征观点对的商家信誉维度构建及评价

2019-12-09 01:48钱寅亮王忠群吴东胜蒋胜陈云霞安徽工程大学计算机与信息学院安徽芜湖241000
长江大学学报(自科版) 2019年12期
关键词:特征词信誉商家

钱寅亮,王忠群,吴东胜,蒋胜,陈云霞 (安徽工程大学计算机与信息学院,安徽 芜湖 241000)

作为互联网经济的一部分,电子商务近年来发展迅速。据中国电子商务研究中心(100EC.CN)监测数据显示,2016年中国电子商务交易额22.97万亿元,同比增长25.5%,其中网络零售市场交易额5.3万亿元,同比增长39.1%[1]。

电子商务发展的同时,商家进入电商平台的门槛越来越低,这导致网络上商家信誉状况良莠不齐并充斥大量假冒伪劣商品,消费者很难从商家对商品的相关描述中识别出真实的商品,从而作出正确的购买决策[2]。在线商品评论包含了丰富的商品评价信息和商家信誉维度信息,但是在某些利益的驱动下,一些商家或用户恶意发布虚假评论,以此误导潜在客户[3~6]。因此,如何对评论文本进行有效地分析和处理,以构建更加准确、客观、可信的商家信誉维度体系已成为当前的研究热点问题。目前关于商家信誉的研究主要在信誉的影响因素和评价方面:陈娅[7]通过从C2C模式的电子商务出发,得出影响C2C商家网络信誉的4个因素:信誉、产品价格、服务水平和网站;方明珠等[8]对电子商务环境中影响在线信誉的因素进行研究并归纳总结为正式制度、非正式制度、微观卖方和微观买方4个方面;姜政军[9]从影响在线信誉的4个方面:卖家因素、消费者特征、外部环境因素和网站因素出发,在已有的在线信誉框架模型基础上建立了在线信誉的影响模型;胡剑波等[10]探讨采用熵权和TOPSIS法协同的模型来评价卖方信用;茹永梅[11]建立基于层次分析法(AHP)和模糊综合评价法的商家信誉评估模型,得出O2O电商交易中影响商家信誉的5个主要因素为:商家、顾客、商家提供的产品和服务O2O 网站平台及交易环境。

针对目前大多数研究从数值化分值的角度来探讨在线信誉问题,赵学峰等[12,13]从在线评论文本出发,通过对在线评论文本聚类分析,拓展了已有的在线商家信誉维度范围;针对在线评论文本语言表达随意、文本长度不一等社会化特征的问题,王宇等[2]基于HNC理论提出一种改进的评论主题词抽取方法和主题词聚类算法,提高了主题词的抽取准确率和聚类准确率,并构建了商家信誉指标体系。

但上述文献存在以下不足:①大量虚假评论干扰了评论主题词的抽取,使得抽取出的主题词准确性降低;②用户某些正面或者负面观点表达了商家的信誉,例如,“系统运行很流畅”“外观感觉陈旧”“物流服务很差”,但所提取主题词作为评价商家信誉的维度未考虑用户观点词,缺失用户情感对商家信誉的影响。商品评论的可信性是构建信誉维度的前提,需要从可信的角度剔除虚假垃圾评论,同时考虑用户观点抽取主题词来构建商家信誉维度。为此,笔者基于依存句法分析提取出在线评论中包含的特征词和观点词(即特征观点对[14]),引入“主流特征观点对”(评论可信信息承载的基本单元)这个概念[15],并对主流特征观点对的特征进行聚类分析,最终构建出商家信誉维度体系。

1 结合观点词的信誉维度特征提取

基于在线评论文本进行商家信誉维度的提取包含2个部分:一是信誉维度特征词的提取;二是特征词的聚类分析。目前信誉维度特征词提取的方法主要是基于特征词出现的频率提取出高频特征词作为信誉维度,鲜少有结合用户观点词来提取信誉维度特征词。基于在线评论构建的信誉维度是对商家信誉进行评价,每个信誉维度存在相应的观点词。因此,表达信誉维度且含有观点词的特征词更能真实反映商家信誉的情况。如评论手机 “电池十分耐用,像素清晰,遗憾的是没有送耳机”,其中包含的特征词有“电池”、“像素”和“耳机”,前2个特征词对应的观点词分别为“耐用”和“清晰”,而“耳机”没有修饰观点词。笔者认为,“电池”和“像素”这2个特征词实际上更适宜作为商品的评价维度。在评论中,观点词的词性通常以形容词为主,其评价对象特征词以名词为主,通过二者间的修饰关系将二者作为一个整体(“特征观点对”)提取,更能获取完整的商家信誉维度信息。

2 基于主流特征观点对的评论可信性

随着在线评论数量呈现爆炸式增长的同时,越来越多的恶意虚假评论严重干扰了人们对有用信息(包括其中的商家信誉维度信息)的获取。如何在获取商家信誉维度信息之前对相关的垃圾、虚假评论进行过滤就变得十分重要。评论可信的本质是评论中出现的用户观点可信,即这种观点的阐述是符合实际的。基于目前多数搜索引擎的原理,即搜索引擎对查询页面的排序是基于以往用户查询相同内容时点击页面的数量,被点击次数较多的页面排序较靠前[16,17],页面内容越可信。现实中,一个观点被越多的人提及,其可信赖度则越高,被认为是一种主流观点。据此,引入 “主流特征观点对” 概念,相关定义如下。

假设C表示某商品,F为商品C的特征集合,fi为商品C第i个特征,O为商品C的观点集合,oi为商品C的某特征的观点,c(fi,oi)为商品C的第i个特征观点对。商品C的评论集合为CR={cr1,cr2,cr3,…,cri,…},其中,cri为第i条商品评论。第i条商品评论的特征观点对集合cri_fo={c(f1,o1,c(f2,o2),…,c(fm,om)} ,商品C评论的所有特征观点对为集合CR_FO={cr1_fo∪cr2_fo∪…∪cri_fo∪…}。如果2个特征观点对集合的交集为非空,则对应的2条评论存在共同的特征观点对。设包含商品第j个特征观点对c(fj,oj)的评论数量为count_c(fj,oj),即:

①count_c(fj,oj)=0,

②count_c(fj,oj)=count_c(fj,oj)+1, ∀i(c(fj,oj)∈cri_foandcri∈CR)。

定义1(主流特征观点对[15])给定阈值η,如第i个特征观点对c(fi,oi)的count_c(fi,oi)≥η,那么第i个特征观点对c(fi,oi)为主流特征观点对。

注阈值η可以在测试商品特征观点对的稳定性时进行选择和调整。特征观点对的稳定性将在试验部分给予验证。

根据上述主流特征观点对的定义,主流特征观点对是可信信息承载的基本单元。如果一条评论中所包含的主流特征观点对数量越多,该条评论就越可信[15]。

3 数据收集与预处理

选取目前国内购物市场的主要电商平台——京东上手机的评论作为试验数据集,利用八爪鱼采集器对评论进行采集。对采集到的评论数据清洗,去除其中无关的评论和重复的评论,并对其中部分句子格式进行调整和补充。

注:n为名词;d为副词;a为形容词。 图1 词性标注和依存句法分析

目前存在的分词软件较多,笔者使用哈尔滨工业大学社会计算与信息检索研究中心所提供的语言处理平台(LTP)对在线评论进行分词、词性标注。句法依存分析是通过分析句子内各成分之间的依存关系揭示其句法结构,句法依存分析能够识别出句子中的“主谓宾”“定状补”等语法成分,并分析各成分之间的关系。如对评论“手机很漂亮,手感很好。”进行句法依存分析,得到分析结果如图1所示,各种分词标识符号代表的含义如表1所示。

表1 分词标识符号说明

4 主流特征观点对提取

4.1 基于依存句法关系的特征观点对提取

使用LTP对在线评论进行分词、词性标注和句法依存分析,将分析结果以XML文件格式输出并保存。在已有的在线评论产品特征和观点提取研究中,通常将名词视为产品特征,形容词视为相应的观点词。观察产品评论,发现名词词组或者动词作为产品特征同样经常出现。如手机评论:

①屏幕n分辨率n很d高a,运行v流畅a;②充电v速度n非常d快a。

根据上述分析,可以构建相应的产品特征观点对识别规则:在在线评论中一个单句满足SBV(主谓)依存关系,将其对应的主语名词或动词提取为产品特征,对应的形容词作为观点词;判断名词或动词之前是否有与其构成ATT依存关系的词,如有则将二者作为一个名词词组提取为产品特征。

通过对分词、词性标注以及依存句法分析的结果文件(XML文件)解析,提取出特征观点对。

4.2 特征观点对数量统计及主流特征观点对提取

对上述提取出的特征观点对在评论中出现的频率进行数量统计,在进行数量统计前,先对特征观点对进行初步的聚类分析,这里的聚类分析主要是考虑同义词的情况。由于特征观点对中包含了特征词和观点词这2类词,因此聚类时需要同时考虑。如特征观点对“价格合适”和“价钱合理”则可聚为一类。根据主流特征观点对的定义即可得到每一特征观点对在评论中出现的数量,如count_c(fj,oj)的大小。根据数量大小进行降序排列,并结合阈值η即可得到主流特征观点对。

5 信誉维度构建及评价

5.1 观点词情感量化

根据上述方法可以提取出评论中的主流特征观点对,每个主流特征观点对中的观点词量化方式可以采用如下的方法:①根据观点词的情感倾向将观点词分为正向观点词、负向观点词以及中性观点词3类,分别赋予其1、-1、0对应的基础情感值;②对于修饰观点词的相关程度副词划分为3个程度等级并赋予一定的极性值,代表修饰强度的不同,具体如表2所示;③情感值=程度副词极性值×基础情感值,对于观点词之前出现的否定副词这种情况,需要将最终计算出的情感值上加上一个负号,如主流特征观点对“<电池,不耐用>”,其最终的情感值=(-1)×1= -1。

表2 程度副词极性值

5.2 主流特征观点对聚类

主流特征观点对的聚类主要是针对产品特征的聚类,产品特征的聚类方法较多,笔者主要参照产品说明书上对产品特征的分类并结合产品特征词语之间的互信息(PMI)来进行产品特征聚类。如从专业的电子产品评价网站——中关村在线(http://www.zol.com.cn/)上下载一份某型号的手机说明书,根据说明书的内容可以将手机的产品特征主要分为网络、屏幕、摄像头、外观、硬件、服务与支持这6大类,对于硬件这一类别则可继续细分为系统、处理器、存储器、电池这4类。对于提取出的主流特征观点对中的产品特征,如果能直观找到其所对应的类别则直接加入到该类别中,对于一些划分较细难以判断其所属类别的产品特征可计算该产品特征与各类别词之间的互信息,互信息高说明词语之间的关联性很强,则可以聚为一类。互信息计算公式如下:

(1)

式中:ω1和ω2是2个词汇;p(ω1,ω2)表示将和构成的二元词对使用搜索引擎检索出现的网页数量;p(ω1)、p(ω2)分别表示使用搜索引擎从网络上检索出现ω1和ω2的网页数量。

5.3 信誉维度评价

设根据上述聚类方法可将主流特征观点对聚类为n类,则可将这n类视为商家信誉的n个维度,设每一维度中包含的主流特征观点对集合foi={c(f1,o1),c(f2,o2),…,c(fm,om)}(i=1,2,…,n),sentj(j=1,2,…,m)为该维度中第j个主流特征观点对的情感值,count_c(fj,oj)为特征观点对的数量,则每一信誉维度总体情感值Si的计算公式如下:

(2)

不同的信誉维度侧重点不同,用户对其关注也会有所不同,因此还需要计算各个维度本身所对应的权重大小。对于每一类别构成信誉维度的权重主要是考虑该类别中包含的主流特征观点对在评论中出现的数量,即count_c(fj,oj)大小,如果某个维度中的主流特征观点对数量越大,权重就越大。每一维度的权重计算公式如下所示:

(3)

式中:M为评论数量。

此外,计算出的权重需要进行归一化处理。根据每一信誉维度的情感值以及权重,最终即可得出商家信誉的得分,消费者可根据商家信誉得分选择商家实施购买行为。

6 试验验证与评价

6.1 主流特征观点对阈值设定及稳定性分析

1)主流特征观点对阈值设定 利用八爪鱼软件分别抓取京东、天猫和淘宝等平台上有关华为荣耀8手机评论各2000条左右,经过预处理后各自保留1200条共3600条有效评论作为试验数据集,以XML文件的形式存储。通过对XML文件的解析可提取出相应的特征观点对。

主流特征观点对的提取需根据设定阈值来确定。为了研究在不同阈值和评论数量下主流特征观点对是如何变化的,是否具有稳定性,具体的验证方案可参照文献[15]中的方法。最终选取主流特征观点对的阈值为η=12。

2)单个主流特征观点对稳定性验证 为了进一步验证主流特征观点对的稳定性,就单个主流特征观点对,探究包含该观点对的评论数量与评论规模数量间的关系。具体说,假设某个主流特征观点对c(fi,oi),当评论数量为n1时,其在评论中的出现的数量为a1;评论数量为n2时,出现的数量为a2,以此类推下去,设定一个变量δi,计算公式如下:

(4)

根据上述选定的阈值η,选取提取到的8个主流特征观点对,绘制变量δi随评论数量ni的变化折线图,不同颜色的折线表示不同的商品特征观点对的变化情况。

由图2和图3可看出,就单个折线来说,当评论数量较小时,折线的波动表现差异较大,有些折线的起始值较小;随着评论数量增加,折线逐步向上,达到一个顶点后逐步向下;有些折线稳步向下逐步趋稳;不同折线走向趋稳的起始点不同,表明该商品特征的观点被较多用户关注认可。但总体来说,随着评论数量的增加, 数值逐渐趋于稳定的,当评论数量达到2100时,包含主流特征观点对的评论数量基本上是随评论数量同步变化的,即主流特征观点对中商品特征的观点被用户认可是稳定的,这表明主流特征观点对是持久得到多数用户认可的,其可信性是可靠的。

图2 数值δi 随评论数量ni的变化趋势(1) 图3 数值δi 随评论数量ni的变化趋势(2)

6.2 信誉维度特征词抽取效果对比分析

试验中,分别使用文献[2]和结合观点词的依存方法进行特征词的抽取,通过每种方法相应的准确率和召回率来进行对比分析,分析结果如图4和图5所示。从上述试验对比效果可以看出,相对于文献[2]中的信誉维度特征词抽取方法,结合观点词的依存方法在准确率、召回率上都有明显的提升;其中随着评论数量的增大,准确率提升较为明显,而召回率的提升幅度较小。

图4 2种方法准确率对比 图5 2种方法召回率对比

6.3 主流特征观点对提取及信誉维度评价

表3 主流特征观点对提取及聚类结果

1)主流特征观点对提取与聚类 采集天猫平台上荣耀8手机评论1200条中的有效评论1123条,对评论进行预处理(分词、词性标注)并进行主流特征观点对提取,从中关村在线网站上下载一份华为荣耀8的手机说明书并结合特征词语之间的互信息计算公式对主流特征观点对聚类,结果如表3所示。

2)信誉维度评价 根据表2的聚类结果可以构建出手机商家的10个信誉维度,每个信誉维度分别包含不同的主流特征观点对,根据式(2)可计算出每一信誉维度的情感值大小,结果如表4所示。根据式(3)可计算出各信誉维度的权重大小,如图6所示。文献[2]构建的手机商家信誉维度如图7所示。

6.4 结果分析与评价

选取天猫平台上手机评论500条,其中有效评论411条,根据笔者和文献[2]构建的信誉维度,对每条评论进行商家信誉值计算并排序,评论排序结果如表5、表6所示(注:由于文献[2]中并未介绍信誉值的具体计算方法,所以在具体某一维度情感量化方式上采用和笔者相同的方法。表5、表6所示显示的是排名前3的结果)。

随着网络交易平台的不断规范,交易环境的安全性逐渐提高,消费者对交易安全等因素的担忧已经越来越少,使得网络购物与传统的线下购物之间的差异越来越小。传统线下消费者对商家信誉的评价则主要集中在商品表现和服务表现这2个方面,与线下购物不同,网络购物需要涉及到相应的物流配送,所以网络环境下商家的信誉主要由如下3个方面构成:①商品表现。商品表现主要指对商品本身的一些描述,如商品的质量、性能、价格等。商品表现是商家信誉评价的本质依据,所以,信誉越好的商家其评论中则会包含越多对商品本身描述的一些信息,同时描述的也更为详细。②服务表现。服务表现主要包括商家的售后服务、服务态度、咨询等。③物流表现。物流表现主要包括物流速度、发货及时性以及物流服务态度等。

表4 信誉维度情感值

图6 手机商家信誉维度体系及权重

为了进一步验证笔者构建的商家信誉维度的有效性,对表5、表6排序出的评论结果进行相关问卷调查。共发放问卷230份,有效问卷152份,对比结果如表7所示,其中“√”表示认可度超过60%,“×”表示认可度低于60%。

图7 文献[2]构建的手机商家信誉维度

笔者/文献[2]商家信誉值评论内容评论者评论时间1/41.960 等了2天终于发货了,顺丰物流很快,昨天收货了,马上打开包裹,对手机很满意。颜值很高,拍照也不错,性价比也高,用起来很流畅,玩游戏也不卡顿,电池也耐用,期待后续精彩表现。荣耀手机也越来越好了,继续关注荣耀手机,期待更多更好的手机。收货当天追加:信号强度非常好。 像素高,拍照效果好,清晰。 续航能力强。 手机外观漂亮大气,手感也好。使用中没有卡顿现象,作为千元机性价比很高,值得购买充电速度快。 服务周到,细致物流包装很完美,不会有损坏。买手机,就买华为的!好评!菲∗∗∗吧(匿名)2017-08-242/441.840总体来说很棒,很流畅,这个价位也确实亲民,同等价位来说,拍照清晰、音质清楚、信号较强,操作暂无长时间卡顿,较为顺畅。手机很流畅,反应很快,颜色很好看,手感超棒,手机尺寸大小刚刚好,真的物超所值,好评,支持华为,支持国产。等∗∗∗¥(匿名)2017-08-093/521.792 给老妈买的额,很快就收到货了!特地试用了一段时间才来评价的,运行速度很快,给老妈用足够了,外形、手感都不错,指纹识别也很灵敏,性价比很高,建议大家玩手机不是特别多的可以考虑!x∗∗∗n(匿名)2017-08-19

表6 评论商家信誉值排序(2)

从表7可以看出,基于笔者构建的手机商家信誉维度进行商家信誉评价的评论较多的涉及商品表现、物流表现以及服务表现3个方面,其中商品表现包括手机、硬件、屏幕、外观、性价比、网络、摄像头、质量,相比于文献[2]较为具体且更加全面,对于文献[2]排序出的评论虽然有涉及商品表现这一部分,但对物流表现和服务表现涉及过少,使得对商家的信誉评价不够全面,其中73.98%的消费者认为经笔者商家信誉维度评价排序出的评论更加能真实反映出商家的信誉,而文献[2]的只有68.38%。此外,从表5、表6排序结果可看出,笔者方法得出的评论内容丰富,体现商家信誉的信息较为全面,一定程度上能够更加合理反映商家信誉。

表7 商家信誉维度对比

5 结语

电子商务的快速发展使得各种电商平台上商家数量逐渐增多,但商家之间信誉差异较大。在线商品评论是用户反馈商家信誉的重要渠道,但恶意虚假评论干扰了该渠道作用的正常发挥。着眼于构建合理的商家信誉维度体系,笔者基于主流特征观点对——评论可信信息承载单元这一概念,验证了可信评论中主流特征观点对的稳定性;基于主流特征观点对的数量阈值的设定,筛选过滤虚假评论,对在线评论的主流特征观点对进行提取;最后,结合产品说明书以及词语互信息计算方法对主流特征观点对进行聚类分析,构建出商家的信誉维度体系以及维度权重,并根据观点词对信誉维度进行情感值计算及评价,验证了笔者方法比其他信誉维度体系构建方法更为有效。

猜你喜欢
特征词信誉商家
以质量求发展 以信誉赢市场
基于单片机MCU的IPMI健康管理系统设计与实现
中国人不骗中国人
基于类信息的TF-IDF权重分析与改进①
No.4 快手电商:已帮助至少50万线下商家恢复生意
信誉如“金”
基于改进TFIDF算法的邮件分类技术
产品评论文本中特征词提取及其关联模型构建与应用
江苏德盛德旺食品:信誉为翅飞五洲
面向文本分类的特征词选取方法研究与改进