姚瑶,李慧宗,桂海霞,张波
2010年以来,我国电子商务市场发展迅速,第三方物流企业也呈现快速发展的趋势。在互联网技术和人均消费能力不断提升的背景下,第三方物流企业对国民经济增长起到了越来越重要的作用[1]。根据国家统计局的数据显示,我国物流企业在2008年的收入额已达到408亿元,在2016年更是达到了4 005亿元的新高度,物流企业的收入额以平均每年33.4%的速度递增。但是,服务质量却不如人意。2016年国家邮政局发布的中国快递发展指数(CEDI)显示,物流企业的服务质量指数从标准基准数100下降至95.8。这表明我国第三方物流企业规模和服务质量存在发展不平衡的状况,可以通过对消费者的评价进行情感分析,找出其存在的问题并加以改进,改善消费者对物流企业的满意度,提高物流企业的服务质量。
本次研究对“四通一达”物流企业的消费者评价进行情感分析,主要采取评价对象抽取以及倾向性计算2种方法。基于词性抽取候选评价对象以及评价词和评价对象的搭配规则进行筛选,运用词频过滤以及 PMI(Point Mutual Information)方式剔除与物流企业无关的信息,得到最终的评价对象。通过建立普通、否定、程度副词、搭配词典以及评价短语的组成结构制定其计算规则,利用Python软件抓取消费者对“四通一达”物流企业的各项评论进行情感分析。基于评价对象抽取原则以及消费者倾向性计算结果,对其速度、服务、价格、物流信息以及品牌形象5个方面进行评分,得出最终结果,完成评价对象的倾向性研究。
S.Poria等人运用卷积神经网络(Convolutional neural network)以Amazon评论作为文本来抽取评价对象,训练词向量作为特征项对评价对象进行研究,再输入到CNN中[2]。邱云飞等人使用商品评价文本,基于词性特征、句法分析与句法树结构提取候选评价对象,过滤核心句法路径,最终提取出所需的评价对象[3]。L.Kang等人同时提取了评价对象和评价词,对评价对象的合理化抽取提供了研究思路,认为若一个评价对象和评价词有较强的关系,可推断另一个与此评价对象强相关的评价对象与评价词也有关系[4]。
高凯等人以微博评论作为文本,计算词性共现概率,研究评价者的情感度,建立博主个性化及情感倾向性分析模型进行情感分析[5]。但是,这种方法无法对一些特殊的情感词做出正确的分析。顾正甲等人在对消费者倾向性进行判别时,提到副词、连词对评价词倾向性判别的影响,认为基于浅层句法分析的方法对句法分析结果的依赖度较大[6]。H.Chen等人在对文本情感倾向性的分析中考虑了否定词及否定句对情感倾向性的具体影响,对否定句的结构与情感倾向性进行分析[7]。
相关研究在语义相关性及特殊情感词分析上均存在不足之处,需进一步改进。因此,本次研究根据上述文献分析不足之处制定了评价对象和评价词选取的规则,再根据词频和PMI指数进行筛选,得到最终的评价对象。在倾向性计算中,基于普通、否定、程度副词以及搭配词典,制定计算规则,对“四通一达”物流企业的评论倾向值进行计算。
1.数据预处理及候选评价对象抽取
在评价对象抽取之前首先要进行数据预处理,将数据处理成可以直接使用的格式,包括分词和词性标注。中文分词是将连续的字序列分成一个个单独词序列的过程。使用R.Collobert中的中文分词包结巴分词,经测试,该系统的分词精确率高达97%以上[8]。词义标注方面,将分词包中的词进行词性的标注,评价词与评价对象的筛选以此为基础。
评价对象是指在网络评论中用户所针对的商品及商品属性[9],例如快递速度、快递包装等。我们借鉴以往研究,将名词或名词性短语作为候选评价对象的词性规则,抽取候选评价对象[10]。对名词短语进行识别,引入语料领域知识,最终制定评价对象抽取规则。第三方物流企业数据集的11条词性规则如表1所示。
2.基于词性、评价词抽取评价对象
评价词是形容评价对象的词语,对于评价对象的抽取起到至关重要的作用。基于词性角度分析,评论中的评价词一般采取形容词或形容词短语的形式。邱云飞等人以形容词和形容词短语作为候选评价词建立了4条抽取评价词的规则,包括形容词+形容词(如“积极热情”)、副词+形容词(如“特别好”)、副词+动词(如“十分满意”)、形容词(如“快”)[3]。
评价对象只有被评价词修饰时才是情感分析所需的评价对象。因此,在评价对象抽取前,需找到和评价词搭配的评价对象,形成一个评价词和评价对象搭配序列。搭配序列生成算法如下:
对评价词和评价对象进行编号,用Wj表示评价对象,Mj表示评价词。评论中存在评价对象缺少评价词,评价词缺少评价对象,则为缺失的评价词编号MTj,为缺失的评价对象编号WTj,j从0开始。例如:最近寄快递(W0,MT0)都是用汇通(W1,WT1),价 格(W2)公道(M2),服务(W3)也还不错(M3)。
根据上面的提取方法,形成了一个评价对象与词的搭配序列(W2,M2)(W3,M3)。
上述算法,存在很多未知搭配,故需要制定以下4条规则进行补充:第一,对很明确的搭配可直接提取;第二,若无评价对象与其搭配,则采用最近原则;第三,若都不满足,则根据邻近的其他对象,查询评价词的前缀是否有连词,若有连词,则认为此评价词为真正的评价对象;第四,若评价词无明显搭配,则采用就近原则[11]。
3.基于词频和PMI算法过滤
得到的候选评价对象会存在一定的噪声,需要通过相应的过滤技术来进行筛选,得到最终的评价对象。我们通过2种方法来进行筛选:一种是根据词频信息进行过滤;另一种是基于网络挖掘的PMI算法进行过滤。
词频过滤是对候选评价对象进行词频统计,将出现次数较少的名词或名词短语去除,筛选出在文本中会出现较多次数的评价对象。
表1 第三方物流企业数据集的11条词性规则
PMI指数可以对2个词之间的关系进行量化,公式如下:式(1)中:L 是指 PMI指数值;公式(1)是求 a,b 两个词之间的关系,Wab是指a,b两词同时出现的文档数,Wa表示只出现a的文档数,Wb表示只出现b的文档数,文档数在本次研究中指的是评论数。Wa是选取这一领域最具代表性的一个词,而Wb是从候选评价对象里选取的一个词。La-b值呈现2种状况:大于0,两个词相关,且值越大,相关性越强;小于等于0,两个词为不相关。本次研究中,La-b值大于0的词语即为评价对象。
4.评价对象与评价词相匹配
根据以上评价对象与评价词的搭配规则,将抽取完成的评价对象与评价词进行匹配,最终得到一个新的具有评价对象和评价词的词对,可以看出消费者最关心的物流属性及对每项物流属性的评价。
对评价对象所匹配的评价词进行计算,累计相加得出每个评价词的强度。
1.本次研究构建一个基础词典、否定词典、程度副词词典和搭配词典
基础词典是指本次研究利用了《中国知网》以及《汉语褒贬义用法词典(2001)》提供的褒贬义词语构建基础词典。经过整理得到正面词语4 324个,负面词语 4 066 个[12]。
否定词词典是指根据文献中对否定副词含义的界定,选取“白、别、不、不要、没有”等 35 个否定词[13]。
程度副词词典是指通过对程度副词的分类,将选取的80多个程度副词分类为极量如“最、即”等,高量如“更、很”等,中量如“还、不太”等,低量如“略微、有点”等。
搭配词典是指像“高、大、多”等词是一种特殊的情感倾向词,搭配不同的评价对象有不同的情感倾向,如“高”形容“价格”是一种负面倾向,形容“技术”就是一种正面倾向。因此,本次研究要建立一个属于研究的某个领域的搭配词典,来提高倾向性计算的正确性。
2.倾向值计算
本次研究对评价词构成的短语进行倾向值计算,并给出了对评价对象强度的计算公式,如表2所示。
表2中:A代表评价短语;P代表评价词;D代表程度副词;N代表否定词;EP和EN代表评价词和否定词的强度,一般正面设定为0.8,负面设定为-0.8[14];LD为程度副词的强度,根据强度的不同设定为0.9、0.7、0.5 和-0.5[15]。
“四通一达”物流企业包括中通、申通、圆通、汇通以及韵达5家民营快递企业。本次研究通过Python软件对“四通一达”物流企业的消费者评论,各抽取2 000条来进行情感分析。
表2 评价对象强度的计算公式
在“四通一达”物流企业中的10 000条评论中得到134个评价对象,不包括重复的,并将这些评价对象分为速度、服务、价格、物流信息以及品牌形象5个大类,再与评价词进行匹配。汇通企业速度类匹配结果示例见表3。
表3 汇通企业速度类匹配结果示例
根据评价词强度的计算公式对评价词进行计算,将类别中的评价词的结果相加,得出每一类的倾向值结果。物流企业评价对象倾向值计算结果如表4所示。
表4 物流企业评价对象倾向值计算结果
以0为衡量值,倾向值大于0,说明评价对象具有一定的优势;倾向值小于0,说明评价对象没有达到客户的要求,有待提高;倾向值越大,优势就越大。
通过分析表4的数据可以得知,大多数消费者的关注点都聚焦于物流企业的服务、速度以及价格上。在速度和服务上,5家物流企业距离客户的要求还有很大差距,但5家企业之间差异同样明显,速度上汇通和韵达表现得最好,服务上汇通和中通处于领先地位。价格上,汇通拥有很大的优势,韵达紧随其后,剩余的3家企业在价格上处于劣势地位。对于物流信息而言,5家企业的差距小,基本处于同一水平线上。在品牌形象上,中通倾向值最高,给客户留下的印象最好,申通和韵达给客户留下的印象最差,需引起重视,努力提高企业在客户心目中的品牌形象,吸引更多的消费者。
在大数据时代,互联网的普及使得人们的生活方式发生了变化,人们对网上购物的需求变得越来越大,极大地推动了第三方物流企业的发展。但是,面对越来越多的物流企业进入市场的局面,物流企业想要提高自身的竞争力,最重要一点就是要把握好消费者的心理。要做到这点,需要从消费者的文本评论数据中挖掘分析内在的信息数据。
从上述研究得出,“四通一达”5家物流企业彼此间虽然存在差距但并不是不可追赶的。特别是在速度和服务上,5家物流企业都有很大的提升空间。及时了解自己的优势与劣势所在,保持优势项,并在劣势项上多下功夫改进,力求达到物美价廉,可以迅速在异军突起的物流企业中抢占市场份额。
[1]曹翠珍,赵国浩.区域物流发展、经济增长与能源消费:基于中国省际面板数据的实证分析[J].财贸研究,2015(2).
[2]PORIA S,CAMBRIA E.Aspect Extraction For Opinion Mining With A Deep Convolutional Neural Network[J].Knowledge-Based Systems, 2016(9).
[3]邱云飞,陈艺方.基于词性特征与句法分析的商品评价对象提取[J].计算机工程,2016(7).
[4]KANG L,LIHENG X U.Extracting Opinion Targets And Opinion Words From Online Reviews With Graph Co-ranking[C].Baltimore,Maryland,USA:Proceedings of the 52 nd Annual Meeting of the ACL,2014.
[5]高凯,李思雨.基于微博的情感倾向性分析方法研究[J].中文信息学报,2015(4).
[6]顾正甲,姚天昉.评价对象及其倾向性的抽取和判别[J].中文信息学报,2012(4).
[7]CHEN H,LIU G.Sentiment Classification Of Commodity Evaluation Based On Parsing[J].Information Security And Communications Privacy, 2013(2).
[8]COLLOBERT R.Natural Language Processing (almost) From Scratch[J].TheJouralofMachineLearningResearch, 2011(12).
[9]廖祥文,陈兴俊,魏晶晶,陈国龙,程学旗.基于多层关系图模型的中文评价对象与评价词抽取方法[J].自动化学报,2017(3).
[10]江腾蛟,万常选,刘德喜,刘喜平,廖国琼.基于语义分析的评价对象:情感词对抽取[J].计算机学报,2017(3).
[11]张建华.基于LDA和词性句法规则的用户评论情感分析研究[D].南宁:广西大学,2014.
[12]王英,龚花萍.基于情感维度的大数据网络舆情情感倾向性分析研究:以“南昌大学自主保洁”微博舆情事件为例[J].情报科学,2017(4).
[13]李晨,朱世伟,魏墨济,于俊凤,李新天.基于词典与规则的新闻文本情感倾向性分析[J].山东科学,2017(1).
[14]高歌,罗珺玫,王宇.基于HNC理论的文本情感倾向性分析[J].数据分析与知识发现,2017(8).
[15]MANNING C D.Computational Linguistics And Deep Learning[J].Computational Linguistics, 2015(4).