郑丽娟+李睿璇+张杰
摘 要:茶叶是我国的特色产业,其质量影响着茶叶的销售量。随着网络零售的快速发展,越来越多的茶商开始利用互联网销售茶叶,该种销售形式,由于无法触及实体商品,消费者需要通过在线评论了解茶叶的质量。本文通过对在线评论的分析,进行茶叶质量的评价,首先获取在线评论并构建语料库,其次,引入情感分析技术,提取在线评论中的特征信息和情感信息,实现由消费者感知出发的茶叶质量的评价。本文借助在线评论,可以实现从消费者角度对茶叶主观性质量的评价,可以帮助茶商和消费者更加全面、细致地了解所销售和所购买的茶叶。
关键词:在线评论;情感分析;茶叶质量;评价
一、引言
近年来,网络零售业发展迅速、如火如荼,在降低流通成本、推动流通方式转型、促进传统产业升级等方面发挥了积极作用。随着网络零售的快速发展,越来越多的茶商开始利用互联网销售茶叶,消费者也开始通过网络购买茶叶。网络购物过程中,由于无法触及实体的茶叶商品,消费者只能通过网络口碑来了解茶叶的质量,良好的口碑已成为网络零售商获得市场空间的前提和保障,在线评论就是其中的一种重要口碑形式。
在线评论(online review)是消费者根据自己对“质量的感知”,从使用者的角度来描述和评价商品的特征和性能,体现了消费者对商品满意与否。质量是客观性和主观性的统一体,客观性质量指通过客观指标进行衡量的质量特性,可以用技术手段规范和检测,主观性质量则指满足人的心理需要的质量特性,需要从消费者的角度评判。在关于茶叶质量的已有研究中,多采用技术手段对客观性质量進行检测,而忽略了对茶叶主观质量的评价,本文通过对在线评论的分析,可以有效解决这一问题,实现从消费者角度对茶叶主观性质量的评价。
二、相关研究
1.茶叶质量评价
在茶叶的销售中,质量是影响顾客满意度的主要因素,而顾客满意又是企业维持老顾客、保持竞争优势的基石。因此,对于网络零售商来说,茶叶的质量至关重要。谢艳云探讨了如何借助大数据分析技术,精准地了解茶叶种植面积、气候、湿度等多方面信息,从而判断茶叶质量。郭燕茹分析了我国茶叶质量安全中存在的主要问题及原因,并提出完善茶叶质量安全保障体系的战略对策。龚艳等运用典型调研法和定点监测法对湖北的茶叶种植、生产、监管等多环节开展了监测和调研,根据所获取数据,明晰了茶叶的安全现状。
2.在线评论分析
现有研究主要采用情感分析技术,探讨评论中包含的商品特征和消费者情感信息。Lin等提出一种基于潜在狄利克雷分析(LDA)的主题情感联合模型(Joint Sentiment-Topic, JST),在原有的三层LDA模型(主题层、文档层和词语层)基础上添加了情感层,用于同时识别产品特征及其对应的观点。王晓耘等基于Apriori算法和隶属度算法提取产品特征和特征观点词对,并构建一种基于评论情感量化的商品综合评分模型。Wang等(2016)提出一种中文在线评论的情感分析方法,对影响情感分析效果的各种因素进行了实验研究。
3.研究综述
已有茶叶质量的研究,重点集中在如何通过技术识别、监控茶叶质量,因此在客观性质量的评价方面已取得显著的进展,但由于数据来源的单一,对主观性质量的评价存在不足。茶叶质量评价中所使用的数据,通常来自于相关部门的监测、检测或调研,该方法本质上不是从“消费者感知的角度”收集的数据,因而不能很好地展开茶叶主观性质量的评价。针对该问题,提出一种基于在线评论的茶叶质量评价方法,该方法可以很好地对茶叶主观性质量进行评价。
三、基于在线评论的茶叶质量评价
在线评论中包含了关于茶叶质量的大量信息,主要包括“特征信息(特征词)”和“情感信息(观点词)”,如表1所示,两类信息体现了客户对茶叶质量的某种特征(特征信息)的需求情况和满意与否(情感信息)。对在线评论进行分析,提取评论中的两类信息,可以实现由消费者感知出发的茶叶质量的评价。
1.在线评论的获取与标注
为提取出在线评论中的特征信息和情感信息,首先需要对在线评论进行获取和标注。步骤如下:(1)使用PHP语言实现网络爬虫,通过淘宝、京东等电子商务网站,下载关于茶叶的在线评论;(2)开发简易的标注系统,以方便标注人员进行在线评论的标记;(3)对标注人员进行“多参数标记规范”的培训,实现词性、词义以及词语间语义关系等的标注,从而构建规范化的训练语料库。
2.在线评论中“特征观点对”的抽取
抽取步骤如下:(1)对训练语料库中所标注的词性、词义以及词语间语义关系进行统计,获得最常见的、出现频率最高的词对形式(如表2所示,其中N代表名词,A代表形容词,V代表动词),并采用“词对”和“词典Hownet”相结合的挖掘方法,实现茶叶质量的特征信息(特征词)和情感信息(观点词)的提取,提取出的信息形成“特征-观点序列”;(2)对“特征-观点序列”进行统计,获得特征观点对的配对规则,从而实现在线评论中“特征观点对”的抽取。
3.针对茶叶具体特征的质量评价
(1)采用[7]中的模糊统计方法,确定观点词的情感极性和情感强度。(2)根据“特征观点对”配对结果,以及观点词的情感极性和情感强度,将所有观点词的情感强度相加后取其平均值,该平均值即为针对茶叶具体特征的情感强度值,即质量评价值。
四、结束语
从消费者角度对茶叶质量进行评价,可以帮助茶商更加全面、细致地了解所销售茶叶的质量,为茶商制定科学、合理、有效的网络营销策略提供参考依据,也可以为客户制定茶叶的网络购买决策提供建议。
参考文献:
[1]谢艳云.基于大数据分析的茶叶质量评估[J].福建茶叶,2016. 05,232-233.
[2]郭燕茹.我国茶叶质量安全现状、问题及保障体系构建[J].林业经济,2014.7,98-101.
[3]龚艳,顾宝根,邢美华.湖北省茶叶质量安全监管现状与控制对策分析[J].农产品质量与安全,2016.6,11-14.
[4]Lin, C., He, Y.L., Everson R., Ruger S. Weakly supervised joint sentiment-topic detection from text [J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 815-824.
[5]王晓耘,史玲玲.基于网络评论情感量化的商品综合评分模型[J].杭州电子科技大学学报:社会科学版, 2016, 12(3), 8-15.
[6]Zheng L. J., Wang H.W. Sentimental feature selection for sentiment analysis of Chinese online reviews[J]. International Journal of Machine Learning and Cybernetics. 2015. First online. http://link.springer.com/article/10.1007/s13042-015-0347-4.
[7]郑丽娟,王洪伟,郭恺强.基于情感词模糊统计的网络评论情感强度研究[J].系统管理学报,2014,23(3),324-330.
作者简介:郑丽娟,女,汉族,聊城大学商学院(质量学院)讲师,博士,研究方向:在线评论与产品质量endprint