陈英梅,浦 佳
本刊核心层次论文
基于消费者评论的顾客满意度评价模型研究
陈英梅,浦 佳
(辽宁工业大学 经济管理学院,辽宁 锦州 121001)
随着电子商务的快速发展,传统顾客满意度调查方法操作复杂,有效率低、成本较高、调查周期长等缺点,已难以满足企业对顾客满意度更新的需求,并且电子商务平台上丰富的商品评论没有得到充分利用。近年来随着信息技术的高速发展,自然语言处理技术取得了巨大的进步,已经在机器翻译、人工客服、智能音箱等领域大放异彩。本文将自然语言处理技术应用在电子商务平台的非结构化评论文本上,构建一个顾客满意度评价模型,以苏宁易购某商品的消费者评论数据为例,对顾客满意度进行评价并找出消费者突出反映的问题。
顾客满意度;消费者评论;评价模型;自然语言处理
伴随着我国网购规模的扩大,电子商务平台上的消费者评论越来越丰富,其中蕴含的价值也逐渐引起了学者们的关注。许多学者研究了消费者评论与产品销量的影响关系:刘俊清、汤定娜研究了在线商品评论与顾客信任、购买意愿三者之间的关系;李林雨利用消费者评论对汽车品牌的舆情进行分析;牛丽慧和由丽萍则给出了基于商品评论的顾客满意度指标体系构建与分析方法。传统顾客满意度调查信息获取方法操作复杂,有效率低、成本较高、调查周期长等缺点,已经难以适应电子商务的快速发展。通过消费者评论来获取顾客满意度这一方面也有学者进行了研究,孙研子与陈玉宏使用灰色综合评价理论对网购顾客满意度进行了分析;樊菊花基于模糊综合评价法对网购消费者的满意度进行评价等。本文利用近两年取得巨大突破的自然语言处理技术来构建一个顾客满意度评价模型,通过消费者评论来获取顾客满意度,不仅推动了自然语言处理技术的应用,还探索了新的顾客满意度获取方法。
顾客满意度的评价是通过运用层次化结构来设定评价的指标,深入清楚地揭示出顾客满意度测评指标体系的内涵。本文在国际通行的电子商务顾客满意度评价指标基础上,参考了国内顾客满意度评价指标体系构建方法,确定该模型的商品顾客满意度评价指标,各指标和权重因商业形态和客户关注度的差异而有些调整[1]。测评指标由两级指标项构成,权重值总和为1,如表1所示。
表1 顾客满意度二级评价指标表
序号一级指标权重 二级指标 1企业形象0.083企业信誉、品牌认可度、网络口碑 2顾客期望0.306网购带来的愉悦、产品与预期一致 3顾客忠诚0.033再次购买欲望、购买频次 4服务水平0.095售前卖家沟通主动性、发货及时性 5商品价值0.211商品价格、功能、性能、质量 6交易安全0.158支付安全、商品送达及时性、商品送达安全性 7商品售后0.104安装、使用辅导、三包政策落实、投诉处理 8用户体验0.010产品体验、上网体验、服务体验
程度副词是对一个副词或形容词在程度上加以限定或修饰的副词。一般位置在被修饰副词或者形容词的前面。在消费者评论中,程度副词非常重要,是消费者所表达情感强弱程度的重要体现,是顾客满意度评价模型分析的依据之一。本文按程度副词所表示的程度级别不同将程度副词分为六个级别,并赋予相应的权重值,如表2所示。
表2 程度副词分级权重值表
序号级别权重 举例 1欠|insufficiently0.5不甚、轻度、丝毫、微、相对…… 2稍|slightly1稍微有点、有些、未免、多少…… 3较|more1.5更加、较比、较为、还要…… 4很|very2很、很是、颇、太、特别、尤其…… 5超|over2.5超、超额、过度、过甚、何止…… 6最|most3极、极度、极其、之极、最……
顾客满意度常用问卷调查法来获取,但是调查问卷模板化的问题,有限的选项常常使被调查者难以表达自己内心的真实感受,仅有的开放性问题也需要经过繁琐的分类统计处理。相较于填写调查问卷,消费者在编辑商品评论时能够不受格式约束、选项限制,尽情描述。而顾客满意度评价模型则需要从这些非格式化文本中提取出消费者对商品的评论特征并进行统计整理。要提取商品的评价特征,首先要对消费者评论进行分词处理。在自然语言处理中,主要是依据语法功能来对语句进行分词。本文使用中文分词库jieba对消费者评论数据分词获取各词的词性,选取四种具有代表性的词性组合来提取消费者评论中的商品特征短语,在语句名词缺失的情况下,将该商品作为默认评价主体[2],具体见表3。
表3 词性组合表
序号词性组合长度限制举例 1n + a>2噪音n 很大a 2v + a>2送货v 快a 3v>1信得过v 4a>1正合适a
建情感词典是进行文本情感分类的准备步骤,本文采用知网Hownet中文情感词典来进行评论文本的情感分析。基于语义的情感词典倾向性计算是通过情感词典与句式词库对文本语句结构和情感倾向词进行分析,在采用权值算法进行情感分类的基础上,针对情感强度不同的情感词赋予不同的权值,最后加权求和[3]。本文采用Python的snownlp库来获取文本情感值,传入要评价的文本,返回情感倾向值λ,如图1所示。λ为-1至1之间的实数,λ越接近-1则代表文本的情感越倾向于消极负面,λ越接近1则代表文本的情感越倾向于乐观正面,0则代表中等程度。
图1 评论情感倾向分析图
顾客满意度评价算法是评价模型的核心,本文参考其他学者的顾客满意度评价模型,设计出顾客满意度评价算法[4]。每段消费者评论的顾客满意度由四个因素计算得出,其中否定词数量与情感极性决定了结果值的正负,程度级别与情感倾向体现评论的情感强度,决定结果值的大小,公式(1)如下,用表示每条消费者评论的满意度;为分句数;为当前句;为否定词数量;为情感极性;为程度级别;为情感倾向值。
公式(1)体现的是一条消费者评论的顾客满意度,在公式(1)的基础上,将每条评论进行一级指标的分类,并与对应权重相乘,最后将所有消费者评论进行求和取平均值处理,计算结果作为该商品的最终顾客满意度。公式(2)如下,为每条评论所属一级指标对应的权重值;与的乘积为该评论的最终满意度;为商品顾客满意度;为费者评论数;为当前评论。最终顾客满意度评价算法如公式(2)所示。
本文使用Python语言构建爬虫,通过伪装爬虫来应对网站反爬虫措施,使用正则表达式、XPath筛选技术对苏宁易购电子商务网站中某商品的消费者评论文本进行批量获取,将获取到的商品评论作为数据集用于实例分析[5]。为提高实验数据的有效性,商品评论数据集在使用前需要对数据进行清理,爬虫获取的评论数据中夹杂一些无效数据、网页标签、重复评论和多余的符号,例如:“
”“}”“!!!!!”等。如果这些文本数据不经处理就传入顾客满意度评价模型进行评价,会降低顾客满意度评价结果的准确性。
将清洗过的评论文本数据,传入顾客满意度评价模型来对商品的顾客满意度进行评价。该模型经过中文分词处理、评论特征提取、情感极性分析、文本分类、顾客满意度评价计算,最终得出该商品在苏宁易购上的顾客满意度为0.20675,提取的评价短语经过归一化处理后以图表形式展现,如图2所示。
图2 模型评价结果图
在商品顾客满意度的定性分析上,本文使用李克特量表将顾客满意度分为五个级别:“很不满意、不满意、一般、满意、很满意”。该模型的顾客满意度区间为[-1,1],对应五级态度的分值区间为:“很不满意;[-1,-0.6)、不满意;[-0.6,-0.2)、一般;[-0.2,0.2)、满意;[0.2,0.6)、很满意;[0.6,1]”。按五级态度分类,该商品的顾客满意度0.20675,属于“满意”级别。从模型评价结果来看,该商品具有性价比高、送货速度快、服务态度好、制冷制热效果好等优点,消费者的整体评价较好。但是也有两点突出的问题被消费者反映较多:第一,工作时噪音过大,这是消费者反映最多的问题。第二,售后保障令人不太满意。若企业能够以这两个问题为出发点,真诚为顾客解决这些问题,该商品的顾客满意度必然会有所提升。
从该数据集的顾客满意度评价结果来看,该模型对商品的顾客满意度评价达到了该模型的设计目标,能够得到顾客满意度量化结果,并通过李克特量表给出较为直观的定性结果,较有效地提取出能够反映大多数消费者评论观点的商品特征短语,帮助企业获取该商品的优缺点。在实例分析中较准确地找出了评论数据集中消费者突出反映的产品工作噪音大和售后服务差两个突出的问题。
尽管自然语言处理技术已经取得了很大进步,顾客满意度评价指标在结合产品相关特性调整后也更加完善,但该模型对蓄意刷单、刷好评的行为尚无力应对,无法辨别的恶意数据会降低顾客满意度评价模型反映商品真实情况的准确率。另外,该模型难以理解消费者抽象表述的真实意图,无法联想到文本以外的内容,复杂的文本语义理解还需要人工智能领域取得更大的发展。本文将消费者评论与自然语言处理技术相结合,是对新技术促进原有理论发展的尝试,对电子商务顾客满意度评价未来的发展有一定的推动作用。
[1] 周娟. 基于顾客需求的B2C电子商务网站满意度评价研究[D]. 南昌: 南昌大学, 2018.
[2] 祝永志, 荆静. 基于Python语言的中文分词技术的研究[J]. 通信技术, 2019, 52(7): 1612-1619.
[3] 姚珂. 基于词典与规则的文本情感分析[J]. 电脑知识与技术, 2018, 14(26): 168-169.
[4] 李玉鹏, 邹帆, 谢卫星. 结合偏好和不均衡语义评价的顾客满意度测定[J]. 计算机集成制造系统, 2019, 1(16): 165-172.
[5] 夏玉芹, 单雪微. 基于Python的简单文本情感分析[J]. 阴山学刊(自然科学版), 2018, 32(4): 60-64.
F270.7
A
1674-327X (2021)02-0039-03
10.15916/j.issn1674-327x.2021.02.011
2020-09-18
辽宁省社会科学规划基金项目(L18CGL014);辽宁省科协创新智库项目(LNKX2019-2020B8);辽宁省教育厅科学研究项目(JJW202015408)
陈英梅(1970-),女,辽宁锦州人,副教授。
(责任编校:许伟丽)