刘 岩 张艳荣 赵志杰 闫晓彤 张佳琳
(哈尔滨商业大学计算机与信息工程学院 黑龙江 哈尔滨 150028) (哈尔滨商业大学黑龙江省电子商务与信息处理重点实验室 黑龙江 哈尔滨 150028)
哈尔滨作为我国冬季旅游热门城市,拥有丰富的冰雪旅游资源。据哈尔滨市文广旅游局统计自2019年1月1日开始的冰上冰雪嘉年华活动,历时48天,累计接待游客210余万人次,哈市旅游市场增长态势稳定,酒店住宿业蓬勃发展。伴随消费升级和购买行为习惯的改变,越来越多的用户在网上发表评论表达自己对于酒店的观点看法。2018年4月11日发布的《2018年中国住宿业市场网络口碑报告》指出,2017年国内外主流点评网站共产生评论超3 600万条,日均接近10万条,分析观点多达1.3亿个[1]。这些由网络消费者产生的酒店评论很大程度上反映实际需求或希望被满足的程度,可能包含对硬件或服务性能,以及酒店硬件设施或服务本身的评价,也是其他顾客获取入住酒店信息的主要参考意见来源。顾客对酒店的满意程度会影响到其他潜在顾客对酒店的整体认知,进而影响酒店在市场中的竞争力。由此可见,研究消费者的满意度对如今酒店业的经济环境而言意义深远。
本文以“2019哈尔滨冰上冰雪嘉年华”期间产生的酒店评论数据为例,运用情感分析技术结合文本挖掘、机器学习算法对酒店评论文本信息进行分析处理。通过对酒店顾客满意度影响因素的提取以及情感得分的计算,构建基于情感分析的酒店顾客满意度评估模型。全面探知顾客特征关注偏好和特征情感对酒店顾客满意度的影响,有助于哈尔滨市酒店经营者了解顾客在冰上冰雪嘉年华期间的消费行为、感知价值,有针对性地提升自身服务水平、改进和创新经营模式,提高顾客的满意度和忠诚度,提升酒店品牌形象,保持强劲的市场竞争力。
顾客满意(Customer Satisfaction,CS)的早期研究可追溯到20世纪30年代在社会和实验心理学领域对满意理论的研究探索。1985年,美国消费心理学家首次提出顾客满意度理论,其后在发达国家得到迅速广泛的传播和运用。1994年,Fornell等提出构建美国顾客满意度指数(the American Customer Satisfaction Index,ACSI)模型,该体系在综合产品消费预期、产品质量感知绩效、产品的实际价值和价格等多种因素的基础上将感知价值作为潜变量,将价格信息引入,使得不同行业、企业、部门的顾客满意度可比。欧洲的顾客满意指数模型延续了ACSI基本架构,不同之处在于将质量感知细分为产品质量感知与服务质量感知,增加了形象变量,并剔除了抱怨变量。
相较于欧美国家成熟的研究体系,我国在顾客满意研究方面具有起步晚、发展快的特点。随着市场化改革的深入及行业竞争的加剧,我国企业也逐渐意识到保持顾客、留住顾客的重要性。清华大学赵平教授于1995年将顾客满意度的概念引进,2000年国家质量监督检验检疫总局提出中国顾客满意指数模型。2015年正式实施国家级的顾客满意度指数(China Customer Satisfaction Index,CCSI),并每年向全社会发布最新调查结果。我国各行业都在努力构建适合自身的满意度指数模型,在对移动互联网背景下经济型酒店顾客满意度进行探究测评时,文献[2]从影响经济型酒店客户满意度的相关因素出发,在概括的问卷中设置了经济型酒店的品牌形象、产品的预期质量、事先感知到的质量、感知到的具体价值、顾客的满意程度及顾客的忠诚等6个主要评价指标。
酒店顾客满意度研究长期以来都是酒店研究领域的重要议题。对于酒店顾客满意度的研究,多数学者都是通过调查问卷获得其研究数据,对于数据的处理大多采用统计分析的方法。传统的酒店顾客满意度研究方法主要包括双因素理论、美国顾客满意指标(ACSI)、多元回归分析等。文献[3]以欧洲47个首都城市的6 768家酒店为样本,采用线性混合模型技术分析发现酒店星级是影响顾客体验的最重要因素。文献[4]通过因子分析认为影响高星级酒店顾客满意度的因素主要体现在酒店软硬环境、酒店员工素质及表现、酒店服务种类等方面。文献[5]通过分析酒店线上预订系统顾客满意度的影响因素,用问卷调查的方式进行实证研究,发现酒店预订系统网站设计、网站信息质量、网络支付、网站营销活动以及网站服务质量对顾客满意度有显著的正向影响。
除传统统计方法,大数据环境下顾客通过自身感受写下正面/负面情绪的评论文字分享给其他消费者,对其他消费者的消费倾向造成影响。这一现象的出现推动了基于文本挖掘的研究。文献[6]通过对33家在社交网站Yelp上注册的拉斯维加斯酒店的47 172条评论进行实证分析,构造帮助酒店管理者了解客人满意度的模型,并在员工经验、专业度等方面提出改善酒店服务的建议。文献[7]收集全球80个主要urbar旅游目的地13 410家酒店160多万份客户评论,通过多层次分析发现商务入住顾客对酒店服务的总体满意度明显低于休闲入住顾客。文献[8]以tripadvisor网站上的127 629条酒店评论为样本,利用在线文本评论的技术属性和顾客在评论社区的参与度预测总体客户满意度。研究发现较高的主观性和可读性以及较长的文本评论时间会导致较低的总体客户满意度,顾客评论参与度对他们的整体满意度有正向影响。
文本情感分析是近年来NLP研究领域中十分重要的课题,是对人们表达的带有情感倾向的评论、观点以及情绪等文本进行分析和处理,并对整理后的信息进行进一步归纳和推理的过程,也被称作意见挖掘。国外文本情感分析的研究起步比较早,并且取得了一定研究成果。文献[9]通过对网络数据进行情感分析,帮助商家识别购物者每个阶段的痛点和消费情绪。文献[10]通过对Airbnb用户的评论进行文本挖掘和情绪分析,发现影响用户体验的三个关键因子包括“位置”、“设施”和“房主”,而负面情绪主要由“噪音”引起。此外,国内学者也丰富了情感分析领域的研究[11]。文献[12]对景点评论从旅游形象和情感分析等角度入手挖掘有价值信息,分析结果能直观显示游客关注点和总体情感倾向,为景点其他潜在游客节省大量选择旅游目的地的决策时间。文献[13]针对美团外卖平台,通过进行情绪值分类和检验评论数据的情感倾向和打分评价的相关性,具体分析评价消极情绪在不同等级城市中差异性以及部分门店消极情绪较高的原因,对商家消费者和平台提出合理建议。文献[14]利用LDA模型和文本情感分析相结合进行模糊综合评价的方法研究用户满意度,以帮助企业低成本和高效地获取目标消费群体反馈信息。
据第三方移动互联网大数据监测平台Trustdata所发布的《2018年Q2中国在线酒店预订行业发展分析报告》显示,美团酒店、携程、去哪儿、同程艺龙、飞猪五大酒店预订平台在线酒店预订市场份额(订单量)合计占2018年第二季度中国在线酒店预订行业的96.4%。平台月活跃用户相比2018年一季度增长了约20%,行业主导地位越来越明显,因此本文就这五大平台进行调研,将本文的评价体系与之对比,发现目前几大主流酒店预订平台评价体系虽然较为完善但仍存在一定缺陷。(1) 评价指标方面。几大主流预订平台关注点略有不同,但都主要从位置、设施、服务、卫生、性价比五个具体方面进行评分。而本文在顾客满意度理论的基础上结合机器学习、自然语言处理技术将评价指标分成两个等级,除了对价格、交通区位、服务、卫生、设备设施、餐饮等一级指标进行评分外,还对每个一级指标下的二级指标进行细化打分,指标设置更加全面、细致。(2) 评估方法上。几大主流预订平台的评分展示主要依据用户的星级评分进行处理计算获得,为数值型定量打分,不能全面体现用户评论文本所包含的特征维度及情感倾向,而本文的评分主要依据用户的实际评论内容,对其进行文本挖掘及情感倾向性分析处理,评分结果更具科学性。
综上所述,目前国内对于酒店的文本评论处理方法还有待精进,大多数学者只关注用户的词频数据并没有从用户生成的文本内容挖掘其情感。少数学者利用了情感分析技术,但结果更多的是对酒店整体满意度的衡量,并未给出直观的衡量酒店满意度结果,也未给出就某一特征的酒店满意度的情感倾向。本文将文本挖掘技术结合情感分析技术对酒店满意度的影响因素进行量化打分,构建基于情感分析的酒店顾客满意度评估模型,客观得出用户满意度评分。该评估体系较目前主流酒店预订平台仅在综合评分处展示用户评价星级评分,或仅在细分领域展示含有某一关键词评论的个数,考虑到顾客在评论中所表现出的情感偏好,并对具体细分特征给出满意度评分,极大地完善了原有评价体系,增强了客观性和可读性。
本文的研究包括文本数据的采集及预处理、TF-IDF、Word2Vec、K-means、基于监督学习的特征分类算法、情感分析及多元线性回归,最后,结合顾客满意度相关理论构建基于情感分析的酒店顾客满意度评估模型,得到酒店顾客满意度的整体得分和各影响因素的个体得分。通过得分能够清晰地分析出顾客对酒店的特征关注偏好及其特征情感对酒店满意度的影响,从而帮助酒店经营者调整其酒店的经营模式,为顾客提供更好的服务。本文的研究框架如图1所示。
图1 基于情感分析的酒店顾客满意度评估
本文以酒店评论为研究对象,在模型构建时主要利用中科院谭松波教授公布的10 000篇酒店评论语料作为数据集,整理语料库,将其中8 000条评论作为训练集、2 000条评论作为测试集。为保证数据的有效性,首先对数据进行清洗工作,去除文本中的无效评论;然后对清洗后的数据利用jieba分词工具进行分词,在分词的过程中加载停用词表,停用词表选用的是哈工大的停用词表,并在停用词表中加入如“酒店”、“宾馆”、“万达”、“香格里拉”等词汇进行停用词的过滤;最后加载过滤函数,过滤评论中的英文单词、数字及字数少于2的词汇获得初步数据处理结果。
1) 利用TF-IDF算法结合酒店顾客满意度相关理论获得酒店顾客满意度二级影响因素。TF-IDF是一种基于统计的计算方法,常用来评估在一个文档中一个词对某份文档的重要程度,这种作用显然很符合关键词提取的需求,一个词对文档越重要,那就越可能是文档的关键词。TF-IDF算法的计算公式如下:
(1)
式中:nij表示词i在文档j中的出现频次;|D|为文档集中文档总数;|Di|为文档集中出现词i的文档数量,分母加1是采用了拉普拉斯平滑,避免有部分新的词没有在语料库中出现过而导致分母为零的情况出现,增强算法的健壮性。
根据2.1节的处理,已经获得了文本预处理后的结果,为获取每一个词的TF-IDF值,首先需要对已有的语料数据进行训练,本文选用的是中科院谭松波教授公布的10 000篇酒店评论语料,然后加载TF-IDF算法对本文的语料数据进行训练。在训练的过程中采用词性过滤的方法仅保留名词作为关键词,结合酒店顾客满意度相关理论和研究,提取TF-IDF值靠前的50个名词作为酒店顾客满意度的二级影响因素,实验结果以前10个结果为例,如表1所示。
表1 TF-IDF算法提取关键词结果
2) 利用Word2Vec工具对二级顾客满意度影响因素词汇进行向量化处理。Word2Vec模型可以很好地利用词上下文信息和句子的内部结构信息,基于神经网络模型将词映射成一个低维、稠密的实数向量。因此为得到某一领域的某个词的词向量,首先要对该领域的语料库进行预处理,然后利用gensim模块的API接口加载Word2Vec训练词向量模型,得到每一个词的词向量,最后从中抽取上一步得到的50个特征词汇的向量化表示。
3) 计算词向量之间的欧几里得距离,采用K-means聚类算法获取词向量的聚类结果,并采用轮廓系数(Silhouette Coefficient)考察簇的分离情况及簇的紧凑情况以评估聚类质量。不断调整K值进行重复实验,发现K=7时,其轮廓系数达到最大值0.722,表明此时的K值最优。绘制聚类结果如图2所示,其中,质心已用序号进行了标识,分配到同一质心附近的点簇归为同一类一级影响因素,横纵坐标的值表示由二级影响因素词向量值所确定的边界范围,是无量纲的。
图2 K-means聚类结果图
通过文本聚类分析结果,并结合顾客满意度相关理论及研究,将酒店顾客满意度影响因素分为7类,分别是价格、交通区位、服务、卫生、设备设施、餐饮以及总体感受,一级影响因素下又分为50个二级影响因素,具体结果如表2所示。
表2 酒店顾客满意度影响因素
1) 由于数据集中的每条评论可能包含不止一个影响因素,可能既包含服务又包含卫生,因此需要先把每条评论分成多个短句的形式方便后续处理。本文采用武汉大学开发的ROST ContentMining软件中的文本一般性处理进行文本短句的划分,然后去除一些不包含特征词汇的短句。
例如划分前评论:位置不错,距离索菲亚教堂很近,离中央大街有一小段距离,步行即可到达,可以行李寄存,客房面积小了点。不配备香皂和面巾,香皂需要向楼层服务员索要,而且洗澡水不热,放了很长一段时间也只是温的,房间隔音效果很差。酒店的早餐很一般,不值15元一位,不过中晚餐还不错,量大味道也还好,而且可以送餐。
拆分后:位置不错/距离索菲亚教堂很近/离中央大街有一小段距离/步行即可到达/可以行李寄存/客房面积小了点/不配备香皂和面巾/香皂需要向楼层服务员索要/而且洗澡水不热/放了很长一段时间也只是温的/房间隔音效果很差/酒店的早餐很一般/不值15元一位/不过中晚餐还不错/量大味道也还好/而且可以送餐。
2) 目前常用的分类方法包括逻辑回归、SVM以及朴素贝叶斯算法。为进一步验证本文适合哪种分类器,故对常用的三种分类器进行验证测试。首先将训练集和测试集按照2.2节得到的二级影响因素进行人工标记分类,以.txt的文本形式分别存到对应的类别特征文件夹下。然后分别对训练集和测试集进行文本的预处理操作(同2.1节),预处理后的数据也存到对应的文件夹中。引入Scikit-Learn库中的Bunch数据结构训练并存储训练集和测试集的词向量空间。使用TF-IDF发现特征词,分别构建训练集和测试集的词袋模型来反映文档主题的特征。然后利用三种算法对生成的词袋模型进行训练,实验结果如表3所示。由于朴素贝叶斯算法对本文实验而言精度较高,因此,采用朴素贝叶斯分类器对本文的数据集进行分类。
表3 文本分类结果
3) 利用百度AI开放平台的自然语言处理模块进行情感得分的计算。该平台的情感倾向性分析是基于大数据和深度学习训练,自动学习深层次的语义及语序特征,具备较强的泛化能力,情感倾向性分析精度高,在相对长的句子上仍然能够保持较好的效果并且在多个垂类上(汽车、餐饮、酒店等)情感倾向性分析准确率达到95%以上,已应用于实际产品中。因此本文调用平台的情感倾向性分析API,进行情感极性值的计算,上文评论示例计算处理结果如表4所示。
表4 情感倾向性分析示例
其中:positive_prob表示属于积极类别的概率;negative_prob表示属于消极类别的概率;confidence表示分类的置信度;sentiment表示情感极性分类结果,有负向-0、中性-1、正向-2三种取值。
综合以上结果并结合顾客满意度相关理论及研究,确定评价指标体系后,对指标进行整理分析。二级影响因素的得分以情感极性值为基础确定,两级影响因素的权重采用预处理中TF-IDF算法得到的结果作为基础进行计算。
1) 情感得分按照5分制的评价标准,sj为第j个二级影响因素的情感得分,如下所示:
(2)
2)ωij为第i个一级影响因素下第j个二级影响因素测评指标的权重,如下所示。
(3)
3)ωi为一级顾客满意度影响因素中第i个测评指标的权重,如下所示:
(4)
最终,构建基于情感分析的酒店满意度评估模型,用于计算酒店整体的满意度得分,如下所示:
(5)
本文利用八爪鱼网络爬虫工具爬取携程网上“2019哈尔滨冰上冰雪嘉年华”(2018年12月1日-2019年2月1日)期间哈尔滨中央大街步行街/松花江畔区域754家酒店的评论数据共8 124条,作为研究文本,评论格式如图3所示。
图3 携程网评论示例
根据第2节构建的基于情感分析的酒店顾客满意度评估模型,得到酒店顾客满意度的整体得分和各影响因素的个体得分,如表5所示。
表5 各影响因素权值及情感得分
续表5
分析实验结果可得,顾客该段时间入住酒店的整体满意度分值为4.774分,表明顾客对哈尔滨市酒店服务质量满意度较高,但仍存在很大提升空间,酒店管理者应提供良好的硬件设施并改善服务质量以减少顾客不满。对各级影响因素进行具体维度的分析,权重的大小代表了顾客对该影响因素的特征偏好程度,即酒店经营者应该给予关注度的大小。一级影响因素顾客特征偏好程度由大到小依次为总体感受、交通区位、价格、设施设备、服务、餐饮及卫生状况。具体得分如图4所示。
图4 一级影响因素满意度得分
就二级影响因素某一细分特征的满意度得分显示,噪音、异味、被子、早餐品种、隔音以及服务问题带来的顾客体验较差。有针对性地改善酒店存在的问题能帮助经营者以较小投入获得更高的顾客满意度,具体得分如图5所示。
图5 二级影响因素满意度得分
本文对实验结果进一步分析并针对具体应用提出合理化建议:酒店除了要注重顾客总体感受、改善员工服务、提升酒店软硬实力外,应格外注意卫生及噪音问题。做好改善隔音、无线网不稳定问题、检查更换客房通风换气系统、建立标准严格的清洁流程、对室内空调 等设备进行定期维护等工作。
本文采用文本挖掘技术结合情感分析技术对提取的酒店满意度的影响因素进行量化打分,构建基于情感分析的酒店顾客满意度评估模型,客观得出用户满意度评分,弥补大多数酒店预订平台和其他学者进行酒店顾客满意度研究时未能准确反映消费者真实体验的不足。研究结果表明:酒店商家及个人都可以根据本文构建的满意度模型对想要了解的酒店进行综合性和细致化评估,从而有效分析出顾客的满意度和不同维度的情感倾向,帮助商家有针对性改进服务改善设施,提升酒店竞争力,帮助消费者更客观地了解酒店的产品及服务,做出合理决策。在今后研究中会考虑对酒店档次进行分类,有文献表明入住不同档次酒店消费者最为关注的特征不尽相同。改进后可以更好地细分市场,帮助酒店经营者调整其酒店的经营模式,为不同需求顾客提供好的服务,提升顾客满意度。