董丽颖
(1.北京外国语大学 国际商学院,北京 100089;2.浙江海洋大学 外国语学院,浙江 舟山 316022)
在新冠疫情冲击之下,我国酒店业面临着史无前例的考验,预期的短期冲击悄然改写着行业形态,为应对变局,酒店管理者比以往更迫切地需要厘清市场引流背后的逻辑。根据迈点研究院发布的《2021 年12月酒店品牌影响力(MBI)100 强榜单》[1]解析,如今消费者个性化需求呈现增势,行业内酒店同质化现象却非常严重,加之新冠疫情带来的动荡,导致客房收入锐减,酒店行业有必要拓展业务场景,通过非客房收入的提升价值引入更多客群流量,实现相对于传统酒店而言的价值重构。反观业内,在新冠疫情挑战和市场需求变化叠加的行业背景下,打造文化主题酒店成为风潮,众多酒店管理者对文化的追逐是否理性,是否能够吸引客群流量,成为酒店业价值重构的一条创新路径,这是酒店管理者和业内专家都在思考并期待求证的课题。鉴于此,笔者尝试通过顾客在线评论开展实证分析,评测我国酒店将中国文化纳入产品设计体系是否会提升酒店的客群吸引力。
随着网络社区化在酒店场景中的全面渗透,使用传统工具存储、处理和分析大量文本数据成为酒店行业面临的挑战,而文本挖掘是分析和处理非结构化数据的最关键方法之一,能够从海量网评数据中提取有用的信息,为酒店管理者提供顾客知识。
应用文本分析法开展酒店在线评论的研究很多,对本研究具有重要参考意义的研究有对顾客评论中的酒店服务属性进行识别和分值估计的算法探索,如ALRABABAH 等[2]提出一种基于多元组(N_gram)和观点词典并独立于具体领域的方法,使用WordNet 中的词典编纂器文件识别与特定领域产品密切相关的特定特征和属性,实现特征提取;对在线文本进行情感计算的相关研究,如GAO Yingying 等[3]提出了一种用于全面描述情感状态的多组分情感模型,将文本级和段落级的情感状态作为上下文特征,以扩展句子级情感检测的可用信息,提出一种从文本中提取情感状态的方法。KUMAR 等[4]通过机器学习对顾客评论进行意见挖掘和情感分析,分别使用朴素贝叶斯分类器、逻辑回归和SentiWordNet 算法实现评论极性分类,结果显示朴素贝叶斯分类器效率最优。ZHAO Zhibin 等[5]提出了一个面向在线顾客评论的属性挖掘和情感分析框架,通过使用京东网站上广泛使用的小型情感和主观性语料库对该模型评估后发现性能良好。
在对文化主题酒店的研究方面,国内学者开展的研究比较丰富,如王姝[6]以苏州凯悦酒店为案例作分析研究,认为酒店增加地域文化特色的设计元素能够提升酒店的文化内涵, 不仅可以展示当地的文化特征,还可以间接提升酒店的经济效益。廖丰平[7]对西北陇东窑洞文化酒店开展案例分析研究, 深入探索地域文化特色在酒店室内设计中的具体应用, 倡导酒店室内设计适当融入地域特色, 帮助酒店在声誉、品位及经济效益等方面取得成效。
与笔者研究相近的研究如段冰[8]以绍兴市文化主题酒店咸亨酒店为样本,通过问卷调查获得数据,构建并分析顾客满意度测评模型中各隐变量的路径系数,结果发现文化主题酒店顾客感知质量对感知价值和顾客满意度的直接正向影响显著;顾翘楚[9]以苏州地区的地域文化型主题酒店作为调查样本,发现地域文化型主题酒店的主题文化表达与顾客主题氛围体验、顾客感知价值和顾客行为倾向之间有正相关关系。田彩云等[10]对顾客进行线上和线下问卷调查,研究了中国文化元素在酒店应用的顾客感知维度,测算其对顾客感知价值的影响, 发现顾客对中国文化元素在酒店感知的维度体现为酒店的中国特色文化产品、中国文化建设、中式建筑及装饰、中式服务和中国文化活动,以上各维度都对顾客感知的功能价值产生显著的正向影响。
以上相近研究均采用传统的问卷调查法收集数据,再通过统计分析研究我国酒店行业提供的文化服务产品,而笔者以顾客生成内容为研究数据,使用文本分析法挖掘顾客购后体验中的重要信息,以求解我国酒店提供的文化体验服务与顾客情感的相关性。
笔者从TripAdvisor 网站采集了95 家中国本土中高端(三星级和四星级)酒店共7 575 条中文在线评论数据,经过疑似虚假评论剔除和预处理等过程,将制作好的在线评论文本语料库按照三星级文化主题酒店、四星级文化主题酒店、三星级标准酒店和四星级标准酒店分成四个子语料库进行对比分析,并提出组间对比(文化主题酒店与标准酒店对比)和组内属性对比(文化主题酒店各服务属性对比)理论假设如下:
假设一(H1):三星级文化主题酒店的顾客情感强度要显著高于三星级标准酒店的顾客体验情感强度;
假设二(H2):四星级文化主题酒店的顾客情感强度要显著高于四星级标准酒店的顾客体验情感强度;
假设三(H3):三星级文化主题酒店评论中,文化体验属性触发的情感强度要高于其他服务属性的情感强度;
假设四(H4):四星级文化主题酒店评论中,文化体验属性触发的情感强度要高于其他服务属性的情感强度。
笔者对文本评论实施了LDA(Latent Dirichlet Allocation)主题聚类过程,以挖掘顾客评论中关注的主题,即酒店服务属性。在这一过程中,通过LDA 方法常用的困惑度确定最优主题数,见图1。
图1 LDA 主题数与困惑度关系图
由图1 可知,根据最低的困惑度能够得到文本评论的最优主题数为7,即笔者将选定7 个酒店服务属性进行后续分析。接下来,笔者为每个单独的词语赋予一个索引,并使用索引将文档列表转为文档—主题(DT)矩阵,利用Gensim 提供的LDA 模型接口输入DT 矩阵,使每一个词项都赋予一个唯一索引键值对序列,建立索引到词项的映射。然后再创建一个 LDA 对象,输入选定的最优主题数7 和 DT 矩阵进行模型训练,超参数由模型从训练语料中估计获得。根据最佳主题数量7 对应的LDA 生成模型输出结果,每一行包含了主题词编号和主题词对应关键词的概率权重,具体见表1。
表1 LDA 主题模型输出结果界面
笔者把输出各主题下面的关键词进行整理,结合行业相关知识和专业表达实施分类,同时参考了数据源平台TripAdvisor 提供的酒店服务分项及以往研究的常见划分,[11-12]得出了对应的主题聚类共7 个酒店服务属性:“房间(room)”“位置(location)”“设施(facilities)”“员工与服务(staff & service)”“价值(value)”“餐饮(food)”以及本文研究对象“中国文化(Chinese culture)”。
通过调用前一步骤分析得到的酒店服务7 个属性特征词列表,笔者从制作好的酒店评论子语料库中提取情感特征词。为了实现全面而且尽可能细粒度的分析,得到每条评论中不同属性的顾客情感倾向,笔者还需要在每条评论文本中找到情感特征词对应的情感词,为情感特征的情感倾向计算做准备。
一般情况下,情感对象词对应的情感词可以通过词性来判断,根据语法,情感词的词性多为形容词或者名词,比如:在评论“酒店装修很陈旧,但是交通很方便,酒店的服务也很好,总的来说可推荐”中涉及了多个服务属性的评价,包括“酒店装修”“交通”“服务”三个方面,因此可以把这三者作为情感对象词,而每个情感对象词所对应的情感词分别为形容词“陈旧”“方便”“好”,从而可识别出用户对酒店装修的负向情感和对酒店交通、服务的正向情感。为了能够识别不同情感对象词对应的情感词,笔者通过BIOES 进行情感词标注,从而作为BERT+CRF 模型的标签(label)进行模型训练,再通过已有的情感对象词,使用情感对象词—情感词对应算法将评论中的每个情感对象词和识别出来的情感词实施一一对应,调用大连理工中文情感词汇本体词典实现情感对象词(通过特征词实现)和情感词强度值的计算,计算过程综合考虑了属性下的每个特征词的强度、出现的频率,以及属性下不同特征词的数量,以便能够更好更准确地表达出属性的强度。具体见表2。
表2 情感对象词—情感词对应算法
通过上述步骤得到了顾客评论中最关注的酒店服务属性和属性情感强度后,笔者可以对比中国文化属性与其他服务属性下顾客情感强度的差异,以验证本研究的理论假设。
首先进行酒店样本组间对比验证性分析。笔者分别对文化主题酒店和标准酒店进行顾客情感强度构建,其中两类酒店同时按三星级和四星级分别实施分析:
顾客的体验情感为顾客在“中国文化”“餐饮”“位置”“房间”“员工与服务”“设施”和“价值(性价比)”7个属性下的情感强度,即attr中国文化、attr餐饮、attr位置、attr房间、attr员工与服务、attr设施和attr价值,针对每一个样本,酒店都能够通过特征词、情感词、情感词的情感强度、特征词的TF-IDF、去重特征词出现的词素来测量该酒店的七个属性下的情感强度。
根据以上分析,分别得到中国文化主题酒店和标准酒店七个服务属性下的情感强度。为了验证假设一,需要证明两点:(1)文化主题酒店和标准酒店的属性情感强度是否有显著性差异;(2)文化主题酒店的属性情感强度是否显著高于标准酒店。
笔者采用假设检验 (hypothesis testing)中的T 检验来验证上述两点假设。T 检验是用于检验两组样本量较小的连续性变量,通过t 分布来推断差异发生的概率,以判定独立样本平均值是否具有显著差异的方法。
第一步:拿到已有的两组酒店的属性情感强度数组。
第二步:提出假设:假设文化主题酒店和标准酒店的属性情感强度相同(零假设H0)。用1和2分别表示文化主题酒店和标准酒店的平均属性情感强度,那么零假设可以表示为1-2= 0。
第三步:基于当前零假设和当前样本,计算t-score 值,通过t-score 值比该数值最极端的值出现的概率来代表抽到目前这个样本集更极端的样本的概率。其计算公式为:
第四步:判断当前t 值和自由度为6 的t 值界限表,如果t 值大表示拒绝零假设,说明两个样本有差异性,如果t 值小,说明两个样本没有差异性。
同时,可以通过查看两组酒店的属性情感强度分布,以及文化主题酒店的均值、标准差、最大值、最小值、二分位数、四分位数等,判断文化主题酒店和标准酒店顾客情感强度的差异性。
通过上述过程计算和比较文化主题酒店和标准酒店的各属性情感强度差异,可得到结果,具体见表3。
表3 文化主题酒店和标准酒店顾客情感强度差异
由表3 可知,假设三星级文化主题酒店的属性情感强度均值与三星级标准酒店的属性情感强度均值相同,经过T 检验,结果为拒绝原假设;同理,针对四星级文化主题酒店和四星级标准酒店评论属性情感强度均值进行分析,假设四星级文化主题酒店的属性情感强度均值与四星级标准酒店的属性情感强度均值相同,经过T 检验,结果为拒绝原假设。
分别对中文评论数据集文化主题酒店和标准酒店的顾客情感强度作对比分析,先对比三星级文化主题酒店和标准酒店的属性情感强度,发现对于三星级酒店样本组来说,文化主题酒店顾客情感强度的均值标准差、最小值、四分之一分位数、二分之一分位数、四分之三分位数、最大值等均显著高于标准酒店。再对比四星级文化主题酒店和标准酒店的属性情感强度,同理对比均值标准差、最小值、四分之一分位数、二分之一分位数、四分之三分位数、和最大值,都是四星级文化主题酒店情感强度比四星级标准酒店的情感强度要高。因此从实现而言,可以说明文化主题酒店的属性情感强度与标准酒店的属性情感强度相比具有显著差异性,并且文化主题酒店顾客体验的情感强度高于标准酒店,具体见图2(a, b)。
图2 酒店评论顾客情感强度组间对比
通过以上分析得出,文化主题酒店的属性情感强度与标准酒店的属性情感强度相比具有显著差异性,假设一(H1)得到证明:三星级文化主题酒店的顾客体验(7 个属性下)情感强度要显著高于标准酒店的顾客体验情感强度;假设二(H2)得到证明:四星级文化主题酒店的顾客体验(7 个属性下)情感强度要显著高于标准酒店的顾客体验情感强度。
其次对不同星级的文化主题酒店进行组内属性对比分析。酒店的服务属性有7 个,因此需要验证“中国文化”属性的情感强度显著高于其他属性的情感强度,即需要验证“中国文化”属性的顾客情感强度与整体情感强度的相关性要大于其他属性顾客情感强度与整体情感强度的相关性。
为了进行上述验证,现定义所有属性的综合情感强度为所有属性下的特征词情感强度之和,找到所有属性下共有的特征词强度并提取出来,作为该属性下的特征词强度,然后提取7 个属性下各自维度共有的特征词,构建出属性特征矩阵,采用皮尔森相关系数(也称皮尔森积矩相关系数,Pearson Product-moment Correlation Coefficient),计算出每个属性对综合属性情感强度的相关性,绝对值越大说明该属性相对其他属性而言,属性的强度越大,影响度就越大,同时还可以分析每个属性下特征词的情感强度分布,方法同上一步分析,计算最大值、最小值、平均值、分位数值等,具体见图3(a,b)。
图3 文化主题酒店评论各属性情感强度对比
按照上述计算分析过程得出的结果, 通过观察图3a 可以发现:文化主题三星级酒店的评论数据集中,中国文化属性与顾客总体情感强度的相关性最高,为0.597,假设三(H3)得到证明:三星级文化主题酒店评论中,文化体验属性触发的情感强度要显著高于其他服务属性的情感强度。
从图3b 中可以观察到,文化主题四星级酒店的评论数据集中,房间属性与顾客总体情感强度的相关性最高,为0.703,假设四(H4)“四星级文化主题酒店评论中,文化体验属性触发的情感强度要高于其他服务属性的情感强度”没有得到证明,根据判断,这一结果具有合理性,在文化主题酒店组内对比中,四星级酒店的房间设施显然优于三星级酒店,但中国文化属性与顾客总体情感强度的相关性仅次于房间属性,为0.371,是与顾客总体情感强度相关性排第二位的重要属性,即文化主题四星级酒店的中国文化属性与顾客评论总体情感强度相关度依然很高,高于酒店设施、员工与服务、位置、餐饮和价值等功能属性。
综上所述,笔者通过采集我国中高端酒店的在线中文文本评论并实施细粒度情感分析,挖掘出三星级和四星级酒店不同属性的情感强度情况,并通过T 检验证明了文化主题酒店的顾客情感体验(情感强度)要高于标准酒店的顾客情感体验,进而通过皮尔森相关性证明了文化主题酒店中国文化属性的强度与总体顾客情感强度具有高度相关性,其中三星级酒店评论数据集的中国文化属性与顾客总体情感强度要高于其他服务属性,四星级酒店评论数据集的中国文化属性与顾客总体情感强度仅次于房间属性,高于其他服务属性。
笔者通过研究得出以下结论:我国文化主题酒店的文化体验对顾客情感强度影响显著,从顾客情感测量角度而言,酒店管理者将中国本土文化元素纳入产品设计体系符合商业逻辑。笔者研究样本中的中国文化主题酒店通过文化体验有效地促进了顾客的情感强度,有的在建筑外观、院落、大堂、廊道和客房陈设等方面全方位呈现浓厚的中国文化色彩(如四星级酒店),有的则低调地演绎当地文化内核,如特色家具、装饰、寝具、盥洗用具和手工艺品等(如三星级酒店),可见打造文化体验并非意味着高成本投入。在文旅融合的行业战略背景下,管理者提炼与其酒店契合的文化要素,设计符合客群期待的文化体验,提升客群吸引力,是我国文化强国战略下具有现实可行性的产业发展创新路径。[13]
当然,本研究的实施还存在一定局限性,样本数据均采集于新冠疫情前,因此得出的分析结论有待于加入新冠疫情后的评论数据再加以验证和修正,这将纳入后续开展的研究当中。尽管如此,笔者希望通过此研究发现能够为后疫情时代的中国酒店产品设计和价值重构提供实证参考。