(无锡职业技术学院 江苏 无锡 214121)
随着经济的飞速发展和人民生活水平的显著提高,如今的酒店已不再只是为“高端人士”服务,而逐渐成为一种大众化的消费场所。酒店业市场呈现出顾客需求多样化、个性化、行情变化快等特征。酒店在力求满足顾客需求的同时,还要兼顾自身的运营成本。为了实现既能满足客户多样化需求,同时又能节省成本的目的,酒店需要充分了解市场、理解客户需求,实现精准营销。所幸的是当今世界是一个大数据高速发展的时代,数据已经成为各行各业重要的生产要素。善于利用数据从数据中挖掘出有价值的信息,可以帮助企业提高营销效率,提升客户满意度,同时节省营销成本。数据挖掘 (Data Mining)是指从大量的数据中发现对决策有用的知识,这些知识包括概念、规则、模式等多种形式。常见的数据挖掘技术主要包括关联规则、聚类分析、分类和预测等。本文介绍关联分析、聚类分析、决策树和线性回归等。
关联分析是挖掘关联规则的过程,关联规则是指在同一事件中出现不同项目的规律性,关联并不一定意味着因果关系。比较经典的关联分析是沃尔玛公司的啤酒和尿布的故事。沃尔玛通过关联分析发现,很多顾客在购买尿布的同时也购买了啤酒。当把尿布和啤酒摆放在一起销售后,两者的销量都增加了。关联分析最初应用于分析零售行业顾客的购物行为模式,因此关联分析有时也被称为购物篮分析。关联分析通常用于商品货架布置、购物路线设计、销售配货、存货安排、交叉销售以及根据购买模式对用户进行分类等。 酒店行业也同样可以运用关联分析来分析客户的购买模式。例如餐饮部门可以对客户点单的内容进行关联分析,挖掘出两种或多种被客户同时购买的菜品或饮品,据此为以后的客户推荐相关联的菜品和饮品,从而促进销售。客房部同样可以对客户在酒店的其他消费情况进行关联分析,例如分析客户所选房型与其他消费行为的关联规则,据此对相应房型的客户推销其更有可能购买的其他酒店商品。关联分析中有三个主要的指标:支持度(Support)、置信度(Confidence)和提升度(Lift)。支持度是指两种商品X和Y同时出现的概率,反映所发现规则的有用性。支持度的计算公式为:
置信度是指购买X的人,同时购买Y的概率,反映的是所发现规则的确定性。置信度的计算公式为:
提升度反映了关联规则中的X与Y的相关性,提升度>1且越高,表明正相关性越高,也即Y的购买确实是被X的购买所提升的;提升度<1且越低,表明负相关性越高;提升度=1表明没有相关性。提升度的计算公式为:
酒店在做关联分析时需要实现设定支持度和置信度的阈值,当挖掘出来的关联规则的支持度和置信度高于阈值,且提升度大于1,则可以认为该关联规则有用且可靠,可以根据其实施相应的营销组合或交叉销售等。
聚类分析是在没有给定类别特征的情况下,把数据样本依据其相似性,划分成多个子集的过程。每个子集被称作一个簇(Cluster),簇内的样本彼此相似,但与其他簇中的样本不相似。聚类分析在客户关系管理中有着广泛且有效的应用。聚类分析有多种算法,其中最经典、最常用的是k-means算法。K-means算法首先需要确定簇的个数K,并随即选择K个簇的中心点,将每个数据点指定给其最近中心点的簇,然后根据每个簇的平均值更新每个簇的中心点,重复此步骤直到没有新的调整。K-means算法相对简单,适用于比较规则的簇,且收敛速度相对较快。但是需要预先指定K的值,因此需要一定的领域知识。由于K-means算法是基于平均数的一种算法,聚类结果可能容易受到噪声数据和异常值的影响。
在聚类结果的基础上,酒店还可以进一步使用RFM模型来衡量各个类客户的价值和贡献度。RFM中的R(Recency)表示最近一次消费时间,F(Frequency)表示消费频率,M(Monetary)表示消费金额。酒店可以计算客户的RFM指标,评判每一类客户群的价值。可以将客户划分为高价值客户、一般价值客户和低价值客户。然后对每一类客户进行不同的营销策略,提供个性化服务,从而做到精准营销。
决策树是一种经典且常见的用来进行预测的分类算法。决策树是一种有监督的分类算法,也即预先设置某个属性为分类标签,如客户是否流失,则可利用客户的其他属性信息对客户是否流失进行预测。假设某酒店有以下数据:
?
根据以上表格信息,可以构建如下决策树。也即年龄在40-50岁之间的客户通常会流失;年龄小于等于40岁带家庭入住的客户往往会流失,年龄小于40岁独自入住的客户往往还会再次选择此酒店;年龄大于50岁且来自省内的客户会流失,年龄大于50岁且来自省外的客户通常还会再次选择此酒店。依据此决策树所展现的信息,酒店需要着重研究流失客户的流失原因,采取相应措施提高满意度避免流失。对于不容易流失的客户则需要采取相应措施保证满意率。分类算法除决策树以外,常见的还有:贝叶斯分类、支持向量机、BP神经网络、逻辑回归等。
线性回归也是一种常用的预测方法。与决策树预测样本的类别不同,回归分析可以预测样本的某个属性的具体取值。例如可以根据客户的其他属性信息,预测客户的消费金额,即可以分析酒店客户的消费金额受到哪些因素的影响,如客户年龄、性别、入住时间、是否为初次客户、是否带家庭入住等等酒店可以掌握的客户信息。建立消费金额与这些客户信息之间的线性关系,进而分析这些客户的这些因素如何影响其消费金额,从而可以为鼓励客户以后再来酒店消费提供指导。
首先,数据挖掘不仅仅对酒店的客户关系管理和营销,起着至关重要的作用,还对酒店员工管理同样具有现实意义。众所周知,酒店行业因其待遇低、工作时间长、周末节假日尤其繁忙、社会认可度低等原因,员工流失率一直居高不下,这也是酒店人力资源管理中长期存在的痛点。 数据挖掘技术可以帮助酒店分析员工心理,预测员工流失和员工表现,从而为酒店更科学地管理员工提供指导意见。因此数据挖掘和商务智能是酒店行业继续大力发展并使用的一项工作任务。其次,在当今这个竞争日益激烈,受疫情影响旅游业普遍不景气的时代,酒店唯有充分了解客户掌握市场,对客户和市场进行精准营销才能在激烈的市场竞争中站稳脚。而精准营销和个性化的客户关系管理,离不开数据的指导。
计算机和物联网技术的发展和在酒店行业的应用为酒店提供了大量的实时数据,使得酒店行业实现商务智能化、采用数据挖掘精准营销和管理成为可能。有了数据还不够,还需要有人会分析和挖掘。因此酒店实现商务智能化的另一个必要条件就是有专门人员和岗位对酒店数据进行分析,为管理层决策提供建议和支持。
首先,酒店行业的应届毕业生基本来自各大中专学校旅游管理和酒店管理等相关专业,目前此类专业培养的重点还集中在技能和外语方面。随着大数据的兴起,高校旅游管理和酒店管理专业,可以相应开设数据挖掘或数据分析课程,为酒店和旅游行业的数据挖掘人才做好人才储备。
其次,酒店可以专设数据分析师岗位,对此岗位招聘计算机、统计、信息管理与信息系统等相关专业的毕业生,并对他们进行酒店业务方面的培训,使之了解酒店业务,将其所掌握的数据挖掘技能充分应用到酒店行业。
再者,酒店还可以对已有员工进行数据挖掘方面的培训。目前部分酒店已经开展与STR(史密斯旅游研究)的合作,有机会获取行业大数据为自身提供必要的信息和指导。与此同时,酒店还需要充分利用本酒店内部的数据,并由专门人员负责数据分析。充分掌握内外部数据才能更全面的了解市场和客户。
本文介绍了几种常用的数据挖掘方法,在酒店行业的应用,旨在鼓励酒店行业充分利用内部数据更好地了解客户和市场。同时还讨论了酒店行业实现商务智能化和应用数据挖掘的路径,以期推动酒店行业商务智能化的进程和数据挖掘的推广。