李涛涛,袁丽哲,钟三艳,陈建国
基于K-Means聚类的餐饮业消费者满意度评价——以广东省1433家餐厅为例
李涛涛1,袁丽哲2,钟三艳1,陈建国1
(1. 萍乡学院 机械电子工程学院,江西 萍乡 337055;2. 电子科技大学中山学院经贸学院,广东 中山 528402)
随着人民生活水平的不断提高,对餐饮消费的期望值也越来越高,如何更好地满足餐饮消费者的需求是关系餐饮行业可持续发展的重要问题。文章基于K-Means聚类分析方法对广东现有餐饮业消费者满意度情况开展评价,利用广东省19市1433家餐饮样本的调研数据,在数据描述性统计的基础上,构建了餐厅消费者满意度TES分析模型;采用K-Means聚类算法,综合分析了消费者对餐厅口味、环境和服务质量三方面的评价情况;依据聚类产生的四种餐厅群体,将餐厅划分为四个满意度等级。评价结果表明,消费者对广东餐饮业的满意度一般,消费者“不满意”餐厅占比最大(35.3%),“满意”和“非常满意”餐厅共占比却仅为52.0%。研究为餐饮业消费者满意的综合、准确评价提供了新方法,可为餐厅的后续改进和发展提供科学依据。
餐饮业;消费者满意度;定量分析;K-Means聚类分析
近年来我国经济水平飞速发展,群众消费需求旺盛,餐饮业的发展成就令人瞩目。中国餐饮行业伴随经济发展,不仅成为人民生活水平和消费能力提升的见证,也逐步成为关系国民经济增长和日常生活需要的重要产业[1]。改革开放40多年来,我国的餐饮业实现了高速发展,餐饮业收入快速突破万亿(2006年)、两万亿(2011年)和三万亿(2015年)[2]。近几年餐饮业的增长率比其他行业高出十多个百分点,行业发展前景备受关注和看好[3]。可以说我国正迎来一个餐饮业大发展的黄金期,但同时也是一个高度竞争期。复杂多变的市场竞争要求餐饮企业必须时刻保持清醒认识,不断从营销方法、饮食口味、用餐环境和服务质量等方面进行完善,进而持续保持竞争力。近年来,新冠肺炎疫情对餐饮业造成了严重的冲击,为保障消费安全餐饮企业必须把好食材、环境和经营安全三道关,全面提升消费体验,提高消费者满意度。
餐饮消费者满意度是用来衡量顾客在餐厅消费完之后对餐厅各方面服务的评价。为了量化评价餐饮消费者满意度情况,为餐饮业发展提供客观、科学的依据,大量学者将理论模型(方法)与实证结合起来,开展餐饮业消费者满意度研究。刘蓉等[4]基于改进的ACSI模型对京沪高铁上的餐饮满意度进行研究,从产品、定价、营销、服务和保障五个方面,提出了高铁餐饮服务质量提升的对策举措。袁良良等[5]针对餐饮业中服务等待时间过长严重影响消费者满意度的问题,通过优化服务流程,缩短关键服务路线,提出了基于流程优化的消费者满意度提升策略。严梦娇等[6]运用IPA法对餐饮老字号扬州富春茶社的22个顾客满意度指标进行了分析,从重要性和满意度两方面总结了顾客对富春茶社就餐环境、美食购物活动、菜肴特色和美食讲解的评价情况。牛兰兰等[7]选取21个餐饮满意度因子,基于IPA分析法对济南芙蓉美食街的游客满意度进行了实证研究,提出了从突出地方特色、加强食品安全管理、挖掘济南泉水文化和提升服务质量四方面提高游客餐饮满意度。张艳等[8]采用模糊层次分析法对西安某街区的顾客满意度进行实证研究,并通过建立顾客满意度评价体系,提出了餐饮街区提升顾客满意度的对策建议。
满意度评价能让餐饮企业定时监控餐饮水平,及时了解顾客需求变化,从而根据市场需求调整市场战略,因此科学的消费者满意度评价方法是保障餐饮企业发展的重要法宝。本文基于广东省的19个市1433家餐饮样本的调研数据,选取其中的饮食口味、用餐环境和服务质量作为满意度评价指标,结合定量分析中的K-Means聚类算法,对广东现有餐饮业消费者满意度情况开展评价,进而提出提升餐厅满意度的改进策略。
文中研究的原始数据为餐饮业管理部门对广东各地餐饮店的实地调研统计结果。数据主要统计了广东省潮州、东莞、中山等19个市的餐厅详细信息,具体包括餐厅ID、餐厅名称、所属地区、地址、平均价格、菜品属类、口味评分、环境评分、服务评分和吸引力值等信息。数据保存在csv格式文件中,文件名“restaurant_data.csv”。对数据进行基本整理和分析,将数据按照餐厅基本信息和客户评价信息进行归类,结果如下表1所示。
表1 餐厅数据特征说明
对上述原始数据开展数据总体情况的计量分析,选择数据的计量方法包括:最大值、最小值、均值、方差和标准差,具体计算公式如下:
上式中,2、依次为均值、方差和标准差,1、2……n依次为变量的个取值。
依据上式依次计算平均消费(avgprice)、口味评分(tastescore)、环境评分(environmentscore)、服务评分(servicescore)和吸引力值(shoppower)五个指标参数的整体情况。采用python中的max、min、mean、var、std函数完成计算,结果见下表2。
表2 餐厅五大指标的计量分析结果
分别描述性统计分析了不同地区的餐厅上述五个评价指标参数的最大值、最小值、均值和标准差情况,结果如下图1(a)、(b)、(c)所示。
从图1中可以看出各个城市餐厅的基本情况如下:
(1)在平均消费方面,各个城市餐厅平均消费最高值区别较大,最高的三个城市依次为佛山(952)、汕头(795)和珠海(689);平均消费最低值相差不大,各餐厅平均消费均值差别较大的城市同样为佛山、汕头和珠海,最低的城市为揭阳,仅为31.8。
(2)在口味评价方面,口味评分整体较好的前三大城市依次为珠海(8.82)、佛山(8.79)和汕头(8.66),口味评分差异最大的前三个城市依次为潮州(0.68)、汕尾(0.52)、肇庆(0.49),其他城市口味评价最佳与最差差别较小,差别最小的为汕头(0.20)。
见到下级的脸——是包公脸。面部僵硬,眼睛向上,嘴角歪曲。他挺胸叠肚,双手交握抄在背后,两只眼微眯着,嘴角下拉,满脸傲气,仿佛不可一世。脸一变,嘴就变,嘴一变,吐出的文字自然生硬,冰冷。你哪儿痛,它就拣哪儿挑。你没问题,他也要鸡蛋挑骨头。如果你在某个场合向他打招呼,他听而不闻;你走到他跟前,他视而不见;你上前与他握手,他傲然屹立于原地,很不情愿地伸出两根手指与你草草一拉;你点头鞠躬致意,他昂然挺胸还礼。
(3)在餐厅环境评价方面,餐厅环境评价整体较好的前三大城市依次为珠海(8.86)、佛山(8.80)和江门(8.67),环境评价差别最大的前三座城市依次为潮州(0.69)、汕尾(0.52)、肇庆(0.48),其他城市环境评价整体差别不大,差别最小的为珠海(0.21)。
(4)在餐厅的服务评价方面,餐厅服务评价整体较好的前三大城市依次为珠海(8.86)、佛山(8.76)和江门(8.67),服务评价差别最大的前三座城市依次为潮州(0.70)、汕尾(0.52)、肇庆(0.50),其他城市服务评价整体差别不大,差别最小的为汕头(0.20)。
(5)在餐厅的吸引力方面,餐厅吸引力整体最强的前三大城市依次为佛山(46.56)、珠海(46.53)和汕头(45.32),吸引力差别最大的前三座城市依次为潮州(4.90)、肇庆(3.5917)、汕尾(3.5915),其他城市环境评价整体差别不大,差别最小的为汕头(1.23)。
由以上分析得出结论:(1)城市餐厅平均消费高低与当地经济水平息息相关,平均消费最高的三大城市在2019年的广东省GDP排行榜中位居19个城市的第1、9、4名,而平均消费最低的揭阳排在第13名(数据源自中商产业研究院[9])。(2)餐厅的口味、环境、服务和吸引力四方面相辅相成,评价较好的为珠海、佛山、江门和汕头,评价差异较大的为潮州、肇庆、汕尾。(3)口味、环境和服务评价高的城市对应的平均消费较高,但19个城市中性价比最高的城市为江门。江门的平均消费均值(43.16)虽然排13名,但餐厅的环境评价(8.67)和服务评价(8.67)都排在第3名。(4)口味、环境、服务和吸引力方面表现最稳定是汕头,其消费者的评价有3项差别最小,大家认可程度基本相似,口味和吸引力的评价均排名第3。
餐厅满意度情况分析是对餐厅消费者青睐程度的重要评价,分析结果很大程度反映出餐厅当前的经营状况,可为餐厅的未来发展和改进提供极为重要的参考依据。餐厅满意度集中体现在消费者对餐厅饮食口味的评价、用餐环境的评价和餐厅服务质量的评价三方面。口味评价直接反映了餐厅所经营饮食是否满足消费者口味需求,这除了跟餐饮自身的饮食风格定位有关外,还与当地主流消费者的饮食习惯有关,能直接反映餐饮店风格定位与当地饮食习惯的契合程度。环境评价是餐饮店自身的硬性竞争条件,与餐厅装修风格、地理位置、大环境主流风格和消费者群体特点等因素相关。餐厅服务则是餐饮店自身的软性竞争条件,与服务员的基本素质有着极为重要的关系。
为了评价餐厅的消费者满意度情况,可以综合消费者在上述三方面的不同评价结果,将餐厅进行分群处理,选择聚类分析方法中的K-Means算法,最终得到餐厅在口味、环境和服务三方面的表现情况,为餐厅的后续改进和发展提供参照依据。
由上述2.1分析可知,聚类分析是餐厅满意度评价有效定量分析方法。聚类的目标就是在相似的基础上收集数据来分类,是将数据分到不同的类或者簇的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析方法[10]的特点表现为:
(1)聚类分析主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解,需要研究者的主观判断和后续的分析;
(2)不管数据是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解;
(3)聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响;
(4)异常值和特殊的变量对聚类有较大影响,当分类变量的测量尺度不一致时,需要事先做标准化处理。
文中开展餐厅满意度分析研究选用的是K-Means聚类算法[11],其优点在于原理简单,容易实现,计算复杂程度小;缺点为过分依赖初始值的选择,一旦初始值选取不好,可能无法获得有效的聚类结果,另外需要预先给定K值,对离群点非常敏感,容易使质心偏移。
参考客户关系管理分析模型中的RFM(Recency-Frequency-Monetary)模型[12],为实现消费者对餐厅满意度的聚类分析,此处构建餐厅满意度TES模型,即“Taste-Environment-Service”模型。TES模型包含三个特征,T特征(taste score)表示口味评价,E特征(environment score)表示环境评价,S特征(service score)表示服务评价,使用三维坐标系进行展示,x轴表示T特征,y轴表示E特征,z轴表示S特征。由于用户打分为10分制,且由表2可知,T、E、S三大特征的最低评分为6.4,为此给每个轴划分为4个等级,等同于消费者满意度划分为64种级别。TES模型特征的取值范围见下表3所示。
表3 TES模型特征的取值范围
采用聚类的K-Means算法开展分析,首先对原始数据进行预处理,将少量的、对分析影响不大的缺失值和异常值进行丢弃处理,如数据中的“shopname”、“shoptags”列以及三大特征中存在可能的空缺或者为零的数据。随后,从数据中选出分析所需要的特征数据,即“tastescore”、“environmentscore”、“servicescore”列的数据。接着,对数据进行聚类分群,将满意度分成4个类群,满意度的聚类结果见下表4。
表4 满意度聚类结果
针对聚类结果进行特征分析,结果如图2所示。从图中可以看出,满意度群4在T、E、S特征上均为最大(8.87、8.91、8.91),满意度群1次之,取值最小为满意度群2(7.16、7.13、7.12);满意度群2聚类个数最多,占35.3%,满意度群3聚类个数最少,占12.7%,大部分聚类个数在满意度群1、2,占52.0%。
图2 餐厅满意度特征分析图
通过比较各类特征在群之间的大小,对某一个群进行评价分析,如满意度群4在T、E、S特征上最大,因此T、E、S特征在满意度群4为优势特征;相反的满意度群2在T、E、S特征上最小,则T、E、S特征在满意度群2为劣势特征。基于上述特征描述,将满意度群体类别分为非常满意、满意、比较满意、不满意四个等级。具体不同满意度等级群体的T、E、S特征值范围如下表5所示。
表5 满意度等级描述
利用python sklearn中的cluster模块提供的K-Means函数构建K-Means聚类模型,cluster分类簇设置为4,n_jobs依据电脑CPU数量配置为4,random_state配置为123,具体函数实现如下:
kmeans_model = KMeans(n_clusters=k, n_jobs=4, random_state=123) #构建模型
聚类分析结果如下图3所示,图中很好展现了四类分群的分布情况。从图3聚类分析结果来看,满意度群2的T、E、S特征普遍较低,同时广东省餐饮业属于满意度群2类别的数量是最多的,消费者对这类餐饮业是不满意的。因此大部分餐厅都需要更加重视在口味,环境和服务上的改进,从而提高消费者满意度;其次,满意群度4的T、E、S特征都是最高的,反映出广东也有一部分餐厅的综合竞争力达到较高水平,消费者非常满意;最后是满意度群3和满意度群1,分别在T、E、S特征上有进步空间,努力争取达到满意度群4的指标要求。
图3 K-Means算法聚类分析结果
为了对广东省餐饮业消费者满意度情况进行分析评价,本文在对前期19个市1433家餐饮店调研数据描述性统计的基础上,通过构建餐厅消费者满意度TES分析模型,采用K-Means聚类分析算法综合分析了消费者在饮食口味、用餐环境和服务质量三方面的评价情况,依据聚类产生的四种餐厅群体,将餐厅划分为“非常满意”“满意”“比较满意”“不满意”四个满意度等级,依次占比为24.2%、27.6%、12.7%、35.3%。其中,消费者“不满意”餐厅占比最大,“满意”和“非常满意”餐厅共占比却仅为一半。由此可见,消费者对广东餐饮业满意度一般,相当一部分餐厅需要从饮食口味、用餐环境和服务质量等方面进行完善。本文基于聚类分析的思想开展消费者满意度评价方法研究,仅仅考虑了满意度评价的三大主要因素,后续在更加全面、复杂的评价中可加入更多影响因子,以实现更为准确、科学的评价。
[1] 曹晓昌, 张凤, 成升魁, 等. 我国餐饮业可持续发展研究:政策与食物浪费(英文)[J]. 资源与生态学报:(英文版), 2021, 12(5): 628–635.
[2] 于干千, 赵京桥. 新时代中国餐饮业的特征与趋势[J]. 商业经济研究, 2019(3): 167–171.
[3] 程慧芳. 浅析我国餐饮业服务营销现状及发展策略[J]. 现代经济信息, 2015(4): 352.
[4] 刘蓉. 高铁餐饮价格顾客满意度调查研究[J]. 现代商业, 2021(16): 40–42.
[5] 袁良良, 周梅华. 基于流程优化的餐饮业消费者满意度提升研究[J]. 江苏商论, 2010(2): 21–22.
[6] 严梦娇, 张旗. 餐饮老字号顾客满意度的IPA分析——以扬州富春茶社为例[J]. 美食研究, 2017, 34(1): 45–50.
[7] 牛兰兰, 张伟. 基于IPA分析法的美食街游客餐饮满意度研究——以济南芙蓉街为例[J]. 美食研究, 2016, 33(3): 53–58.
[8] 张艳, 王喜庆. 基于模糊层次分析法的餐饮街区顾客满意度评价研究[J]. 美食研究, 2018, 35(1): 57–59.
[9] 2019年广东省21地市GDP排行榜[EB/OL]. (2020-01-29)[2021-11-10]. https://top.askci.com.
[10] 伍育红. 浅议聚类分析方法[J]. 计算机科学, 2012, 39(S1): 325–327.
[11] 夏名首, 刘玉林. 基于K-Means聚类的电商店铺经营策略分析[J]. 商业经济研究, 2017(5): 52–54.
[12] 徐文瑞. 基于RFM模型的顾客消费行为与顾客价值预测研究[J]. 商业经济研究, 2017(19):44–46.
Consumer Satisfaction Evaluation of Catering Industry Based on K-Means Clustering Analysis—— A Case Study of 1433 Restaurants in Guangdong Province
LI Tao-tao1, YUAN Li-zhe2, ZHONG San-yan1, CHEN Jian-guo1
(1. School of Mechanical and Electronic Engineering, Pingxiang University, Pingxiang, Jiangxi 337055, China; 2. School of Economics and Commerce, Zhongshan Institute, University of Electronic Science and Technology of China, Zhongshan, Guangdong 528402, China)
With the improvement of people’s living standards and income levels, the requirements and expectations for catering consumption are higher and higher. How to satisfy the requirement of catering consumers is an important issue, which is related to the sustainable development of catering industry. In the paper, the consumer satisfaction of the existing catering industry in Guangdong province base on K-Means clustering analysis is evaluated. Using the sample data of 1433 restaurants in 19 cities of Guangdong province, data descriptive statistics are firstly carried out. Then, the TES (taste score, environment score, service score) model applied to analyze consumer satisfaction of catering industry is constructed. Combined with K-Means clustering analysis algorithm, the evaluation results of catering industry in taste of food, dining environment and service quality are comprehensively analyzed further. Finally, according to the four restaurant groups generated by cluster analysis, the restaurants are divided into four levels. The results show that consumers are not very satisfied with the catering industry in Guangdong province. The number of restaurants classified as “dissatisfaction” account for the largest proportion (35.3%), while the “satisfaction” and “very satisfaction” account for only 52%. The research provides a new method for the comprehensive and accurate evaluation of consumer satisfaction in catering industry, and further provides scientific reference for the subsequent improvement and development of restaurants.
catering industry; consumer satisfaction; quantitative analysis; K-Means clustering analysis
F719.3
A
2095-9249(2021)06-0013-05
2021-12-06
江西省自然科学基金资助项目(20212BAB214047);江西省教育厅科学技术研究项目(202710)
李涛涛(1988—),男,萍乡人,副教授,博士,研究方向:数据分析与挖掘。
〔责任编校:吴侃民〕