任姚鹏
(运城学院计算机科学与技术系,运城044000)
基于聚类分析的永济市旅游人群分类研究
任姚鹏
(运城学院计算机科学与技术系,运城044000)
在旅游业日趋成熟的形势下,如何使其稳步快速良好的发展成为目前旅游业研究的焦点问题。其中,旅游地能不能准确全面地分析旅游人群及其基本特征,从而做出合理有效的旅游决策变得越来越重要。基于近两年永济市旅游人群的相关特征数据,采用数据挖掘中的K-均值聚类算法,对永济市旅游人群进行分类研究,从而有助于制定相应针对性的方案,促进其旅游业的可持续发展。
随着经济的迅速进步,旅游市场已经在全球范围内受到广泛的关注。中国的旅游业也逐步扩大,走向市场化为区域旅游做了很大的贡献,带动了当地的财政收入,使得当地的居民就业工作机会增加[1]。旅游业在发展的同时,为了更好的把握旅游人群的特征,将潜在的人群变为现实的人群,已逐渐成为旅游景点为进一步发展所要重点考虑的问题。各种旅游专家开始研究旅游人群的特征,只有对人群有一个准确的定位便能抓住客户,为旅游目的地带来效益等。
因此,本文利用聚类分析技术,对永济市的旅游人群进行了分类研究,从而可更准确地把握不同人群特征,进而做出合理有效的旅游决策,促进其旅游业的发展。
旅游市场,就是在现在发展已经相对成熟的商品生产基础上,以及人们进行商品交易也已经发展相对成熟的基础上,在旅游产品及其附属产品生产供应商与旅游消费者之间发生交易的经济关系的场所。一般来说,旅游市场有广义和狭义之分。从广义上看,它就是指旅游商品及附属产品在交易过程中所发生的信息之间的关系以及交易过程中的经济来往的行为。从狭义上看,它就是指在某段期间或某个区域中对旅游商品及其附属商品的有正真消费的人或想要消费的人的总和。从狭义理解的旅游市场,实际上就是通常所说的旅游客源市场[2-3]。
(1)旅游客源市场:是指在特定的区域和特定的时间内对旅游产品及其旅游附属东西有实际支付力和潜在购买力的购买者的总和。现在对旅游者的研究还仅限于对旅游者本身属性进行人口统计分析,应该对其研究转向旅游者的行为特征。
(2)旅游者:就是指目的是为了参观一些历史文化景点或大自然景点,或是为了看望亲朋好友,或是为了寻医治病,或是为了购买自己想要的东西,或是为了庆祝特殊节日进行休息度假,或是为了外出解决工作的事而出差等,为此需要离开经常居住的地区或经常居住国,在目的地待的连续时间没有超过一个月,而且在目的地的活动并不是为了获取利益报酬的人。旅游者就是一些没有时间地点规律可循的外出者。
(3)潜在客户:就是指一群具有旅游消费倾向的人。通俗的讲就是一群潜在的旅游消费者转化为现实旅游消费的人。这种类型的人群一般具有两个特征:一个是具有一定的消费能力,就是具有一些可以支配的经济收入和游乐的时间;二是具有对目的地认知能力,只有在了解了目的地的基础上才有可能进行对目的地选择进行决策。潜在客户对于各种市场的发展与提高也是很重要的。
(4)旅游购买力:就是旅游者的现实购买力,是指人们除去生活必需消费以外还可以用于旅游产品及旅游附属产品消费的能力。一个人收入高就可以说这个人的购买能力强。
(5)旅游购买欲望:就是指旅游产品及其旅游附属产品对购买者的想要购买的主观意愿和购买者的购买必须程度。只有将旅游购买欲望不断提高才能促进旅游城产业的不断发展,只有旅游者的旅游购买欲望越强,才可以使这些潜在的消费成为正真的消费,提高旅游收入。
旅游市场细分就是指将出去游玩的人群通过各不相同的分类因素进行要求与方法划分,分为很多个各不相同的市场,通过分析各个市场的不同特点来进行分析研究,并对每个市场采取制定不同的策略。对旅游市场进行细分的时候要从下面两方面分:一是市场中出现的一些有形的特征。包括景点类型、景点数量等特点。二是游客在行为方面的特点。包括出游的目的、出行的时间、在景点买的纪念品的类型和性价比等特点。
(1)细分市场的常用方法是从游玩人员的几方面进行分析研究。一是从旅游者的自身特点,如年龄、性别、家庭状况、学历以及宗教信仰等;二是从旅游者具体从事什么类型的工作方面的特点,如职业类型、收入水平以及经常工作的地点等;三是从旅游者的生活方式与情操培养的特点,如生活节奏的快慢以及素质培养的次数;以及其他方面。
(2)旅游市场细分的标准如表1所示。
基于上述的细分标准,获取相应旅游人群特征,进而进行分类研究。而对其分类有很多种方法,使用聚类算法对变量先后输入顺序没有要求,功能稳定且不容易导致重复的分类。因此本文中,对永济市旅游人群分类的研究选用了聚类分析方法。
表1 旅游市场细分标准
聚类分析就是一种根据研究对象的特征对研究对象进行分类的分析研究技术。通过分析变量或者样本联系的紧密程度把相近特点的归成一类,分析得到的每组数据都有各自的相似特征,并且它们各个组之间各不相近。它是一种功能好、效率高的数据统计分析方法,被广泛应用于数据分析、划分图形、语言辨别等。此外,在很多商业决策分析时也经常用到聚类分析,帮助商业决策者在众多的数据中分析得出市场的发展现状以及发展前景,促进企业的发展[4]。
本文采用了经典的K均值聚类,实现对永济市旅游人群的分析研究。K均值聚类算法基本步骤如下:
(1)给每个数集组选定原始聚类中心,几个数集组几个中心;
(2)把每个数集组之间距离进行排序,并距离最小的两组反倒一起;
(3)求每个数集组之间的平均值,再把它看作是聚类中心;
(4)不断的进行步骤(2)、(3),等到聚类中心保持不变;
(5)结束,得到K个聚类。
依据永济市近两年来的旅游资料分类综合分析可得,对永济市旅游人群分类研究的数据进行聚类分析的属性值如表2所示。
(1)性别、年龄、家庭因素。男女在日常生活的各个地方都会有很大的差异。不同的年龄阶段,由于对事物的认识和理解程度的不同,所以在旅游中的需求也不同。家庭是否已婚或者是否有孩子,会对旅游者玩的时间、出行的时间、投入的消费等都会有影响。
(2)教育水平。教育水平比较高的人群更加重视对自我素质的提升,因此旅游成为这类人群提升素质的主要方式。通过旅游他们可以在众多的历史文化景点中,体会到文化的积淀从而提高自身素质。
(3)从事工作、收入情况。从事各异工作的游客对于旅游地点的选择各不相同。例如从事文化创作的工作者更多的愿意去一些人文景点旅游;然而从事历史文化研究的工作者更愿意去一些文化底蕴高的地方等。收入情况的不同也就意味着自己的购物能力的不相同的。如收入低人们控制旅游消费金额进而选择一些距离近性价比高的景点旅游等。
(4)旅游时间。不相同的人群会针对自己是否有时间空闲决定出去旅游的时间。上班一族大多只能选择周末或者法定节假日出去玩,而学生则倾向在寒暑假游玩。
(5)城镇居民、村镇居民。一般,城镇居民在旅游时的人数会比村镇的多。这是因为,一是城市居民收入一般比乡村居民高,经济条件较好;二是公路多,有方便的交通还有获取信息比农村快多;第三,城市人口密度高,环境不太好,污染大,逼得城市居民产生出外一段时间以调节环境的需要。
表2 旅游人群分类属性细分表
基于上述的人群分类属性,制定了相应的问卷调查表;通过现场调查和网上调查两种方式,共获得3150份有效调查表,并对这些样本数据进行汇总,导入SPSS统计分析软件进行K均值聚类分析,得到最终的三个聚类中心,如图1所示。并基于聚类中心,获得了每类中样本数据的个数,第一类中有684个,第二类中有1565个,第三类中有901个。
图1 聚类中心
基于所获得的样本数据,采用K均值聚类算法,分析出永济市旅游人群主要分为三类:旅游者A、旅游者B、旅游者C,且旅游者B人数较多。
(1)旅游者 A:男性、31-44岁、高中以上、已婚、高管或者个人经营者、国内、住在城镇、来自省内、来自北方、来自汉族、一般选择法定节假日、月收入1500-3000、孩子上大学、坐客车、精神需求、旅行社或和家人朋友接班出行、喜欢住快捷酒店、通过网络了解相关信息。
(2)旅游者 B:女性、18-25岁、本科学历、未婚、学生、国内、省内、北方、汉族、法定节假日或周末、1500-3000、无孩子、做汽车、物质生活、和朋友结伴出行、喜欢住快捷酒店、通过网络或者朋友了解相关信息。
(3)旅游者 C:女性、18-25岁、大专、已婚、公务员、国内、省内、城镇、汉族、北方、喜欢在周末出行、3000-5000、孩子处于婴儿期、坐火车、物质享受、和家人出去、喜欢住快捷酒店、通过网络了解相关信息。
依据分类的结果,永济市政府可以更好地深入了解到旅游者的特征,从而可以针对不同旅游人群,因地制宜地制定出可行的有针对性的旅游方案,吸引旅游者,促进其旅游业的快速平稳发展。
[1]张春慧.我国旅游客源市场研究进展[J].中国旅游业的发展,2005,16(5):23-37.
[2]蒋铭萍,周年兴,梁艳艳.基于聚类分析的江苏省区域旅游空间结构差异分析[J].长江流域资源与环境,2012,21(2):81-88.
[3]李慧芳,谢双玉,张琪,侯雪琦,任前.武汉市国内旅游客源市场空间结构及其影响因素研究[J].河南科学.2015,7(7):1258-1264.
[4]贺玉珍,任姚鹏.K-means算法在大学生消费状况分析中的应用[J].计算机时代,2013(2):19-21.
任姚鹏(1982-),女,山西运城人,讲师,硕士学位,研究方向为人工智能、数据挖掘
2017-08-15
2017-10-10
Tourism Industry;Population Classification;Data Mining;Cluster Analysis
Research on the Classification of Yongji City Tourism Population Based on Cluster Analysis
REN Yao-peng
(Department of Computer Science and Technology,Yuncheng University,Shanxi 044000)
In the situation of the increasing mature tourist industry,how to develop steady and fast has become the research focus of the current tour⁃ism.Among it,making reasonable and effective tourism decision has become more and more important,depending the tourism can accurate⁃ly and comprehensive analysis of the tourist population and their basic characteristics or not.On the basis of the relevant characteristic data of Yongji city tourism crowd in the last two years,uses the k-means clustering algorithm in data mining to study the classification of Yongji city tourism crowd,so as to help to formulate corresponding targeted schemes to promote the sustainable development of tourism.
旅游业;人群分类;数据挖掘;聚类分析
运城学院协同创新项目
1007-1423(2017)29-0052-04
10.3969/j.issn.1007-1423.2017.29.013