罗千千
摘要:随着乡村旅游业发展,民宿从最原始的住宿设施逐渐发展为能代表地域特色的旅游文化元素之一。文章首先从多角度分析了黔西南州民宿产业发展的现存问题,发现主要在旅游民宿产品开发、经营、管理等方面与发达国家地区有较大差距,并指出用传统的政策扶持与经营者培训无法从根本提升民宿产品的质量,长远提升黔西南州的旅游业水平。在互联网信息技术快速发展的大背景下,更多学者从大规模的消费者历史行为数据或期望数据中寻找最符合市场偏好的产品开发、营销策略,由于所得到的结果是基于客观的消费者行为,无主观因素干预,因此更能契合消费者本身需求。文章借鉴该思路,从不同角度将民宿产品分割为各偏好项的集合并设计问卷,通过问卷反馈获取游客群体的偏好组合,最后通过关联规则挖掘问题中的Apriori算法得出这些组合内在的强关联项,用以指导民宿产品的开发与经营服务的优化。
关键词:乡村旅游业;黔西南;民宿产品开发;关联规则挖掘
一、引言
随着旅游业的发展,作为产业链中不可缺少的住宿配套设施,也在不断改进以迎合游客的多元化需求。民宿因其较独立的运营模式和所能提供的个性化差异服务,从而成为旅游住宿配套设施中一个特殊的分类,弥补了标准化住宿设施,如酒店和旅馆等留下的市场空缺,民宿从形态上属于融于自然的物质景观,实则代表当地特色文化的宣传符。当前国内外盛行的乡村度假旅游,极大地带动了乡村地区经济的发展,为促进社会文化的交流做出了巨大贡献。在基础设施建设薄弱的乡村地区,旅游接待以小宾馆、农家乐这样的民宿为主。
国外民宿发展较早,最初是为给那些寻求当地文化特色体验的游客提供定制化的服务,其所带来的巨大的经济收益吸引更多的当地居民将自己的居住场所改造成家庭式旅馆,民宿概念因此逐渐形成。而国内起步相对较晚,大部分民宿在发展理念上仍然属于初级阶段,即只提供住宿和简单的餐饮,缺乏主动引导式的互动交流,不利于游客深入体验地域文化,在产品设计、经营模式、营销手段上跟发达国家还存在很大的差距。因此本文通过分析黔西南地区民宿产业发展的现状,思考如何从民宿产品开发、经营、管理方面增强旅游市场竞争力。
二、黔西南州民宿经营发展困境
(一)民宿经营者文化素质较低
黔西南州民宿经营者和从业者素质参差不齐,仅有少数人员具备高等学历,不太善于接纳吸收民宿经营方面的新思想、新模式,而大部分经营者受制于文化素质不高,甚至不识汉字,在业务发展方面缺乏科学经验,对建设民俗文化缺乏独立思考,不容易接受经营新思路,各民宿经营者之间缺少沟通交流等主观因素是阻碍当地民宿经营发展的主要原因之一。
(二)当地民宿业监管乏力
在民宿监管立法方面,我国于2013年颁布了《旅游法》,其第46条规定:城镇和乡村居民利用自有住宅或者其他条件依法从事旅游经营,其管理办法由省、自治区、直辖市制定。近几年来,个别地方政府为鼓励民宿业发展,相继出台了家庭旅馆、农家乐与民宿的地方法规与政策。例如北京市的《郊区民俗旅游户服务质量划分与评定标准》,上海市的《农家乐旅游服务质量等级划分》等,贵州省黔西南州也借鉴其他省份的经验制定了简单的农家乐管理制度,但多局限于单一的服务质量等评定标准制定,在民宿安全性、建筑合规性、经验规范、奖励惩处方面过于笼统,缺乏针对民宿全面管理的规定。
在民宿监管主体方面,从黔西南州目前的情况来看,民宿经营所涉及的环保、治安、卫生、旅游等方面由各政府机构自行监管,没有统一的总体监管部门,多头监管相互推诿的现象难以避免,民宿监管主体建设不健全严重阻碍了黔西南州民宿合法、有序發展。
(三)基础设施建设薄弱
旅游业是黔西南州第三产业的龙头产业,近几年来,当地加强了以马岭河峡谷、万峰林、万峰湖、双乳峰、招堤等为重点的旅游景区、景点基础设施建设,旅游业持续快速增长,步入了快速发展阶段,对全州社会经济发展的贡献日益显著。但是,随着国内外旅游业的整体快速发展,特别是休闲度假旅游的升温和市场竞争的日趋激烈,游客对旅游环境、食宿条件、交通状况、服务质量等方面提出了更高的要求。而黔西南州相对于国内外其他地区在基础设施薄弱、硬件不足、软件缺乏的问题日益突出,已经成为制约当地旅游业发展的瓶颈。具体表现在一些重点景区的道路、标识系统、供水、供电、厕所、垃圾和污水等处理设施还需要进一步完善;在客流量较大的旅游集散中心兴义、安龙、贞丰、兴仁、晴隆等地缺少星级旅游接待设施和文化、娱乐、休闲设施,旅游用车条件,客房数量与服务标准距一线旅游城市有较大差距,在民航交通设施上,兴义机场的吞吐能力有待扩容等。
(四)缺乏民宿品牌与民俗文化的建设
黔西南州少数名族文化美名远扬,但是多数民宿经营者在主观上由于经营理念落后、受趋利思维影响,客观上受资金、区域政策等因素制约,导致文化特色类旅游民宿品牌尚未真正建立起来,没有明显的文化宣传符,从民宿品牌建设来看,理念识别系统、行为识别系统、视觉识别系统三方面的建设还不够完善。据不少游客反馈,黔西南州的民宿特色元素并不突出,长此以往不仅浪费当地资源,还会降低整体旅游品位,民宿作为商业交易载体的同时也是文化关联的形式之一,是游客在当地的重要人文价值体验。
综上所述,笔者总结出黔西南州民宿经营管理相对滞后一方面是受制于当地政府监管、规划经验不足,没能给民宿经营者提供有力的法律制度保障和经营管理引导,另一方面民宿经营者文化素质普遍不高,自主学习、接受民宿经营管理知识的能力比较欠缺,阻碍了民宿产品向高端化发展。要想在短时间内改善黔西南州民宿行业发展状况,促使民宿产业带动当地旅游业发展,不能完全寄托于依靠上述规范分析所得出的解决措施,如政府立即出台有效的监管扶持政策、给经营者提供科学的经营指导培训等,1.民宿业本质是用户体验性较强的住宿设施,游客在选择住宿时因个人习惯性差异导致对民宿硬件设施和服务水平并没有统一标准,规范化的经营培训容易使民宿发展走向同质化;2.加大政策扶持和财政补助虽能使经营者得到资金支持,但并不能保证资金能被合理运用在提升民宿服务品质上。民宿行业的经营发展思路应该同其他服务行业一样,从收集、获取顾客需求数据出发,量化分析出最符合市场需求的特色经营模式,最后将这些经营模式提供给民宿经营管理者作为参考。在众多量化分析工具中,数据挖掘技术越来越成为科研工作者偏爱的工具。endprint
三、研究方法
(一)研究理论
数据挖掘自问世以来就得到了广泛关注和深入研究,它是一门集机器学习、数理统计、人工智能、数据库技术、神经网络等多门学科于一体的交叉性学科,是从现存的大量的数据源中通过加工处理,探寻出有用的、有潜在价值并且是可以被理解的信息或知识的复杂过程。关联规则是数据挖掘研究领域中最活跃和最重要的研究方向,主要研究如何从大型数据集中挖掘隐藏的、有趣的、属性间存在的关联和规律。
1993年Agrawal等人首次提出了关联规则挖掘的概念,目前已经发展成为挖掘数据之间关联知识最常用的方法。关联规则一般可描述为:设I={i1,i2,i3,…,in}是n个不同项的集合,给定一个事务数据库 D,T是I中一些项组成的集合,表示数据库D中的一个事务,T?哿I,每个T都有唯一的标识符TID,假设X是一个I中项的集合,如果X?哿T,则称作事务T包含项X,如果X中有k个项,则又称X为k-项集。那么一条关联规则用公式表示为:X?圯Y,其中X?奂I,Y?奂I且X∩Y≠?专,X是此关联规则的前提,Y是结果,推理结果通过支持度和置信度来确定。支持度(Support)S表示事务集合D中有S%的事务同时包含项X和Y,即是事务集中同时包含X和的事务数与所有事务数之比,用公式记作Support(X?圯Y)=P(X∩Y)。置信度(Confidence)C表示D中有C%的事务同时也包含Y,即包含X和Y的事务数与包含X的事务数之比,记作Confidence(X?圯Y)=P(X∩Y)/P(X)。支持度表示包含此关联规则的事务在全体事务集合中的代表性,置信度表示该事务中所包含关联项的关联规则的强度,关联规则挖掘就是找出满足用户给定的最小支持度和最小置信度阈值的有意义的规则,一般分为两步:首先找出所有的频繁项集(满足最小支持度的项集),然后产生有价值的关联规则。
在众多的关联规则算法中,Apriori算法是挖掘布尔关联规则频繁项集的最有影响力的有效算法,它是使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。Apriori算法流程分两步进行:一是生成所有支持度大于minsup(最小支持度阈值)的频繁项集,基本原理是先遍历事务数据库得到频繁1-项集L1。再由L2产生长度为2的候选项集合C2,然后求出事务数据库中的每一个事务t在C2中的全部子集Ct,令Ct中的每一个长度为2的候选项集c的计数加1,当扫描事务数据库一遍后,筛选出候选项集合C2中所有计数满足最小支持度的项集组成频繁2-项集,如此重复步骤,直到没有频繁k-项集产生,其中候选项集产生的过程被分为连接与剪枝两个部分;二是从频繁项集中生成所有满足置信度大于minconf(最小置信度阈值)的关联规则。
(二)问卷设计
借鉴消费者购物行为分析的研究方法,归纳出所有通过分析消费者偏好数据从而得出营销规律的问题都可以归纳为关联规则挖掘问题。在民宿的经营者缺乏科学的经营指导,对民宿定价、装潢、主题设计、服务内容、宣传渠道等定位不准确的情形下,要从根本解决黔西南州旅游民宿经营现存问题,提高民宿服务质量,从而带动当地旅游经济产业,达到游客期望的标准,最直观的做法是对游客进行民宿期望问卷调查,从广大游客群体中获取他们对黔西南州民宿在服务、经营、定价、环境等各方面的期望,然后分析期望项之间的强关联规则,找出大部分游客对民宿服务的期望偏好项组合,并以此作为建设标准开发新的民宿產品,改进现有民宿经营与服务模式,以求最大限度迎合游客的偏好,达到吸引游客前来消费民宿产品的营销目的。具体来讲,可以把黔西南地区民宿在经营层面的各个因素设计成独立的偏好项,如表1《问卷设计》中的第1个问题Q1的A选项(期望民宿的定价为<100元每晚)=偏好“Q1A”,第4个问题Q4的B选项(期望民宿的卫生标准达到家庭普通卫生标准)=偏好“Q4B”......,当被访游客勾选完一份问卷,即构成一个问卷调查事务,如{Q1A,Q2C,Q3B,Q4A,...,Q28D}。收集所有被访者的调查问卷数据,用关联挖掘Apriori算法找出其中的强关联项,例如{Q1B-Q3C-Q4B-Q6C-Q7E=>Q9C},结果表明同时具备这几项经营要素的民宿最符合游客的期望,此结论可以直观地指导民宿经营者开发新的具备强关联特征的民宿产品、优化经营要素,使民宿各要素具备较强的符合游客期望的关联性。
(三) 数据处理
1. 数据收集
笔者于2017年8月9日至8月15日期间陆续走访了黔西南州兴义市的民宿共30家,调查采用与民宿住宿游客一对一随机抽样调查访谈的形式,本次调查共发放问卷300份,回收问卷250份,其中有效问卷占比225份。回收问卷后将每一份问卷的每一个问题作为一个属性,每个问题的答案作为属性取值,转化为225行*28列的数据项集合的形式保存于Weka能够识别处理的arff文件中,该数据集的偏好项共6*28=168个,有效事务共225个。
2. 数据预处理
数据预处理是指在主要的处理以前对数据进行的一些清理、转化、加工步骤,目的是排除干扰和误差因素,保证数据分析结果更加准确。笔者收集完消费者的反馈数据后发现问卷中存在空缺项问题,采用判定树归纳的方法确定问卷中的空缺值,该方法依靠现有的数据信息来推测空缺值,使空缺值有更大的机会保持与其他属性之间的联系。最终所得待挖掘的数据集arff文件如下,图1中@attribute区域的每个属性Q1~Q28代表问卷中的28个问题,其后的取值范围A-F代表问题答案选项范围,@data区域每一行代表一份调查问卷事务(共445行,后省略)。
3. 关联规则计算
将包含所有被访者问卷答案的arff数据问卷导入weka工具,选择其中的关联规则挖掘Apriori工具,把其中LowerBoundMinSupport和UpperBoundSupport两个参数分别设置为0.1和1,表示计划筛选出支持度在10%到100%之间的关联规则。其他参数取默认值,最后运行算法即可。endprint
四、结果分析
软件运行结果将关联规则项按置信度与支持度从高到低排序如图2。
例如从算法运行结果可看出在自然景观选择方面,年龄段在25~35周岁的,贵州省内或西南周边省份就职于企事业单位的职员在和家庭出游黔西南地区时,更偏向通过亲朋好友推荐选择足不出户就能体验黔西南地区山峦地貌特征的并且能营造家庭亲子环境的家庭式民宿。进一步分析该强关联规则项可以推测该年龄段的家住附近的企事业单位员工由于日常工作压力较大,和家庭结伴短途出行更多是为放松心情的慢节奏度假式旅游,而非旅途奔波探索式的游玩,该游客群体再次前往当地度假休闲的几率较大。因此在民宿产品开发层面,可以突出建设景观观景效果,如修建观景天台等,在室内装潢、民宿命名、餐饮服务等方面注入更多“家庭”因素;在民宿经营管理层面,给该类游客提供更多自主、隐私的家庭活动空间例如可以将自家蔬果农田开放给游客采摘,将民宿内厨房设施提供给游客自主烹饪等,让游客置身异地也能感受家庭生活气氛,增强客户粘性,使其有再次前来短途度假放松的欲望。在民宿产品营销层面,旅游管理机构可以收集具备该类特色的民宿信息,通过政策协助、企业工会等渠道定向投放给附近的企事业单位职工家庭。
类似的,每一条具有较高支持度与置信度的关联规则都可以分析出某一类游客对某一类型民宿在产品特色、服务内容等方面的特别偏好,民宿经营者可以以之为参考開发特色符号鲜明的民宿产品,旅游业管理者也可找到精准营销宣传、资金扶持的正确方向。
由于算法运行结果极大限度依赖于所选取的调查样本数据,笔者通过线下渠道收集的问卷数量规模较小,样本分布不均匀,调研时间跨度短,研究结果不能代表所有游客的偏好。鉴于线下主动获取反馈数据的规模具有局限性,且进行离线数据挖掘,所得关联规则并不能动态反应随时间变化的游客偏好,因此建议黔西南州加强线上民宿预定平台的建设,以便从该平台实时被动获取、累积游客的历史偏好反馈并进行联机挖掘分析,给经营管理者提供更及时准确的开发管理决策。
参考文献:
[1]王伟全,赵丽萍.国内外民宿发展历史研究[J].江西建材,2017(01).
[2]郭莹莹.民宿在乡村旅游中的地位和作用研究[J].新经济,2016(12).
[3]何景明.国内乡村旅游研究:蓬勃发展而有待深入[J].旅游学刊,2004(01).
[4]黄杰龙,张玲玲,范梦丹等.基于游客行为意图的民宿景观的组合评价与开发设计[J].福建农林大学学报(哲学社会科学版),2015(04).
[5]黄杰龙,张玲玲,范梦丹,陈贵松.基于游客行为意图的民宿景观的组合评价与开发设计[J].福建农林大学学报(哲学社会科学版),2015(04).
[6]席珮.探究“互联网+”时代下我国旅游产业的发展方向[J].现代经济信息,2016(19).
[7]张书海,禹贡.近5年我国智慧旅游研究述评[J],2015(13).
[8]吴斌,肖刚,陆佳炜.基于关联规则挖掘领域的Apriori算法的优化研究[J].计算机工程与科学,2009(06).
[9]李志勇.深入分析关联规则Apriori算法[J].现代计算机(专业版),2009(05).
[10]范苏颖.浅析计算机数据挖掘技术[J].信息系统工程,2017(01).
(作者单位:贵州大学)endprint