“畅游中国”

2016-09-26 00:37张宗浩
卷宗 2016年7期
关键词:聚类分析

摘 要:本文针对游遍我国201个5A级景区的旅游路线规划问题进行了深入探讨,基于实际情况考虑,假设旅游爱好者每年有不超过30天的外出旅游时间,每年外出旅游的次数不超过4次,每次旅游的时间不超过15天;而且考虑到安全因素,行车时间限定于每天7:00至19:00之间,每天开车时间不超过8小时,景区开放时间统一为8:00至18:00。在无费用限制情况下,以时间最短为目标建立了优化模型。采用以区域为单位,对31个省市自治区用SPSS进行合理的聚类分析,以按省份分类为主结合距离数据,并用改进的Hamilton圈算法,采用LINGO编程实现,得到了西安的自驾游爱好者游遍全国201个5A级景区至少需要12.5年。

关键词:旅游路线规划;非线性规划;聚类分析;哈密顿圈

1 问题的提出

旅游活动正在成为全球经济发展的重要动力之一,它加速国际资金流转和信息、技术管理的传播,创造高效率消费行为模式、需求和价值等。随着我国国民经济的快速发展,人们生活水平得到很大提升,越来越多的人积极参与有益于身心健康的旅游活动。

一位自驾游爱好者拟按国家旅游局公布的201个5A级景区名单制定旅游计划。该旅游爱好者每年有不超过30天的外出旅游时间,每年外出旅游的次数不超过4次,每次旅游的时间不超过15天;基于个人旅游偏好确定了在每个5A级景区最少的游览时间。基于安全考虑,行车时间限定于每天7:00至19:00之间,每天开车时间不超过8小时;在每天的行程安排上,若安排全天游览则开车时间控制在3小时内,安排半天景区游览,开车时间控制在5小时内;在高速公路上的行车平均速度为90公里/小时,在普通公路上的行车平均速度为40公里/小时。该旅游爱好者计划在每一个省会城市至少停留24小时,以安排专门时间去游览城市特色建筑和体验当地风土人情。景区开放时间统一为8:00至18:00。请考虑下面问题:在行车线路的设计上采用高速优先的策略,即先通过高速公路到达与景区邻近的城市,再自驾到景区。从网上可以查到各景区到相邻城市的道路和行车时间参考信息,国家高速公路相关信息,以及若干省会城市之间高速公路路网相关信息。请设计合适的方法,建立数学模型,以该旅游爱好者的常住地在西安市为例,规划设计旅游线路,试确定游遍201个5A级景区至少需要几年?

2 问题的分析

根据问题描述述,可以知道这是一个旅游路线优化问题,旅游路线规划从区域范围可以分为三个部分:城市之间的旅游路线规划、城市内各景区的旅游路线规划、景区内各景点的旅游路线规划。城市之间的旅游路线规划和景区内各景点的旅游路线规划都是从一点出发,经过其他点,且只经过一次,最后回到出发点的路线规划,即图论中的旅行商问题(又称TSP问题)。如果将此算法直接用到旅游路线的选择上,则可以简单地表现为考虑两景区的路程,但对旅游者而言,如果仅仅考虑景区间的相互距离肯定是不够的。给定旅游地图,游客在旅行过程中总想从出发地到目的地的距离最短, 以节省费用和时间。本文针对旅游者主要关心的问题——时间、费用和体验,并且考虑在各个不同景区停留的时间,对已有算法加以改进,以此来满足该算法在旅游景区路线选择上的需要,最终得到适合的最优旅游线路。国家旅游线路空间跨度大,其发展必然要以区域为基础,依托区域现状进行开发和设计,最终实现以线路的发展带动整个区域旅游业发展。基于此,先运用聚类分析的方法分成一定类别数。然后在类中找出最优路线。基于此,我们要采用以区域为单位,对31个省市自治区用SPSS根据距离和坐标两者相结合的指标进行合理的聚类分析,并用改进的Hamilton圈算法,在只考虑时间、但费用不限的前提下,采用LINGO编程实现,得到西安的自驾游爱好者游遍全国201个5A级景区至少需要的年数。

3 问题的求解

聚类分析是数据挖掘的一项重要的方法。聚类问题实际上是将一组数据分成若干个组,每个组里的对象具有很大的相似性,不同的组之间存在尽量大的差异性。K-均值聚类分析法又称快速样本聚类法,是非系统聚类中常用的聚类法。 具体做法如下:

a.按照指定的分类数目n,按某种方法选择观测量,设为{Z1,Z2,…},作为初始聚心 ;

b.计算每个观测量的欧式距离,即。按接近原则将将每个观测量选入一个类中,然后计算个类的中心位置,即均值,作为新的聚心;

c.使用计算出来的新聚心重新进行分类,分类完毕后继续计算各类的中心位置,作为新的聚心,如此反复操作,直到两次迭代计算的聚心之间距离的最大改变量小于初始聚心间最小距离的倍数时,或者达到迭代次数的上限,迭代停止。

哈密顿圈:对于旅游路线的规划有如下三点基本要求:

a.在尽可能短的时间内给出旅游路线规划。

b.旅游路线要经过所有景区,且只经过一次,最后回到起始地。

c.景区与景区之间的距离要尽可能的短。

要求算法的反应时间尽可能快,同时规划出的路线质量不但要短,而且要人性化。这是一个旅行商问题,重要在找出最小权Hamilton圈,称这种圈为最优圈。设,则对于所有适合1

w(vivj)+w(vi+1vj+1)

则圈Cij将是圈C的一个改进。在接连进行上述一系列修改之后,最后得到一个圈不能在用此方法改进了。针对各个省份的旅游景区,利用哈密顿最优圈,找出在各个省份旅游景区的一条最优路径,然后分区对应,满足题目中所给出的约束条件,最后得出最優求解。

我们不妨以江苏省为例,假如要去江苏省游玩,设计一条合理的最优路径。首先将江苏省内的旅游景区按照顺序依次编排好,由统计可发现共有19个。然后查找出每两个景区之间的距离(包括高速与普速),然后由此计算出每两个景区之间连通的时间,从这些数据中,我们可以得到一条游玩江苏省所有旅游景区所花时间最少的路径。

相应的线性规划问题是:

程序如下:

MODEL:

SETS:

city/1..19/:u;

link(city,city):d,x;

ENDSETS

DATA:

d = @ole(‘C:\Users\Administrator\Desktop\时间表\江苏.xls,js) ;

ENDDATA

n=@SIZE(city);

MIN=@SUM(link:d*x);

@FOR(city(k):@sum(city(i)|i#ne#k:x(i,k))=1;

@sum(city(j)|j#ne#k:x(k,j))=1;

@for(city(j)|j#gt#1#and#j#ne#k:

u(j)>=u(k)+x(k,j)-(n-2)*(1-x(k,j))+(n-3)*x(j,k));

);

@FOR(link:@BIN(x));

@for(city(k)|k#gt#1:

u(k)<=n-1-(n-2)*x(1,k);

u(k)>=1+(n-2)*x(k,1));

END

求解和结果

运用以上程序得到结果:X( 1, 16)=1, X( 2, 12)=1, X( 3, 13)=1, X( 4, 15)=1, X( 5, 14)=1, X( 6, 2)=1, X( 7, 3)=1, X( 8, 5)=1, X( 9, 19)=1, X( 10, 11)=1, X( 11, 9)=1, X( 12, 1)=1, X( 13, 8)=1, X( 14, 4)=1, X( 15, 6)=1, X( 16, 10)=1, X( 17, 7)=1, X( 18, 17)=1, X( 19, 18)=1

可得到西安到江苏的最优路径图:

西安 → 苏州园林(拙政园-留园-虎丘)→ 苏州常熟沙家浜-虞山尚湖旅游区 → 南通市濠河风景区→泰州姜堰区溱湖国家湿地公园 → 扬州瘦西湖风景区 → 淮安市周恩来故里景区(周恩来纪念馆-周恩来故居-附马巷历史街区-河下古镇)→ 镇江句容茅山景区 → 常州溧阳市天目湖景区(天目湖-南山竹海-御水温泉) → 南京夫子庙-秦淮河风光带(江南贡院-白鹭洲-中华门-瞻园-王谢故居)→ 南京钟山—中山陵风景名胜区(明孝陵-音乐台-灵谷寺-梅花山-紫金山天文台)→ 常州环球恐龙城景区(中华恐龙园-恐龙谷温泉-恐龙城大剧院) → 无锡灵山大佛景区→无锡鼋头渚景区 → 中央电视台无锡影视基地三国水浒城景区 → 苏州吴中太湖旅游区(旺山-穹窿山-东山)→苏州吴江同里古镇景区 → 苏州昆山周庄古镇景区 → 苏州市金鸡湖国家商务旅游示范区 → 西安

按照这种方法,可以求得西安去每一个区域的最优路径,如表2所示:

4 结束语

本文突破以往旅游线路的研究视角,从开发规划角度出发,以区域研究为背景,对国家旅游线路的开发基础进行定性描述和定量分析。并以区域为基础,确定国家旅游线路的主要节点。思路简单清晰,没有太多复杂的运算过程。巧妙的运用一系列假设前提简化问题,在运行得到的结果基础上加以改进,可以得到较为合理的方案。为了更加准确地阐释本文讨论的旅游线路的含义,下面从空间维度、时间维度、成本维度和旅游活动维度四个维度进行具体的说明:

首先,旅游线路的空间性十分明显。旅游线路包括一系列空间单元,这些空间单元通过交通线路连接成一个线性连续空间,有长度和拓扑结构,并且可以交错成网。例如国际旅游线路、国内旅游线路,都体现了旅游线路空间范围的特征;又如环形旅游线路、树形旅游线路,则体现了旅游线路的空间拓扑结构的特征。其次,旅游线路也是一种时间安排。同样的交通线路,倘若给予不同的时间安排,就可以被认为是不同的旅游线路。例如五一黄金周线路、十一黄金周线路等,均体现了旅游活动持续时间的特征。旅游线路的时间维度包含三个方面:旅游线路开始的时间、结束的时间(时间点);作为节点的景区(点)的时间顺序(时间序列);旅游线路持续的时间(时间段)。再次,成本问题。实际上,旅游线路作为一种特殊的消费品,其购买和消费不仅仅要消耗金钱,而且还要消耗財富的另一种形式:余暇时间。显而易见,这两种财富的消耗,都构成了旅游者的成本支出。因此,旅游线路设计过程中的优化考虑,就必然要以成本作为一个阈限或约束条件。旅游者需要选择各个空间单元间不同的交通线组合或改变时间安排来改变旅游线路,进而改变旅游线路的对成本约束条件的适应性。最后,旅游线路这个概念的含义是很丰富的。除了上述的三个维度,作为旅游活动的载体,旅游线路必将包含旅游活动的一些特征。旅游线路承载的是旅游者的旅游活动,旅游线路优化问题不同于一般的线路优化问题也是基于此。

参考文献

[1]曹阳.城市旅游规划行程链的模型构建及其应用研究[D].

[2]吴凯.旅游线路设计与优化中的运筹学问题[J].旅游科学,2004(3)

[3]蔡文芳.运筹学在旅游线路规划中的作用[J].科技经济市场,2009(9):96-97

[4]薛毅,动态规划.图论与网络模型[M].北京:北京工业大学出版社,2005

[5]肖华勇.基于MATLAB和LINGO的数学实验[M].西安:西北工业大学出版社,2009.

作者简介

张宗浩(1990-),男,河南信阳人,汉族,南京财经大学硕士研究生,研究方向:金融数学。

猜你喜欢
聚类分析
基于Weka的江苏13个地级市温度聚类分析
浅析聚类分析在郫县烟草卷烟营销方面的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究