基于马尔可夫链模型的游客流预测
——以海南国际旅游岛为例

2015-04-24 06:11符方健陈福川
海南开放大学学报 2015年1期
关键词:马尔可夫概率分布回归方程

符方健,陈福川

(琼台师范高等专科学校 数理系,海南 海口 571100)



基于马尔可夫链模型的游客流预测
——以海南国际旅游岛为例

符方健,陈福川

(琼台师范高等专科学校 数理系,海南 海口 571100)

以海南国际旅游岛为例,应用马尔可夫链构造游客流动态模型,对未来几年海南旅游人数进行预测,为海南省建设国际旅游岛进程中做好交通、宾馆等基础设施提供参考。

马尔可夫链;转移概率;海南国际旅游岛;游客人数

2010年1月4日,国务院发布《国务院关于推进海南国际旅游岛建设发展的若干意见》。至此,海南国际旅游岛建设正式步入正轨,海南将迎来国内外众多游客。能否对未来几年游客人数变化进行科学预测,关系到交通、宾馆等基础设施建设和旅游景点门票设定,而对这些资源的最大合理利用,更关系到海南省经济增长和外汇收入。

一 马尔可夫链理论

定义1[1]如果随机序列{Xn,n≥0}对任意i0,i1,…,in,in+1∈S,n∈N0,及P{X0=i0,X1=i1,…,Xn=in}>0,有

p{Xn+1=in+1|X0=i0,X1=i1,…,Xn=in}=P{Xn+1=in+1|Xn=in},

(1)

则称其为马尔可夫链.(1)式刻画了马尔可夫链特性,称为马尔可夫性(或无后效性)。

π(n+1)=π(n)p;π(n)=π(0)Pn

二 模型建立

对于旅游人数预测,不同学者采用不同方法[2-3],各有利弊.笔者认为境内外来海南国际旅游岛旅游的人数随着客源地和岛内气候、管理以及我国政治、经济、文化等诸多因素影响而变化,所以都是随机变量。且由经验知,某年来海南岛旅游的某类客源地旅游人数多少只受到前一年影响,且与大前年等无关。因此根据马尔可夫链特性,各类客源地来海南国际旅游岛旅游人数可分别被视作一个齐次马尔可夫链。于是可应用马尔可夫链建立如下模型:

本文中,m=0表示2012年度,所以瞬时概率分布P(1)、P(2)和P(3),分别表示2013、2014和2015年度。下面主要工作是计算出P(1)、P(2)和P(3),通过对P(1)、P(2)和P(3)进行数据分析,对未来两年2014和2015年来海南国际旅游岛旅游的人数做出概率预测。

三 未来几年来海南旅游人数预测

将游客分为国内旅游者,外国人,港澳同胞,台湾同胞,最后进行总人数统计。

根据海南省统计局数据[4],我们提取了海南省1995—2012年来琼旅游人数,统计情况见表1。

(表1) 1995年至2012年来琼旅游人数统计表 (单位:万人次)

(一)国内旅游者

经计算x1中a1=328.24,β1=3238.80,组距为:d1=970.19。分组区间为:[328.24,1298.4)[1298.43,2268.62),[2268.62,3238.80]。初始状态概率分布为P(0)=(0.5,0.3333,0.1667),m步转移概率矩阵分别为:

P(1)=(0.4444,0.3333,0.2223),

P(2)=(0.3951,0.3271,0.2778)

P(3)=(0.3512,0.3164,0.3324).

数据分析:观察P(1),P(2) 和P(3)中数据落在各组的概率,发现数据落在第一组[328.24,1298.4)的概率最大,分别为0.4444,0.3951和0.3512。但是从逐年发展趋势看,数据落在第一组和第二组的概率都是逐年减少,但是数据落在第三组[2268.62,3238.80]的概率是逐年增大的,分别为0.2223,0.2778和0.3324。再观察表1,从2003年起,国内旅游人数是逐年递增的,因此本文认为2014和2015年,来海南国际旅游岛旅游的国内旅游人数应多于2268.62万人次。

(二)外国人

经计算x2中a2=7.29,β2=73.13,组距为:d2=21.95。分组区间为:[7.29,29.24)[29.24,51.19),[51.19,73.13]。初始状态概率分布为P(0)=(0.6111,0.1667,0.2222),m步转移概率矩阵分别为:

所以m时瞬时概率分布分别为:

P(1)=(0.5555,0.1 667,0.2778) ,

P(2)=(0.5051,0.1755,0.3194),

P(3)=(0.4591,0.1843,0.3566) 。

数据分析:观察P(1),P(2) 和P(3)中数据落在各组的概率,发现数据落在第一组[7.29,29.24)的概率最大,分别为0.5555,0.5051和0.4591。其次是第三组[51.19,73.13],概率分别为0.2778,0.3194和0.3566。但是从逐年发展趋势看,数据落在第一组的概率是逐年减少,而落在第三组的概率是逐年增大的,且随着海南国际旅游岛各项工作的完善,应越来越吸引外国人来旅游。因此本文将分别以概率0.3194和0.3566认为2014和2015年,来海南国际旅游岛旅游的外国人人数应介于51.19和73.13万人次之间。

(三)港澳同胞

经计算x3中a3=8.11β3=32.54,组距d3=8.14。分组区间为[8.11,16.25),[16.25,24.39),[24.39,32.54],初始状态概率分布为P(0)=(0.6111,0.2222,0.1667),m步转移概率矩阵分别为:

所以m时瞬时概率分布分别为:

P(1)=(0.611102,0.222209,0.166689) ,

P(2)=(0.611146,0.2222197,0.166657),

P(3)=(0.611106,0.222174,0.166720) .

数据分析:观察P(1),P(2) 和P(3)中数据落在各组的概率,发现数据落在第一组[8.11,16.25)的概率最大,分别为0.611102,0.611146,0.611106,并且明显大于第一和第二组概率,因此本文将分别以概率0.611146和0.611106认为2014和2015年,来海南国际旅游岛旅游的港澳游客人数应介于8.11和16.25万人次之间。

(四)台湾同胞

经计算x4中a4=3.32,β4=17.77,组距d4=4.82,分组区[3.32,8.14),[8.14,12.96),[12.96,17.77],初始状态概率分布为P(0)=(0。7222,0。1111,0。1667),m步转移概率矩阵分别为:

P(1)=(0.7222,0.0 556,0.2222) ,

P(2)=(0.7406,0.0556,0.2038),

P(3)=(0.7515,0.0570,0.1915) .

数据分析:观察P(1),P(2) 和P(3)中数据落在各组的概率,发现数据落在第一组[3.32,8.14)的概率最大,分别为0.7222,0.7406,0.7515,并且明显大于第一和第二组概率,因此本文将分别以概率0.7406和0.7515认为2014和2015年,来海南国际旅游岛旅游的台湾游客人数应介于3.32和8.14万人次之间。

(五)总人数

经计算x5中a5=361.01 ,β5=3320.37,组距d5=986.45,分组区间为[361.01,1347.46)[1347.46,23 33.91),[2333.91,33 2037]。初始状态概率分布为P(0)=(0.5,0.3333,0.1667),m步转移概率矩阵分别为:

所以m时瞬时概率分布分别为:

P(1)=(0.4444,0.3 333,0.2223),

P(2)=(0.3951,0.3271,0.2778)

P(3)=(0.3512,0.3164,0.3324) 。

数据分析:观察P(1),P(2) 和P(3)中数据落在各组的概率,发现数据落在第一组[361.01,1347.46)的概率最大,分别为0.4444,0.3951和0.3512。但是从逐年发展趋势看,数据落在第一组和第二组的概率都是逐年减少,而数据落在第三组[2333.91,33 20.37]的概率是逐年增大的,分别为0.2223,0.2778和0.3324。再观察表1,从2003年起,来海南旅游的总人数是逐年递增的,因此本文认为2014和2015年,来海南国际旅游岛旅游的总人数应多于2333.91万人次。

四 模型修改

通过对数据分析发现,对于各年波动较大的数据组,应用马尔可夫链进行预测,发生的概率还是很大的,如对港澳同胞与台湾同胞的预测,分别大于0.6和0.7,因此应用马尔可夫链对于这类波动较大的旅客流进行预测具有较大的指导价值和应用价值。但是对于逐年递增的数据组,如国内旅游者与旅游总人数的预测,发生的概率较小,仅0.3左右,意义不是太大.实际上,通过图1的散点图发现,这两类数据接近直线上升趋势,因此,可建立线性回归模型进行预测。

对于国内旅游者,利用SPSS软件可得(表2),相关系数R=0.965,拟合优度检验R2=0.931,截距a=-294880.496,回归系数b=147.923,线性回归方程为y=147.923x-294880.496。误差自由度dfE=18-1-1=16,回归系数检验统计量t=14.717>2.921=t0.01(16),所以P<0.01,回归方程非常显著【5】。于是可用线性回归方程进行预测:当x=2014时,y=3036.426; 当x=2015时,y=3184.349.即可预测2014与2015年来海南国际旅游岛旅游的国内旅客流分别为3036.426万人次与3184.349万人次。

表2 国内旅游者数据回归分析模型汇总

a.预测变量:(常量),年度*

系数a

a.因变量:国内旅游人数

对于旅游总人数,利用SPSS软件可得(表3),相关系数R=0.965,拟合优度检验R2=0.932,截距a=-300604.949,回归系数b=150.806,线性回归方程为y=150.806x-300604.949。误差自由度dfE=18-1-1=16,回归系数检验统计量t=14.761>2.921=t0.01(16),所以P<0.01,回归方程非常显著【5】。于是可用线性回归方程进行预测:当x=2014时,y=3118.335; 当x=2015时,y=3269.141。即可预测2014与2015年来海南国际旅游岛旅游的总人数分别为3118.335万人次与3269.141万人次。

表3 旅游总人数回归分析模型汇总

a.预测变量:(常量),年度*

系数a

a.因变量:总人数

结 语

海南建设国际旅游岛各项工作正在如火如荼地推进中,对未来来岛人数预测意义重大。文中对于波动较大的数据应用马氏链构造动态模型对旅客流进行预测,对于接近直线上升的数据,建立线性回归模型进行预测,科学可靠,不仅对未来来海南国际旅游岛旅游的人数预测有用,对于其他城市、景点旅游人数预测也同样具有参考价值。

致谢:感谢中山大学郭先平教授的悉心指导!

[1]林元烈.应用随机过程[M].北京:清华大学出版社,2002.

[2]靳巧花,李帅彪,张彬彬.基于灰色动态模型的丽江旅游人数预测研究[J].数学的实践与认识,2012(22).

[3]陈鹏,吴玲,宋徽.基于ARIMA模型的安徽省入境旅游人数预测[J].安徽农业大学学报(社会科学版),2012(1).

[4]海南省统计局网站[EB/OL].http://www.hi.stats.gov.cn/.

[5]王景英.教育统计学[M].北京:高等教育出版社,2010.

(责任编辑:李 芬)

Prediction of Tourist Flow Based on Markov Chain Model —A Case Study of Hainan International Tourism Island

FU Fang-jian ,CHEN Fu-chuan

(Department of Mathematics and Physics ,Qiongtai Teachers College,Haikou 571100,China)

This article takes Hainan International Tourism Island as case,applies Markov Chain to construct a dynamic model for tourist flow,and further predicts the number of tourists in years.This work will be beneficial for preparing infrastructure in Hainan in the progress of the construction of Hainan International Tourism Island.

Markov chain; transition probability; Hainan international tourism island; number of tourists.

2015-03-11

符方健,男,汉族,海南琼海人。海南琼台师范高等专科学校数理系教授。主要研究方向:概率与统计理论;通讯作者:陈福川,男,汉族,海南万宁人。海南琼台师范高等专科学校数理系副教授。主要研究方向:高等数学教学。

海南省自然科学基金项目“云进化策略方法及其应用研究”(编号:114013)成果之一;琼台师范高等专科学校教育教学改革研究项目“《概率统计》教学内容、方法与手段改革研究”(编号:QTJY201301)成果之一。2015年第1期

F224

A

1009-9743(2015)01-0049-05

10.13803/j.cnki.issn1009-9743.2015.01.012

猜你喜欢
马尔可夫概率分布回归方程
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
离散型概率分布的ORB图像特征点误匹配剔除算法
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
走进回归分析,让回归方程不再是你高考的绊脚石
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
多状态马尔可夫信道的时延分析