基于VLBP神经网络算法的中国旅游外汇收入预测研究

2019-08-14 10:02李泓颖MikhalevDaniilSergeevich
计算机应用与软件 2019年8期
关键词:外籍人士旅行社入境

李泓颖 李 飞 Mikhalev Daniil Sergeevich

1(西南科技大学城市学院 四川 绵阳 621000)2(成都理工大学核技术与自动化工程学院 四川 成都 610059)3(彼得一世技术学院 阿尔汉格尔斯克州 阿尔汉格尔斯克 163002)

0 引 言

旅游外汇收入也称国际旅游外汇收入,它主要是指国际游客(外籍人士和特殊政治背景人士)在本国以旅游为目的,在旅游过程,获取的一切商品及各种服务所发生的支出。旅游业作为国家的重要经济支柱产业之一,同时也是反映国家国际地位的风向标,旅游外汇收入更是国家外汇收入的主要来源之一。通过对旅游外汇收入的分析,可以判断一个国家的旅游规模和水平。

我国的旅游业发展起步较晚,第一家旅行社于1949年11月成立,在随后的30年时间内,只属于初步发展阶段。1978年入境人数仅为180.9万人次(外籍人员23万人次),年旅游外汇收入为2.63亿美元。经过近30年的发展,2006年入境人数为12 494万人次(外籍人员2 221万人次),年旅游外汇收入为339.5亿美元,相比1978年增长接近130倍。到2017年,入境旅游人数为13 948.24万人次(外籍人员2 916.53万人次),年旅游外汇收入为1 234.17亿美元。世界旅游组织预测到2020年,中国将成为世界最大的旅游目的地,旅游外汇收入将达到一个新高。对年旅游外汇收入准确预测,并对外汇收入的影响因素分析,可以比较直观地反映我国在旅游规划建设方面存在的问题。通过可靠的数学模型,对影响因素调整,改善可控因素,提出相对有效的建议,能够更好地帮助我国旅游业发展。

对于旅游外汇收入与国民经济之间的关系,大量的研究学者进行了广泛而深入的研究。董兴军(2018)利用剂量经济模型分析方法对山东省GDP与旅游外汇收入关系关系进行了实证分析,研究结果表明山东省经济增长与旅游外汇收入不呈明显的线性关系,仅仅是GDP增长可以促进入境旅游业的发展[1]。谢健通过对安徽省的GDP和旅游外汇收入进行ADF检验、EG协整检验、格兰杰因果检验和误差修正,表明了安徽省的旅游外汇收入能够单方面促进GDP的提升,两者可以达到长期平衡[2]。何峰通过对汇率和入境旅游收入之间的关系研究,找出提高山西入境旅游收入的重要影响因素,提出通过合理化消费结构改善山西省入境旅游外汇收入[3]。游文静认为四川旅游入境收入可以衡量旅游业的发展情况和区域开放程度,通过计量经济学、市场营销学等多学科支持的定性定量方法对四川省入境旅游外汇收入重要影响因素进行分析,结果表明交通、旅游资源、工作人员、市场对旅游外汇呈正相关影响[4]。同时,针对旅游外汇收入的预测相关研究和文献大多数是基于时序模型、线性回归及变体模型来进行预测。马婷等利用两类时间序列模型(Index model和ARIMA model)对云南省旅游外汇收入进行预测,结果表明两类时序模型都有一定的预测能力,但相对而言ARIMA的精度会高一些[5]。朱念通过多种灰色组合模型对2016年-2020年我国入境外汇收入数据进行预测,关联旅游入境外汇收入及其重要影响因素[6]。蔡敏等通过线性模型构建杭州Logistic入境旅游的游客人数增长曲线,并与杭州市的GDP增长曲线对比拟合。结果表明杭州市的入境旅游人数与GDP呈正相关上升[7]。以上这些算法和模型在一定程度上和特定的背景下可以比较准确地预测到旅游外汇收入的数值,但其最基本的设置都是影响因素与预测结果有比较好的线性关系。旅游外汇收入的构成是一个比较复杂的非线性网络,若要更准确地对数据进行预测,则需建立的数理模型具备一定的非线性处理能力。本文拟采用可变学习率反向传播算法(Variable learning rate back propagation,VLBP)建立我国旅游外汇收入及其线性和非线性影响因素的神经网络模型,对该模型训练并对2020年至2025年的旅游外汇收入进行预测和讨论。

1 原理和算法

BP神经网络是一种反向传播神经网络,是根据误差反向传播算法训练的多层前馈神经网络[8-10]。图1展示了基本的BP神经网络拓扑结构,网络由输入层、输出层和隐藏层组成,隐藏层的数量大于或等于1,每一层神经元只与相邻神经元进行数据传输,同一层神经元之间不存在数据传输。

图1 BP神经网络的基本结构

BP网络算法的关键是输入向量的正向传递和误差的反向传递。以单个隐含层BP网络为例:网络的输入部分有n个神经元,隐藏层有p个神经元,输出层有q个神经元。Wnp为对隐含层的权值输入,Vpq为和隐含层的权值输出,f是一个集合的激活函数。在神经网络中,每个神经元都可以通过激活函数完成输入输出的非线性映射。激活函数为Sigmoid,其表达式如下:

隐含层第p个节点的输出公式如下:

式中:θ是神经元的阈值;V是输入神经元,是输入净值;b是输出值。

VLBP是在BP算法的基础上提出的一种快速收敛的BP算法[11-12]。其基本思想是通过设置学习速率的增减因子,通过改变学习速率来快速减少误差。核心公式如下:

式中:η是学习速率。

如果收敛效果好,误差减小,则学习速率乘以kinc,η会增加,因此,迭代速度将会增加;否则,如果收敛效果差,误差增加,则学习速率乘以kdec,η将减少,迭代速度会减小。一般来说,kinc和kdec在训练前都有预设值。虽然VLBP可以在一定程度上校正梯度最陡下降方向上的权值,但在增加和减少因子的设置上仍需反复实验。因为增减因子本身是不能改变的。

本文使用VLBP算法建立模型对旅游外汇收入预测(见图2),流程如下:

(1) 设输入向量和输出向量个数,隐层神经元个数可通过经验公式计算:

式中:n为隐藏神经元的数量,a和b分别为输入神经元和输出神经元的数量,c为任意常数的1到10。每个向量的权值和阈值由随机函数初始化生成,满足均匀分布和较小值的两个要求。

(2) 选择训练样本数据并进行归一化。

(3) 根据传递函数公式计算隐含层和输出层各神经元节点的输出。

(4) 计算当前的迭代误差。

(5) 确定当前的迭代数是否是迭代的最大次数,或者输出结果是否满足误差精度。如果结果为“是”,则停止训练,输出向量集的权值和阈值,记录当前的迭代数和误差;如果结果是“否”,对学习率进行修正并返回步骤(3)。

图2 VLBP算法流程图

2 实验结果与讨论

2.1 软件平台

MATLAB是一款常用于数据分析、算法开发以及数据可视化的数学软件,其具备功能丰富的工具箱(如神经网络工具箱、信号处理工具箱等)。得益于MATLAB强大的扩展性,其被广泛应用于金融建模、图像处理、信号处理技信号检测等领域。MATLAB以矩阵作为基本数据单位,它的指令表达式与工程应用中常用的公式十分类似,因此用MATLAB来解决工程问题比C、FORTRAN等语言更加方便快捷。

BP神经网络在MATLAB里是一种常用的神经网络模型,对BP神经网络的构造一般分为构建网络、网络训练和结果预测三步。本文需要在构建网络这一步对学习率进行修改。

在MATLAB里,关于学习率的设置语句为:

net=newff(minmax(P),[100,5],{′tansig′,′purelin′},′trainrp′);

%构建神经网络

net.trainParam.lr=0.01;

%学习率

这里表示学习率被设置为0.01,而在本文设置中,学习率需要设置为一个可变的参数。因此需采用自适应学习速率调整的方法。函数设置为:

net=newff(x,[60,4],{′logsig′,′logsig′},′traingda′);

%′traingda′表示可调整学习速率

net.trainParam.Ir_inc=1.2;

%增加的学习速率倍数,默认为1.2

net.trainParam.Ir_dec=0.8;

%减少的学习速率倍数,默认为0.8

2.2 实验设计

本文拟采用3层神经网络结构。收集了1998年到2008年期间我国旅游外汇收入信息,并将其作为输出层神经元向量。同时将国际旅行社的数目、国际旅行社职工、入境旅游人数、入境旅游外籍人士、星级饭店个数、二氧化碳排量、PM10、互联网用户等可能对旅游外汇收入的影响因素作为输入层神经元向量。根据经验公式设定隐含层神经元个数,建立VLBP神经网络并对模型进行训练。输入神经元向量和输出神经元向量数据见表1。同时,对所有数据归一化后建立8个不同的影响因素与旅游外汇收入的折线图(见图3),横坐标为旅游外汇收入(亿美元),纵坐标分别为8个不同的影响因素。由图可见入境旅游人数和入境外籍人士与旅游外汇收入呈较好的线性正相关,其他6项均呈现不同程度的非线性或反相关关系。

表1 VLBP神经网络输入输出神经元

图3 旅游外汇收入与其影响因素

在MATLAB中设置为显示训练过程,基础学习率为0.01,最大训练次数为500次,训练精度为1e-5,增加学习倍数为1.2,减少学习倍数为0.8,在结果上显示预测曲线和实际曲线。

2.3 VLBP结果与讨论

对建立好的VLBP神经网络进行权值、阈值的矩阵分析,发现旅游外汇收入与入境旅游人数、入境外籍人士和国际旅行社数目相关性很大,同时PM10、互联网用户、国际旅行社职工的相关性较弱,但同样对预测结果有贡献。这说明了在旅游市场规划、政策制定的时候,需要更多考虑吸引入境旅游人数的政策。对空气的治理、网络的普及和旅行社职工的素质培训也是不能忽略的。

再取2009年到2014年的国际旅行社的数目、国际旅行社职工、入境旅游人数、入境旅游外籍人士、星级饭店个数、二氧化碳排量、PM10、互联网用户数据(见表2)。通过模型对当年旅游外汇收入总额进行预测,其预测结果见表3。结果表明,2009年至2014年的旅游外汇收入的VLBP预测值分别为:368.43、469.84、523.5、522.91、553.14、571.77亿美元,与国家旅游局公布的实际收入值的相对相对误差分别为:7.14%、-2.55%、-8.02%、-4.52%、-7.06%、-0.47%。最大相对误差绝对值为8.02%,最小相对误差绝对值为0.47%,都小于10%的相对误差。

表2 2009年-2014年旅游外汇收入相关因素数据

表3 2009年-2014年旅游外汇实际收入与预测收入对比

2.4 时序模型及对比

通过对已有的数据做相关性分析,可以得出结论:其中与国际旅游外汇收入基本呈正相关的且影响因素较大的是入境旅游人数与入境外籍人士。

将VLBP与时序模型预测方法进行对比,选择计量模型为:

logincome=a1+a2×logagent+a3×logstuff+a4×logtourist+

a5×logtouristf+a6×loghotel+a7×logco2+

a8×logpm10+a9×loginternet+b1

式中:logincome表示国际旅游外汇收入,logagent、logstuff、logtourist、logtouristf、loghotel、logco2、logpm10、loginternet分别表示国际旅行社的数目、国际旅行社职工、入境旅游人数、入境旅游外籍人士、星级饭店个数、二氧化碳排量、PM10、互联网用户。

对表1的数据进行序列相关性分析可知,国际旅游外汇收入与入境外籍人士的相关性最大,与国际旅行社职工的相关性最弱。为了避免伪回归的情况,需要对时序数据进行平稳性检查,采用ADF,应用10%的临界值得到各项影响因素的临界值的范围为-3.000 711 9~0.849 623,属于平稳时间序列。最后需要对回归方程进行协整检验,本文采用EG协整,对回归残差进行ADF单位根检验,残差项未出现单位根。结果表明回归模型的各变量之间存在稳定协整的关系,变量间符合长期稳定关系。

将时序模型与VLBP神经网络模型的预测结果进行对比,如图4所示。

图4 两种模型预测值与实际值的对比

可以看出两种方法均能对入境旅游外汇收入进行预测,但VLBP的预测准确度更高,与实际的旅游外汇收入额的相对误差更小。

3 结 语

本文基于近20年的旅游外汇收入及其影响因素的数据,训练VLBP神经网络,并对2009年-2014年的国际旅游外汇收入进行预测值的分析,结果表明VLBP的预测值相对误差在10%以内。同时加入时序模型在同样条件下进行回归预测分析,得到结果具有一定的置信度,但VLBP相对预测精度更高,误差更小,更适合于国际旅游外汇收入的预测,为涉外旅游策略的制定和旅游市场环境的改善提供了基础依据。

猜你喜欢
外籍人士旅行社入境
义乌:举行外籍人士旁听人员座谈会
中国第三个国家级入境再制造示范区通过验收
巴拿马将取消伪造资料者的居留和工作权
中华人民共和国出境入境管理法
警查證截獲非法再入境男
深度解析
近200家旅行社接入“清新福建”智慧旅行社云项目
非法入境
旅行社的选择
旅行社违约如何索赔