GM(1,1)模型的优化与应用

2022-01-09 11:23李颖男
关键词:原始数据太原市算子

张 鹏,李颖男

(太原工业学院 理学系,山西 太原 030008)

GM(1,1)模型是一个连续性的微分方程,它主要根据灰导数、关联度等数学思想建立起来的,是数量经济模型的一个子结构[1].其优点在于不需要依靠大量的样本数据,也不需要利用统计学的思想去挖掘信息规律.灰色预测模型更多的是依靠累加生成对原始数据序列进行变换,并从累加生成序列中挖掘数据潜藏的规律.

GM(1,1)模型作为灰色预测模型的核心与基础,被广泛地应用于社会各领域,尤其是在“小样本,贫信息,数据不完全掌握”的情况下,该模型取得了优异的预测成果[2].但该模型并非在任何情形下都能得到有效的预测成果,有时该模型的预测结果与实际情况存在较大的差距,甚至还会出现背道而驰的情况.

本文首先简要介绍了传统GM(1,1)模型,并对该模型的定义和性质进行了分析研究.接下来,从模型的定义出发,发现对该模型的优化要先从提高原始数据序列的光滑度入手,而通过对比研究可得,调和变权缓冲算子可以实现作用强度的微调,具有良好的调节性,因此,本文将引进调和变权缓冲算子,使其作用于原始数据序列.

原始数据序列得到优化后,将对GM(1,1)模型的背景值和时间响应函数进行优化,通过白化响应式解出参数的值,将得到新的背景值与时间响应函数的表达式.由此,该模型得到了优化.

1 传统的GM(1,1)模型

设原始非负数据序列为:

X(0)=(x(0)(1),x(0)(2),…,x(0)(n))

X(1)=(x(1)(1),x(1)(2),…,x(1)(n))

称累加后的数据序列X(1)为原始数据序列X(0)的1-AGO序列.

GM(1,1)的灰色微分方程[3]为

x(0)(k)+az(1)(k)=b

(1)

其中x(0)(k)为灰导数,a为发展系数,z(1)(k)为白化背景值,且:

由(1)式得

通过最小二乘法得[ab]T=(BTB)-1BTY.

GM(1,1)的白化微分方程[4]为

(2)

2 GM(1,1)模型的优化

2.1 调和变权缓冲算子的构造

对GM(1,1)模型的优化要先从提高原始数据序列的光滑度开始,在原始数据序列中引进调和变权缓冲算子[5].

设X=(x(1),x(2),...,x(n)),其中x(k)>0,k=1,2,...,n.

记XD=(x(k)d),x(k)d=(λ(x(n))-1+(1-λ)(x(k))-1)-1,λ为可变权重,0<λ<1,k=1,2,…,n.此时,无论X是单调递增序列还是单调衰减序列,或者振荡序列,D均为弱化缓冲算子.

数据序列X=(x(1),x(2),...,x(n))中由x(k)到x(n)的平均变化率为r(k);将缓冲算子D作用于数据序列X,得到XD=(x(1)d,x(2)d,...,x(n)d),定义缓冲算子D在k点的调节度为:

调节度反映了缓冲算子对数据序列的作用强度.不同的缓冲算子对数据序列的作用强度大小不同,因此,通过调节可变的权重能够调整缓冲算子的作用强度[6].

在实际应用中,权重的取值可以随着模拟精度的变化规律进行调节,也可以基于一定的误差最小化原则选择最优的权重.常见的最优衡量标准为误差平方和最小、平均相对误差最小,但由于权重的选取与预测误差之间并非线性关系,因此难以用确切的解析式表达出来[7].所以,可以在一定的误差准则下,在λ∈(0,1)内寻找最优值.在赋权时,可以将权重取为递增的等差数列或递增的等比数列,在确定好大概范围后,再精细确定权重的最优取值.

2.2 背景值及时间响应函数的优化

x(1)(t)=GeBt+C

令(x(1)(t))`=BGeBt,得

因此x(1)(t)在区间[k-1,k]上积分就可得到GM(1,1)的背景值为:

(3)

通过(3)式可知,只要得到B和C的值,则能得到背景值z(1)(k)的表达式.

由白化响应式[8]:

(4)

将B的代入方程(1)、(2)并相减得:

(5)

将(4)式和(5)式带入(a)式可得到C值为:

(6)

将B、C的值代入z(1)(k)中,得到重构的背景值为:

且,x(0)(k)≠x(0)(k-1),k=2,3,...,n.若x(0)(k)=x(0)(k-1),则此时的背景值与原GM(1,1)模型一致.

其中根据文献[9]可得:

通过上式可以得到GM(1,1)模型的时间响应函数为:

对优化后的结果进行还原:

3 实例验证

3.1 数据的获取

太原市是国务院批复确定的中国中部地区重要的中心城市,是国家历史文化名城,是一座拥有2 500多年建城历史的古都,是“控带山河,距天下之肩背”,“襟四塞之要冲,控五原之都邑”的历史古城,它吸引了来自五湖四海的游客,使得太原市的旅游业蓬勃发展.太原2010—2019年的旅游人数见表1.

表1 2010—2019太原市旅游人数统计表

数据来源:根据《太原统计年鉴》[10]历年数据整理计算

3.2 传统模型的建立和预测

由表1可得到太原市近十年来的旅游人数初始序列:

x(0)=(2 023.32,2 461.88,2 983.89,3 691.33,4 196.51,4 912.48,5 688.12,6 780.95,8 126.20,9 655.80)

对原始数列做累加后生成数列x(1):

x(1)=(2 033.32,4 485.20,7 469.09,11 160.42,15 356.93,20 269.41,25 957.53,32 738.48,40 864.68,50 520.48)

由此得到:

通过以上计算可得到传统的GM(1.1)模型为

该模型对2010—2019年太原市旅游人数的预测结果见表2.

表2 传统GM(1,1)模型的预测结果

3.3 优化模型的建立和预测

由表1可计算出2010—2019年太原市旅游人数的增长速度,见表3.

表3 2010—2019年太原市旅游人数增长速度表

从表3中还可以得出2013年以后的增长速度明显低于2013年以前的增长速度,因此数据变化规律难以准确把握.若将本文构造的调和变权缓冲算子引进该原始序列,结果见表4.

表4 可变权重不同取值时的2013—2014年预测误差表

通过表4可以得到,随着λ的增大,预测的误差也越来越大,由此取λ=0.01最为合适.

由此,得到了一个新的原始序列:x1(0)=(2 023.32,2 513.72,2 969.20,3 714.27,4 220.37,4 936.73,5 711.59,6 801.20,8 139.09,9 655.80),利用新的原始序列建立传统的GM(1,1)模型,计算得到时间响应式为:

由该模型得到的预测值及预测误差参见表5.

表5 改进原始序列后的传统GM(1,1)模型预测结果

引进调和变权缓冲算子后计算得到的预测误差为1.282 5%.因此,引进调和缓冲算子可以很好地提高原始序列的光滑度,优化了GM(1,1)模型,提高了预测精度.下面对引进缓冲算子后的GM(1,1)模型进行背景值和时间响应函数的优化,以期得到更加精准的预测结果.通过公式(4)得到:

计算(BTB)-1BTyn得到:

因而得到:

a=-0.165 88,b=2 001.674 9

利用以上计算结果,通过公式(6)计算得到:

进而得到优化后的GM(1,1)模型的时间响应函数为:

将优化后的GM(1,1)模型应用到实际预测中,通过计算得到预测值及预测误差,并将结果见表6.

表6 优化后的GM(1,1)模型预测结果

从表6可知采用优化后的GM(1,1)模型预测得到的平均相对误差为0.969 6%,相比于未优化的GM(1,1)预测得到的平均相对误差1.414 4%,预测精度明显得到了提高,因此对GM(1,1)模型的优化具有实际意义,而优化后的GM(1,1)模型也更适于解决现实中原始数据序列变化平缓的问题.

4 结论

1) GM(1,1)模型是一种对“贫信息,小样本”适用的解决方法,其对一些已经知道的信息进行生成、开发和提取,从看似无规律的数据中找寻潜藏的规律,使其具有独特的研究手段,从而被广泛地应用于实际问题的解决.

2) 在对模型的优化过程中,本文首先从提高原始序列的光滑度开始入手,引进了调和变权缓冲算子,使其作用于原始序列,从而很好地提高了原始序列的光滑度,有利于后续的建模过程.

3) 在对原始序列引进缓冲算子作用后,本文又对传统GM(1,1)模型的背景值进行了指数函数的拟合,使模型本身固有的问题得到了优化,接着对时间响应函数进行了改造,使其更加贴合实际,非常有效地提高了预测的精度.

4) 最后,将优化后的GM(1,1)模型应用于太原市旅游人数的预测研究中,并用现实问题验证了优化后的GM(1,1)模型更具有实用性和精确性,同时也为该领域的预测研究提供了一种新的解决方法.

猜你喜欢
原始数据太原市算子
太原市为农村寄递物流补“短板”
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
太原市61个村要建污水处理设施严禁直排入河
受特定变化趋势限制的传感器数据处理方法研究
太原市六家药茶企业获省级授权
Domestication or Foreignization:A Cultural Choice
QK空间上的叠加算子
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
对物理实验测量仪器读数的思考
奇怪的雨伞