宋国鹏 张述清 朱大明 阮理念
摘 要:对于昆明市人口呈不均匀的增长趋势,传统的灰色预测方法并不能取得很好的预测效果。将小波变换与DGM(2,1)模型相结合,利用小波变换去除原始序列中的噪声,将非光滑的原始序列转化为相对光滑的新序列,然后通过DGM(2,1)模型对新序列进行预测,可以得到较为满意的预测效果。以2006—2014年的昆明市人口数据为基础,预测2015—2019年5年昆明市人口数据,并和传统GM(1,1)模型、DGM(2,1)模型进行对比。结果表明:小波DGM(2,1)模型的平均绝对百分比误差为0.15%,DGM(2,1)模型为0.79%, GM(1,1)模型为0.96%,小波DGM(2,1)模型精度高于DGM(2,1)模型和GM(1,1)模型;小波DGM(2,1)模型的均方根误差与平均绝对误差都低于GM(1,1)模型和DGM(2,1)模型。由此,以2006—2019年昆明市人口数据作为原始序列样本,用小波DGM(2,1)模型预测2025、2035年人口为723.07万人、766.56万人。
关键词:小波变换;DGM(2,1);预测;人口增长
中图分类号:N941.5;C924.24
文献标志码:A
人口问题一直以来都是影响城市发展与国土空间格局的关键因素。随着人口数量的不断增长,从时间序列上对大中型城市人口建立预测模型,掌握未来城市人口的变化规律,识别未来人口空间变化的基本趋势、合理的人口结构与空间分布是大中型城市实现可持续发展的重要保障之一。同时,用来满足国土空间规划编制,分析2025、2035年城镇体系的优化、新型城镇化发展过程、城镇化格局的变化趋势,研究人口空间变化与城镇建设的关系,对于调控各类空间资源和城镇体系结构都发挥着重要的作用。
关于人口的预测问题,近些年来,国内学者利用不同的方法和模型进行研究。戴涛明等[1]基于灰色GM(1,1)模型法自身的特点,模型不需要大量的样本数据即可进行小样本数据的短期人口预测,非常适合于小样本,信息不充分,具有模糊性的系统。黄秋生等[2]采用Leslie矩阵预测模型,在预测人口精度较好的同时预测变量更加规范。石贤贤[3] 认为Logistic人口增长模型比较适用于样本量非常大的情况,模型没有考虑年龄结构,预测效果不佳,且人口出现负增长不能预测。王英伟等[4]认为差分自回归移动平均(autoregressive integrated moving average,ARIMA)模型通常以灵活和简单被应用在时间序列预测,但传统的时间序列预测是线性模型,现实中的时间序列预测通常是非线性,因此存在一定的局限性。张姝玮等[5]利用ARIMA模型不依赖外部变量,能够在一定程度上克服因考虑因素不全面而影响模型精度不足的问题。张浩等[6]基于BP神经网络具有逼近复杂函数的良好能力,建立的模型在产量预测方面得到广泛的应用。总体来看,这些模型和方法各有优势,同时也存在相应的不足。
小波变换(wavelet transform,WT)是一种新的变换分析方法[7],从本质上来说,是用小波函数通过一定的数学方法近似地表达某一信号。它继承了傅里叶变换的优点并克服了其缺点,具有多分辨率的特性,可对信号的频域和时域进行局部化分析[8],在滤波方向对信号的处理也能发挥出一定的作用,应用于诸多领域。
灰色模型(grey model,GM)最初由邓聚龙教授提出,并在此基础上发展出很多模型[9-11]。其中,由于 GM(1,1)模型对单调曲线的拟合具有一定的局限性,由此通过一定数学方法的改进生成GM(2,1),能动态反映单调的、非单调的等多种复杂情形。同时,GM (2,1)模型还考虑了原始时间序列的导数变化对其影响,因此特别适合变化趋势不太规律的时间序列的预测[12]。DGM(2,1) 模型是其离散形式,对于处理原始信号的动荡性效果更好。
本文针对连续时间序列的人口数据,采用小波DGM(2,1)模型,使用去噪后新的时间序列样本数据,通过DGM(2,1)模型预测2015—2019年5年人口数据,提高了预测的精度,最后预测了2020—2035年昆明市人口数据。
1 小波DGM(2,1)模型
小波DGM(2,1)模型的基本思想就是将小波变换与DGM(2,1)模型组合[12]。通过对非平稳的原始序列分解与重构,生成新的时间序列样本,使非平稳的时间序列变得相对平稳。以重构的新时间序列数据为建模的基础,利用DGM(2,1)模型对原始时间序列样本做出预测,从而达到提高预测精度的目的。
1.1 小波变换与去噪原理
小波变换是一种能够提供一个随频率改变的时域窗口和频域窗口,具备了局部分析与细化的能力[8,13],其中一个主要优势是窗口的大小不随频率变化而变化。它的基本思路可以理解为通过滤波器运用卷积的数学方法将原始序列分解为两种分量,即高频信号(细节部分)与低频信号(逼近部分)。设原始信号f(t)分解为逼近部分a1和细节部分d1,对逼近部分进行再一次分解,a1分解为a2和d2,ai分解为ai+1和di+1,同理,an-1分解为an和dn,则原始信号为
f(t)=a1+a2+…+an+d1+d2+…+dn(1)
一般来说,随着细节部分di中的i不断降低,信号中所包含的噪声信号也随之增加,即层次最低的细节部分往往包含的噪声信号最高。通过对分解信号的重构,可以消除低层细节部分的噪声,较好地保持原始信号特点。
原始信号f(t)一般可以分为连续和离散两种。现实中的原始信号f(t)多数为离散型,连续小波进行离散化操作称为离散小波变换,则f(t)的连续小波变换公式为
Wf(a,τ)=a-12∫+∞-∞f(t)ψt-τadt,a>0,τ∈r(2)
式中: f(a,τ)為变量函数,a为尺度因子;t为变量函数中的自变量;τ为平移因子;ψ(·)为子小波函数。
将a、τ进行离散化,则f(t)的离散小波变换公式为
Ψj,k(t)=a-j2ψ(2-jt-k)(3)
W(j,k)=∫+∞-∞f(t)ψj,k(t)dt(4)
式中:a=2j;τ=k×2j;Ψj,k(t)为离散小波函数;Wj,k为离散小波变换;ψ*(·)为ψ(·)的共轭。
小波去噪的实质是消除原始信号中的噪声。通过对原始信号多层分解为细节部分和逼近部分,一般来说,随着逼近部分ai中的i不断升高,逼近部分越接近原始信号 [12,14-15],即最高层的近似部分最能表达原始信号。设原始信号的分解层次为n,低频部分为a1,a2,…,an,高频部分为d1,d2,…,dn,则重构的信号为
f^(t)=an+di+di+1+…+dn(5)
式中di取决于原始信号去噪的精度。
1.2 DGM(2,1)模型
灰色系统以“部分信息已知,部分信息未知”的“小样本和贫信息”作为系统研究对象 [16-17]。灰色模型是对系统内部各个因素之间差异的识别,从原始序列中根据某些规则生成具有一定规律与原始序列相接近的序列,建立微分方程,预测序列的大致发展趋势和走向,为事物的未来做出相应的措施,发现事物未来的价值。
设原始非负序列为
X(0)(k)={x(0)(1),x(0)(2),…,x(0)(n)},k=1,2,…,n
X(0)的1-AGO序列X(0)(k)和1-IAGO序列a(1)X(0)(k)为
X(1)(k)={x(1)(1),x(1)(2),…,x(1)(n)}
其中
X(1)=∑ki=1x(0)(i),k=1,2,…,n
a(1)X(0)(k)={a(1)x(0)(1),a(1)x(0)(2),…,a(1)x(0)(n)},k=1,2,…,n
其中
a(1)X(0)(k)=x(0)(k)-x(0)(k-1),k=2,3,…,n
则
a(1)X(0)(k)+aX(0)(k)=b(6)
为DGM(2,1)模型[18],式中a、b分别为发展系数和灰色作用量,其中白化方程为
d2x(1)dt2+adx(1)dt=b(7)
若A^=[a,b]T为参数列,X(0),a(1)X(0)满足式(6)(7),则 DGM(2,1)模型中的参数a,b的最小二乘法估计满足:
A^=[a,b]T=(BTB)-1Y(8)
其中
B=-x(0)(2)1
-x(0)(2)1
-x(0)(2)1,Y=αx(0)(2)αx(0)(3) αx(0)(n)
则白化方程的响应式为
x^(1)(k+1)=ba2-x(0)(1)ae-ak+ba(k+1)+x(0)(1)-ba1+aa(9)
通过一次累减还原,原始序列第k+1期的预测值可以表达为
X^(0)(k+1)=X^(1)(k+1)-X^(1)(k),k=1,2,…,n(10)
2 昆明市人口的预测
2006—2019年昆明市人口数据统计(数据来源为云南省统计局)见表1。由表1可见:昆明市人口数量整体逐渐上升,呈现不均匀波动增长态势,因此运用小波DGM(2,1)模型比较适合。
本文采用平均绝对百分比误差(mean absolute percentage error,MAPE)、均方根误差(root mean square error,RMSE)和平均绝对误差(mean absolute eror,MAE) 3个性能度量指标对模型的预测值与实际值进行评估[15,18]。评价指标为实际值与预测值之间的偏差,偏差值越小说明预测值精度越高。
2.1 GM(1,1)模型预测
设原始人口数量序列为X(0)(k),对X(0)(k)通过一定的数学方法变换获得X(1)(k),以X(1)(k)建立GM(1,1)模型,得到参数发展系数a和灰色作用量b的估计值为
A^=a^=-0.010 2
b^=609.949 0
则白化方程的响应式为
x^(1)(k+1)=60 414.121 569e0.001 02k-59 798.921 569
以2006—2014年人口数据建模,对序列做一次累减,通过GM(1,1)模型预测2015—2019年的人口数量。
2.2 DGM(2,1)模型
原理同2.1节,建立DGM(2,1)模型,得到參数a和b的估计值为
A^=a^=-0.021 9
b^=-8.129 8
则白化方程的响应式为
x^(1)(k+1)=371.223 744(k+1)+11 140.468 3e0.021 9k-10 896.492 04
以2006—2014年人口数据建模,对序列做一次累减,通过DGM(2,1)模型预测2015—2019年的人口数量。
2.3 小波DGM(2,1)模型
采用db小波,运用Mallat算法,进行5层分解,消失矩为6,得到各层的高频细节部分为d1, d2, d3, d4, d5;各层的低频逼近部分为a1, a2, a3, a4, a5。高频信号分解结果如图1所示。
从图1可以看出,小波系数d1和 d2的曲线波动幅度比较大,说明细节部分d1和 d2存在噪声。对于信号的重构,细节部分d1, d2所包含的噪声所占比例最高,需要去除;一般情况来说,逼近部分a5与原始信号最为接近,最能表达原始信号,因此选用a5和d3, d4, d5作为重构信号。重构信号的公式为
x^(0)(k)=a5+d3+d4+d5(11)
重建信号的结果为
X^(0)(k)={614.431 5,618.128 1,624.909 0,632.693 3,640.722 3,647.213 8,652.457 0,657.850 8,661.741 3}
小波去噪的信号与原始信号对比结果如图2所示。从图2可以看出,原始信号波动起伏比较明显,运用DGM(2,1)模型去噪之后的信号较为光滑,说明去噪效果较好。
以x^(0)(k)作为新的原始时间序列,利用DGM(2,1)模型进行预测,得到参数估计值发展系数a和灰色作用量b为
A^=a^=0.019 8
b^=18.616 6
则白化方程的响应式为
x^(1)(k)=940.232 323 2(k+1)+16 454.587 03e0.019 8k-16 780.387 86
以2006—2014年人口為建模数据,小波分析去除噪声,然后进行一次累减,预测2015—2019年的人口数量。3种模型2015—2019 年的人口预测值及3种误差评价指标,分别如表 2、3、4所示。
从表2可知,小波DGM(2,1)模型的平均绝对百分比误差为0.15%,GM(1,1)模型为0.96%,DGM(2,1)模型为0.79%。由此可知,小波DGM(2,1)模型的误差指标经对比分析低于其他两种模型,说明模型组合的精度相比其他两种模型得到了提高。从表3可以看出,小波DGM(2,1)模型的均方根误差为2.80,低于GM(1,1)模型的6.67和DGM(2,1)模型的5.50。从表4也可以看出,小波DGM(2,1)模型的平均绝对误差为2.62,低于GM(1,1)模型的6.52和DGM(2,1)模型的5.35。从3项评价指标对比可以看出,小波DGM(2,1)模型的预测误差均优于GM(1,1)模型和DGM(2,1)模型,表明小波DGM(2,1)模型的有效性优于另外两种模型。利用软件绘制3种模型的预测人口曲线,如图3所示。由图3可以看出,小波DGM(2,1)模型的人口预测值曲线比GM(1,1)模型、DGM(2,1)模型更接近真实人口数据曲线。
2.4 鲁棒性分析
为了检验不同地区的人口数量变化对小波DGM(2,1)模型鲁棒性的影响,验证小波DGM(2,1)模型在不同地区仍然能够具有较高的预测精度,本文选取上海市2006—2019年人口数据作为验证数据集。表5为上海市人口数据在3种模型上的预测误差。从表5可以看出:小波DGM(2,1)模型的平均绝对百分比误差为0.07%,低于GM(1,1)模型和DGM(2,1)模型的0.74%、0.15%;就均方根误差而言,小波DGM(2,1)模型为3.04万人,低于另外两种模型的11.40万人和4.02万人;小波DGM(2,1)模型的平均绝对误差为2.74万人,低于另外两种模型的10.74万人和3.48万人。因此,3种模型在预测昆明市和上海市人口中,小波DGM(2,1)模型的评估指标均低于传统的GM(1,1)模型和DGM(2,1)模型,其能够较好地预测城市人口的变化,在鲁棒性上也有不错的表现,具有较好的稳定性。
本文以2006—2019年共14年昆明市人口原始序列数据为基础,利用小波DGM(2,1)模型预测2020—2035年昆明市的人口数量,其中,2025、2035年的人口数量分别为723.07万、766.56万,见表6。
3 结语
针对昆明市时间序列人口数据呈不均匀增长趋势,传统的GM(1,1)模型及DGM(2,1)模型对不均匀增长趋势的人口序列预测效果并不明显,而小波变换消除原始信号中的无用噪声可使其更加光滑,本文将小波变换与DGM(2,1)模型相结合,预测昆明市人口数量。通过和GM(1,1)模型、DGM(2,1)模型对比,小波DGM(2,1)模型的去噪效果、鲁棒性均优于GM(1,1)模型和DGM(2,1)模型,在昆明市人口数量预测中取得较好的效果。人口规模是各类总体规划编制的核心问题之一,因此,小波DGM(2,1)模型不但可以预测未来人口数量的变化趋势,而且从人口规模的时间演变研究与城镇建设的关系出发,还可以为国土空间规划编制中的城镇体系、新型城镇化与城镇演变格局提供积极的作用。
参考文献:
[1]戴涛明, 甄天民, 宋奎勐. 基于GM(1,1)灰色预测模型的山东省公立医院医疗费用分析及预测[J]. 卫生软科学, 2021, 35(2): 51-54.
[2] 黄秋生, 汤琼. 基于Leslie矩阵模型的湖南省人口老龄化预测分析[J]. 河北工程大学学报(社会科学版), 2020, 37(4):28-34.
[3] 石贤贤. 北京市人口预测研究综述[J]. 现代经济信息, 2019(16): 490-493.
[4] 王英伟, 马树才. 基于ARIMA和LSTM混合模型的时间序列预测[J]. 计算机应用与软件, 2021, 38(2): 291-298.
[5] 张姝玮, 郭忠印, 陈立辉. 基于自回归求积移动平均的制动器温度预测方法[J]. 吉林大学学报(工学版), 2020, 50(6): 2080-2086.
[6] 张浩, 王国伟, 苑超, 等. 基于AIGA-BP神经网络的粮食产量预测研究[J]. 中国农机化学报, 2016, 37(6): 205-209.
[7] 蒋清月. 基于模型预测分析的电机节能控制研究[D]. 哈尔滨: 哈尔滨工业大学, 2017.
[8] 韦春苗, 徐岩, 李媛. 基于小波变换的迭代融合去雾算法[J/OL]. 激光与光电子学进展: 1-16[2021-05-12]. http://kns.cnki.net/kcms/detail/31.1690.tn.20201021.0955.008.html.
[9] 章曉英, 李阳. 重庆市碳排放趋势及产业关联性分析: 基于灰色理论的实证研究[J]. 重庆理工大学学报(社会科学), 2015, 29(4): 21-27.
[10]杨国华, 颜艳, 杨慧中. GM(1,1)灰色预测模型的改进与应用[J]. 南京理工大学学报, 2020, 44(5): 575-582.
[11]舒服华, 张新贵. 小波变换-DGM(2,1)预测全国税收收入[J]. 海关与经贸研究, 2019, 40(2): 87-99.
[12]田会方, 舒服华. 小波变换和DGM(2,1)预测自然时效ZL305A铝合金的强度[J]. 特种铸造及有色合金, 2018, 38(8): 821-824.
[13]徐妍琰, 孟建军, 张宇彤, 等. 基于小波分析的脉搏采集信号处理研究[J]. 工业控制计算机, 2020, 33(12): 63-64, 67.
[14]舒服华. 基于小波DGM(2,1)模型的我国进出口贸易额预测[J]. 保定学院学报, 2018, 31(3): 17-23.
[15]田睿, 董绪荣. 小波分解与Prophet框架融合的电离层VTEC预报模型[J]. 系统工程与电子技术, 2021, 43(3): 610-622.
[16]刘思峰, 邓聚龙. GM(1,1)模型的适用范围[J]. 系统工程理论与实践, 2000(5): 121-124.
[17]杨华龙, 刘金霞, 郑斌. 灰色预测GM(1,1)模型的改进及应用[J]. 数学的实践与认识, 2011, 41(23): 39-46.
[18]杨雪, 郭金海, 申蓓, 等. 分数阶反向累加DGM(2,1)模型在低渗透油井产能预测中的应用[J]. 数学的实践与认识, 2020, 50(16): 292-297.
(责任编辑:周晓南)
Application of Wavelet Transform and DGM (2,1) Model
in Population Prediction of Kunming City
SONG Guopeng1, ZHANG Shuqing*1,2, ZHU Daming1, RUAN Linian1
(1.School of Land and Resources Engineering, Kunming University of Science and Technology, Kunming 650093, China; 2.Yunnan Institute of Land and Resources Planning and Design, Kunming 650216, China)
Abstract:
For the uneven growth trend of Kunming population, the traditional grey prediction method can not achieve good prediction results. The method of combining wavelet transform with DGM (2,1)model can get a satisfactory prediction result. The noise in the original sequence is removed by wavelet transform, and the non-smooth original sequence is transformed into a relatively smooth new sequence. Then the new sequence of removing noise by wavelet transform is predicted by DGM (2,1) model. Based on the population data of Kunming from 2006 to 2014, the population data of Kunming from 2015 to 2019 are predicted and compared with grey GM (1,1) model and DGM (2,1) model.The results show that the average absolute percentage error of wavelet DGM (2,1) model is 0.15%, DGM (2,1) model is 0.79%, GM (1,1) model is 0.96%, the accuracy of wavelet DGM (2,1) model is higher than that of DGM (2,1) model and GM (1,1) model; The root mean square error and average absolute error of the wavelet DGM (2,1) model are lower than those of the grey GM (1,1) model and DGM (2,1) model. Taking the population of Kunming from 2006 to 2019 as the original sequence sample, the wavelet DGM (2,1) model is used to predict the population of 7.230 7 million and 7.665 6 million in 2025 and 2035.
Key words:
wavelet transform; DGM(2,1); prediction; population growth
1428500520255