优化的灰色-马尔可夫模型在呼伦贝尔市年降水量预测中的应用

2021-09-14 09:10张志莉
湖北农业科学 2021年16期
关键词:呼伦贝尔市马尔可夫原始数据

张志莉

(呼伦贝尔学院数学与统计学院,内蒙古 呼伦贝尔 021008)

呼伦贝尔市是内蒙古自治区下辖的一个地级市,因其境内的呼伦湖和贝尔湖而得名。其自然地理位置处于东经115°31′—126°04′、北纬47°05′—53°20′。东邻黑龙江省,西、北与蒙古国、俄罗斯相接壤,是中、俄、蒙三国的交界地带。呼伦贝尔市总面积26.2万km2,主要由草原、耕地以及森林构成。其境内的呼伦贝尔草原总面积为993万hm2,是世界四大草原之一,也是中国北方保存最完好的草原牧区,“水草丰美”被誉为中国草原上的明珠,呼伦贝尔草原既是中国畜牧业生产的重要基地,也是东北及西部地区的天然绿色生态屏障,具有较高的经济价值,对生态安全格局维护也具有重要的意义。呼伦贝尔市是以放牧、刈割为主要利用方式的草原生态系统,对气候变化非常敏感,特别是降水量对于呼伦贝尔市畜牧业、农业、旅游业以及生态发展都起着举足轻重的作用。因此,科学分析呼伦贝尔市年降水量的变化和趋势,预测未来年降水量变化,从而为相关部门制定相关政策提供重要的科学参考和决策依据。

1 呼伦贝尔市年降水量的数据分析

呼伦贝尔市位于北半球,地处温带北部,是典型的大陆性气候。冬季漫长寒冷,夏季短促温凉,春季风大干燥,秋季气温降幅大、霜冻早。年度温差、昼夜温差大,日照丰富。降水期多集中在7—8月,降水量变化率大,分布不均匀,年际变化大。春、冬两季各地降水量通常为40~80 mm,约占年降水量的15%。夏季降水期分布集中、降水量相对较多:大部分地区达200~300 mm,占年降水量的70%左右。秋季降水量逐渐减少,分布趋势为农区60~80 mm、林区50~80 mm、牧区30~50 mm,各地平均降水量为40~70 mm[1]。根据《呼伦贝尔市统计年鉴》(2018年)的统计数据,呼伦贝尔市年降水量在2002—2016年的15年时间里呈振荡变化。2004年降水量明显减少,年降水量下降到300 mm以下,而2005年降水量明显增多,增幅达28%。此后,在2007年降水量为历年最少,仅为274.92 mm。2008—2016年呼伦贝尔市年降水量呈上升-下降-上升的反复变化趋势(图1)。2013年和2016年降水量突破630 mm。可见,呼伦贝尔市年降水量数据随机性较强,其内在规律性难以把握。

图1 2002—2016年呼伦贝尔市年降水量变化趋势

2 呼伦贝尔市年降水量的预测模型分析

由于降水量的影响因素多而复杂,因此对降水量的预测大多采用随机模型的方法,本研究分别选取单一的滑动传统灰色模型、滑动无偏灰色模型和优化的灰色-马尔可夫组合模型对呼伦贝尔市年降水量进行预测研究。

2.1 灰色预测模型

灰色系统理论是由中国学者邓聚龙教授在1982年首先提出,是一种研究少数据、贫信息不确定性问题的新方法。该理论是以“小样本”“贫信息”不确定性系统为研究对象,主要通过对部分已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述,并进而实现对其未来变化的定量预测[2]。目前使用最广泛的灰色预测模型就是关于数列预测的GM(1,1)模型,是指含有一个变量、一阶微分的预测模型。它是基于随机原始时间序列,经按时间累加后所形成的新的时间序列所呈现的规律性,该模型可用一阶线性微分方程的解来逼近[3]。经证明,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测结果较为理想。参考刘思峰等[4]研究GM(1,1)模型的基本形式及其适用范围,并结合呼伦贝尔市年降水量原始数据波动较大、呈反复振荡的特点,选取均值GM(1,1)模型进行预测。

2.1.1 构建均值GM(1,1)模型 由原始数据建立均值GM(1,1)模型的主要步骤如下。

1)光滑度检验[5],在实际操作中,数据序列是否满足光滑条件,是检验能否对一个序列建立灰色模型的重要准则。

2)构造累加生成序列。

3)建立灰色模型的微分方程形式,即白化微分方程。

式中,a,b为未知待定参数。a是发展灰数,b是内生控制灰数[6]。当发展灰数a的绝对值越大时,灰色预测模型的模拟误差也越大,一般有以下结论[7]:当,预测模型适合中长期预测;0.3<预测模型适合短期预测进行短期预测需谨慎;,预测模型需采取残差修正;当|,不宜使用该模型进行预测。

4)计算发展灰数a与内生控制灰数b。设可以采用最小二乘法求解。

式中,B、Yn分别为

5)建立累加生成数据序列模型。

6)累减还原,建立原始数据序列模型。

2.1.2 三点滑动GM(1,1)模型 当原始数据无法达到光滑条件,需对原始数据X(0)= [X(0)(1),X(0)(2) ,… ,X(0)(n)]进行加权滑动平均处理,再建立灰色模型,形成滑动灰色模型[8]。根据原始数据的特点,经比较,采用三点进行滑动加权[9],即

2.1.3 无偏GM(1,1)模型 为消除传统灰色模型本身固有的灰色偏差,吉培荣等[10]提出了无偏灰色模型,该模型不仅性能优于传统灰色预测模型,且计算速度更快(因为模型无需累减还原),因此,其适用范围更广。

依据原始数据序列X(0)=[(X(0)(1) ,X(0)(2) ,… ,X(0)(n)],求解出灰色参数a、b,通过a、b计算出无偏灰色参数A、B。其中

因此,可得无偏灰色模型[11]。

2.1.4 模型检验[12]通常对建立的模型进行残差、后验差以及关联度检验,预测模型精度检验等级见表1。

表1 模型预测精度检验等级划分

2.2 模型求解及分析

以2002—2016年呼伦贝尔市年降水量数据为样本数据,发现不满足数据光滑性条件,表明原始数据变化大,不适合建立灰色模型。为提高原始数据序列的光滑性,减少极端值对预测结果的影响,因此,对呼伦贝尔市年降水量原始数据序列进行三点滑动加权处理。当k>3时,数据符合准光滑序列条件,如表2所示,可以建立呼伦贝尔市年降水量的灰色模型。

表2 光滑性检验

由DPS数据处理系统[13],得到C=0.4998,P=1.00,说明模型拟合效果很好。

得到a=-0.037225,b=287.222 4,说明可以应用该模型对呼伦贝尔市年降水量进行中长期预测。同时根据前述计算公式,构建灰色GM(1,1)预测模型,进一步累减还原,得到预测模型。

由灰色参数求解出无偏灰色模型中参数A、B,得到滑动无偏预测模型。

滑动GM(1,1)和滑动无偏GM(1,1)模型预测结果见表3。

表3 2002—2016呼伦贝尔市年降水量预测值及相对误差

经过计算,可以得到2种预测模型的检验结果,如表4所示。由表4可知,滑动无偏GM(1,1)模型预测精度优于滑动GM(1,1)模型,更适合于呼伦贝尔市年降水量的预测。因此,采用滑动无偏GM(1,1)模型得到未来5年(2017—2021年)呼伦贝尔 市 年 降 水 量,分 别 为512.13、531.59、551.80、572.77、594.54 mm。

表4 滑动GM(1,1)模型和滑动无偏GM(1,1)模型预测精度比较

根据滑动无偏GM(1,1)模型,得到2017年呼伦贝尔市年降雨量的预测值为512.13 mm。根据《呼伦贝尔市统计年鉴》(2018年),呼伦贝尔市2017年降水量的实际值为274.92 mm。相对误差非常高,达86.28%,这说明由于降水量受多种因素影响,其数据具有很强的随机性和波动性,这是无法避免的客观现实。如2017年呼伦贝尔市年降水量是样本数据中的极端值(16个数据中的最小值);其次,原始数据变化范围过大时,灰色模型存在预测精度低的问题;最后,预测模型通过检验,但不代表预测效果好,即使灰色预测模型的拟合精度较高,也未必能保证预测值一定可靠、有效。

由于灰色预测模型总是用指数方程拟合,对隐含指数规律的原始序列预测非常理想,但对于起伏性、无序性较大的原始数据序列,其预测结果粗糙,误差较大,而且数据的累加生成和累减还原更加大了模型的误差。因此,本研究对前述的预测模型加以优化,尝试组合预测模型方法,以提高预测模型的预测精度。

3 基于滑动无偏残差修正的灰色-马尔可夫模型的呼伦贝尔市年降水量预测

3.1 构建灰色残差修正模型

由2002-2017年呼伦贝尔市年降水量实际值与预测值的相对误差(表5)可以看出,由于原始数据波动较大导致预测模拟误差较大。其平均相对误差为18.47,其精度不到82%,因此需要对原来的模型进行修正,以提高模型的预测精度。结合文献[4]中的方法,采用残差模型进行修正,取k0=9,得残差尾 段ε0=(13.20,10.13,2.48,30.19,1.21,30.71,24.00),建立GM(1,1)模型,并进一步累减还原得到残差修正模型。

尽管残差改进后的灰色方法使得模型的预测效果有了改善,但依旧无法克服灰色模型对非线性数据的不适应性,为了进一步提高模拟精度,对上述的灰色模型应用马尔可夫模型进行改进,建立滑动无偏残差修正的灰色-马尔可夫模型。

3.2 构建灰色残差修正-马尔可夫模型

年降水量的变化过程是一个随机呈上升或下降趋势的非稳定随机过程,呼伦贝尔市年降水量的数据序列符合n阶马尔可夫非平稳随机序列。根据原始数据的真实情况、马尔可夫模型预测方法的应用特点,结合呼伦贝尔市年降水量的灰色预测结果的相对误差,可以划分为5种状态:状态1,过度低估状态,即相对误差x小于-40%,在15年(2002-2016年)中未出现过度低估状态;状态2,低估状态,即相对误差x介于[-40%,-10%),在15年中出现过4年(2003、2013、2014、2016年)低估状态;状态3,较为准确评估状态,即相对误差x介于[-10%,10%),在15年中出现过6年(2002、2005、2008、2009、2011、2012年)较为准确评估状态。状态4,高估状态,相对误差x介于[10%,40%],15年中有5年(2004、2006、2007、2010、2015年)出现高估状态。状态5,过度高估状态,相对误差x大于40%,15年中未出现过这种状态(表5)。

由上述分析,这里只需要研究3个状态,即状态2、状态3、状态4,将每个状态定义为模糊集,并用三角形法构造每个模糊集的隶属函数[14],即

由上述隶属函数,可以得到每点数据的模糊状态向量,根据最大隶属原则确定每点数据所属状态,如表5所示,进而得到2002-2016年呼伦贝尔市年降水量的一步状态转移概率矩阵。

依据马尔可夫预测模型A(n)=A(0)P(n),可以得到2002—2016年的预测状态向量,如表5所示,其中表示系统在时刻n所处的状态概率向量,A(0)为系统在初始时刻所处的状态概率向量,在此即为2016年的状态概率向量[11],由于2016年相对误差为-32.21%,计算得到其状态模糊向量A(0)=(1,0,0),因此

表5 2002—2016年呼伦贝尔市年降水量的状态划分

这说明2017年处于状态4的可能性最大,且年降水量预测高估的概率达67%。进一步应用马尔可夫模型对滑动无偏残差修正的灰色模型进行改进,得到2017年降水量的预测结果:预测中值为423.34 mm,其误差率为53.99%,远小于滑动无偏GM(1,1)的误差率86.28%。此外,可划分为3个预测区间:预测区间1(274.84,354.82),概率为33%;预测区间2(354.82,461.87),概率为0;预测区间3(461.87,632.45),概率为67%。

根据呼伦贝尔市统计年鉴可知,2017年呼伦贝市年降水量为274.92 mm,属于预测区间1。这说明滑动无偏残差修正的灰色-马尔可夫模型的预测准确度和合理性都得到了很大提高,运用该预测模型进行呼伦贝尔市年降水量的预测是可行的,预测结果比较理想。因此,进一步得到2018—2021年各年状态向量(表6)。从表6可以看出,呼伦贝尔市年降水量在2018—2021年所处的状态并不稳定。2018年处于状态3的可能性最大,其概率向量为0.45,即呼伦贝尔市在2018年的年降水量有45%的可能性为准确估计;2019年处于状态3的可能性最大,2020、2021年这2年处于状态4的可能性最大。

表6 2018—2021年呼伦贝尔市年降水量的马尔可夫状态向量

由此,进一步得到灰色-马尔可夫预测模型的结果(表7)。从表7可以看出,由优化的灰色-马尔可夫预测模型得到2018年呼伦贝尔市年降水量的预测中值为474.29 mm,而这一预测值高于实际值的概率达34%,根据2019年《呼伦贝尔市统计年鉴》的数据可知,2018年呼伦贝尔市年降水量的真实值为为449.91 mm,预测值确实高于实际值,再次说明优化的灰色-马尔可夫模型能够较准确地预测呼伦贝尔市年降水量。在未来的3年里,呼伦贝尔市年降水量呈上升趋势。2019年最有可能处于评估较为准确状态和高估状态,概率分别为41%和38%。2020年和2021年最有可能的状态为高估状态,即这2年实际年降水量会低于预测模型预测的结果,可能的概率均为42%。从总体上来看,呼伦贝尔市未来的年降水量较为充沛,这将对呼伦贝尔草原草地生态发展起到积极的促进作用。

表7 模型预测结果

4 小结

对呼伦贝尔市2002—2016年的年降水量进行分析,发现呼伦贝尔市年降水量是一条波浪式变化的曲线。由于年降水量数据随机波动大,趋势变化频繁,因此单一的预测模型难免会导致预测模拟结果误差较大(即使拟合精度很高)。因此,采用组合模型进行预测,并针对数据特点,采取了滑动加权优化、无偏灰色模型改进以及残差序列修正等构建出滑动无偏残差修正的灰色-马尔可夫模型。经过验证,发现该模型在预测拟合度、预测精度方面都比较理想。由于该模型不仅给出预测中值,更能提供预测带,即预测区间,以及落入该区间的可能性大小,使得该模型对于呼伦贝尔市年降水量的常规数据、变化波动大的极端数据(如2017年降水量)均能给出较合理、较可靠的预测结果。

猜你喜欢
呼伦贝尔市马尔可夫原始数据
复兴
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
呼伦贝尔市额尔古纳市卡伦敖包清理
呼伦贝尔市海拉尔区城市绿地系统存在的问题及建议
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
保费随机且带有红利支付的复合马尔可夫二项模型
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测
认知无线网络中基于隐马尔可夫预测的P-CSMA协议
世界经济趋势