陈友余
(湖南财政经济学院 工商管理系,湖南 长沙410205)
变起点GM(1,1)马尔可夫链模型在我国农村人均纯收入预测中的应用
陈友余
(湖南财政经济学院 工商管理系,湖南 长沙410205)
以扩展我国农村人均纯收入预测方法和提高预测精度为目标,采用变起点模型对传统GM(1,1)模型进行改进,通过建立一个预测模型群,从中挑选精度最高、拟合程度最好的模型作为后续的预测模型,通过实际应用的确提高了预测精度和拟合程度;然后在此基础上对后续的预测模型的残差进行分类,计算转移概率矩阵,从而得出由区间和概率组成的预测范围,较大的增强了预测的可操作性和可信性。
GM(1,1);变起点GM(1,1);马尔科夫链;农村人均纯收入
农业是国民经济基础,农民问题是“三农”工作的重心。农村人均纯收入呈现持续增长的同时,城乡收入差距较大,影响和制约农民收入增长的因素仍然存在。基于此,本文依据2000~2010年农村人均纯收入数据,运用改进的灰色马尔科夫链模型对我国农村人均纯收入进行预测。
灰色系统理论是邓聚龙教授首次提出的,解决了学术界一直无人解决的微积分方程建模问题。其研究对象是“部分信息已知,部分信息未知”的小样本、贫信息的不确定性系统,具有建模过程简单,建模表达式简洁等优点,被广泛应用于经济、生物、农业、医药、水利等领域,但其模型有一定的缺陷,不少学者对其进行了一定程度的改进,残差GM(1,1)模型在实际应用广泛。本文在传统GM(1,1)模型的基础上采用变起点方法进行改进,建立了一个预测群,从预测群中挑选最优的模型用于预测,这种方法一方面提高了预测精度和拟合程度,一方面增强了预测的可操作性和实用性。
在实际预测建模中,不一定用原始序列中全部的数据来建模。在原始序列中有规律挑选一部分数据(数据至少为4个),就可建立一个模型。为了提高传统GM(1,1)模型的预测精度和拟合程度,建模数据中应为包含x(0)在内的一个等时距序列,基于这种思想,以x(0)为建模取值的终点,从后往前不断取值,可以建立一个预测模型群,从预测模型群中挑选最优的模型用于以后的预测,其建模和求解如下:
(1)给定原始时间序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),其中n为原始数据个数;
(2)用x(0)=(x(0)(1),x(0)(2),…,x(0)(n))建立的GM(1,1)模型为全部数据模型;用 x(0)=(x(0)(i),x(0)(i+1),…,x(0)(n))(i叟2)建立的GM(1,1)模型为部分数据模型;
(3)由于最短时间序列中数据至少为4个,于是可建立一个4维子序列:(x(0)(n-3),x(0)(n-2),x(0)(n-1),x(0)(n)),依次往下,最后可建立一个n维子序列(即原时间序列),总共可建立n-3个子序列;
(4)对各子序列按传统GM(1,1)模型方法进行预测,并进行精度检验和拟合度检验,从模型群中挑选最优的模型应用于预测。
从变起点GM(1,1)模型得到的预测结果,可通过马尔可夫链方法对残差进行分类,精确估计每类情况可能出现的概率,得出由区间和概率组成的预测范围,从而较大的增强了预测的可操作性,更有利于保证预测的可信性。
(一)马尔可夫链与K步转移概率矩阵定义
设随机过程{x(i),i∈I}的状态空间S为R中的可列集,对应I中任意参数i1<i2<i3,以及使P{x(i1)=m1,x(i2)=m2,…,x(in-1)=mn-1}>0成立的S中的任意状态 m1,m2,…,mn,均有P{x(in)=mn|x(i1)=m1,x(i2)=m2,…,x(in-1)=mn-1}=P{x(in)=mn|x(in-1)= mn-1},则称{x(i),i∈I}为马尔可夫链,并记:I,j∈S,表示在时刻m系统处于状态i条件下,在时刻m+k系统处于状态j的概率,将依次排序,可得m×n阶转移概率矩阵:,该矩阵称为马尔可夫链的K步转移概率矩阵,其中P(k)ij叟0
(二)划分状态,计算转移概率
划分状态是将数据数列划分成若干个大致均等的区间范围,其中任一状态区间Ei=[E1i,E2i],其中i=1,2,…,n,式中E1i,E2i为状态边界。如果数据序列由状态Ei转移到状态Ej的次数共为mij次,状态Ei出现的次数共为mi次,则可计算出此时的转移概率
(三)根据转移概率矩阵进行预测
根据状态Ei,利用状态转移概率矩阵,估计未来转向状态Ej的可能性,即若目前预测对象处于状态就描述了目前状态Ei在未来转向状态Ej的可能性,按最大概率原则,选择Pij中最大者对应的状态为预测结果,即当Max={Pi1,Pi2,…,Pin}=Pij(i=1,2,…,n)时,可以预测下一步系统将转向状态Ej。或是若知道该时间所处的状态向量为A(t)=(a1(t),a2(t),…,ai(t)),则时刻A(t+m)=A(t+m-1),根据A(t+m)可以为预测者提供预测依据。当比较复杂或是要求精确结果时我们往往选用后一种计算方式。
21世纪开局以来,我国农村人均纯收入见下表,数据均来至于《全国国民经济和社会发展统计公报》。
表1 :我国2000~2010年农村人均纯收入(单位:元)
(一)变起点GM(1,1)模型
由于n=11,首先可建立8个子序列;然后对各子序列按传统GM(1,1)模型方法进行预测,得各模型对应的离散响应函数,计算平均相对误差、后验差比值和小误差频率,计算结果均见表2;最后对各子模型进行精度比较和拟合程度比较,选择8维子序列作为预测模型。
(二)改进的灰色马尔科夫链模型
首先,将8维子序列的残差划分为5种状态:状态1:呈明显高估状态,即差额与实际值的比例低于-5%;状态2:呈高估状态,即差额与实际值的比例在-5%到-2%之间;状态3:较为准确,即差额与实际值的比例的绝对值在2%以内;状态4:呈低估状态,即差额与实际值的比例在2%到5%之间;状态5:呈明显低估状态,即差额与实际值的比例超过5%。
其次,计算我国农村人均纯收入年状态表,得到转移概率矩阵。由于状态1与状态5没有出现,可将55阶转移概率矩阵简化为33阶转移概率矩阵,得最后,根据转移概率矩阵求出相应的状态向量,并进行预测,从而得到由区间和概率组成的预测范围。
本文采用变起点对传统GM(1,1)模型进行改进,建立一个预测模型群,从预测模型群中结合精度要求和拟合程度要求挑选了最优的8维子序列作为后续的预测模型,然后在此基础上将8维子序列的残差分为了5类,计算了相应的转移概率矩阵,从而得到由区间和概率组成的预测范围。这种方法既提高了预测精度和拟合程度,又增强了预测的可操作性和实用性。
[1]邓聚龙.灰色系统理论的GM模型[J].模糊数学,1985,(2):23-32.
[2]张勇军,袁德富.电力系统可靠性原始参数的优化GM(1,1)预测[J].华南理工大学学报(自然科学版),2009,37(11):50-55.
[3]崔冬冬,陈建康,吴震宇,程黎明.大坝变形度的不等维加权动态GM(1,1)预测模型[J].长江科学院院报,2011,28(6):5-9.
[4]李晓蕾,刘睿,田永瑞,谢炳科.基于灰色预测的空间多点残差修正模型研究[J].大地测量与地球动力学,2010,30(5):125-128.
[5]邓聚龙.灰色系统基本方法[M].华中科技大学出版社,2005.42-55.