陈友余
(湖南财政经济学院,湖南 长沙 410205)
农村人均纯收入是我国全面建设小康社会非常重要的衡量指标之一。我国农村人均纯收入呈现持续缓慢增长态势的同时,农村居民与城镇居民之间、农村农民内部之间的收入差距正不断扩大。基于此,根据我国近十年来的农村人均纯收入数据,运用灰色预测法和马尔科夫链数学方法建立改进的灰色马尔科夫链组合模型进行预测,对农村人均纯收入进行系统分析具有非常重要的现实意义。
灰色预测方法由邓聚龙教授最先提出,其应用微积分理论进行首次建模,用于研究一些灰色系统。灰色系统的特点是一部分信息是能被观察且已知的,但还有一部分信息是未知的[1]。这种预测方法的最大优点在于建模操作过程简单、模型表达式简洁且实用性强,故而已广泛应用于医药、旅游、水利、农业、生物等领域[2-6]。现行灰色预测方法主要应用于平稳序列中,应用范围过于狭隘,为了突破这一瓶颈,一些学者在现有模型的基础上进行了方法上的改进,残差GM(1,1)模型即是其中较为突出的改进方法之一[7-8]。笔者先根据我国十年来的农村人均纯收入数据,建立了传统GM(1,1)模型,然后运用残差改进法中的变起点方式进行改进,建立预测模型,并从中挑选最理想的模型用于后续研究,在此基础上应用马尔科夫链模型对灰色残差进行分类,得到由区间和概率组成的预测范围。这种组合预测方法既提高了预测精度,又能有效增强实践操作性。
灰色传统GM(1,1)模型是对初始的时间序列经过一次累加后生成具有强递增性质的时间序列,然后在此基础上建立一一对应的近似微分方程,以呈现时间序列内在的发展规律。
初始的时间序列表示为:x(0)=[x(0)(1),x(0)(2),…,x(0)(n)],其中n 为初始的时间序列内部数据个数,对x(0)经过一次累加后生成的时间序列表示为:,其中,具有强递增性,i=1,2,…,n。
准光滑性检验主要通过准光滑系数来检验,用p(i+1)表示,当p(i)∈[0,0.5]时满足准光滑条件,通过检验;准指数性检验主要通过准指数性指标来检验,用σi+1表示当σ(i)∈[1,1.5]时满足准指数条件,通过检验。
若x(0)能通过准光滑性检验,x(1)能通过准指数性检验,则灰色传统GM(1,1)的白化微分方程可表示为:,其中,a 为发展过程灰度,b 为灰色影响量,a 与b 均为未知参数;t 表示时间;由于x(1)与不满足平射关系,故白化微分方程无精确解,笔者采用等权数方法计算近似解,即对x(1)采用相邻均值生成一序列,表示为w(1),w(1)= [w(1)(1),w(1)(2),…,w(1)(n)],其中w(1)(i+1)=0.5x(1)(i)+0.5x(1)(i+1)。于是由白化微分方程可变形为灰微分方程,灰微分方程为x(0)(i)+aw(1)(i)=b.
代入灰微分方程x(0)(i)+aw(1)(i)=b,可求出对应的离散响应函数:
对累加的^x(1)(i+1),进行累减还原,得到初始数据的预测值:
(1)逐点检验
逐点检验主要是检验绝对误差[不妨用ε(0)(i)表示]和相对误差[用e(i)表示]。平均相对误差为逐点检验的检验指标,不妨用¯e(i)表示,0.10 为临界点,当(i)≤0.10 时,表明通过检验,¯e(i)越小,精度越高。
(2)后验差比值检验
(3)小误差频率检验
表1 精度检验表
实际应用过程中,不需要应用初始时间序列中的全部数据来建立灰色预测模型。在初始时间序列中有规律的选取部分数据(应大于等于4 个),就可建立一个灰色预测模型。为了改进传统GM(1,1)模型,建模所应用的数据要满足两个条件:第一,时距是相等的,从而使之具备可比性;第二,必须包含x(0)(n),因为最近的时间影响最大。基于此,以数据x(0)(n)为终点,从后往前依次不断选取数据,可以形成一组预测模型,从这组模型中挑选最佳模型应用于后续预测,其方法如下:一是初始时间序列的生成。给定初始时间序列x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),其中n 为初始时间序列中数据的个数。二是模型构建思路。若初始时间序列包含全部数据,则为全数据模型;若初始时间序列包含部分数据,则为部分数据模型。三是模型构建。由于模型中数据至少为4 个,故可建立一个4 维预测模型:[x(0)(n-3),x(0)(n-2),x(0)(n-1),x(0)(n)];由于模型中数据最多为n 个,故可建立一个n 维预测模型(即全数据模型)。通过计算,总共可建立n-3 个预测模型。四是精度检验与拟合度检验。对这n-3 个预测模型按传统灰色预测模型方法进行预测,并对各模型进行检验,从中挑选出最佳的模型用于后续预测。
从变起点灰色预测模型中挑选出最佳模型,应用马尔可夫链方法对这一模型的残差进行分类,通过计算,可精确估计出各类情况出现的概率,从而得出由概率和区间组成的预测范围。可见,这种组合预测方法具有更好的精确度、可操作性和可信性。
设随机过程{x(i),i∈I}的状态空间为S,S 为R 的可列集,对应I 中的任意参数i1<i2<…<in,且满足P{x(i1)=m1,x(i2)=m2,…,x(in-1=mn-1)}>0 成立的S 中的任意状态为m1,m2,…,mn,均有P{x(in)=mn|x(i1)=m1,x(i2)=m2,…,x(in-1)=mn-1}。此时称{x(i1),i∈I}为马尔可夫链,并有:|xm=i},i,j∈s 表示系统处于时刻m 和状态i 这两个条件下,系统在时刻m+k 和状态j 时的概率,将依次排列,可得到m×n 阶转移概率矩阵,不妨用p(k)表示,即该矩阵称为马尔可夫链的K 步转移概率矩阵,其中必大于零且
划分状态是指将数据序列划分成若干个大致相等的区间范围,其中任一状态区间Ei=[E1i,E2i],式中E1i,E2i为状态的临界点。计算数据序列从状态Ei转移到状态Ej的次数,若共有mij次,状态Ei出现的次数若共为mi次,则此时可计算出转移概率对于非平稳随机序列,只要符合马氏链特点,状态的划分就可根据实际情况对数据进行不均等的划分,只要合理即可。
根据计算出的状态转移概率,可形成状态转移矩阵。若状态Ei已知,利用状态转移概率矩阵,可估计出未来转向状态Ej的可能性,即若目前预测对象处于状态Ei,就描述了目前状态Ei转向未来状态Ej的可能性。按最大概率原则,其预测结果即为最大的对应的状态,当Max{pi1,pi2,…,pin}时,可预测系统将转向未来状态Ej,或是若已知时刻t 所处的状态向量为A(t)为[a1(t),a2(t),…,ai(t)],则有时刻A(t+m)=A(t+m-1)。这两种方法均可为预测者提供预测方法,当计算复杂或是对精确结果要求较高时可选用后一种预测方法进行预测。
2000 以来,我国的年均农村人均纯收入水平呈现逐年增长的趋势,见表2。通过改进的灰色模型对以往年份收入水平的检测,可得出最佳模型用以预测未来年度的年均农村人均纯收入。
表2 2000-2010 我国年农村人均纯收入(单位:元)
首先,建立我国农村人均纯收入时间序列,见表3 中x(0)项,同时建立1-AGO 累加序列,见表3 中x(1)。其次,检验x(1)的准光滑性和x(1)的准指数性。当i >2 时,p(i)∈[0,0.5],满足准光滑性要求;当i >2 时,σ(i)∈[1,1.5],满足准指数性要求,见表3 中p(i)及σ(1)(i)项。再次,构造累加权数矩阵B 和常数矩阵Y,见表3 中-w(1)(i)项。再次,应用Excel 中的LINEST 可求出:= -0.1107,=1773.23。接着,将代入灰微分方程x(0)(i)+a w(1)(i)=b,可求出离散响应函数:然后,对)累减还原,得到初始数据的预测值:最后,进行检验。第一步,逐点检验。相对误差e(i)及绝对误差ε(0)(i)见表3,平均相对误差可见,表明预测误差主要集中在0.0043 左右,预测误差的一般水平很低,精度高,能达到一级效果。第二步,后验差比值。经计算,s1=1246.78,s2=可见c <0.35,表明预测误差摆动的幅度小,精度高,能达到一级效果。第三步,小误差频率。经计算,P=1,精度高,能达到一级效果。第四步,拟合度检验。求初始序列与预测序列的初值像(或均值像),笔者算出初值像(x(0)'、^x(0)')和关联系数(ζi),见表4;最后得出拟合度为0.6366,可见能通过检验。
表4 拟合度检验计算过程及结果
综上,我国2000-2010 年农村年人均纯收入时间序列完全能通过以上各项检验,且均达到了一级检验标准,可直接用于后续分析。
由于n=11,故共可建立8 组预测序列,分别为4 维预测序列、5 维预测序列、6 维预测序列、7 维预测序列、8 维预测序列、9 维预测序列、10 维预测序列和11 维预测序列。对各组预测序列按传统灰色预测模型方法进行预测,可以得到各组模型,计算其平均相对误差(¯e(i))、后验差比值(C)、小误差频率(P)、灰色拟合度,结果见表5。同时,对各组预测模型的精度与灰色拟合度进行比较。平均相对误差方面,11 维预测序列达到1 级精度,5 维预测序列达到3 级精度,其余预测序列达到2 级精度,2 级精度由高到低顺序为:精度最高的是4 维预测序列,然后是6 维预测序列、8 维预测序列和9 维预测序列,再接着的是10 维预测序列,最后是7 维预测序列。后验差比值方面,各预测序列均达到了1 级精度,精度由高到低顺序为:9 维预测序列,8 维预测序列,10 维预测序列,6 维预测序列,5 维预测序列,11维预测序列,4 维预测序列,7 维预测序列。小误差频率方面,各预测序列均达到了1 级精度。拟合度检验方面,5 维预测序列及4 维预测序列灰色拟合度没有达到0.60,没有通过拟合度检验。其余均能达到要求,满足条件的预测序列灰色拟合度由高到低顺序为:8 维预测序列,7 维预测序列,10 维预测序列,11 维预测序列,9 维预测序列,6 维预测序列。可见,8 维预测序列为最优选择,故选择8 维预测序列作为预测模型。
表5 变起点GM(1,1)模型计算结果
首先,将我国农村年人均纯收入的8 维预测序列的残差划分为以下5 种状态:
状态1:呈明显高估状态,即差额与初始值之比低于-5%;
状态2:呈高估状态,即差额与初始值之比在-5%到-2%之间;
状态3:较为准确,即差额与初始值的之比的绝对值在2%以内;
状态4:呈低估状态,即差额与初始值之比在2%到5%之间;
状态5:呈明显低估状态,即差额与初始值之比超过5%。
表6 我国农村年人均纯收入状态表
表7 状态转移状况表
表8 基于灰色预测结果的马尔科夫链状态向量表
表9 基于灰色预测结果的马尔科夫链改进预测结果
时间 灰结色预测果预测中值 马尔科夫链预测区间 概率7978.7108-8230.6700 0.152 2013 8398.6429 8398.6429 8230.6700-8566.6158 0.696 8566.6158-8818.5750 0.152 8981.5892-9265.2183 0.1392 2014 9454.3044 9454.3044 9265.2183-9643.3905 0.7216 9643.3905-9927.0196 0.1392 10110.5238-10429.8035 0.1443 2015 10642.6566 10642.6566 10429.8035-10855.5097 0.7114 10855.5097-11174.7894 0.1443
农村人均纯收入是我国社会经济发展的重要衡量指标,对农村农民收入进行系统量化分析尤为必要[10]。为实现对我国农村年人均纯收入进行预测,可以先采用传统灰色预测模型对我国2000-2010 年农村年人均纯收入时间序列进行分析,然后采用变起点模型对传统预测模型进行改进,建立多组预测序列模型,对各组预测序列按传统灰色预测模型方法分别进行预测,并对各组预测序列的预测模型进行精度和拟合度比较,最终选择一项预测序列作为最优预测模型。在此基础上又将该项预测序列的残差分为多种状态,并通过计算我国农村农民年人均纯收入的状态表与状态转移状况表,得出转移概率矩阵,从而求出以后各年的状态向量,由此得出由区间和概率组成的预测范围。这种组合预测方法可精确预测出未来各年的预测值区间及其所对应的概率,提高了预测精度,增强了实践操作性和可信度。
[1]邓聚龙.灰色系统理论的GM 模型[J].模糊数学,1985,(2):23-32.
[2]王宇熹,汪 泓,肖 峻.基于灰色GM(1,1)模型的上海城镇养老保险人口分布预测[J].系统工程理论与实践,2010,(12):2244-2253.
[3]张勇军,袁德富.电力系统可靠性原始参数的优化GM(1,1)预测[J].华南理工大学学报(自然科学版),2009,(11):50-55.
[4]崔冬冬,陈建康,吴震宇,程黎明.大坝变形度的不等维加权动态GM (1,1)预测模型[J].长江科学院院报,2011,(6):5-9.
[5]刘培路.辽宁农村居民消费支出的灰色预测及因素分析[J].辽宁石油化工大学学报,2011,(1):79-84.
[6]杨 婷,王玉贵,邓 琼,杨 丹.基于G M(1,1)模型的住院人次预测[J],中国病案,2010,(11):33-34.
[7]田桂英,王花兰.基于GM(1,1)残差模型的铁路客运量预测[J].价值工程,2010,(18):252-253.
[8]李晓蕾,刘 睿,田永瑞,谢炳科.基于灰色预测的空间多点残差修正模型研究[J].大地测量与地球动力学,2010,(5):125-128.
[9]邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2005.42-55.
[10]谢治菊,谭洪波.农村社会资本存量:概念、测量与计算[J].贵州财经学院学报,2011,(5):81-86.