原玉昌 袁国宝 崔晓 暴占军
摘要灰色系统模型在贫信息、小样本的非线性系统建模中具有明显优势,适合对时间序列较短时的需水量进行预测。针对基本灰色预测模型背景值构造不合理,及未充分利用新信息的缺点,采用重构背景值和等维递补原理对基本GM(1,1)模型进行改进,并利用改进模型对安阳市小南海泉的涌泉量进行拟合和预测,结果表明,改进模型预测精度更高。
关键词涌泉量预测;灰色预测;重构背景值GM(1,1);等维递补GM(1,1)
中图分类号S181.3文献标识码A文章编号0517-6611(2014)22-07574-03
小南海泉出露于洹河河谷之中,是河南省的名泉,年均涌水量1.3亿m3,相当于一座大型水库的库容。小南海泉水经过下游的彰武水库调节,担负着安阳市区用水量近一半的供水任务,是安钢、电厂、安化集团及万金灌区的主要水源,也是市区生活用水的重要后备水源地,在安阳市国民经济和社会发展中占有举足轻重的地位,被称为安阳市的“生命泉”。近年来,随着安阳市社会经济的快速发展,城市水资源供需矛盾日益突出,严重制约了城市经济的发展。及时准确地预测小南海泉的涌泉量是城市供水系统优化调度的基础,对保护、合理开发小南海泉域地下水资源、实现区域水资源的合理配置、缓解城市水资源供需矛盾、保障安阳市经济、社会的可持续发展,有重要意义。
目前,常规的预测多采用回归分析法和时间序列分析方法[1],这些方法虽然简单、直观,但必须建立在大量数据样本之上。而影响涌泉量的因素众多,难以一一确定,导致建模困难,且进行涌泉量预测时受实测数据时间系列较短、可靠性低等条件的限制,预测结果往往难以令人满意。灰色系统模型在贫信息、小样本的非线性系统建模中具有明显优势,适合对信息不完全、时间序列较短时的数据进行预测。该研究即把受各种因素影响的涌泉量视为在一定范围内变化的与时间有关的灰色量,从其自身的数据列中挖掘有用信息,从而预测小南海泉的涌泉量。基本灰色预测模型进行预测时之所以在某些时候出现预测精度较差的现象,主要原因有两点:①常采用传统公式来构造参数a、b的背景值,对数据变化急剧的序列预测精度较低;②且只考虑过去的全体数据,未充分利用新信息,精度较高的仅仅是最近的几个数据,导致越往未来发展,预测意义就越弱。因此,笔者采用重构背景值和等维递补原理对灰色预测模型进行改进,并用改进的模型对小南海泉的涌泉量进行拟合和预测。
1 GM(1,1)模型及其改进
1.1GM(1,1)模型灰色系统理论是邓聚龙教授于1982年创立的[1],是一种研究少数据、贫信息的不确定性问题的新方法。其实质是基于灰色系统分析原理对含有不完全信息的研究对象的发展规律进行预估,其核心为GM(1,1)模型,基本的GM(1,1)模型的建模步骤如下[2]。
①对无规律的、随机的、有明显摆动的原始数据X(0)={x(0)(1),x(0)(2),…,x(0)(n)}进行一次累加,生成累加序列X(1)={x(1)(1),x(1)(2),…,x(1)(n)},其中:x(1)(k)=∑k1i=1x(0)(i)(k=1,2,…,n)。新生成的数据列为单调递增数列,增加了原始数据列的规律性。
②由X(1)构造背景值序列Z(1)=(z(1)(1),z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)(k)=αx(1)(k)+(1-α)x(1)(k-1)(k=2,3,…,n),一般取α=112,做紧邻均值生成z(1)(k)=x(1)(k)+x(1)(k-1)12(k=2,3,…,n)。
③对累加生成序列建立微分方程:
dx(1)1dt+ax(1)=b (1)
④该方程的离散解为:
x(1)(k+1)=[x(0)(1)-b1a]e-ak+b1ak=0,1,2,…,n (2)
式(1)的发展系数a和灰色作用量b由下述方法确定:
α=(a,b)T=(BTB)-1BTY (3)
其中,B=-z(1)(2)11
-z(1)(3)11
…1…
-z(1)(n)11,Y=x(0)(2)
x(0)(3)
…
x(0)(n)。
⑤GM(1,1)数列预报模型为:
x(0)(k+1)=x(1)(k+1)-x(1)(k)=(1-ea)[x(0)(1)-b1a]e-akk=1,2,…,n (4)
模型规定x(0)(1)=x(0)(1)。
GM(1,1)模型中系数a称为发展系数,它反映系统的发展态势,当a为负值时,其绝对值越小,系统发展就越慢;反之,则越快。参数b称为灰作用量,它反映数据变化的关系。
1.2 重构背景值的GM(1,1)模型由公式(2)可知,GM(1,1)模型预测和拟合精度取决于发展系数a、灰色作用量b,而a、b的求解依赖于背景值的构造形式。因此,背景值z(1)(k+1)的构造公式成为直接影响GM(1,1)模型精度和适应性的关键因素[3]。
由建模机理可知GM(1,1)模型拟合曲线是指数曲线,设图1中曲线x(1)(t)为拟合指数曲线,传统方法取背景值z(1)(k)=x(1)(k)+x(1)(k+1)12,即图中的梯形abcd面积,但在区间[k,k+1]上指数曲线x(1)(t)对应的面积总是小于梯形abcd的面积,会出现误差Δs。序列数据变化越大,指数曲线曲率越大,模型误差Δs越大。GM(1,1)模型无论是数据变化平缓的低增长指数序列,还是数据变化急剧的高增长指数序列,都采用传统公式来构造参数a、b的背景值是不尽合理的,对数据变化急剧的序列预测精度往往较差。