冯 乐,窦鲁星
基于动态广义回归神经网络煤炭需求预测模型
冯 乐,窦鲁星
(中国矿业大学资源与地球科学学院,江苏 徐州 221116)
煤炭需求预测是指导我国煤炭工业发展规划的重要依据之一。我国煤炭资源需求影响因素复杂,准确地预测需要考虑经济、社会等多方面因素。针对获取数据不足等特点,首次在煤炭的预测中运用动态广义回归神经网络(D-GRNN)的方法,预测了中国未来近十年内的煤炭预测值,得到了比较合理的预测值。运用预测数据对国家的煤炭宏观调控做出了合理评价。
煤炭需求;预测;动态广义回归神经网络;宏观调控
众所周知,中国能源结构始终是以煤炭为主,作为世界上最大的煤炭需求国。我国煤炭行业自建国以来,一直未走出“过剩—缓和—再过剩”的“怪圈”[1],其供需不平衡很大程度是由于我国煤炭需求预测上偏差较大或是预测方式的不合理所导致。在接下来的十年时间,石油供需增大的同时将继续面临补充不足、价格持续攀升等阻碍,而常规和非常规天然气、风电、水电等能源的开发利用尚处于初级阶段,不足以作为煤和石油的替代物。与此同时,我国的煤炭储量依然丰富,价格低廉。《BP能源统计2011》预计我国煤炭的储产比为35年,远高于石油(9.9年)和天然气(29.0 年)[2]。
因此,如何能科学地对煤炭的需求做出预测,继而引导煤炭行业合理勘探开采,是符合21世纪科学发展的大计,也是避免能源的不合理开发利用对国家发展带来阻碍的必要手段。近年来,BPNN(Back Propagation Neural Network,简称BP神经网络)是一种误差反向传播的多层前向人工神经网络,是应用的最为广泛的一种神经网络[3,4],被广泛应用于能源的预测之中。但是,性能优良的BPNN需要确定模型的结构,存在训练耗时和不能保证全局最优等问题[5]。
本文所用的动态GRNN(General Regression Neural Netwok,广义回归神经网络)是一种径向基神经网络,同时采取动态预测的手段,具有很强的非线性映射能力,由于它具有高度的容错性,在逼近能力和学习速度上优势更强。同时,GRNN满足在相关数据缺乏的情况下对数据的预测,弥补了煤炭需求预测数据不足的特点。目前,GRNN的预测主要集中在工程、交通等领域,而在能源需要预测中未被很好地应用。因此,本文针对我国煤炭需求模型中数据具有非线性和历史数据较少以及影响因素众多等特征,建立应用Matlab求解的动态GRNN模型进行模拟与仿真,并对中国未来十年来煤炭需求状况进行预测,为煤炭行业提供决策支持。
我国的煤炭需求预测过程是个非线性的极其复杂系统[6],煤炭的需求受到经济、社会等众多因素的影响。同时,煤炭需求又直接关系到我国经济建设和社会发展,所以必须根据其需求行为,归纳和选择影响煤炭需求的各种因素,并充分考虑这些影响因素自身之间错综复杂的关系,以达到预测的合理性与科学性。结合相关资料,分析指标之间相关性,确定了如下影响煤炭需求的主要因素。
煤炭行业的运行是一个长期性高投入的产业,其发展水平直接受制于经济发展水平[7]。故采用国内生产总值(GDP)和原材料、燃料、动力购进价格指数两个指标来表示相关性;我国是世界上人口最多的国家,人的因素对煤炭需求的影响较之其他国家和地区有着更为重要的意义,人口总量的多少直接影响着能源总需求量,也直接影响着能源资源的人均占有量和利用方式[8],故人口总数和人均生活煤炭需求量也是需要重视的两个因素;产业结构决定能源的需求水平,在中国的能源需求结构中,煤炭几乎占到了70%,足以说明产业结构对我国煤炭的影响意义深远,而第二产业的能耗指数远高于第一产业和第三产业的能耗指数,故随着我国产业结构的调整,综合能耗指数必将受到影响,因此,第二产业结构的变化也是能源需求重要影响因素之一[9,10];随着经济的发展,能源的不合理利用带来的负面影响也在增大,所以,科学合理地利用资源,也逐渐成为了主流趋势,特别是煤炭的洁净技术,是科学合理利用的一大表现,本文拟采用与之有关的能源加工转换效率这一指标来作为替代因素之一;煤炭在能源需求总量的比重以及能源需求弹性系数,是我国政府调控和市场调节的直接体现,是对煤炭进行预测的一个不可缺少的指标。
除以上因素外,还有其他一些因素也在煤炭需求上起着一定的作用,由于这些数据难以量化或者数据难以获取,故本文没有考虑。
鉴于改革开放30年发展势头迅猛,不宜选取过长的年限,故从《中国统计年鉴2011》中选取1990—2009年的统计数据(表1,表2),来对2010—2019年的煤炭需求进行预测。
表1数据来源:《中国统计年鉴2011》
表中各字母分别代表:
A:人均生活煤炭需求量(%)
B:原材料、燃料、动力购进价格指数(%)
C:煤炭占能源需求总量的比重(%)
D:人口总数(万人)
E:能源需求弹性系数(%)
F:GDP(亿元)
G:国内生产总值构成中第二产业比重(%)
H:能源加工转换效率(%)
表2数据来源:《中国统计年鉴2011》
表1 1990—2009年煤炭需求量影响因素
表2 1990—2009年煤炭需求总量
GRNN是非线性回归分析,不需要事先确定方程形式,而是以概率密度函数来代替固有方程形式,然后计算具有最大概率值的回归值y。进行网络训练的过程实际上就是确定光滑因子的过程。其中,光滑因子即是高斯函数的宽度系数。具体过程是由4层结构组(图1),输入层神经元接受学习样本中输入向量,直接传递给模式层,模式层各神经元对应不同的样本,传递函数通常采用高斯函数:
式中:
x—输入向量;
xi—第i个神经元对应的学习样本。
再传递给输出层,神经元输出对应估计结果的相应元素。
图1 GRNN网络结构图
可以看出,传统的GRNN只是一种局部递归的静态网络模型,只能对确定的输入数据进行预测,相对于动态的神经网络模型,GRNN模型的应用范围受到了较大的限制。在进行煤炭需求量预测过程中,需要对静态GRNN进行动态化,即采取滚动预测的方式,动态GRNN模型属于全局的递归模型,即前一段时间的模型预测输入值成为后一段时间的模型输入值作为训练,后一段时间的输出值作为输入,实现多步预测[11]。
动态预测输入可以表达为:
得到相应的网络模型输出为:
式中:
Γ—由GRNN刻画的非线性映射;
u(p)—模型在p时刻的输入;
ny、nu—u、y 的延迟时间长度。
由于本文所选的输入数据因素较多,数量相差大且量纲不同,如果直接引用源数据,很可能出现较大范围内的变化,使预测结果降低。首先对数据进行归一化处理,归一化常用下面的公式:
本文将采用多步滚动预测的方式进行预测,选取1990—1999年归一化后数据作为训练输入,表2中2000—2009年归一化后得数据输出作为训练输出,以达到多步预测的目的。并随机抽取2003、2006、2008年的检验样本,检验合格后,做出对我国近期煤炭需求的预测。
一般情况下,训练能力差时网络的预测能力也差,并且在一定程度上随着训练能力的提高预测能力也会提高,但这种趋势有一个极限,达到此极限后,随着训练能力的提高,预测能力反而下降,即出现所谓过适性,也称为过拟合,此时网络学习了过多的样本细节而不能反映样本内在的规律。泛化能力差会造成不适性,过适性和不适性的网络都属于不成熟网络,仿真效果较差[12]。
本文光滑因子采用交叉验证方法评估模型的预测能力,在一定范围内,以某一步长递增变化,在学习样本中以1个样本作为估计样本,剩余的样本采用构造的GRNN对估计样本仿真,对所有样本都遍历1次,得到预测值与样本值之间的误差序列,以序列均方误差值作为网络的评价指标,将最小误差对应的光滑因子作为最终所选值。
本次试验用matlab程序来实现,最佳spread值为0.7,并获得以下数据,输入数据,得到测试结果见表3。
表3 随机抽取预测验证值
用保存的GRNN的训练函数对2010—2019的需求量进行预测,得到结果见表4,图2。
表4 2010—2019年10年煤炭需求预测值
图2 我国近10年煤炭需求预测值/万t
1)广义回归模型(GRNN)用于煤炭需求量的中、短期预测,具有较高的可信赖度。通过预测可以看出,我国煤炭的需求量在未来近10年将在上升一段时间后保持一个较平稳的水平,这与国家对煤炭工业的宏观调控相吻合,即未来煤炭的需求要在“零增长”中寻求更加高效高能的利用。
2)较之BPNN,收敛速度明显加快,且需要的数据更少,实际操作更加方便。
3)由于影响煤炭需求的因素还有很多,需要进一步找出它们之间的相互联系以及量化更多的相关数据以达到更高精度。
综上所述,D-GRNN在煤炭需求预测有其优势,其预测方式可以推广到更为广泛的领域,为决策者提供更加科学、合理的决策支持。
[1] 艾德春.我国煤炭供需平衡的预测预警研究[D].徐州:中国矿业大学,2008.
[2] 英国石油公司.BP 世界能源统计2011[EB/OL],2011,BP 中国网站:http://www.bp.com/productlanding.do?categoryId=9025442&contentId=7047113.
[3] 左 佼.基于灰色神经网络的我国原煤产量预测[J].煤炭技术,2011,30(10):5-7.
[4] 方 莹.瓦斯预测中的 BP神经网络融合技术[J].煤炭技术,2011,30(8):107-109.
[5] 廖志伟,叶青华.基于GRNN的多故障自适应电力系统故障诊断[J].华南理工大学学报,2005,33(9):6-9.
[6] 孙 涵.基于Matlab支持向量回归机的能源需求预测模型[J].系统工程理论与实践,2011,31(10):2001-2007.
[7] 韩智勇,魏一鸣,焦建玲,等.中国能源需求与经济增长的协整性与因果关系分析[J].系统工程,2004,22(12):17-21.
[8] 林伯强.中国能源需求的经济计量模型[J].统计研究,2001(10):34-39.
[9] 郭菊娥,柴 建,吕振东.我国能源需求需求影响因素及其影响机理分析[J].管理学报,2008,9(5):651-654.
[10] 刘延静.我国煤炭行业供求状况与发展趋势研究[D].福州:福州大学,2010.
[11] 贺湘宇,何清华.基于动态GRNN模型的挖掘机液压系统故障检测[J].中国工程机械学报,2010,8(3):335-339.
[12] 狄圣杰,李晓敏.GRNN在边坡稳定预测分析中的应用[J].水利水电科技进展,2011,31(3):80-83.
Forecasting Model of Coal Demand Based on Dynamic D-GRNN
Feng Le,Dou Lu -xing
Forecasting of coal demand is one of the key basis to guide the development plan of China’s coal industry.Economic,social and other factors should been comprehensive considered when predict precisely due to the complexity of coal command in China.On account of the lack of the related data,this paper applies Dynamic GRNN(D -GRNN)to forecast the coal demand in nearly ten years firstly and get the quite reasonable result.Finally,we evaluated the macro-control of coal industry based on the forecasting data.
Coal demand;Forecast;Dynamic GRNN;Macro-control
[TD-9]
A
1672-0652(2012)01-0004-04
2011-11-27
冯 乐(1990—),男,山西平定人,2009级中国矿业大学在读本科生,主要从事地质工程资源勘查的研究(E -mail)shxpdfl@163.com