高 迪,任庚坡,李琦芬,毛俊鹏,桂雄威
(1.上海电力大学, 上海 200090; 2.上海市节能监察中心, 上海 200083)
上海市作为长江流域经济带的骨干和“龙头”,近年来能源需求也不断提高。与日俱增的能源需求,不仅影响我市能源自身安全,而且会对全国能源生产与供给产生一定影响。响应绿色低碳号召,加强自身能源保障,是未来经济社会发展所遵循的规律[1]。因此,把握未来能源需求趋势,对上海市能源战略的制定实施及经济社会持续发展都具有重要意义。
为实现“十三五”时期上海工业绿色发展“双控”目标的完成,本文尝试从工业企业能源消费、工业固定资产投资项目能源消费及产调与技改能耗减少量3部分驱动因素入手调控上海市工业能源消费总量。采用ARIMA-BP神经网络组合模型、情景分析法等能耗预测方法,综合预测上海市工业能源消费总量的需求趋势。
本文研究共涉及7个变量,分别为上海市工业能源消费、经济水平(上海市生产总值)、产业结构(三次产业结构能源消费)、能源强度(单位产值能源消费)、能源消费结构(一次能源消费)、四大高载能行业能源消费以及固定资产投资项目新增能源消费量。考虑数据获得性,本文选取的时间序列跨度为2000—2018年,数据主要来源于历年《上海能源统计年鉴》、《上海统计年鉴》、固定资产投资项目能评管理系统及统计局官网公布信息,数据资料真实可靠,有据可依[2-3]。
目前在能源消费领域预测方法主要有回归分析法、灰色预测法及时间序列法等,常用的能源消费预测方法特点,见表1。
表1 能源消费预测模型特点
续表(表1)
能源消费变化本身会受到很多外部因素的影响,如经济水平(上海市生产总值)、产业结构(三次产业结构能源消费)、能源强度(单位产值能源消费)、能源消费结构(一次能源消费)及固定资产投资项目新增能源消费量等。根据各预测模型的优势比较分析,并结合上海能源消费数据的特点,本文主要采用预测精度较高的时间序列法、人工神经网络法、情景分析法等单一方法构建预测模型,并通过误差绝对值的对比分析,最终确定构建组合模型进行预测,组合预测模型有效提高了单一模型的预测精度,扩大了单一模型适用范围,且涉及参考的因素指标全面新颖、科学合理、方便快捷,适用于上海市工业能源消费预测。
通过对上海市相关能源消费监测统计部门的调研学习及历年数据整理分析得知:上海市工业能源消费总量主要由3部分构成,即工业企业能源消费量E1、工业固定资产投资项目新增能源消费E2以及通过产业结构调整及节能技改能源消费减少量E3。则可设上海市能源消费总量主要构成关系式:
E=E1+E2-E3
(1)
通过上式可知:将3部分能源消费量通过不同方法逐一进行预测分析,最终将各部分预测值通过式(1)联立即可得出上海市工业能源消费总量的预测结果。其中,预测上海市工业企业能源消费E1采用ARIMA-BP神经网络组合预测模型;预测上海市工业固定资产投资项目新增能源消费E2采用情景分析法;工业产业结构调整及节能技改减少量E3可根据近10年上海市重点用能企业能源审计报告数据统计预算,综合得出上海市工业能源消费总量的预测结果。
通过实证分析构建多个单一预测模型进行初步预测,并利用模型组合法提高单一模型精确度,最终作出最优化组合模型对上海市工业企业能源消费E1进行预测。
3.1.1时间序列法——ARIMA预测模型
自回归移动平均模型(ARIMA) 由美国统计学家Box和Jenkins于20世纪70年代提出。ARIMA模型(autoregressive integrated moving average model)被广泛用于时间序列预测分析,其实质是利用差分运算将非平稳时间序列转化为平稳时间序列,再建立ARIMA模型并进行预测分析。在模型ARIMA(p,d,q) 中,p为自回归阶数,d为数据差分次数,q为移动平均阶数[15]。
ARIMA(p,d,q)模型的基本形式如下:
ΔdXt=Φ1ΔdXt-1+Φt-2ΔdXt-2+…+
ΦpΔdXt-p+εt+θ1εt-1+
θ2εt-2+…+θqεt-q
(2)
选取2000—2018年上海市工业能源消费量作为随机时间序列模型的样本数据,将该序列数据导入Eviews 9.0中进行处理,利用ARIMA(p,d,q)模型对上海市工业企业能源消费E1进行预测。
1) 序列平稳性检验
对时间序列进行观察,发现上海市工业能源消费量有明显的波动趋势,为非平稳序列。通过对能源消费量序列进行一阶差分处理,利用 ADF(augment dikey-fuller)方法进行序列的单位根检验,结果见表2。
表2 一阶差分序列的ADF检验
单位根检验结果说明非平稳序列经过一阶差分后是平稳的,因此可以对模型定阶为d=1。即对一阶差分以后的平稳序列可以建立 ARMA(p,q)模型。
2) 模型识别与选择
选择AR(p)模型、MA(q)模型还是ARMA(p,q)模型,以及如何确定p、q值,通常利用自相关与偏自相关函数来识别。使用Eviews 9.0统计软件对序列进行自相关和偏自相关分析,结果见图1。
图1 一阶差分序列自相关与偏自相关
在自相关图中,系数显著不为零的阶数为1、4、5;偏自相关图中,系数显著不为零的阶数为1、2。即通过对多个 ARMA(p,q)模型的不断尝试比较,结果显示 ARMA(4,2)模型自回归及移动平均部分系数最为显著,AIC值相对较小,模型拟合效果良好。故可建立上海市工业能源消费的ARIMA(4,1,2)模型,其参数估计结果见表3。
表3 差分序列模型的参数估计
3) 模型预测
运用Eviews9.0软件对ARIMA(4,1,2)模型进行预测,由图2可知模型不确定系数为0.4,即说明上海市工业能源消费ARIMA(4,1,2)预测模型拟合效果较好。
图2 ARIMA(4,1,2)模型估计及预测
根据参数估计结果可得模型的口径为
ΔXt=Φ1ΔXt-1+Φ2ΔXt-2+Φ3ΔXt-3+
Φ4ΔXt-4+εt+θ1εt-1+θ2εt-2
(3)
(1-B)Xt=-1.165 246(1-B)Xt-1+
0.017 732(1-B)Xt-2+
0.758 934(1-B)Xt-3+
0.232 667(1-B)Xt-4+
εt+1.954 687εt-1+
0.984 390εt-2
(4)
根据上式计算出上海市工业企业能源消费ARIMA(4,1,2)模型在2000—2018年中的预测值和相对误差绝对值,见表4。
表4 ARIMA(4,1,2)模型能源消费预测
由ARIMA(4,1,2)模型预测结果可以发现:平均相对误差绝对值为2.302%,拟合效果较好,精度较高。
3.1.2BP神经网络预测模型
BP神经网络是指运用误差逆传播(error back propagation)算法训练的多层前馈神经网络,基于梯度下降(gradient descent)策略,以目标的负梯度方向对参数进行调整,是目前为止最成功且应用最广泛的神经网络算法[16]。神经网络由输入层、一个或者多个Sigmoid隐层隐含层和输出层3部分构成,见图3。隐藏层的存在使网络可以呈现和计算更加复杂的关联模式,人工神经网络的基本方法主要由网络训练和测试两部分组成。
图3 BP神经网络预测模型示意图
本文选取2000—2018年上海市工业企业能源消费量作为样本数据,将该序列数据导入Matlab中进行网络训练,利用BP人工神经网络模型对上海市工业企业能源消费进行预测。
建立 BP神经网络模型可分以下几步进行:
1) 归一化处理
归一化处理可避免由于出入向量的物理意义和单位不同对BP神经网络产生影响。将输入数据处理为区间[0,1]之间的数据,釆用公式:
(5)
2) 确定网络层及输入、输出层神经元数
BP神经网络是通过输入层到输出层的计算完成的。网络层数越多需要的训练时间越多,而训练速度可通过增加隐含层节点个数来实现,因此选取含一个隐含层的3层神经网络即可。
输入、输出层神经元数与样本紧密相关,本文利用x(i-1),x(i-2),…,x(i-k)的信息预测i时刻的值,则输出层神经元数为1;通过确定其他参数值,获得输入层神经元数为5,分别为上海市经济水平、产业结构、能源强度、能源结构、四大高载能行业能源消费情况。
3) 确定隐含层神经元数
隐含层中神经元数的确定,关系到模型是否能够有效完成映射。在建模时,首先根据公式初步确定隐含层神经元个数,然后对不同神经元数的网络进行训练对比误差大小来确定隐含层的神经元数。通用的隐含层神经元数的确定经验公式为:
(6)