基于EMD与BP神经网络的北京市采暖季天然气消耗量预测

2021-11-15 09:01闵晶晶
干旱气象 2021年5期
关键词:消耗量分量气象

闵晶晶,王 华,董 颜

(北京市气象服务中心,北京 100097)

引 言

近年来,我国经济的迅速发展导致能源消费量快速增加,能源安全与环境问题日益显著。天然气作为优质高效的清洁能源极大改善了空气环境质量。伴随北京煤改气的全面推进,天然气消费量呈现爆发式增长[1-4]。合理预测天然气消耗量,不仅有利于城市管网的优化调度,保证管网供气量,而且在实现节能减排、国家政策分析与制定以及国民经济核算等方面具有深远意义。据统计,天然气作为北京市主要的供暖燃料,采暖季的消耗量占全年消耗总量的80%,具有明显的季节性特征。如2009—2010、2012—2013年冬季北京遭遇了罕见的大雪、低温天气,天然气出现供需不平衡情况,直接威胁到城市居民的冬季供暖。因此,灾害性天气影响下冬季采暖季天然气预测显得尤为重要。

天然气消耗量常用的预测方法主要分为统计方法、经济数学模型和智能算法三类[5]。统计学方法以时间序列分析为主,广泛应用于能源预测[6-8],但统计模型需要长期数据积累,且模型中影响因子的贡献率较为固定,无法反映随时间推移某些特征因子贡献率的衰减。经济数学模型如灰色系统理论,可量化不确定因素和小样本信息,常用于构建短期天然气消耗量预测模型[9-11]。近年来,为了解决非线性决策问题,陆续采用神经网络、遗传算法等智能算法构建天然气消耗量预测模型[12-15]。经验模态分解是处理非平稳信号的一种时频分析方法,可依据输入信号的自身特点,将原始信号分解成若干个本征模态函数与残差,该方法是对傅里叶分析和小波变换的重大突破[16]。BP神经网络方法在处理非线性问题上具有极大的灵活性和自适应性,可通过训练数据集合不断刺激系统来调整网络权值和阈值,最终达到网络误差平方和最小的标准[17]。

从天然气消耗量的影响因素来看,一方面受国民经济、城市人口、能源政策等社会经济发展要素的影响,燃气负荷表现出长期变化趋势[18];另一方面受天气影响,燃气负荷呈现季节变化和波动特征[19-21]。然而,以往研究天然气消耗量的影响因素大多局限在温度、湿度、天气状况、降雨量、风等基本要素,且多以温度作为唯一气象参考因子[22-23],没有过多考虑持续低温或强降雪等灾害性天气过程造成天然气消耗量大幅增加的情况,同时也缺乏社会经济发展要素影响的考量。为此,本文以北京市为例,采用经验模态分解、BP神经网络和相关分析等方法,根据天然气消耗量的非线性和非平稳的特点,综合分析经济、人口、供热面积和气象等多种影响要素,构建北京市采暖季天然气消耗量预测模型,并进行评估检验,以期为北京能源规划和调控提供一定参考。

1 资料和方法

1.1 资 料

天然气资料为北京市2002—2018年采暖季(11月至次年3月)天然气月消耗量,累加后得到采暖季天然气总消耗量,其中2002—2015年作为预测模型构建样本,2016—2018年作为模型评估样本。

北京市有20个国家级气象观测站,其中佛爷顶、汤河口、上甸子、斋堂、霞云岭5站海拔较高且地处远郊,人类活动较少,不具代表性,因此选用采暖季其他15站最高、最低气温及平均气温和降水量、风速等气象要素逐日观测资料,并用上述15站平均值代表北京市气候特征,同时还引入了表征冬季冷暖程度的负积温和低温日数2个参数[24]。其中,负积温是指日平均气温低于0 ℃的累积值;低温日数是指日最低气温小于某个阈值的累积天数,本文将北京供暖部门关注的-5 ℃和-8 ℃作为阈值。

社会因素资料选用了2002—2018年GDP、集中供热面积、常住人口。

1.2 经验模态分解方法

经验模态分解(empirical mode decomposition, EMD)作为数据驱动的自适应非线性时变信号分解方法,是以傅里叶分析和小波分析为基础,适用于对非线性、非平稳信号逐级进行平稳化处理。EMD算法的筛选过程是将复杂时序数据分解为有限个本征模函数(intrinsic mode function, IMF),分解得到的IMF分量包含了原数据在不同时间尺度上的波动信息[25]。具体处理过程如下:

(1)对任一处理信号x(t),确定其局部最大值、最小值,将信号数据x(t)与上、下包络线均值m1(t)的差值记为h1(t),其表达式如下:

h1(t)=x(t)-m1(t)

(1)

(2)重复以上过程,从原始信号中筛选出的第一阶段IMF分量h1(t)通常包含信号的最高频分量。将h1(t)从x(t)中分离出来,得到去除高频分量的差值信号r1(t),把r1(t)作为新信号重复以上筛分步骤,直到第n阶段的残余信号为单调函数不再筛分出IMF分量的rn(t),其表达式如下:

(2)

根据分解算法,x(t)可表示为n个IMF分量和1个残差的和,表达式如下:

(3)

式中:rn(t)为残差,表示信号中的平均趋势;hj(t)为第j个IMF分量,j=1,2,…,n,分别表示信号从高到低不同频率的成分。

筛分过程的结束主要依据类似Cauchy收敛准则[26],标准偏差SD通常设置为0.2~0.3,表达式如下:

(4)

1.3 BP神经网络方法

采用BP(back propagation)神经网络方法构建预测模型。BP神经网络适用于一些高度复杂和非线性问题的建模,主要包含输入层、输出层和隐含层。一般采用梯度下降法作为权值修正,常利用Sigmoid函数计算各节点神经元的激励函数,并归一化到-1~1之间。设W(k+1)和W(k)为BP网络各层节点之间相邻训练数的连接权值[27],△W(k)为权值的修正值,k为训练次数,权值修正公式如下:

W(k+1)=W(k)+△W(k)

(5)

设有N组训练样本和M组检测样本,Ti和Yi(k)分别为第i组训练样本的目标值和网络实际输出值,而Tj和Yj(k)分别为第j组检验样本的目标值和网络实际输出值,则训练误差函数Etrain(k)和检验误差函数Etest(k)可表示为:

(6)

(7)

2 天然气消耗量特征及其影响要素

2.1 采暖季天然气消耗量年际变化特征

2002—2018年,北京地区采暖季天然气消耗量呈波动增加趋势,2008年以前增加缓慢,之后迅速增加[图1(a)];采暖季天然气消耗量的IMF1高频分量呈波动变化,无明显变化趋势,2008年以前变化较平稳,之后波动幅度明显增大,最高峰值和次高峰值分别出现在2012年和2009年,谷值出现在2013年和2016年[图1(b)]。与采暖季天然气消耗量的变化趋势相似,天然气消耗量的IMF2趋势项呈持续增加趋势,2002—2012年消耗量平稳增加,2014—2015年急剧增加[图1(c)],增量超过20%。

图1 北京地区2002—2018年采暖季天然气消耗量(a)及分解量IMF1(b)和IMF2(c)的年际变化Fig.1 The inter-annual changes of natural gas consumption (a) and its decomposed IMF1 (b) and IMF2 (c) components in Beijing in heating season from 2002 to 2018

2.2 影响要素及年际变化特征

天然气消耗量受社会因素和气象条件的影响,具有典型的非平稳特征,其中气象条件是造成天然气负荷短期波动的主要原因。利用EMD方法分析北京市2002—2018年采暖季天然气消耗量,得到不同频率的本征模态分量IMF1和趋势分量IMF2,并与各影响因子作相关分析(表1)。可以看出,IMF1与平均气温、最低气温、最高气温、负积温均呈显著负相关,而与持续低温日数和降水量呈显著正相关;IMF2与GDP、集中供热面积、常住人口数量呈显著正相关,而与气象因子相关性不大,表明IMF2分量综合反映了GDP、人口、城市化、能源结构等社会因素的影响。因此,设定高频分量IMF1为气象消耗量,趋势分量IMF2为社会消耗量。

表1 北京市2002—2018年采暖季天然气消耗量的IMF1和IMF2分量与各因子的相关系数Tab.1 Correlation coefficients between IMF1, IMF2 components of natural gas consumption and each factor in Beijing in heating season from 2002 to 2018

2.2.1 气象消耗量年际变化特征

近17 a北京地区采暖季平均气温大多在0 ℃以上,2009年和2012年采暖季因出现多次强降雪过程导致平均气温较常年同期(0.7 ℃)明显偏低,分别为-1.3、-0.9 ℃[图2(a)],而降水量较常年同期(27.7 mm)异常偏多,分别为74.6、106 mm[图2(b)],致使低温持续时间较长,低温日数多于常年,负积温低于-400 ℃(常年平均为-295.6 ℃);2013、2014、2016年采暖季平均气温分别为2.4、2.3、2.0 ℃,均明显高于常年同期,而降水量相对较少,低于-8 ℃的低温日数在20 d左右,较常年同期(42 d)明显偏少,负积温仅在-150 ℃左右。因此,当采暖季气温明显偏低或出现较强降雪、持续低温等天气过程时,天然气的气象消耗量会大幅增加,而当采暖季气温明显偏高、负积温偏少时,天然气的气象消耗量明显减少。

图2 北京地区2002—2018年采暖季平均气温(a)、降水量(b)年际变化Fig.2 The inter-annual changes of average temperature (a) and precipitation (b) in Beijing in heating season from 2002 to 2018

2.2.2 社会消耗量年际变化特征

近17 a北京市GDP、集中供热面积持续平稳增长,而常住人口数量增长相对缓慢,特别是2015年以后人口略有减少(图3),其中2013—2015年GDP、集中供热面积及人口数量均线性平稳增长,未出现与天然气社会消耗量IMF2相对应的明显增长现象。2013年9月北京市政府发布了《北京市2013—2017年清洁空气行动计划》,这可能是导致2013—2015年采暖季天然气用量明显增加的主要原因。

图3 北京地区2002—2018年采暖季GDP、集中供热面积及常住人口数量的年际变化Fig.3 The inter-annual changes of GDP, intensive heating supply area and permanent population number in Beijing in heating season from 2002 to 2018

3 天然气消耗量预测模型与检验

3.1 预测模型的建立

基于EMD方法在处理非平稳信号和BP神经网络方法在处理非线性问题的优势,提出了基于EMD_BP方法的采暖季天然气消耗量预测模型(图4)。选取平均气温Tave、最低气温Tmin、最高气温Tmax、风速V、降水量R、负积温NAT、小于-8 ℃的低温日数LTD-8等作为IMF1预测模型的输入因子,GDP、集中供热面积、常住人口数量、时间(年份)等作为IMF2预测模型的输入因子,分别建立天然气气象消耗量IMF1和社会消耗量IMF2的预测模型,两分量预测值求和得到天然气总消耗量预测值。其中,2002—2015年采暖季天然气消耗量数据作为训练样本,2016—2018年数据作为检验样本。

3.2 预测结果检验

利用采暖季天然气消耗量EMD_BP预测模型,分别对2002—2015年建模样本进行拟合、2016—2018年检验样本进行预测。可以看出,EMD_BP预测模型对天然气消耗量IMF1、IMF2分量和总消耗量均具有很好的拟合与预测效果(图5),尤其是气象消耗量IMF1预测模型能够准确预测出陡增点(2009、2012、2015、2017年)和陡减点(2010、2013、2016年)。

图5 北京地区2002—2018年采暖季天然气消耗量IMF1(a)、IMF2(b)分量和总消耗量(c)的拟合值、预测值与真实值对比Fig.5 Comparison of fitted and forecasted IMF1 (a), IMF2 (b) components of natural gas consumption and total consumption (c) with actual value in Beijing in heating season from 2002 to 2018

通过拟合、预测与真实值的结果进行检验,发现EMD_BP预测模型对2002—2015年数据样本拟合的平均相对误差为4.5%,对2016—2018年检验样本预测的平均相对误差为5.6%。总体来看,采暖季天然气消耗量EMD_BP预测模型具有较好的预测效果,能够准确预测出天气变化带来的影响。

4 结论和讨论

本文引入对非线性非平稳信号进行平稳化处理的EMD方法,对北京市采暖季天然气消耗量的时间序列进行分解及特征分析,探讨天然气消耗量的社会和气象影响因子,采用BP神经网络方法构建预测模型并检验,主要结论如下:

(1)EMD方法能够较好地提取北京市采暖季天然气消耗量线性增加的社会消耗量和波动变化的气象消耗量。

(2)北京市采暖季天然气的社会消耗量与GDP、集中供热面积、常住人口数量呈显著正相关,但受政策影响,2014—2015年天然气的社会消耗量出现剧增,此后增量有所减缓。

(3)北京市采暖季天然气的气象消耗量与气温、负积温呈显著负相关,而与降水量、小于-8 ℃的低温日数呈显著正相关。当采暖季气温明显偏低或出现较强降雪、持续低温等天气过程时,天然气的气象消耗量会大幅增加,而在气温明显偏高、负积温偏少时,气象消耗量明显减少。

(4)采暖季天然气消耗量EMD_BP预测模型具有较好的预测效果,2002—2015年数据样本拟合的平均相对误差为4.5%,2016—2018年检验样本预测的平均相对误差为5.6%,能够准确预测因天气变化而引起的天然气气象消耗量的峰谷变化。

猜你喜欢
消耗量分量气象
气象树
路基石方爆破降低炸药消耗量研究
《内蒙古气象》征稿简则
帽子的分量
一物千斤
论《哈姆雷特》中良心的分量
大国气象
美丽的气象奇观
有机化学反应中试剂最大消耗量问题探析
《轻型商用车辆燃料消耗量限值》强制性国家标准发布