三支残差修正的燃气负荷预测

2022-11-20 14:00吴思琪
计算机工程与应用 2022年22期
关键词:残差燃气修正

王 兵,吴思琪,方 宇

西南石油大学 计算机科学学院,成都 610500

对于天然气输配系统来说,负荷预测模块是重要组成部分。精准的燃气负荷预测结果可以帮助有效地规划燃气供应,实现燃气的科学调度。

目前燃气负荷预测有大量国内外的研究。Akpinar等人[1]使用时间序列分解和季节ARIMA(autoregressive integrated moving average)模型来预测天然气的每日和每月需求。Fabbiani等人[2]指出使用线性回归、随机森林、支持向量机等单一模型不如集成模型效果好。Anelkovi等人[3]根据欧洲天然气市场的使用特点设计了一种自适应神经模糊推理系统,该系统融合了神经网络和模糊逻辑原理。Yukseltan等人[4]提出的预测模型中引入了傅里叶级数,并且使用了预测日温度的偏差作为回归因子。Zhou等人[5]结合燃气负荷序列的非线性和周期性特征设计了一种新型离散灰色预测模型,使用文化算法对预测过程进行了优化。Wu等人[6]在预测燃气用量的时候使用了灰色伯努利模型,并且基于模型的线性化形式使用了粒子群优化算法确定非线性参数。张彤[7]提出一种改进的LMD(local mean decomposition)算法与GRU(gated recurrent unit)相结合的组合预测模型。王晓霞等人[8]将AE(auto-encoder)和EEMD(ensemble empirical mode decomposition)两种优化算法进行融合,另外结合LSTM(long short-term memory)网络形成一种新的基于EEAE-LSTM多模型融合预测模型。龚承柱等人[9]基于燃气负荷的特点建立了基于经验模态分解、相空间重构、最小二乘支持向量机的组合预测模型,指出组合模型的预测精度更高。陆继翔等人[10]先采用CNN(convolutional neural network)提取特征向量,然后将特征向量以时序序列方式构造并作为LSTM网络输入数据,再采用LSTM网络进行短期负荷预测。宋娟等人[11]提出了一种兼顾多元线性回归的非线性特性和BP神经网络的泛化特性的混合预测模型。陈川等人[12]结合燃气负荷特征建立了基于BP神经网络、经验模态分解、长短期记忆神经网络的组合预测模型。

三支决策作为一个重要的决策方法论在近些年得到了蓬勃发展,Yang等人[13]使用复杂网络对三支决策的应用、三支决策的发展方向等进行了分析综述。在不同的研究背景下很多研究对三分和三支两个任务进行具体的构造和解释,提出了大量三支决策的模型和应用,如相控阵雷达、疫情复工、属性约简、临床诊断、论文同行评审、投资决策、文本分类、邮件过滤、推荐系统、聚类分析和人脸识别[14-20]等。

燃气负荷预测可以看作一个时序预测问题,且负荷受天气、温度等多种外部因素影响,复杂多变。虽然目前已有大量关于燃气负荷预测的研究,但鲜有学者将三支决策理论应用于燃气负荷预测过程中。本文使用历史负荷数据和负荷影响因素进行短期燃气负荷预测,在此基础上提出了一种三支残差修正的短期燃气负荷组合预测模型。该模型可以提高负荷预测准确度,帮助实现更为科学的燃气调度。

1 相关简介

ARIMA(p,d,q)指的是差分自回归移动平均模型[21],首先通过d阶差分将非平稳序列转化为平稳序列,再通过自回归模型AR(p)和移动平均模型MA(q)的组合对当前时刻t的值xt求解,可表示为:

LightGBM(light gradient boosting machine)指的是轻量级的梯度提升机[22],是一个基于树模型的分布式梯度增强框架,具有训练速度快、内存占用低、准确性高、支持并行和GPU学习的特点。

STL(seasonal and trend decomposition using Loess)[23]是以鲁棒局部加权回归(robust locally weighted regression)作为平滑方法的时间序列分解方法。鲁棒局部加权回归[24]由Cleveland提出,结合了局部加权回归和强鲁棒性的拟合过程,利用局部观测数据对欲拟合点进行拟合。

基于评价函数的三支决策[25]是解决实用性问题的有效途径。三支决策理论强调“三分三治”来处理不确定性问题。假设U是一个有限非空的对象集合,C是一个有限的条件集合。“三分”指的是引入评价函数v(x)和阈值对(α,β)对U进行划分,其中α≥β;“三治”指的是对划分后的区域采取不同的处理方式。U基于评价函数v(x)和阈值对(α,β)划分为L-region、M-region、R-region,简记为L、M、R:

2 基于三支残差修正的燃气负荷组合预测模型

为了提高燃气负荷预测的精度,本文首先基于燃气负荷序列特点构造了一种组合预测模型,接着设计了三支残差修正法来修正模型的预测结果,并将这个模型命名为DA-LGBM-3WRC(double ARIMA and LightGBM with three-way residual correction)。DA-LGBM-3WRC

模型首先使用STL将负荷序列分解成趋势项、周期项和余项,然后结合了时序模型ARIMA和机器学习模型LightGBM各自的预测优势,分别处理分解后的负荷分量,最后使用了三支残差修正法(three-way residual correction,3WRC)对LightGBM的预测结果进行修正。接下来将详细介绍DA-LGBM-3WRC模型的原理及算法流程。

2.1 三支残差修正法

三支决策理论[26]最早由姚一豫教授提出,用于灵活处理现实中的不确定性问题。三支决策理论在两种极端下引入第三种情况来缓和二支决策的不合理性,其主要思想是将整体划分为三个独立的部分,对每部分分别采取不同的处理方式。残差是观察值与模型预测值之间的差,对残差进行修正可以进一步改进模型效果,提升模型准确率。故基于三支决策理论设计了三支残差修正法,如算法1所示,用于对LightGBM子模型产生的预测值进行修正,进一步提高预测准确率。3WRC模型流程如图1所示。

算法1三支残差修正法

(1)初始化k;

(2)使用聚类算法将restrain划分为k个簇;

(3)β=最小质心所在簇的最大值;α=最大质心所在簇的最小值;

(4)用restrain拟合ARIMA模型,得到预测残差序列resarima;

(5)根据式(2)和v(x)处理resarima得到res3wrc;

(6)返回res3wrc。

其中restrain为用作训练的残差序列,k为超参数,v(x)为三支决策理论中的评价函数。3WRC可以将残差圈定在一定的波动范围内,将修正后的残差再加回LightGBM的预测值上,能一定程度上修正LightGBM预测值,达到更好的预测效果。

2.2 DA-LGBM-3WRC模型

燃气负荷数据具有长期趋势、周期波动及随机波动相结合的特点,使用STL可以将燃气负荷序列分解为趋势项、周期项和余项,针对三个不同的分量选用各自适用的模型,能最大程度地提取信息,提高预测精度。ARIMA模型只需要自身数据序列而不需要借助其他变量,且适用于规律性和周期性明显的序列,LightGBM具有训练速度快、准确率高、泛化性强的特点,因此DA-LGBM-3WRC将ARIMA用于趋势项和周期项的预测,将LightGBM用于余项的预测,可以充分提取数据中的潜在信息。结合第2.1节中的3WRC对余项的预测残差进行修正,可以进一步提高预测准确度。

DA-LGBM-3WRC模型流程如图2所示。首先使用STL将负荷序列分解成趋势项、周期项和余项三个分量,趋势项和周期项分别使用两个ARIMA模型进行预测,余项使用LightGBM模型进行预测。余项受多种外部因素的影响,如天气、温度、节假日等因素,因此在余项的预测过程中加入了负荷影响因素。最后将三个子模型的预测值进行线性加和就是DA-LGBM-3WRC的最终预测值。

2.3 时序数据转换

时序数据集是按照时间索引排序的一系列数字,而监督学习数据集由输入特征矩阵和输出标签组成。燃气负荷Y是一组时序数据,要将前i天的历史负荷数据和影响因素导入机器学习模型进行进一步的探索和预测,需对燃气负荷序列进行转换。具体转换过程示意见图3。

图3 中,时序的燃气负荷序列表示为Y(y1,y2,…,ym),如步骤①所示;天气、温度等影响因素组成的特征矩阵表示为X=[x1,x2,…,xm]T,如步骤②所示;时间窗口设定为i,即使用前i天的负荷数据[ym-i,…,ym-2,ym-1]和影响因素[xm1,xm2,…,xmn]预测当前天ym的负荷,当前i天的负荷数据不存在时值置为nan,如步骤③所示;删除包含nan的行得到最终的监督学习数据集,如步骤④所示。

2.4 模型建立步骤

基于DA-LGBM-3WDRC组合模型的燃气负荷预测步骤如下:

(1)数据预处理。辨识和修正不良数据。

(2)负荷序列分解。采用STL对燃气负荷序列进行分解,得到趋势项、周期项和余项。

(3)特征加工与处理。加入天气、温度等初始特征,日平均温度、日期类型等衍生特征,组成特征矩阵,另外确定时间窗口,将时序数据转化为监督学习数据导入LightGBM模型中使用。

现阶段而言,许多的高职院校,误将校园文化建设理解成物质文化建设,这是十分片面的。误以为将校园内的设置完善,丰富学生的课余生活,这就是校园文化建设,但是实际上来说,这只是一种娱乐文化,这将会导致娱乐消遣之风在整个校园盛行。高校要进行文化建设,但是却没有一个明确的目标,整个局限在对于学生的管理和思想政治教育的基础层面上,没有达到整体办学、培养高素质人才的高层次目标。

(4)各子模型训练与预测。趋势分项使用ARIMA模型,周期分项使用ARIMA模型,余项使用LightGBM模型。

(5)三支残差修正。对LightGBM的余项预测结果使用三支残差修正法进行修正。

(6)子模型预测结果计算与评价。将三个分量的预测结果进行加和得到最终的DA-LGBM-3WRC组合模型预测结果,使用评价指标对模型预测结果进行评估。

3 实验

本文选取了某市2016—2018三年的燃气负荷数据,共计1 096条记录。时间窗口选择为7,转换为监督学习数据集之后弃用前7条的数据,共计1 089条数据。根据数据集划分原则,采取8∶2比例划分训练集和测试集,训练集共计870条记录,时间跨度为2016-01-08到2018-05-26,测试集共计219条记录,时间跨度为2018-05-27到2018-12-31。根据第2.4节所示步骤建立DA-LGBM-3WRC燃气组合预测模型并进行评估。原始数据如表1所示。

表1 原始数据示例Table 1 Raw data example

本文首先分析了DA-LGBM-3WRC中各分量的预测结果,然后分析了DA-LGBM-3WRC的预测结果,与其他模型进行了对比。实验结果使用平均绝对误差(MAE)和均方根误差(RMSE)进行评估,评价指标定义如下:

3.1 各分量预测结果与分析

DA-LGBM-3WRC针对STL分解后的趋势项、周期项和余项分别使用了ARIMA、ARIMA、LightGBM三个子模型,其中LightGBM模型引入了三支残差修正法对预测结果进行修正。三个分量预测结果分别对应表2、表3、表4。由表2可知,ARIMA预测趋势项效果最优。由表3可知,ARIMA是预测周期项的最佳选择。由表4可知,基于3WRC的LightGBM表现更好,具有更优的预测效果。

表2 趋势项对比Table 2 Trend item comparison

表3 周期项对比Table 3 Periodic item comparison

表4 余项对比Table 4 Remaining item comparison

3.2 最终预测结果与分析

将趋势项、周期项、余项进行线性加和得到最终预测结果,图4展示了DA-LGBM-3WRC模型的最终预测结果图。从DA-LGBM-3WRC的预测曲线来看,其与真实负荷曲线的拟合性较好,能准确跟随真实走势。预测曲线相较于真实曲线平滑且波动小,但在真实负荷曲线的毛刺点处具有一定的误差,原因是毛刺点呈现的波峰波谷受一些随机因素的影响,而这些因素不可控,复杂多变,难以预测,预测模型想要捕捉这些随机因素的信息难度较大。

DA-LGBM-3WRC模型主要结合了ARIMA和Light-GBM两种模型,另外使用了3WRC进行了残差修正,故绘制了ARIMA单一模型、LightGBM单一模型、DA-LGBM和DA-LGBM-3WRC四条预测曲线进行对比。从图5中可以看出,ARIMA和LightGBM两个单一模型的预测值与真实值整体偏差较大,具有明显的滞后性,预测效果不理想。DA-LGBM的预测曲线与真实曲线的拟合性更好,但在部分数据拐点处会出现严重偏离真实值情况。而在引入三支残差修正法之后,DA-LGBM-3WRC模型针对这种情况有了一定程度的改善。另外DA-LGBM-3WRC的预测曲线整体上也比DA-LGBM的曲线更靠近真实曲线。

表5展示了不同模型的预测结果评价指标。

表5 模型对比Table 5 Models comparison

从评价指标来看,DA-LGBM-3WRC的MAE、RMSE是四个模型中最优的,分别为50 910、68 784。综合曲线和评价指标,DA-LGBM-3WRC具有较高的预测精度,由此可见DA-LGBM-3WRC的有效性。

4 总结

本文为了提高燃气负荷预测准确度,结合燃气序列特点构建了使用STL的ARIMA和LightGBM组合预测方法,在组合预测方法的基础上进一步结合三支决策理论提出了三支残差修正法,建立了三支残差修正的DALGBM-3WRC模型。首先给出了ARIMA、LightGBM、STL和三支决策理论的相关简介,然后详细阐述了3WRC的设计原理和思想,并给出了算法模型流程图和算法伪代码;其次绘制示意图对数据集转换进行了解释;最后设计了ARIMA和LightGBM的组合预测模型,使用3WRC对LightGBM的预测结果进行了修正。为了验证模型DA-LGBM-3WRC的有效性,实验部分使用真实燃气负荷数据,对比了两个单一模型和不使用3WRC的组合模型,使用MAE、RMSE分析了模型预测结果。DA-LGBM-3WRC组合模型开创性地引入了三支决策,理论分析和实验结果表明,其预测效果明显优于单一预测模型。未来工作的重点将首先关注寻找更优的方法确定3WRC中的阈值对(α,β),以得到更优的残差修正效果;其次将拓展应用场景,进行长期负荷预测场景下的研究。

猜你喜欢
残差燃气修正
对一起燃气泄漏爆炸引发火灾的调查
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
教材《燃气工程施工》于2022年1月出版
近期实施的燃气国家标准
修正这一天
探讨燃气工程的造价控制及跟踪审计
基于残差学习的自适应无人机目标跟踪算法
基于深度卷积的残差三生网络研究与应用
对微扰论波函数的非正交修正