曹敏 蒲学吉 巨健 俞文瑾
摘要:在总结现有用电量预测的主流方法基础上,对工业用电量数据特征进行分析,提出一种新的工業市场用电量预测方法。文章通过分析文献,总结了当前主流预测模型和方法的优势和劣势,从而提出灰色预测和梯度提升回归的组合模型。针对文章建立的模型,使用某地区四年实际用电量数据,与传统灰色预测模型、神经网络模型、单一梯度提升回归模型的预测结果进行对比,发现该组合模型在数据量较少或数据量比较充足的情况下,预测精度和稳定性很高,证明了所建立模型可靠性和有效性。
Abstract: On the basis of summarizing the current mainstream methods of electricity consumption forecasting, the paper analyzes the characteristics of industrial electricity consumption data, and proposes a new industrial market electricity consumption forecasting method. By analyzing the literature, the paper summarizes the advantages and disadvantages of current mainstream prediction models and methods, then it proposes a combined model of grey prediction and gradient elevation regression. According to the model established in the article, using the four-year actual electricity consumption data of a certain area, compared with the prediction results of the traditional gray prediction model, neural network model and single gradient lifting regression model, it is found that the combined model has less data volume or data volume. In the case of sufficient conditions, the prediction accuracy and stability are high, which proves the reliability and effectiveness of the established model.
关键词:预测;用电量;灰色预测模型;梯度提升回归
Key words: forecast;electricity consumption;grey-forecasting model;ANN
中图分类号:TM715 文献标识码:A 文章编号:1006-4311(2019)13-0035-03
0 引言
在电力需求侧管理中,用电量预测是一项关键的工作。在售电市场开放后,工业电力用户作为电力市场的主体,它们的用电量需求对用电市场产生很大的影响,工业市场用电量是各售电市场主体制定策略时参考的一项重要的指标,买卖双方通过预测用电量来估计成交价格成交规模,从而制定自己的营销及交易策略。对于售电企业来说,对工业用电量的预测准确性决定了其对售电市场方向的把握程度;对于供电主体来说,准确的用电量预测对合理地制定发电计划、能源销售计划以及配置电力资源起到了十分重要的作用[1]。
众多学者针对售电量预测方法进行了大量的研究,从各种角度进行创新提出了很多具有不同特点的预测方法。当前较为常见的预测方法有时间序列、灰色预测模型以及回归预测模型。时间序列预测模型主要通过历史数据预测未来趋势,对样本需求量较低[2],目前主流的时间序列方法主要包括平滑类方法和自回归类方法,平滑类方法包含简单移动平均、指数平滑等方法,对波动量较大的数据较为敏感,要求数据与时间有线性或其他函数关系,呈一条平滑的曲线;而自回归类模型包含现有主流的自回归积分滑动平均模型(ARIMA)等要求数据平稳,在使用该类模型时除了要将数据转换为平稳序列外,还要确定多个参数,工程化难度较大。灰色预测理论最早由邓聚龙在1982年提出[3],其原理是使用数学方法利用少量数据建立灰色系统[4],从部分已知或部分未知的信息和趋势中提取有价值的信息。最早的灰色预测模型是GM(1,1)模型,它通过单变量的一阶微分方程估计预测值,虽然该模型原理简单、可检验性强[5],但是它单纯的从目标变量的趋势来预测,不能加入更多已知的影响因素。由此考虑多变量影响的GM(1,n)模型得到了更广泛的应用[6-8],但是Tien等[9](2012)通过对GM(1,n)的一次累计估计函数进行积分形式的推导发现,传统的GM(1,n)模型存在一定的缺陷,并在文章中证明卷积积分灰色预测模型GMC(1,n)的正确性,但是笔者在实际运用中发现GMC(1,n)模型也存在一定缺陷,一方面在特征选择方面还不够完善,容易受低相关特征影响而出现较大的偏差;另一方面,某些特征的某一段数据出现互相关时,会导致依赖于最小二乘法求解参数的GMC(1,n)模型失效。较为常用的预测方法还有回归预测方法,包含线性回归、神经网络等算法,回归模型可以应用于中长期预测,但是此类模型对数据量有着一定的要求;梯度提升回归[10]本质上是一种回归模型,区别于传统回归模型,梯度提升回归对离散值不敏感,因此不需要归一化处理,由于其有着预测精度高、泛化能力强等特点,该模型被广泛应用于数据建模比赛中。
在以月为单位的工业市场用电量预测中,用电量受较多的随机因素影响,区别于其他行业用电特征,工业用电市场各月之间变动幅度大、周期波动呈现复杂的非线性结构,如图1所示(单位:万千瓦时),单独使用一种预测模型无法产生较好的预测效果,事实证明,组合预测算法可以提高预测精度[11-13]。文章在前人研究基础上,将灰色预测与梯度提升回归结合,建立了一种自适应的组合预测模型;使用某省4年的数据进行预测,通过对比多个预测模型发现,文章所建立的组合预测模型预测精度较高,鲁棒性较强。
1 用电量预测模型
1.1 灰色预测模型
文章使用售电市场月用电量序列数据作为输入,使用GM(1,1)模型预测,用最小二乘法求解出系统参数,带入灰色微分方程解得预测值。
模型的具体求解过程如下:
设有观察值X(0),是该动态系统的原始序列,将原始序列一次累加生成X(1)(缩写为1-AGO),以减少数据的随机性,则GM(1,1)模型的离散动力系统可由以下灰色微分方程表示:
2 算例分析
2.1 实验设计
文章选取某省2014年1到2017年9月工业用电数据(单位:万千瓦时),分别使用灰色预测模型、梯度提升树、神经网络以及文章建立的组合预测模型进行建模和预测,对比多个模型的预测结果;此外,文章通过调整训练期长度和预测期长度,分析不同数据量下各个模型在预测不同时长内工业市场用电量的表现。
神经网络由于其出色的非线性拟合能力,近年来被广泛的应用于各个领域,本文使用3层神经网络模型进行对比,通过对2-3倍的输入层节点数进行测试,确定隐含层节点数,最终设置为12个。迭代次数设置为1000次,防止过拟合。
文章使用公式(12)中的绝对百分误差MAPE评估模型的预测精度,使用MAPE的标准差作为评估预测模型稳定性的指标,即在多次实验中,MAPE均值越低模型准确度越高,MAPE标准差越低,模型稳定性越好。
2.2 实验结果与分析
在训练期长度r分别6、12、24时的实验结果如表1所示。
通过对比实验数据发现,和以往的经验不同,灰色预测模型在数据匮乏的时候的表现并不是很好,而如神经网络、梯度提升回归等一些强学习器却得到了一些很好的预测结果。
当训练数据量增加到12个月时,此时训练期的数据量仍然是偏小的,四个预测模型中,组合预测模型表现最好,精度和稳定性都是最高的。
当数据量比较充足时前三种模型的预测精度相近,但是相比较来说灰色预测模型的稳定性较差,在这种情况下宜采用组合预测或神经网络模型。
此外可以發现当预测期逐渐增加,灰色预测模型的精度和稳定性在不断提高,主要原因是灰色预测在长期的趋势预测方面有着一定的优势,而它的的拟合能力较差,使用组合模型将其与梯度提升回归模型进行耦合,可以在一定条件下实现二者的互补。文章所述组合模型在数据量较少或充足的情况下可以实现对工业用电市场进行有效预测。
3 结束语
工业用户,特别是大工业用户在售电市场用电量中占有很大的比重,不同于其他用电量,工业用电量在中长期的随机波动很强,波动周期不太明显。使用拟合能力较强的梯度提升回归模型与灰色预测模型组合,可以很好的发挥互相修正的作用。通过实验结果可以发现,组合预测优于单个预测模型,文章所建立的组合预测模型参数较少,预测精度和稳定性高,可以在工业用电预测中发挥有效的作用。
参考文献:
[1]何川,舒勤,贺含峰.ICA特征提取与BP神经网络在负荷预测中的应用[J].电力系统及其自动化学报,2014,26(08):40-46.
[2]颜伟,程超,薛斌,李丹,陈飞,王顺昌.结合X12乘法模型和ARIMA模型的月售电量预测方法[J].电力系统及其自动化学报,2016,28(05):74-80.
[3]邓聚龙.灰色控制系统[J].华中工学院学报,1982(03):9-18.
[4]Ren J, Gao S, Tan S, et al. Prediction of the yield of biohydrogen under scanty data conditions based on GM(1, N)[J]. Interna-tional Journal of Hydrogen Energy, 2013, 38(30): 13198-13203.
[5]王允平,黄殿勋,熊浩清,牛元立.智能电网环境下采用关联分析和多变量灰色模型的用电量预测[J].电力系统保护与控制,2012,40(01):96-100.
[6]Wang W, Hao Y, Du X. Application of grey system GM(1, N) model to predicting spring flow[C]// IEEE International Conference on Grey Systems and Intelligent Services. IEEE, 2007:448-452.
[7]Wang Z X. Grey multivariable power model GM(1, N) and its application[J]. Systems Engineering-Theory & Practice, 2014, 34(9):2357-2363.
[8]李晓波.GM(1,N)改进模型在年度售电量预测中的应用[J].中国新技术新产品,2016(03):4-5.
[9]Tien T L. A research on the grey prediction model GM(1,n)[J]. Applied Mathematics & Computation, 2012, 218(9): 4903-4916.
[10]Friedman JH. Greedy function approx-imation: a gradient boosting machine [J]. The Annals of Statistics, 2001, 29(5): 1189-1232.
[11]牛东晓,陈志业,邢棉,谢宏.具有二重趋势性的季节型电力负荷预测组合优化灰色神经网络模型[J].中国电机工程学报,2002(01):30-33.
[12]杨大晟,李涛,吴大军,冯瑞明.全社会用电量的优选组合预测法[J].电气应用,2013,32(24):81-84.
[13]Zhang J, Wei Y M, Li D, et al. Short term electricity load forecasting using a hybrid model[J]. Energy, 2018, 158: 774-781.
[14]王允平,黄殿勋,熊浩清,牛元立.智能电网环境下采用关联分析和多变量灰色模型的用电量预测[J].电力系统保护与控制,2012,40(01):96-100.