杨跞 钟力强 殷豪
摘 要:随着电力系统的飞速发展,电力负荷数据的规模也愈加庞大,以往基于小规模数据的电力负荷预测算法可能无法容纳大量数据集。为改善预测模型的工程实用性,本文提出了一种新型的机器学习模型,该模型将卷积神经网络(CNN)与纵横交叉优化算法(CSO)结合起来,应用于短期负荷预测。从大规模的负荷数据中收集到横向相邻日和纵向的相似日负荷数据,设置横向预测和纵向预测的权值系数,再用CSO优化算法去找最优系数,得到最后的二维组合预测结果,并与其它机器学习算法比较。通过实验证明,模型可以快速有效地处理大规模的负荷数据,具有较强的泛化能力。
关键词:大数据压缩;卷积神经网络;纵横交叉算法;组合预测;相似日负荷
中图分类号:TP183;TM715 文献标识码:A 文章编号:2096-4706(2019)04-0160-03
Research on Two-dimensional Combined Short-term Load Forecasting Method
Based on Convolution Neural Network and Crosswise Algorithm
YANG Luo1,ZHONG Liqiang2,YIN Hao1
(1.Guangdong University of Technology,Guangzhou 510006,China;
2.Guangdong Electric Power Research Institute,Guangzhou 510030,China)
Abstract:With the rapid development of power system,the scale of power load data is becoming larger and larger. In the past,power load forecasting algorithms based on small-scale data may not be able to accommodate large data sets. In order to improve the engineering practicability of the predictive model,a new machine learning model is proposed which combines the Convolutional Neural Network (CNN) with the Cross and Cross Optimization Algorithm (CSO) for short-term load forecasting. Collecting similar daily load data from horizontally adjacent days and verticals from large-scale load data,setting the weight coefficients of lateral prediction and longitudinal prediction,and then using CSO optimization algorithm to find the optimal coefficient to obtain the final two-dimensional combined prediction,the result is compared to other machine learning algorithms. Experiments show that the model can quickly process large-scale load data and has strong generalization ability.
Keywords:large data compression;convolutional neural network;crossover algorithm;combination forecasting;similar daily load
0 引 言
在电力领域中,电力负荷预测在电力系统调度、电力市场和制定发电厂检修计划等方面一直是关键问题[1]。负荷预测问题是一个复杂的非线性问题,通常包含天气、地理、社会经济等因素[2]。文献[3]认为通过对智能电网大数据的处理和分析,电力公司可以准确预测用户的电力负荷,及时发现异常和故障,并加以處理。基于传统机器学习算法的短期负荷预测模型显示了它在预测负荷方面的有效性,特别是在解决负荷非线性特征拟合方面的有效性,其中人工神经网络(ANN)和支持向量机(SVM)是构建预测模型中最常见的机器学习方法[4-6]。随着学习样本的增多,ANN的计算量会急剧增加,并且容易陷入局部最优或过度拟合[7]。虽然支持向量机(SVM)的kernel函数和正则化技术可以有效解决过拟合问题[8],但是基于kernel函数的SVM在处理大数据预测模型时所耗费的时间过多,以至于失去了工程实用性[9]。这些算法都在各自的实验环境中取得了不错的实验结果,但是这些研究都是基于小规模数据来进行设计和验证的。此外,上述预测算法也很难发现与电力负荷不相关的坏数据。针对部分已有算法存在的问题,本文提出了一种新的方法,结合CSO优化算法和深度学习模型(卷积神经网络CNN)来进行短期负荷预测,并基于实际数据进行了提前24小时负荷预测实验。结果表明,新方法结合了CSO算法强大的全局搜索能力和CNN算法的矩阵处理能力,能有效处理大规模数据,提高预测的准确性。
1 CNN卷积神经网络
卷积神经网络由一个或多个卷积层和顶端的全连通层(对应经典的神经网络)组成,同时也包括关联权重和池化层(Pooling Layer)[10]。卷积层是深度学习神经网络的核心部分,卷积运算的目的是提取输入的不同特征;池化层会不断地减小数据的空间大小,因此参数的数量和计算量也会下降,这在一定程度上控制了过度拟合[11,12]。CNN的运行与局部输入区域的基本操作(包括卷积、激活函数和池化)仅依赖于相关的空间坐标,这一结构使卷积神经网络能够利用输入数据的二维结构[13]。相比较其他深度、前馈神经网络,卷积神经网络需要的参数更少,同时CNN在实现上采用GPU并行计算,计算速度和效率得到提高[14]。
本文使用CNN进行预训练,典型的CNN结构如图1所示。它包含5个卷积层和2个全连接层,部分卷积层的后面还添加了池化层,每层滤波器尺寸和卷积步长略有不同。如图1所示,CNN的最后一个卷积层(Convolutional Layer,CONV)CONV5输出256通道的特征图(Feature Map),全连接层(Fully connected layer,FC)FC6将256个通道内的全部特征进行串联,生成一个4096维的高维特征向量。不同类别的数据集在深层特征上的差异很大,对经过CONV5、FC6、FC7输出的特征向量使用分类器(这里使用的是支持向量机SVM),能够输出较好的预测结果。
2 CSO纵横交叉算法
纵横交叉算法[15](Crisscross Optimization,CSO)不同于其他人工智能算法之处在于,CSO由双搜索机制组成,分别是横向交叉算子和纵向交叉算子,两种算子在与竞争算子的同步配合下完成搜索任务。本文采用CSO智能算法优化横向预测和纵向预测的权值系数ra和rb,目标函数为预测误差,优化后的加权系数ra为0.3231,rb为0.6769。
2.1 横向交叉算子
横向交叉算子是一种在不同个体中所有维进行交叉的一种运算。假设种群用X表示,种群在更新过程中,横向交叉所产生的解用MShc表示。假设父代种群中两个个体X(i)和X(j)的第d维进行横向交叉运算,则它们的子代产生公式如下所示:
式(1)和式(2)中,r1和r2是介于0~1之间的随机数;c1和c2是介于-1~1之间的随机数;D为粒子的维度;M为粒子的规模;X(i,d)和X(j,d)分别是种群中第i和j个个体的第d维。
从式(1)和式(2)可以看出,横向交叉运算是以较大的概率在父代X(i)和X(j)所产生的超立方体空间内的对角顶点产生子代X(i,d)和X(j,d),并且以较小的概率在超立方体边缘进行搜索,这种跨界搜索方式可以提升算法的全局搜索能力。
2.2 纵向交叉算子
CSO算法的特点在于纵向交叉算子,这种算子是一种在一个个体之间的不同维进行的一种交叉运算,假设种群中第i个体的d1维和d2维进行纵向交叉运算,则公式为:
式(3)中,X(i,d1)和X(i,d2)分别是X(i)的第d1维和d2维;r是分布在0~1之间的随机数;MSvc(i,d1)是纵向交叉算子所产生的子代。
3 仿真实验
3.1 仿真环境
为验证本文所使用的算法在负荷预测中的有效性,在PC机上进行了仿真实验,深度学习采用CNN框架进行网络训练,训练时间共22小时。使用随机梯度下降法进行网络微调训练,初始学习率为10-4,动量项为0.9,权值衰减系数为0.0005。
初次训练耗时较多,如果数据更新需要重新训练CNN网络结构,把新的CNN网络和旧CNN网络共享的那些卷积层的学习率设置为0,仅更新网络特有的网络层。这样两个网络就共享了所有公共的卷积层,使得网络训练几乎不花时间,有效缩短了算法耗时。
3.2 实验数据重构与误差评价指标
從澳大利亚AEMO电力公司下载了大量电力负荷数据集,其中2012年至2017年的电力负荷记录超过100万次。数据集包括许多字段:负荷、日类型、温湿度、天气。样本参数用矩阵表示为:
(4)
式(4)中,xt,i为预测时刻负荷,纵向数据(xt-n,i~xt,i)为n个相似日同一时刻的负荷;横向数据xt,1~xt,96为相邻日负荷。相似日的选取以综合气象指数为标准,其公式为:
式(5)中,{D=1,2,3}为天气因子,3个等级代表肉眼可见云层的遮蔽程度;T为温度因子,这里以摄氏度为单位;H为湿度因子,采用天气预报中的相对湿度。计算出每天固定12个时刻的THI的平均值作为相似日的评价指标。训练神经网络时选出THI最接近的n日的数据作为相似日矩阵输入训练集中。误差评价指标为平均绝对百分比误差(MAPE)和均方根误差(RMSE)。
4 实验结果分析
实验结果由两部分组成。因为本文首先针对CSO优化算法参与预测的效果进行了实验对比,然后用CNN-CSO算法与常见预测方法进行了比较,验证了CNN-CSO算法的优点和不足。
(1)本文在CNN的基础上构造了CNN-CSO算法。因此,本文首先比较了CNN-CSO算法和CNN算法,详细结果如表1所示。在夏季和冬季负荷预测中,本方法获得的最优MAPE值分别为3.0554和7.4102,这意味着在CSO优化算法的帮助下,CNN-CSO算法优于基于CNN的负荷预测算法。考虑到RMSE,也就是说,将常规时间序列数据扩展为优化了权重系数后的二维数据矩阵,可以明显地提高预测的性能。
(2)将本文的方法与基于线性回归、支持向量机和神经网络等常见负荷预测方法进行比较,结果如表2所示。与表2所示的结果相比,CNN-CSO算法的大多数评价结果都高于常规算法。此外,对数据集进行重构可以更有效地提高传统机器学习方法的性能。例如,在夏季和冬季负荷预测中,将时间序列数据扩展为二维数据矩阵可有效提高预测的效果,因为MAPE值分别提高了84%和12%。
5 结 论
本文提出了一种基于CNN和CSO联合算法的短期负荷预测方法。具体来说,CSO算法用于优化重构后的数据矩阵的横向、纵向数据的权值,以便更有效地构建模型。由评价指标MAPE和RMSE验证,该模型在基于大规模数据的负荷预测上具有良好的效果。
参考文献:
[1] 廖旎焕,胡智宏,马莹莹,等.电力系统短期负荷预测方法综述 [J].电力系统保护与控制,2011,39(1):147-152.
[2] FAN S,CHEN L. Short-Term Load Forecasting Based on an Adaptive Hybrid Method [J].IEEE Transactions on Power Systems,2006,21(1):392-401.
[3] Diamantoulakis P D ,Kapinas V M ,Karagiannidis G K . Big Data Analytics for Dynamic Energy Management in Smart Grids [J]. Big Data Research,2015,2(3):94-101.
[4] 李龙,魏靖,黎灿兵,等.基于人工神经网络的负荷模型预测 [J].电工技术学报,2015,30(8):225-230.
[5] 吴倩红,高军,侯广松,等.实现影响因素多源异构融合的短期负荷预测支持向量机算法 [J].电力系统自动化,2016,40(15):67-72+92.
[6] 杨再鹤,向铁元,郑丹.基于小波变换和SVM算法的微电网短期负荷预测研究 [J].现代电力,2014,31(3):74-79.
[7] Hernández,Luis,Baladrón,Carlos,Aguiar J M ,et al. Artificial neural networks for short-term load forecasting in microgrids environment [J].Energy,2014,75(1):252-264.
[8] 王岗,姜杰,唐昆明,等.基于自适应双向加权最小二乘支持向量机的超短期负荷预测 [J].电力系统保护与控制,2010,38(19):142-146.
[9] 吴润泽,包正睿,王文韬,等.Hadoop架构下基于模式匹配的短期电力负荷预测方法 [J].电工技术学报,2018,33(7):1542-1551.
[10] [7] Hernández,Luis,Baladrón,Carlos,Aguiar J M ,et al. Artificial neural networks for short-term load forecasting in microgrids environment [J].Energy,2014,75(1):252-264.
[11] X.Wang,Y.Shi,J.Zhang,L.Bo,C.Cheng. Computation services and applications of electricity big data based on Hadoop Power Syst Technol,2015,39(11):3128-3133.
[12] GIRSHICK R,DONAHUE J,DARRELL T,et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]// Computer Vision and Pattern Recognition (CVPR),2014 IEEE Conference on. S.l.:s.n.,2014:580-587.
[13] Geoffrey E. Hinton,Nitish Srivastava,Alex Krizhevsky,et al. Improving neural networks by preventing co-adaptation of feature detectors [J].CoRR,2012.
[14] Xishuang Dong,Lijun Qian and Lei Huang.[IEEE 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)-Jeju Island,South Korea (2017.2.13-2017.2.16)] 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)-Short-term load forecasting in smart grid:A combined CNN and K-means clustering approach[C]//IEEE International Conference on Big Data & Smart Computing.IEEE,2017:119-125.
[15] 孟安波,胡函武,劉向东.基于纵横交叉算法优化神经网络的负荷预测模型 [J].电力系统保护与控制,2016,44(7):102-106.
作者简介:杨跞(1993-),男,汉族,河南驻马店人,硕士研究生,研究方向:人工智能在电力系统中的应用;钟力强(1984-),男,汉族,广东广州人,博士,高级工程师,研究方向:电机驱动与控制;殷豪(1972-),女,汉族,重庆人,副教授,研究方向:人工智能在电力系统中的应用。