刘晓悦 孙海鹤
摘 要: 针对集中式负荷预测方法没有考虑到各区域内负荷特性的不同,也不能充分利用电网大数据优势的问题,提出了基于大数据的多子网预测方法。该方法通过子网预测实现大电网的预测。根据大数据分析负荷变化规律,利用数据挖掘原理对样本进行聚类。基于大数据对子网划分,根据相似度评价方法对子网合并,利用神经网络建立子网负荷预测模型。为验证所提方法的有效性,利用电网数据进行算例分析,对比集中式负荷预测,所提方法预测效果更好并且用时更少,在大电网负荷预测中有一定实用价值。
关键词: 大数据; 数据挖掘; 神经网络; 负荷预测; 子网预测; 相似度评价
中图分类号: TN919?34; TM743 文献标识码: A 文章编号: 1004?373X(2020)12?0061?04
Abstract: Since the centralized load prediction method does not take the load feature differences of various regions into account, and cannot fully utilize the advantages of power grid big data, a multi?subnet prediction method based on big data is proposed. In the method, the big power grid prediction is realized by means of subnet prediction. The load variation law is analyzed based on the big data. The samples are clustered by adopting the data mining principle. The subnet is divided based on big data, and merged according to the similarity evaluation method. The subnet load prediction model is established based on the neural network. The example analysis is conducted with the power grid data, so as to verify the effectiveness of the proposed method. In comparison with the centralized load prediction method, the proposed method has a better prediction effect and less time consumption, which has a certain practical value in the load prediction of big power grids.
Keywords: big data; data mining; neural network; load prediction; subnet prediction; similarity evaluation
0 引 言
短期负荷预测在电力系统经济调度中占有重要位置[1]。预测结果对于电力调度运营部门来说显得尤为重要,通过预测结果可以合理制定发电计划,降低发电成本,保证安全可靠的供电,提高电力系统的稳定性。
负荷预测方法的研究随着电网技术的发展也在不断深入。传统的负荷预测方法,如:负荷求导法、相似日法,方法虽简单方便,但没有体现出引起负荷变化的各种因素。经典负荷预测方法有时序分析法、回归分析法等统计模型。这些方法集中在负荷序列自身的变化规律上,因此灵活性差且预测效果一般。人工智能技术的成熟使得专家系统法、灰色系统理论、小波分析法、支持向量机[2]、人工神经网络[3]、鱼群算法等智能算法也加入到负荷预测的行列,一定程度上提升了负荷预测的精度。
近年智能电网的快速发展,使得电网的数据采集变得简单,同时获取的数据类型也越来越多,智能电网中大数据趋势日益明显。目前有很多人把数据挖掘应用于集中式负荷预测的研究。文獻[4]基于数据挖掘技术利用模糊系统进行负荷预测。文献[5]通过数据挖掘提高了支持向量机方法对海量数据的处理能力。文献[6]基于数据挖掘技术改善了短期负荷预测效果。集中地对大电网进行分析、预测的方法过于笼统,使得海量电力数据得不到充分利用。文献[7]研究了并行运算的预测模型,提高了处理海量高维数据的能力。文献[8]提出了子网累加法。文献[9]考虑温度对电网负荷的影响,实现对子网的划分。文献[10]基于HI实现了电网的分区预测。文献[11]通过分区预测实现了大区内负荷精细化预测。
研究表明了多子网负荷预测是解决负荷区域性问题的有效手段,但是以往的研究在对子网预测时选取样本较少,不能充分发挥海量电力数据的优势,无法对子网进行有效划分。因此,需要把大数据与多子网负荷预测相结合才能相得益彰。
1 基于大数据的电网负荷变化规律分析
1.1 短期负荷时间序列特性
分析负荷变化规律是进行负荷预测的基础。本文以东部某地区为研究对象,负荷数据为2016年每天每隔30 min的采样数据。利用大数据和数据挖掘来寻找负荷变化规律。图1显示的是该地区短期负荷随时间变化的曲线。
由图1可以看出,每天的负荷曲线变化规律基本一致,从时间上看这和人们的生活规律是密不可分的。每天上午和晚上的9:00—11:00这两个时间段是用电的高峰期,凌晨时段一般是低谷期。工作日的负荷要明显高于休息日,这是因为工业用电一般比生活用电更高;而周六由于是节假日的缘故负荷要高于周日。
从图2可以看出,负荷一个月内每周波动情况也基本一致。因此电网短期负荷在时间上有周期性、相似性的特征。
1.2 数据挖掘分析历史负荷数据
为了合理选择数据样本,使建立的模型更贴合实际,本文采用数据挖掘原理对历史负荷数据进行聚类分析。
4) 更新相异矩阵C。如果更新距离后的C中最小元素为c(i,j),表示目前聚类i和j最相似,下一次选择合并它们。不断重复这个过程,直到生成包含全部负荷曲线的单个聚类。相异矩阵C表示曲线两两的距离。若C小于阈值,就合为一类,接着更新相异矩阵。
设定阈值为0.4,采用以上聚类方法对该地区每天负荷数据进行聚类分析,结果见表1。
2 多子网短期负荷预测方法
2.1 多子网负荷预测方案
由于大电网覆盖地理区域较大,内部不同区域气象分布情况可能不尽相同,难以用一组气象数据来体现大电网所具有的气象特征,因此集中式负荷预测方法在进行预测时难免出现偏差。为了改善集中式负荷预测结果,本文提出了基于大数据将大电网分为多个子网单独分析、建模的预测方案。预测方案如图3所示。
2.2 基于大数据集的子网的划分
有效对子网进行区分是提高预测效果的关键一步。过大或过小的划分预测区域都会对预测结果造成偏差。因此,需要基于大数据集合理划分子网,控制好子网规模。具体步骤如下:
1) 子网预划分。根据行政区域和气象特征的分布情况,自下而上,把220 kV节点作为基本单元进行预划分。找出气象观测站的实时数据、预测数据以及各个子网之间的联系。
2.4 基于神经网络的负荷预测模型
人工神经网络是人工智能领域的分支,它具有自适应、自组织和实时学习的优点。BP神经网络结构简单且具有很强的非线性映射能力、泛化能力和容错能力,因此BP神经网络是现在使用比较多的神经网络模型。但BP神经网络也存在着容易陷入局部极小值的缺点。粒子群优化算法由于参数少、易于实现、运算速度快等特点,在优化问题中得到广泛使用。本文采用粒子群优化的BP神经网络进行负荷预测。
3 实验分析
为验证多子网负荷预测方案的有效性和准确性,利用东部某地区电网大数据,进行建模仿真并分析预测结果。实验环境:ThinkServer RD650,处理器是六核Intel至强E52600 v3,型号E5?2620 v3,拥有32 GB内存,32 TB存储容量。实验步骤如下:
1) 选择样本、划分子网。数据采用该地区2016年8月份电网数据。子网划分结果见表3。由于子网2,5负荷曲线相似度较高,因此合并为一个网络,最终将子网划成4个。
从预测结果可以看出,多子网预测方法预测值比集中式预测值更加接近实际负荷值,且所提方法的预测误差都在2%以内,有很好的预测精度和良好的稳定性。
为了进一步验证预测结果,对8月29—31日的负荷进行预测,结果如表4所示。
从表4可以看出,多子网负荷预测方法在平均相对误差、最大相对误差两个方面都要低于集中式预测方法,负荷预测准确率更高,并且由于多子网负荷预测可以并行计算,大大缩短了预测的时间。综上结果表明无论是对工作日还是休息日的负荷预测,多子网负荷预测法都占有优势。
4 结 论
发挥大数据的优势,通过划分子网的方式在一定程度上解决了以往集中式负荷预测过程中无法准确把握负荷区域性的问题。本文采用电网大数据进行实验仿真,结果表明,所提出的多子网预测方法在负荷预测的精度、稳定性及时间上相比集中式负荷预测都有了提升,在对大电网进行负荷预测的实际中有应用价值。
参考文献
[1] 朱海兵,崔玉,熊浩.基于改进型BP神經网络的电网负荷预测[J].现代电子技术,2016,39(20):64?66.
[2] 李清霞.海量数据的支持向量机优化挖掘方法[J].现代电子技术,2018,41(6):137?140.
[3] 李秋硕,王岩,孙宇军,等.BP神经网络在用电用户分类中的应用[J].现代电子技术,2017,40(9):156?158.
[4] AZADEH A, SABERI M, GHADERI S F, et al. Improved estimation of electricity demand function by integration of fuzzy system and data mining approach [J]. Energy conversion and management, 2008, 49(8): 2165?2177.
[5] HONG W C. Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model [J]. Energy conversion and management, 2009, 50(1): 105?117.
[6] 林顺富,郝朝,汤晓栋,等.基于数据挖掘的楼宇短期负荷预测方法研究[J].电力系统保护与控制,2016,44(7):83?89.
[7] 王保义,王冬阳,张少敏.基于Spark和IPPSO_LSSVM的短期分布式电力负荷预测算法[J].电力自动化设备,2016,36(1):117?122.
[8] 杨朋.大电网短期负荷预测方法研究[D].郑州:郑州大学,2010.
[9] LI T, GUO J, LUO D, et al. Region load forecasting based on load characteristics analysis and GRNN [M]. Berlin: Springer, 2014.
[10] 马坤隆.基于大数据的分布式短期负荷预测方法[D].长沙:湖南大学,2014.
[11] 马晓东,顾杨青,张军民,等.基于区域划分的分布式短期负荷预测方案设计[J].自动化与仪器仪表,2017(12):88?91.