石 佳,丁 俊,张纳川
(国网苏州供电公司,江苏 苏州 215004)
合理的电网规划对电网的投资、运行、效益等方面有着重要意义。电网是电力系统的重要组成部分,电网能否合理运行直接取决于规划是否科学经济,因此电网规划是一个尤为重要的问题。电力电量平衡是电力规划设计的重要组成部分,根据系统负荷预测和机组出力情况,得到连续多年的电力盈亏[1-2]。在系统水电容量比重大时,需要进行电量平衡分析,分析结果可以帮助规划人员了解未来的装机进度以及检修安排是否合理,并做相应调整,以保证电力电量的生产使用。
电力电量平衡是规划的基础工作,数据量大,工作繁杂,现在多采用人工经验和计算软件相结合的方式开展该项工作。面对电力系统迅速膨胀的数据量,规划人员如何从中挑选有用信息,摒弃冗余数据,也是电力系统建设的一项艰巨任务。在当今互联网时代,数据来源广,信息获取速度快,这就要求工作人员合理利用工具进行业务分析[3-5]。数据挖掘技术的提出与应用为数据分析提供了强有力的技术支持,便于发现数据深层的相似性和差异性[6-7]。
本文对数据挖掘技术在电力电量平衡中的应用进行初步探索。通过实际电网历史数据对不同方法在负荷预测的适用性进行对比,分析不同类型机组检修计划和电力平衡结果之间的关联性。
数据挖掘是为了在大量数据中获取事先未知的信息或规则而进行的选择、探索和建模过程。对一特定领域采用该技术,使用者要对分析的数据有深层理解和认识,才能挖掘出有意义的结果。这一技术依托数据库[8-10],对其中数据进行处理,利用有关算法获取隐藏信息。
数据挖掘主要步骤有数据的预处理,数据挖掘和后处理三部分(见图1):首先,对数据进行特征的筛选、规范;其次,基于不同任务选取合适的方法去挖掘其中信息;最后,获得结果后过滤无用数据,将结论用图表形式可视化展现。
图1 数据挖掘过程
预测是通过构建和使用模型学习标号样本的规则来评估无标号样本,或者对给定样本所具有的值区间或者属性值进行评估[11-12]。因此,预测的主要问题是分类和回归,分类多用于预测标称值或者离散值,回归多用于预测有序值或者连续值[13-15]。负荷可以看作是一组按时间排序的随机序列,即时间序列,间隔可取分钟,日,周,月,年等。不同于典型的预测,时间序列强调一种自然的时间顺序,比一般的数据集多一个时间戳字段。
关联是用以发现隐藏在大数据集中有意义的关系,反映一个项目与其他项目之间的依赖性。多个项目之间关联关系较多,可以采用支持度和置信度两个指标来评判最为重要的关联规则。为了获得包含最小覆盖量的属性组合,现多用Apriori算法、FP增长算法和PCA算法来获取项集[16-17]。对于关联规则的挖掘,需要将数据进行二元表示,即忽视数值,采用有无或是01来表示数据。
电力电量平衡中,最高发电负荷和电量是可以通过负荷预测得到的。而负荷预测受到国民经济发展等因素影响,是一项极为复杂的工作,现有的电力软件都是通过各种预测模型来实现的。本文利用平台数据库中的历史最高发电负荷数据作为训练集,通过数据挖掘中的时间序列预测算法,来预测未来一年的负荷曲线。
该平台中已存有电网6年的电力电量平衡数据,可通过接口获取其中五年的最高发电负荷作为训练集,用于预测未来的负荷曲线,与实际的数据作平均相对误差分析。
WEKA在时间序列预测中提供了如下算法:正态随机过程 (GaussianProcesses,GP)、 线性回归(Linear Regression,LR)、多层感知器 (Multilayer Perceptron,MLP)、SMOreg。四种算法的预测分析见表1至表3。
表1 预测12个月负荷
表2 预测6个月负荷
表3 预测3个月负荷
对这四种算法得到的预测误差对比总结如表4所示。
表4 不同算法的平均相对误差对比
从表4可以看出,MLP算法的误差过大,不适合用于电力平衡的负荷预测。在预测时训练数据少,需要预测序列长时,使用GP算法精度更高,训练数据多,预测序列短时,使用SMOreg算法精度更高。
机组检修安排在遵循一定的基本原则下,多由人工安排机组检修时间段。如果考虑不全,安排不恰当,电力平衡计算结果就会出现亏损。
以数年电力平衡结果为输入数据,但需要对数据进行预处理,将数值形式转化为二元形式,才能提供给WEKA使用。通过数据平台接口,将电力平衡计算后盈余月份标记为y,亏损月份标记为n。机组检修计划按照机组类型归类,将煤电、气电和水电在各月的检修状态也用二元变量表示,机组的检修状态为y,运行状态为n。
处理后的数据存入表格的对应项目中,作为挖掘的输入文件。以五年的电力平衡结果为输入数据,使用Apriori、FP-Growth等算法分析电力平衡盈亏和机组检修计划间的关联性。
选取最小置信度为0.9时,得到的最佳关联结果反映了电力盈亏主要与火电、水电和气电机组检修状态相关。
当水电不检修,电力盈余时,火电处于检修状态;
当火电不检修,电力盈余时,水电处于检修状态;
当水电不检修,气电检修,电力盈余时,火电处于检修状态。
从这些结果可以看出,为保证电力盈余,应该尽可能地安排水电和火电不在同一时段(单位为月)检修。
本文对数据挖掘技术在电力电量平衡中的应用进行了初步探索。通过实际电网历史数据对比分析了不同方法在负荷预测的适用性,得出训练数据少,需要预测序列长时,使用GP算法精度更高,训练数据多,预测序列短时,使用SMOreg算法精度更高。本文通过分析某省历年不同类型机组检修计划和电力平衡结果之间的关联性,发现不同类型机组应安排在不同时间段检修,以保证电力平衡。
参考文献:
[1] 蒲天骄,陈乃仕,葛贤军,等.电力电量平衡评价指标体系及其综合评估方法研究[J].电网技术,2015,39(1):250-256.
PU Tianjiao,CHEN Naishi,GE Xianjun,et al.Research on Evaluation Index System and Synthetical Evaluation Method for Balance of Electric Power and Energy[J].Power System Technology,2015,39(1):250-256.
[2]朱泽磊,周京阳,潘毅,等.考虑电力电量平衡的安全约束经济调度[J].中国电机工程学报,2013,33(10):168-176.
ZHU Zelei,ZHOU Jingyang,PAN Yi,et al.Security constrained economic dispatch considering balance of electric power and energy[J].Proceedings of the CSEE,2013,33(10):168-176.
[3]宋亚奇,周国亮,朱永利.智能电网大数据处理技术现状与挑战[J].电网技术,2013,37(4):927-935.
SONG Yaqi,ZHOU Guoliang,ZHU Yongli.Present status and challenges of big data processing in smart grid [J].Power System Technology,2013,37(4):927-935.
[4]VJ D.High information content database generation for data mining based power system operational planning studies[C]//IEEE Power and Energy Society General Meeting,2010.
[5]廖志伟,孙雅明.数据挖掘技术及其在电力系统中的应用[J].电力系统自动化,2001,25(11):62-66.
LIAO Zhiwei,SUN Yaming.Data Mining Technology and its Application on Power System[J].Automation of Electric Power System,2001,25(11):62-66.
[6]廖志伟,孙雅明.基于事件序列数据挖掘原理的高压输电线系统故障诊断[J].电力系统自动化,2004,28(4):22-27.
[15] LIAO Zhiwei,SUN Yaming.A new data mining approach for fault diagnosis of HV transmission line system based on sequence of events[J].Automation of Electric Power Systems,2004,28(4):22-27.
[7]邱凤翔,徐治皋,司风琪,等.基于主元分析的关联规则挖掘及在电厂中的应用[J].电力系统自动化,2009,33(16):81-84,107.
QIU Fengxiang,XU Zhigao,SI Fengqi,et al.Association Rules Mining Based on Principal Component Analysis and Its Applications in Power Plant[J].Automation of Electric Power System,2009,33(16):81-84,107.
[8]Mori H.State-of-art overview on data mining in power systems [C]//IEEE Power Engineering Society General Meeting, Canada, 2006.
[9]陈健,万国成,孙冠男,等.GIS平台电网规划辅助决策系统开发与应用[J].电力系统及其自动化学报,2010,22(6):99-103.
CHEN Jian,WAN Guocheng,SUN Guannan,et al.Development and Application of GIS Platform Decision-making Support System for Power Network Planning[J].Proceedings of the CSU-EPSA,2010,22(6):99-103.
[10]陶文伟,吴文传,王俏文,等.基于EMS的电网规划分析系统的设计与实现[J].电力系统自动化,2006,30(14):87-91.
TAO Wenwei,WU Wenchuan,WANG Qiaowen,et al.Design and Implementation of Transmission Network Planning Analysis System Based on EMS[J].Automation of Electric Power System,2006,30(14):87-91.
[11]李翔,高山,陈昊,等.基于变结构协整理论的中长期电力负荷预测模型[J].电网技术,2007,31(9):48-52.
LI Xiang,GAO Shan,CHEN Hao,et al.A New Medium-and Long——term Load Forecasting Model Based on Variable Structure Cointegration Theory[J].Power System Technology,2007,31(9):48-52.
[12]薛万磊,于继来.分形外推插值算法在电力负荷预测中的应用[J].电网技术,2006,30(13):49-54.
XUE Wanlei,YU Jilai.Application of Fractal Extrapolation Algorithm in Load Forecasting[J].Power System Technology,2006,30(13):49-54.
[13]林顺富,郝朝,汤晓栋,等.基于数据挖掘的楼宇短期负荷预测方法研究[J].电力系统保护与控制,2016,44(7):83-89.
LIN Shunfu,HAO Chao,TANG Xiaodong,et al.Study of short-term load forecasting method based on data mining for buildings[J].Power System Protection and Control,2016,44(7):83-89.
[14]CHATURVEDI D K,SINHA A P,MALIK O P.Short term load forecast using fuzzy logic and wavelet transform integrated generalized neural network[J].Electrical Power and Energy Systems,2015,67:230-237.
[15]康重庆,夏清,刘梅.电力系统负荷预测[M].北京:中国电力出版社,2007.
[16]马瑞,周谢,彭舟,等.考虑气温因素的负荷特性统计指标关联特征数据挖掘[J].中国电机工程学报,2015,35(1):43-51.
MA Rui,ZHOU Xie,PENG Zhou,et al.Data Mining on Correlation Feature of Load Characteristics Statistical Indexes Considering Temperature[J].Proceedings of the CSEE,2015,35(1):43-51.
[17]于之虹,黄彦浩,鲁广明,等.基于时间序列关联分析的稳定运行规则提取方法[J].中国电机工程学报,2015,35(3):519-525.
YU Zhihong,HUANG Yanhao,LU Guangming,et al.A Time Series Associative Classification Method for the Operation Rule Extracting of Transient Stability[J].Proceedings of the CSEE,2015,35(3):519-525.