陈 康,王 泽,郭永吉
(兰州理工大学电气工程与信息工程学院,甘肃兰州 730050)
近年来,因为风力发电技术具有清洁、无污染的特点,以及国家对于节能减排的重点需求,越来越多的大规模风电场开始并入电网,风电并网容量逐年上升,使得电力系统的运行工况变得复杂多变,暂态电压安全问题越来越严重,可能带来巨大的经济损失[1-4]。因此,快速、准确地对风电并网系统暂态电压稳定进行评估成为关键所在[5-7]。
目前,电力系统暂态电压稳定评估的主要方法有时域仿真法[8-9]、直接法[10-11]和机器学习法[12-16]。时域仿真法仿真准确,但搭建模型耗时时间长,不满足快速性的要求;直接法计算速度快,但暂态能量函数精度低,且模型受限,不满足准确性的要求。这2 种方法无法满足快速性、准确性的要求。目前,机器学习法广泛应用于图像识别与处理[17]、语言识别、目标跟踪等领域。机器学习法无需建立详细模型、构建能量函数,只需给模型输入相应的输入特征,就能完成暂态电压稳定评估。因其满足快速性、准确性的要求,已逐步应用于电力系统暂态电压稳定分析方面。
最近,已有基于机器学习的电力系统暂态电压稳定评估方法,如文献[18]研究卷积神经网络(Convolutional Neural Network,CNN)与暂态电压稳定评估的关联性,建立了基于CNN 的暂态电压稳定评估模型。但基于CNN 算法模型数据集大、超参数多、结构复杂、计算结果精度低,在快速性、准确性方面仍待优化。文献[19]利用混合训练方法优化CNN 模型,将模型对于不同配网的快速重构能力进一步提高,提高了CNN 模型的快速性。文献[20]中的残差网络(Residual Network,ResNet)是在CNN 的基础上发展而来,优化模型提取特征的多样性,选取高时效的物理量作为输入特征,验证了该模型的快速性和准确性。文献[21]中引入多粒度级联森林(Multi-grained Cascade Forest,gcForest)模型,省去了模型参数调整、数据处理等工作,选取易测量的系统状态变量构建样本特征,快速、准确地完成电压稳定评估,证明了该方法在电网领域的有效性和可行性。
因此,本文选择周志华[22]提出的基于随机森林算法的gcForest 模型,同时引入ResNet[23],对gcForest 模型进行优化,提出了一种基于多粒度残差级联森林(Multi-grained Residual Cascade Forest,grcForest)模型的风电并网系统暂态电压稳定评估方法,应用ResNet 提高gcForest 模型提取输入特征的多样性,优化模型的数据错误问题,使gcForest 模型在评估的快速性、准确性方面进一步提升。通过IEEE39 节点系统模型并借助PSASP 和Python 软件分析,与其他的机器学习算法在模型评价指标上进行对比。
现阶段应用于电网领域的机器学习方法,往往需要大量的数据集,具有模型结构较为复杂的缺点。本文采用的grcForest 模型是由ResNet 优化gcForest 模型后所得,它优化了原模型在提取输入特征多样性方面的不足,修正了原模型在森林层数增加后,导致特征量梯度爆炸或梯度消失的问题。gcForest 是一种基于随机森林的集成机器学习算法,该模型主要分为级联森林和多粒度扫描两个部分[22]。
级联森林的结构如图1 所示,由多层随机决策树森林的级联堆叠形成,共有两种树模型,完全随机森林(Completely-random Tree Forests,CRTF)和随机森林(Random Forest,RF)。级联森林的每一层都具有2 个CRTF 和2 个RF,CRTF 在全部输入特征向量空间中随机选取并对其进行分裂,RF 在部分输入特征向量空间中随机选取再通过基尼系数进行分裂。
图1 级联森林Fig.1 Structure of cascade forest
级联森林有多层并行排列的网络层,输入特征向量经网络层处理后,会形成一个代表该特征分布概率的类向量。运行过程中,森林层数会不断增加,各网络层间相互联系,开始时输入的输入特征向量和该层的输出结果共同作为下一层的输入特征向量。每层运算结束后,都会对模型的预测效果进行评估,如果该层评估效果相较于上一层提升效果不明显,森林层数不会再继续增加,将该层作为级联森林的最后一层。级联森林会根据不同的输入特征向量,自行确定级联森林的层数,无需通过复杂的算法确定模型大小。
多粒度扫描中引入滑动窗口对输入特征进行扫描,可多个不同尺寸的滑动窗口同时进行扫描,使输入特征向量里包含更多的特征,如图2 所示。
图2 多粒度扫描Fig.2 Multi-grained scanning
在神经网络算法的启发下,gcForest 模型通过多粒度扫描技术对级联森林的输入特征向量进行加强,使得gcForest 模型在处理数据时能够更加出色。
多粒度扫描流程:首先,假设给模型输入一个P维的输入特征样本,用尺寸长度为L的滑动窗口对其进行采样,获得S=(P-K)/L+1 个K维特征子样本向量;其次,在子样本向量用于级联森林模型后,经过每层森林都会获得长度为C(类别数)的不同概率向量,即能获得长度为S×C的表征向量。如果维度为K的滑动窗口共有n个,可得到输出结果的维度D:
式中:g为第g个滑动窗口;F为每层的F个森林数。
多粒度扫描选取不同长度的子样本,有利于关联样本的维度和特征属性,达到加强级联森林的目的。
gcForest 模型的优化思想来源于CNN 模型的优化,当CNN 模型的网络层数增多时,提取的特征更多,模型的拟合效果更优秀。但过多的网络层数使拟合效果不升反降,带来信息梯度消失的问题。因此需要对模型调整优化,于是引入了ResNet,使得模型即使在网络层数增加后,依旧能够保证与增加前相同的学习效果。
gcForest 模型面临着同样的问题,将ResNet 引入到级联森林后,不仅增强了模型提取特征多样性的能力,还保证了森林层数增加后,使模型在保持原学习效果的基础上不断接近最优结果。
残差级联森林的结构如图3 所示,把输入特征输入到模型内,先经过多粒度扫描得到特征值,再把特征值输入到级联森林中,因为暂态电压稳定评估可以看作是一个二分类问题,所以每个RF 都会有稳定与不稳定2 个结果。最后,将多粒度扫描得到的特征值和二分类结果共同作为输入特征向量,输入到下一层RF 中。反复循环该操作,在模型评估性能不再优化后停止循环。
图3 残差级联森林Fig.3 Structure of residual cascade forest
暂态电压失稳一般是电力系统受到大扰动所致,如系统遭受三相接地故障后,导致系统的暂态电压失稳。本文分析暂态电压稳定关键影响因素,完成风电并网系统暂态电压稳定评估的输入特征构建。
电气量的选取和故障信息是输入特征构建的关键[24],本文从电源、网络、负荷3 个方面进行分析。
1)电源。电源对电力系统的电压稳定起着支撑作用。大规模风电接入电力系统后,对电压稳定产生影响,需补充无功容量,保持电压稳定[25]。
2)网络。电压稳定与系统运行参数同样密不可分。分析电压稳定时常用PV曲线[26]对网络中传输功率的大小与电压稳定性之间的关系进行分析。
3)负荷。感应电动机的负荷与暂态电压的稳定关系密切。系统故障时,电压下降,感应电动机向系统吸收无功功率,进一步引发电力系统的电压失稳。
综上所述,选取发电机、风电机组、输电线路、节点电压、发电机无功功率、节点和支路的有功/无功功率作为影响暂态电压稳定的关键因素。
在完成电气量的选择后,对系统受扰后电压从稳定到失稳的整个过程进行研究分析,本文将发生和切除瞬间的故障信息与暂态电压稳定的关键因素相结合,共同构建13 维输入特征集,具体如下。
1)故障发生时刻t0,节点电压变化率的最大值T1为:
式中:αVi,t0为t0时第i个节点的电压变化率。
2)故障切除时刻t1,发电机无功加速的最大值T2为:
式中:,t1为t1时第x台发电机的无功加速度。
3)t1时,节点电压变化率的最大值T3为:
式中:αVi,t1为t1时第i个节点的电压变化率。
4)t1时,支路电流变化率的最大值T4为:
式中:,t1为t1时第i个节点的电压变化率。
5)由t0到t1时段,系统内每台发电机无功变化的最大值T5为:
6)由t0到t1时段,节点总有功功率的变化量T6及总无功功率的变化量T7为:
式中:Nb为电网中的节点个数;分别为t1和t0时第i个节点的有功功率;分别为t1和t0时第i个节点的无功功率。
7)由t0到t1时段,支路总有功功率的变化量T8及总无功功率的变化量T9为:
式中:Nl为电网中的支路条数;分别为t1和t0时第y条支路的有功功率;分别为t1和t0时第y条支路的无功功率。
风电并网系统与传统电力系统的主要区别在于风电机组,因此其输入特征集构建主要针对风电机组。
1)t0时,风电并网点的电压变化率T10为:
2)t1时,风电并网点的电压变化率T11为:
3)由t0到t1时段,风电并网点有功功率的变化量T12及无功功率的变化量T13为:
基于grcForest 模型的风电并网系统暂态电压稳定评估流程如图4 所示。
图4 基于grcForest模型的风电并网系统暂态电压稳定评估流程Fig.4 Flow chart of transient voltage stability assessment of wind power grid-connected system based on grcForest model
3.1.1 离线样本生成
离线输入特征样本通过离线时域仿真获取,仿真满足风电并网系统原始潮流分布,模拟各种故障情况下风电并网系统的状态信息,生成离线输入特征样本。
3.1.2 离线模型训练
把输入特征按比例分为训练集和测试集,训练集用来训练模型的参数,测试集用来测试模型的性能,将训练集和测试集先后输入到grcForest 模型完成暂态电压稳定预测评估。
3.1.3 模型性能评估
针对暂态电压稳定评估问题,首先根据暂态电压稳定判据判别电压是否稳定,再通过模型评价指标对模型性能进行评估。《南方电网安全稳定计算分析导则》[27]中暂态电压稳定判据为:暂态过程中系统电压中枢点母线电压下降持续低于限定值(一般为0.75 p.u.)的时间不超过规定(一般为1 s),可认为暂态电压是稳定的。
本文引入暂态电压稳定评估的混淆矩阵如表1所示,其中Ts,Fu,Fs,Tu分别为“真稳定”、“假失稳”、“假稳定”、“真失稳”。同时还加入预测评价指标如正确率Pac、召回率Pre和漏判率Pfa,完成模型评估结果验证。
表1 混淆矩阵Table 1 Confusion matrix
1)Pac表示模型预测结果正确的个数占预测总个数的比例:
2)Pre表示模型预测不稳定正确的个数占实际不稳定总个数的比例:
3)Pfa表示模型预测不稳定错误的个数占预测总个数的比例:
模型的实时评估一般是通过相量测量单元在线采样数据,进一步根据输入特征形式对数据进行处理,再把处理好的数据输入到基于grcForest 的风电并网系统暂态电压稳定评估模型中,完成风电并网系统暂态电压稳定评估。
本文选择IEEE39 节点系统作为仿真模型,PSASP 和Python 作为仿真平台。仿真计算机配置为Intel(R)Core(TM)i7-8700,2.60GHz 处理器,16 GB内存。IEEE 39 节点系统共有10 台传统机组、39 条母线和46 条交流线路,基准功率为100 MVA。在系统32 节点处接入风电机组,将36 台1.5 MW 的风力发电机等值成1 台风电机组。设置负荷水平占比以10%的步长从80%增加至120%,故障位置分别为距离线路首端0%,25%,50%和75%处,故障类型为三相短路故障,故障发生时间为0.2 s,故障切除时间为0.4 s。从仿真结果中选取6 000 个样本,根据暂态电压稳定判据可以得到4 354 个稳定样本和1 646 个失稳样本。随机选择6 000 个样本中的70%作为训练集,其余30%作为测试集。
系统32 节点处在加入风电机组前后,系统电压稳定性如图5 所示。从图5 中可以看出,加入风电机组前,节点电压在三相故障发生后急剧下降,待故障切除后迅速上升,经过一段时间的波动后,恢复到正常值。加入风电机组后,电压幅值上升,所需无功较多,但电压变化趋势相同,最终都将趋近于稳定。
图5 32节点加入风电机组前后的电压幅值对比Fig.5 Comparison of voltage amplitude of bus 32 with and without wind power integration
本文级联森林的集成学习算法采用极端梯度提升算法(XGBoost)和RF 算法,级联森林的最大层数设置为100 层,每层XGBoost 算法和RF 算法都设置为100 次,多粒度扫描中滑动窗口的大小分别设置为7,13 和21。如果模型在训练过程中得到的结果提升不大,则停止训练。
为了验证本文grcForest 模型评估结果的准确性与有效性,将其与CNN,gcForest 等机器学习模型共同应用于风电并网系统电力系统暂态电压稳定评估中,进行对比分析,不同模型的评估性能如表2所示。
表2 不同模型的评估性能Table 2 Evaluation performance of different models
从表2 中可以看出,grcForest 模型在Pac,Pre和Pfa3 个指标上性能更为优秀。相较于CNN 模型,gcForest 模型具有更好的特征提取能力,grcForest 模型在电压稳定评估方面具有更高的准确性。
模型测试时间如表3 所示。
表3 不同模型测试时间Table 3 Testing time of different models s
由表3 可知,grcForest 模型测试时间最短,满足快速性的要求。
gcForest 模型内部参数根据样本数量动态确定,鲁棒性好。为了研究不同的测试集比例对模型评估性能的影响,设置测试集比例为50%~90%,如图6 所示。
图6 不同测试集比例的影响Fig.6 Effect of different testing set ratios
由图6 可以看出,随着测试集比例增大,所有模型的性能都有所下降。相较于CNN 模型,gcForest 和grcForest 模型可较大程度上保持原有的性能,grcForest 模型在不同测试集比例下的准确性更好。
本文把ResNet 优化后的gcForest 模型应用于电网领域,提出一种基于grcForest 模型的风电并网系统暂态电压稳定评估方法。分析影响电力系统暂态电压稳定的关键因素,从电气量和故障信息两方面构建13 维输入特征,将其输入到基于grcForest的暂态电压稳定评估模型中,通过IEEE39 节点系统的算例分析,得到如下结论:
1)与CNN,gcForest 等机器学习模型相比,grcForest 模型的特征提取能力更好,在评估性能方面准确性、快速性更好。
2)对比CNN,gcForest 模型,grcForest 模型参数鲁棒性更好,更改测试集比例后,在不同比例下grcForest 模型可保持更好的准确性。
3)gcForest 模型在暂态电压稳定评估准确性和快速性方面的提升较小,仍有待优化。