纪素娜,吴丹妍,林幕群,黄朝凯
(广东电网有限责任公司汕头供电局,广东 汕头 515041)
随着高压直流输电(high voltage direct current,HVDC)和风能、太阳能、水电能等新能源的不断发展,现代电力系统已成为大规模交直流混合电网系统[1-2]。由于电力需求的不断增长,电力系统被迫在压力更大、安全级别更低的条件下运行。实际电力系统运行可基于网络、大数据、物联网、通信技术[3-5],对通过关键接口的功率传输进行监测,从而及时发现电网安全隐患。电网数据安全分析对配电网动态安全评估具有重要意义,可为后续的预防控制提供有价值的决策信息。
为此,众多学者对配电网数据安全分析进行了研究。文献[6]提出了1种基于模糊神经网络的配电网故障风险智能预警方法,有效提升了配电网异常事件约束及预警算法效率。文献[7]提出了1种新的配电网多级继电保护系统故障运行状态预警方法。该方法通过信号检测器判断配电网多级继电保护系统故障是暂时性故障还是永久性故障。文献[8]提出了1种基于风险评估计算安全预警评估指标的方法。该方法对低压台区运行状态实施定量分析,并对状态实时变化的风险进行预警。现有研究的配电网安全分析方法大多针对低压或高压单一情况,而混合配电网数据的安全分析研究较少。此外,风电等新能源存在不确定因素及故障数据不易收集而导致数据量不均衡等问题。这给混合配电网数据分析带来了挑战。
针对上述问题,本文提出了1种基于计算智能的混合电网数据分析方法。该方法充分结合基于快速相关的滤波器(fast correlation-based filter,FCBF)、堆叠稀疏去噪自动编码器(stacked sparse denoising automatic encoder,SSDAE)、半监督极限学习机(semi supervised extreme learning machine,SSELM)、生成对抗网络(generative adversarial network,GAN)等技术,可有效提升混合电网数据安全评估效率。
本文提出了用于快速、动态、安全地评估运行条件的最大输电能力估计模型。该模型通过比较实际功率传输和最大传输能力来评估运行条件的安全性。如果实际功率传输小于最大传输能力,则运行条件为安全;否则,为不安全。
最大输电能力估计模型的输入为原始特征,经过FCBF、SSDAE、SSELM、GAN等关键技术,输出为最大传输能力值。
首先,最大输电能力估计模型基于FCBF从原始输入特征中剔除无意义特征,以简化特征维度,从而提高输入数据质量。其次,最大输电能力估计模型将简化后的特征代入SSDAE,并从输入特征中提取高级表示,从而学习复杂特征之间的内部关系。接着,最大输电能力估计模型基于GAN进行电力数据增强,从而提高样本多样性。最后,最大输电能力估计模型基于SSELM构建高层表示和最大传输能力值之间的内在联系。
混合电力网中,原始输入特性包括影响最大传输能力评估的所有因素。假设负载功率因数和风力发电功率因数恒定,本文选择发电机的终端电压、负载的有功功率、发电机、风电场和HVDC链路作为原始输入特征以表征运行条件。此外,最大传输能力可以通过预防性控制措施改善,如发电机功率重调度、HVDC设定点控制和甩负荷等。当采取这些预防性控制措施时,相应母线的功率注入将发生变化。这些变化可以通过原始输入特征反映。考虑到大型电网的输入特征维数非常高,为消除不相关的输入特征,本文基于FCBF进行特征选取,从而提高最大传输能力估计模型的准确性和训练效率。
FCBF使用对称不确定性测量2个随机变量的非线性相关性,并快速从高维输入特征中消除不相关特征。输入特征选择过程为:首先,计算每个特征和最大传输能力之间的对称不确定性;其次,如果特征的对称不确定性低于预定义的相关性阈值,则消除该特征。本文考虑了混合电网中风电功率的不确定性,因此风电场的有功功率始终保留在输入特征中。
为了有效提取混合电网高级表示,本文将输入数据转换为一系列长度和高度相同的二维数据,并提出了一种基于SSDAE的特征提取方法。
(1)
对DAE进行改进后的堆叠去噪自动编码器(stacked denoising automatic encoder,SDAE)LT为:
(2)
本文所提SSDAE特征提取器通过叠加SDAE构建,并以贪心的分层方式进行训练,即前者的隐藏层用作后者的输入。为解决多层神经网络训练时存在的梯度消失问题,本文提出了1种贪婪分层训练策略:自下而上的无监督预训练和自上而下的有监督微调。特征提取器遵循从SDAE1到SDAEn的逐层预训练过程:首先,通过正向传播计算第i层的网络参数wi、bi和Fi;其次,将上一层的Fi作为下一层的输入来计算Fi+1,直至训练结束;最后,对所有SDAE进行叠加,生成最终特征映射,用于进一步的监督训练。
本文令数据集X上可观测特征的真实样本分布为Pg。本文假定输入噪声向量z下的数据分布为z~Pz(z)。GAN中生成器的目标为找到1个可微函数G,使得:
Pg(x)=G(z;θg)
(3)
式中:G为由多层感知器表示的可微函数;θg为生成器网络的权重。
同理,鉴别器可定义为1个多层感知器D(x,θd)。其输出为单个标量。D(x)为数据x来自生成器的概率。θd为鉴别器网络的权重。鉴别器的主要目标是最大化实际数据和生成数据之间的相似性。
本文所提基于GAN的电力数据增强网络结构如图1所示。
图1 基于GAN的电力数据增强网络结构
GAN训练过程可分为2个步骤:用固定的生成器参数更新鉴别器和用固定的鉴别器参数更新生成器。根据前述生成器和鉴别器的目标,GAN需要根据损失函数更新神经网络的权重。鉴别器和生成器的损失函数分别如式(4)和式(5)所示。
Ez~Pz(z){log{1-D[G′(z)]}}
(4)
(5)
进一步结合式(4)和式(5),则有:
Ez~Pz(z){log{1-D[G′(z)]}}
(6)
一般情况下,监督学习需要大量标记样本[10-11]。然而,在考虑动态安全约束的情况下,最大传输能力估计的标记样本生成非常耗时。为此,本文采用SSELM,通过将流形正则化项嵌入极限学习机(extreme learning machine,ELM)的损失函数,从而利用额外的未标记样本提高回归精度。与使用基于梯度的训练算法的神经网络相比,SSELM具有更高的训练效率,且通常具有更好的泛化性能。
SSELM模型结构如图2所示。
图2 SSELM模型结构
SSELM的损失函数如式(7)所示。
(7)
式中:Les为SSELM的损失函数;C1为惩罚系数,取C1=30;Y为训练样本的标签向量,即训练样本的最大传输能力值向量;J为隐含层的输出矢量;ωe为SSELM的输出权重向量;C2为流形正则项的系数,取C2=0.2;Tr(·)为矩阵的轨迹;H为隐含层神经元相对于所有标记和未标记样本的输出矩阵;L为拉普拉斯矩阵。
(8)
式中:h为隐藏神经元的数量,取h=280;Ih为维数为h的单位矩阵。
试验所用数据集为中国某两市互联输电网线路采集的数据。该电网包含2 292条母线、8条HVDC链路、305台发电机和3 761条交流线路。电网基本负荷为126.547 GW。8条HVDC链路相关参数如表1所示。
表1 8条HVDC链路相关参数
互联输电网线路链接如图3所示。
图3 互联输电网线路链接示意图
图3互联输电网包含2个电网,即电网1和电网2。电网之间的关键输电接口由1条1 000 kV和3条500 kV的输电线路组成。其中,电网1包括6个500 MW的风电场,电网2中一部分发电机设置为旋转备用发电机。当风力发电波动时,旋转备用发电机将调节功率输出,从而保持功率平衡。在计算最大传输能力时,电网1的发电功率和电网2的负荷功率同时增加。
电网中故障类型包括单个500 kV或1 000 kV输电线路的三相短路故障。静态安全约束条件设置为:正常和故障后状态的母线电压在0.9~1.1 p.u.范围;暂态稳定约束为任意2个转子角度的最大分离不超过180°;瞬态电压安全约束为0.75~1.1 p.u.范围的任意母线电压的持续时间不超过1 s;判断换相故障的最小允许电压设置为0.8 p.u.。判断强制HVDC阻塞的时间阈值设置为1 s。
仿真软件环境为由pycharm建立算法框架、由Python基于tensorflow和Keras搭建学习算法。同时,算法运行硬件环境为Intel Core i9-9280X CPU,内存为32 GB,操作系统为Ubuntu 18.04 64位,显卡为 NVIDIA RTX2080Ti 11G 2块。仿真时,数据集中的50%样本需进行标注,并将标注的样本按照8∶2分为训练集和测试集,并代入所提SSELM模型进行训练。训练完成后,标注的测试集和未标注的样本共同构成验证集以进行验证。
试验选取均方根误差(root mean square error,RMSE)、平均相对误差(average relative error,ARE)指标来衡量模型性能。RMSE和ARE较小表示模型估计能力较高,较大表示模型估计能力较低。RMSE和ARE计算如式(9)和式(10)所示。
(9)
式中:N为样本个数;Pi为第i个样本的真实值;Oi为第i个样本的估计值。
(10)
不同模型在优化策略下训练集ARE对比如图4所示。
图4 不同模型在优化策略下训练集ARE对比
由图4可知,SSELM模型+基于FCBF的特征选取+基于SSDAE的特征提取+基于GAN的数据增强训练性能最优,最低ARE为0.018 9。该结果表明所提模型具有较好的训练效果。基础ELM模型训练波段较大,收敛曲线非常不稳定,最低ARE为0.0543。这是因为所提模型的特征选择与特征提取可以有效过滤不重要特征,从而提升模型训练针对性,有意引导模型向更优特征学习。此外,数据增强能够在一定程度上抑制过拟合问题,从而使模型能够快速跳出“局部极值”,进一步加快网络训练效果。
为了进一步测试所提模型性能,本节在5个模型上进行了测试集对比验证。5个模型分别是基础ELM、FCBF特征选择ELM(F-ELM)、SSDAE提取的高级表示ELM(S-ELM)、所提模型(无GAN数据增强)以及所提模型(SSELM+FCFB+SSDAE+GAN)。
测试集不同模型对比结果如表2所示。
表2 测试集不同模型对比结果
由表2可知,所提模型(基于GAN)的ARE和RMSE分别为0.020 9和81.59 MW。而基础ELM最高,ARE和RMSE分别为0.084 6和289.51 MW。仿真结果表明,所提模型(基于GAN)可以利用未标记样本有效提高回归精度。这是因为传统模型非常依赖数据样本的质量,如果验证集质量不高,将严重影响估计结果。另外,与基础ELM模型相比,F-ELM和S-ELM性能更优。这是因为特征选择可以有效提升特征提取之间的关键信息,从而有效提高模型的回归精度。
本文对混合电力网电力数据进行了研究与分析,建立了1种基于计算智能的混合电网数据分析方法。首先,本文基于FCBF进行特征选取,从而提高最大输电能力估计模型的准确性和训练效率。其次,本文提出了1种基于SSDAE的特征提取方法以解决输入数据带噪声问题,从而提高网络鲁棒性。考虑到混合电力系统中存在数据缺失、数据不均衡等问题,本文提出基于GAN的数据增强方案,以准确补充电力系统中的缺失数据。本文方法为电力数据分析及安全故障排查的发展提供借鉴。
未来可对电力数据安全管理领域进行研究,如引入区块链、云计算等技术提高混合配电网数据交互可靠性及效率,以进一步优化智能电力故障诊断及定位方案。