郭 杉,贾俊青,思勤
(内蒙古电力科学研究院,内蒙古呼和浩特 010020)
配电网故障自愈是指通过对电网故障区域进行定位并断路,从而实现非故障区域的正常供电。在众多故障类型中,接地故障是较为常见的形式。我国配电网通常使用的是中性点不接地,即小电流接地的保护措施[1-3]。当发生单相接地点故障时,线路特征为线性电压对称、故障电流小且无法达到系统规定的故障阈值;非故障相路的电压会增加至原来的1.7 倍,而后端设备也会在过电压的环境中运行。若无法及时发现该故障,便会引发后端设备短路的状况,从而扩大故障的范围。因此,需对单相接地点故障进行识别并加以排除[4-5]。
针对单相接地点故障的识别问题,众多专家学者也提出了多种解决方法。这些方法可概括为两种:接地信息分析法与广域信息对比法。其中,接地信息分析法大多采用信号分析理论来对信号的基波幅度及零序电流进行分析;再通过模态分解法和小波分析法(Wavelet Analysis)来判断故障发生的线路。该种方法的物理信息明确,但信息单薄、关联性较差、可靠性也受阈值选择的影响。而广域信息对比法通常采用人工智能(Artificial Intelligence,AI)与神经网络(Artificial Neural Networks,ANN)等算法。这类算法的计算准确度高,能够挖掘故障及数据现象间所存在的关系,进而获得故障识别的最终结果。因此,文中从广域信息的角度出发,基于神经网络的方法,通过训练大量故障仿真数据来对故障发生的位置进行判断,从而实现对非故障电路的有效保护。
配电网的中性点不接地系统如图1 所示。其中C0为三相电的相对地分布电容,而三相电分别为A相、B相与C相。
图1 中性点不接地系统
当电网未发生故障时,三相电的电容与电流数值相等,对地电流与中性点的接地电压均为0,系统呈对称区间。此时,中性点的电压可表示为:
则A、B、C相的对地电压为:
由式(3)可知,当因故障使一条线路的相位发生变化时,其他相次线路的相位也会同步变化为其数值的倍。为了进一步分析零序故障,对各相线路的暂态零序电流进行求解,则有:
式中,ICm和ILm、τC与τL分别为线路等效电容、电感的电流有效值及时间常数;φ为相位角;ωf为工频角频率,其可表征为:
其中,R为线路等效电阻。
由式(4)可知,当接地点发生故障时,系统的暂态电流主要由基波衰减量、高次谐波衰减量以及工频角频率组成,而工频角频率则受等效阻容感的影响。因此,该文使用零序电流的特征作为后续模型的训练数据。
文中通过对零序电流的特征加以分析,进而得到故障位置,因此首先需对零序电流特征进行综合提取[6-7]。交流电信号可分为基波与高次谐波,该次将采集信号的时域特征、频域特征以及小波域特征[8-10]。
1)时域特征是信号的表面特征,信号以时间为度量衡,该文选择能表示信号特征的变量,分别为电流与电压的均值、标准差、峰值以及波形因子。
2)频域特征。当配电网线路发生故障时,信号的频谱也会发生一定的变化。因此,对信号进行频域分析也有助于故障的识别。该次选择的相关特征为:频谱功率与相位变化指标。
3)小波域特征。对于复杂小信号而言,小波分析是一种全面且无遗漏的信号分析方法,其可对信号进行多个维度的分析。该次使用三层的小波包络分析算法,能够得到8 个子信号频带。小波分解过程如图2 所示。
图2 三层小波分解过程
随机森林(Random Forest,RF)算法[11-13]是一种由多个决策树(Decision Trees)组成的数据特征分类算法。其通过对多个子集进行训练,从而使模型获得一定的差异性数据搜索能力。RF 算法包含两个步骤:模型训练与决策分类。该算法的模型如图3所示。
图3 随机森林算法模型
假设随机森林算法故障特征样本集合为X=(xi,yi),i=1,2,…,N,对其进行Bootstrap 采样以获得相关子集;然后对每个子集均使用决策树模型hj(x),进而得到决策树分类器;而样本经过该分类器后会进行权重投票,最终输出对应的类别。分类的策略如下:
LightGBM[14-16]也被称为轻量级梯度提升机,其是一种类决策树算法,基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的框架设计而来。与其他算法不同的是,传统算法仅关注正负样本之间的权重,而决策树类算法使用前向分布算法来降低上一次的迭代误差,使算法朝着梯度下降的方向运行。GBDT 结构框架如图4 所示。
图4 GBDT结构框架
GBDT 算法主要用于处理离散数据,但对于其损失函数而言,计算优化时只能使用一阶导数,由此导致算法仅能按顺序进行操作。而LightGBM 算法利用Histogram 策略,使用深度算法模拟叶子生长的过程,计算时可以调用并行内核来提高计算速度,同时数据的处理能力也随之增强。
假定监督数据集用N=(xi,yi),i=1,2,…,n表示,则LightGBM 算法对监督数据集进行训练的目的是找到一个函数映射关系,使模型的损失函数期望值最优,具体如下所示:
式中,Ψ(y,F(x))表示模型的损失函数;E表示数学期望的值。LightGBM 使用回归树(Regression Tree)策略对期望值进行搜索,则有:
而求解目标可以定义为:
式中,Ω表示模型的正则项次。使用牛顿法(Newton’s Method)对目标函数进行求解,可得一阶和二阶的损失函数分别为:
由上式可知,仅需确定树结构,即可求得叶子节点的权重。其具体表达式为:
其中,λ为权重调节偏置值。
该文算法的实现共包含三个部分:数据预处理模块、样本权重排序模块以及故障分析模块。其中,数据预处理模块对原始数据进行采集,并使用时域、频域和小波域分析对数据进行分割,从而形成多维数据特征。而样本权重排序模块采用随机森林算法对多维数据特征加以排序。故障分析模块则使用LightGBM 对多维数据特征进行分析,最终输出故障预测区域的结果。该文算法模型如图5 所示。
图5 RF-LightGBM算法模型
文中使用Matlab Simlink 作为仿真平台,根据某区域实际环境建立500 kV 的高压输电线路仿真模型。利用Simlink 自带的工具,模型可以对暂态响应进行精确抓取。输电线路的等效电容选择10 nF,仿真时的电流采样频率则为10 kHz。构建的线路共有3 条,长度分别为1 号线路150 km、2 号线路130 km、3 号线路200 km。同时,为了验证模型的故障检测性能,对多种故障参数进行选取,并得到尽可能多的样本集,以提高模型检测的准确度。根据电流信号的特征,选择不同初始相位角、过渡电阻以及故障距离进行组合。训练样本故障参数如表1 所示。
表1 训练样本故障参数
文中在表1 中设置了不同相位角、过渡电阻以及故障发生位置。当输电线路发生接地故障时,电流便会产生变化。而随着过渡电阻的改变,系统噪声也会影响故障识别率。因此,首先对过渡电阻的影响进行了评估。实验选择XGBoost、SVM 和CNN算法与该算法进行对比。测试结果如表2 所示。
表2 不同算法误判率测试结果
由表2 可知,该文算法能对过渡电阻小于700 Ω的线路进行准确地判断,而对于过渡电阻在1 000 Ω以内的线路,其误判率也可以控制在0.5%以内。对比表中其他算法的结果可以看出,该文算法的误判率优于其他对比算法,且具有较大的冗余度。通常线路的过渡电阻在100 Ω以内,故该文算法抗干扰的能力较强。此外,在后续测试中也将100 Ω作为实验的过渡电阻。
将仿真得到的故障距离样本输入至算法模型中完成测试,进而验证各算法在不同电流相位与故障发生位置的预测精确度。随机选择故障发生距离及初始相位角,并选取50 次测试后的平均值作为故障检测准确率。不同算法的实验结果如表3 所示。
表3 不同算法的故障检测准确率
由表3 可知,该文算法的故障识别准确率较高,平均值为98.9%,相较于对比算法分别提升了1.3%、2.4%及0.8%。由此说明,该文算法将特征分类算法RF 与故障预测算法LightGBM 进行结合,能够提升原算法的故障检测准确度。此外还证明了,该算法可有效检测配电网发生的单相接地点故障并保护非故障电路,进而帮助电网完成自愈。
文中基于随机森林算法和LightGBM 算法提出了一种输电线路故障识别及自愈算法。该算法以单相接地点故障为例,对零序电流模型进行了分析,并将电流信号进行分解,同时使用随机森林算法对特征向量进行排序分类。最终,利用LightGBM 算法对故障进行预测。仿真实验结果表明,所提算法在不同工况下的故障识别率均较高,且具有一定的抗噪声能力。