李旭明 李传军
摘 要:针对输电线路故障传统诊断方法抗干扰能力差的现状,利用随机森林模型在预测和分类工程领域的独特优势,提出了一种基于随机森林模型的输电线路故障诊断方法,故障类型诊断的特征量采用小波变换提取的故障电流暂态能量和故障状态下各相电流突变量比例系数。通过基于PSCAD/EMTDC的仿真对比试验验证了本方法在不同故障时刻、不同过渡电阻和不同故障位置下输电线路故障诊断的有效性和优越性。本方法具有更好的故障诊断准确率和适应性,可为不同情况下的输电线路故障检测提供有效的借鉴和技术指导。
关键词:输电线路;故障检测;随机森林;小波变换;特征量
中图分类号:TM77 文献标识码:A
Research on Transmission Line Fault Detection
System Based on Random Forest Model
LI Xu-ming?覮,LI Chuan-jun
(Luoyang Railway Information Engineering School,Luoyang,Henan 471000,China)
Abstract:Aiming at the current situation that the traditional fault diagnosis method of transmission line has weak anti-interference ability,using the unique advantages of random forest model in the field of prediction and classification engineering,this paper presents a fault diagnosis method for transmission line based on random forest model,the characteristic parameters of fault type diagnosis are the transient energy of fault current extracted by wavelet transform and the proportional coefficient of the abrupt current of each phase in fault state. Through PSCAD/EMTDC based simulation comparison test,the effectiveness and advantages of the proposed method in fault diagnosis of transmission lines at different fault moments,transition resistances and fault locations are verified. This method has better fault diagnosis accuracy and adaptability,and it can provide effective reference and technical guidance for transmission line fault detection under different circumstances.
Key words:transmission Line;fault detection;random forest;wavelet transform;characteristic
随着现代电网规模的日益扩大,输电线路的电压等级和输电容量不断增加,高压输电线路故障会给社会经济和人民的日常生活带来严重的影响[1]。为尽快恢复电力的正常供应,高压输电线路故障后需快速准确地诊断出故障类型,从而为自动重合闸、继电保护服务以及给上级决策中心提供必需的正确数据。因此输电线路故障检测对线路的分析和故障的排除以及保障电力系统的安全性与经济性具有重要的意义[2]。
输电线路故障特征量包括基于工频的稳态量及傅里叶变换提取稳态特征量等[3],但传统故障特征量易受系统运行方式、过渡电阻和故障位置等因素的影响,因此国内外相关学者提出了基于故障的暂态量和突变量,文献[4]利用对暂态信号敏感和时频局部特性良好的小波变换提取了故障电流的暂态能量,文献[5]利用故障状态下相电流差突变量来作为故障特征量,均取得了不错的效果。输电线路故障的传统分类方法主要有阈值法和推理法等,阈值法和推理法原理比较简单,容易实现,但其适用性较差,故障诊断准确率难以满足相关要求。为提高故障診断的效果,近年来相关学者将一些新型分类方法应用于输电线路故障诊断,文献[6]采用小波变换对故障暂态信号进行分析,并将支持向量机应用于输电线路故障诊断。文献[7]采用电流突变量比例系数作为故障特征量,建立了基于RBF神经网络的输电线路故障诊断系统。文献[8]利用小波变换法提取故障时暂态电流能量作为特征量,提出了基于人工免疫算法的输电线路故障诊断系统。以上方法虽然在输电线路故障诊断中取得了一定的效果,但其抗干扰能力较差,在故障时刻、过渡电阻和故障位置差异性等的干扰下,故障诊断的准确率无法满足相关要求。
为保证不同情况下输电线路故障诊断的准确率,采用小波变换提取的故障电流暂态能量和故障状态下各相电流突变量比例系数作为故障诊断的特征量,提出了基于随机森林模型的输电线路故障诊断系统,在仿真对比试验中验证了本文方法的有效性和优越性。
1 随机森林模型理论
随机森林算法是根据“Bootstrap aggregating”和“random subspace method”结合而构造的多个决策树的分类器[9],该算法采用自助法的无放回抽样法,并借鉴随机子空间的思想,最终分类结果由各决策树投票统计结果来决定。随机森林算法可以对特征量的重要性进行估计,抗干扰能力很强,具有很好的适用性和很强的泛化能力。因此,随机森林算法在故障诊断等众多领域获得了广泛的应用,其高效实用的优势得到了很好的认证[10]。
随机森林算法的基本步骤如下:
1)利用Bootstrapaggregating抽样法从训练数
据集随机抽出k个样本,样本的容量占数据集的2/3左右,且子数据集的容量都与原始数据集相等。
2)分别对抽出的k个样本建立相应的决策树
模型,获得k种分类模型序列{h1(X),h2(X),…,hk(X)}。
3)根据分类模型序列组成的多分类模型系统
训练结束后,随机森林模型对新样本则由平均所有回归树的判定值来赋予该样本的决策值 ■,并决定其最终类别。
随机森林算法决策树的规模达到一定程度時,根据大数定律可以得到:对于所有的随机向量θ,决策树分类器的泛化误差PE*趋向于
Px,y(pθ(h(x,θ) = y) - ■pθ(h(x,θ) = j)■)
(1)
随着随机森林决策树规模的加大,其泛化误差将达到一上界值:
PE* ≤ ■ (1-s2)/s2 (2)
s = Ex,ymr(x,y) (3)
mr(x,y) = pθ(h(x,θ) = y) - ■pθ(h(x,θ) = j)
(4)
式中:s表示分类强度,ρ表示平均相关系数,mr(x,y)则为随机森林算法的边缘函数。
随机森林在对训练集进行抽取时未被抽中的原始训练集样本(OOB样本)可以用来衡量算法的性能,Breiman通过实验证明了OOB为随机森林性能的无偏估计[11]。决策树Ji的OOB准确率为
OOBCorr(i) = ■ (5)
式中:OOBSize(i)为OOB(i)样本的大小,OOBCorrectiNum为获得的总的正确分类结果数量。
2 输电线路故障特征量分析
输电线路发生故障时的各相电流差突变量可表示为[12]:
Δ■AB = ■A - ■B - ■[0]A - ■[0]B (6)
Δ■BC = ■B - ■C - ■[0]B - ■[0]C (7)
Δ■CA = ■C - ■A - ■[0]C - ■[0]A (8)
式中:■[0]A、■[0]B、■[0]C分别表示故障前的A、B、C各相电流大小,■A、■B、■C则分别表示故障后的A、B、C各相电流大小。
输电线路只有在发生故障时,相电流差突变量ΔI才有输出,而在其正常运行时的相电流差突变量ΔI则近似为零。相电流差突变量在一个周期内的有效值可表示为
ΔI = ■ (9)
将ΔI进行离散化,则可得电流突变量有效值表达式为
ΔI = ■ (10)
式中:N表示一个周期内采样点数大小。
三相电流差突变量在故障后第一个周期内的 有效值之和可表示为:
ΔI∑ = ΔIAB + ΔIBC + ΔICA (11)
根据式(6)~ (11)可以获得各相电流差突变量比例系数表达式为:
λAB = ΔIAB /ΔI∑ (12)
λBC = ΔIBC /ΔI∑ (13)
λCA = ΔICA /ΔI∑ (14)
当输电线路发生不同相别故障时,相电流差突变量比例系数差异明显,且其对故障时刻、过渡电阻和故障位置差异性等因素的敏感度较低,抗干扰能力较强,因此可将其作为输电线路故障诊断的故障特征量.,但相电流差突变量比例系数未包含接地故障相关信息,无法有效判断线路是否发生接地故障,所以还需引入其它故障特征量。
输电线路发生故障时的零序故障电流可表示为:
I0 = ■(IA + IB + IC) (15)
由于良好的时频局部化特性,小波变换能很好地反映被分析信号的时频特性,利用小波变换可以很好地提取故障电流的暂态能量[13],并作为输电线路故障诊断的特征量。本文采用db3小波对故障后1/4个周波内的IA、IB、IC及I0进行相应的8层分解处理,获得相应的高频细节信号系数d1~d8。由于输电线路发生故障时的暂态电流能量基本上都位于1500 Hz以内[14],且暂态电流能量主要集中在d5 ~ d8这4个高频细节信号的频带范围内,则分别求取IA、IB、IC及I0在d5~d8这4个频带的暂态能量之和后,对其进行归一化处理后可得:
参考文献
[1] 丘映丹,李海锋,郭履星,等. 基于异常点剔除的高压直流输电线路故障定位算法[J]. 电力建设,2015,36(12):91—96.
[2] WEI L,GUO W,WEN F,et al. Waveform matching approach for fault diagnosis of a high-voltage transmission line employing harmony search algorithm[J]. Iet Generation Transmission & Distribution,2010,4(7):801—809.
[3] 段建东,张保会,周艺. 利用电流行波进行超高压输电线路故障类型识别的研究[J]. 中国电机工程学报,2005,25(7):58—63.
[4] 李东敏,刘志刚,苏玉香,等. 基于多小波包和人工神经网络的电力系统故障类型识别[J]. 电力自动化设备,2009,29(1):99—103
[5] 马静,王希,王增平. 一种基于电流突变量的故障选相方法[J]. 中国电机工程学报,2012,32(19):117—123.
[6] 杨健维,罗国敏,何正友. 基于小波熵权和支持向量机的高压输电线路故障分类方法[J]. 电网技术,2007,31(23):22—26.
[7] 吴浩,罗毅,蔡亮. 基于RBF神经网络的输电线路故障类型识别新方法[J]. 重庆邮电大学学报:自然科学版,2013,25(3):418—426.
[8] 林圣,何正友,钱清泉. 基于人工免疫算法的输电线路故障类型识别新方法[J]. 电力系统保护与控制,2011,39(11):95—100.
[9] MURSALIN M,YUAN Z,CHEN Y,et al. Automated epileptic seizure detection using improved correlation-based feature selection with random forest classifier[J]. Neurocomputing,2017,241(C):204—214.
[10] 黃衍,查伟雄. 随机森林与支持向量机分类性能比较[J]. 软件,2012,33(6):107—110.
[11] KULKARNI V Y,SINHA P K,PETARE M C. Weighted hybrid decision tree model for random forest classifier[J]. Journal of the Institution of Engineers,2016,97(2):209—217.
[12] 鲁文军,林湘宁,黄小波,等. 一种自动适应电力系统运行方式变化的新型突变量选相元件[J]. 中国电机工程学报,2007,27(28):53—58.
[13] SILVA K M ,SOUZA,B.A,BRITO N S D . Fault detection and classification in transmission lines based on wavelet transform and ANN[J]. IEEE Transactions on Power Delivery,2006,21(4):2058—2063.
[14] APOSTOLOPOULOS C A,KORRES G N. A novel fault-location algorithm for double-circuit transmission lines without utilizing line parameters[J]. IEEE Transactions on Power Delivery,2011,26(3):1467—1478.
[15] ELLIS K,KERR J,GODBOLE S,et al. A random forest classifier for the prediction of energy expenditure and type of physical activity from wrist and hip accelerometers[J]. Physiological Measurement,2014,35(11):2191—2195.
[16] 林圣,钱清泉,何正友. 基于粗神经网络的输电线路故障分类方法[J]. 中国电机工程学报,2010,30(28):72—79.