基于多分类器融合的XLPE电缆局部放电模式识别研究

2011-02-03 03:05:30徐颖敏姚林朋钱勇黄成军江秀臣
电气自动化 2011年3期
关键词:感知器模式识别识别率

徐颖敏 姚林朋 钱勇 黄成军 江秀臣

(上海交通大学 电气工程系,上海 200240)

0 引言

交联聚乙烯(XLPE)电缆作为输送电力的主要设备,其绝缘系统的好坏直接决定了整个城网送电系统能否安全运行。在XLPE电缆的某些薄弱部位,强电场作用极易引起局部放电。如果局部放电持续存在,一定条件下会导致绝缘劣化甚至击穿。局部放电是电缆设备监测的重要参量,从局放信号中提取的特征参数能有效地反映XLPE电缆绝缘状态。因此,对局部放电信号进行模式识别以及时发现电缆运行中存在的缺陷故障,对于XLPE电缆的可靠运行具有重要意义[1,2]。

在目前局放模式识别中,神经网络[3],决策树[4]等算法得到广泛应用。但是传统的分类方法仅使用特定的某种分类器进行分类,当先验知识不足时,很难选择最优的分类器。针对这一问题,本文采用多分类器融合的方法进行局放模式识别,有效地提高了整个系统的分类精度。

1 基于神经网络的多分类器融合

1.1 多层感知器神经网络

人工神经网络作为人工智能技术的一个分支,具备非线性系统的自学习能力,在难以建模的复杂识别等方面具有不可替代的优势。Rtunelhart等人提出了多层感知器神经网络[5]的拓扑结构,为神经网络的研究开创了新思路。多层感知器神经网络由输入层、隐含层和输出层组成,其中隐含层可含有若干子层。

在本文中,结合特征参数的数量及训练时间,采用多层感知器模型作为基本分类器。在该模型中,输入层负责输入信号的变换传递,隐含层完成数据处理,后由输出层将输出信号进行加权后聚合为神经网络的输出信号。本文采用反向传播算法作为训练算法。该算法结构简单,且操作性强,能模拟任意的非线性输入输出关系,是一种较为成熟的学习算法。

1.2 多分类器融合

多分类器融合算法通过综合多个分类器得到的分类信息,得出最终的分类结果。这一分类算法避免了单一分类器可能存在的片面性,有效提高了系统的分类精度。Freund等人提出Boosting算法[6],通过改变训练样本的样本分布和权重,将弱学习算法提升为强学习算法。Freund和Schapire提出了基于Boosting算法的AdaBoost算法[7],克服了Boosting算法在训练前需获得基本分类器的识别率下限的问题。由于基本分类器的识别率下限在实际应用中很难预测,AdaBoost算法的这一改进大大提高了其适用性。

1.3 基于AdaBoost的神经网络融合

本文采用的基于AdaBoost的多感知器神经网络融合模式识别算法原理如图1所示。其基本设计思想如下:将多个分类能力一般的多感知器神经网络分类器作为基本分类器,采用AdaBoost算法针对不同的训练集训练同一个基本分类器(弱分类器),逐步修正分类器的分类错误率,然后把不同训练集上得到的分类器集合后得到一个强分类器。该算法通过调整每个样本的权重来获取不同的训练集,初始状态时,样本的权重值相同,基于此分布可训练出基本分类器h1(x)。此时,对于h1(x)错分的样本,则增加对应样本的权重,反之则降低其权重。同时,根据h1(x)识别率设定分类器的权重,错分的越少则该基本分类器的权重越大,即重要程度越高。重复上述过程T次,可得到T个基本分类器

图1 基于AdaBoost的神经网络融合算法

根据权重进行累加后可得到强分类器。

该算法的设计流程描述如下

(1)权值初始化。设样本均匀分布,则权值

Di(i)表示在i次迭代中赋给样本(xi,yi)的权值。

(2)基本分类器训练。将多感知器神经网络作为基本分类器,记为hi(hi为第i次迭代时的神经网络分类器)。

(3)确定迭代次数。可根据算法实际的分类错误率选择合适的迭代次数,记为T。

(4)执行fort=1 to T

① 在训练集(St为第t次迭代时基本分类器的训练样本)St上训练分类器ht,用分类器ht对训练集S中的所有样本分类。

② 得到本次迭代的分类器ht,误差

则分类器权重为

③ 更新样本权值

其中Zt为一个正规因子,使得

(5)输出结果。分类函数

即对T个神经网络分类器输出结果进行加权投票。

2 模型设计

目前,XLPE电缆局部放电的测试和研究表明以下情况易产生局部放电现象:电缆内部气隙在长期工作电压下,由于压力变化发生移动和形变,进而极易生成电树,导致绝缘破坏和击穿;由于电缆制造工艺和安装质量等原因,容易在电缆头中出现悬浮电极,出现电极放电现象;同时,在线路设计、电缆铺设等情况下发生的电晕放电会直接导致电缆绝缘性能的下降;此外,电缆的表面放电和滑闪放电等也是造成绝缘事故频发的缺陷类型。

2.1 模型设计

为了验证本文提出的模式识别方法的有效性,针对上述情况,设计出了导致XLPE电缆发生局放电的4种典型缺陷模型:内部气隙放电,悬浮电极放电,表面放电以及电晕放电模型。

实验中以10kV的XLPE电缆为研究对象,在电缆头中人工制作这几类绝缘缺陷。图2为电缆头的缺陷模型示意图,具体制作过程如下:剥开电缆的金属屏蔽层和外半导体层,针刺XLPE绝缘约1/2左右,作为内部气隙放电模型;用长条铜片作高压电极和地电极,固定在XLPE绝缘与硅橡胶之间,通过加压来测试悬浮放电模型;从导线芯引出约15mm长条铜片作为滑闪通道并固定在XLPE绝缘与硅橡胶之间模拟表面放电。电晕放电则在连接电缆终端头的高压导体上悬挂针尖,模拟电晕放电模型。

图2 电缆头的绝缘缺陷模型

2.2 特征提取

本文采用脉冲电流检测方法采集局放信号,局放试验回路及信号采集系统如图3所示。

图3 局放试验系统结构示意图

依照图3所示的系统结构搭建试验平台,采用脉冲电流检测方法采集局放信号。基于不同的起始电压测试四种电缆缺陷,每次连续测量50个工频周期,而后将多个工频周期的放电信号叠加进行归一化。基于工频相位φ和放电量q统计q-φ平面上各区间内的放电次数n,得到Hn(q-φ)三维图谱。

从三维图谱Hn(q-φ)提取出最大放电量相位分布(Hqmax(φ)),平均放电量相位分布(Hqmean(φ)),放电次数相位分布(Hn(φ))以及放电量次数分布(Hqn(φ))四种二维图谱。为了从二维图谱中计算特征参数,将图谱根据相位信息划分为正负半周,φ代表随机变量,q和n代表概率密度,根据概率密度分布函数计算相关的统计特征。

偏斜度Sk(Skewness)和陡峭度Ku(Kurtosis)表示了图谱相对于正态分布的差异度,互相关因数cc(Cross-correlation factor)和放电量因数Q[8]则表示了放电正负半周的相似度。在二维图谱中选取上述4种特征参数,共得到20个特征其中,下标对应于二维图谱的下标,上标表示放电的正负半周。

2.3 主成分分析降维

为了尽可能全面地反映局放信号的特征信息,本文选取了20组特征参数作为模式识别的样本数据。而当样本特征维数过高时,会加大系统的计算量从而增加系统的识别时间,选取适当的降维方法可降低样本数据的冗余度以提高识别速度。其中,主成分分析(Principle Component Analysis,PCA)[9]是最为常用的一种线性映射方法。

为了尽可能完整地表示数据特征,需借助协方差矩阵来判断各特征参数之间的冗余度,协方差矩阵包含了所有特征变量之间的相关性度量,于是可对各特征参数的重要性进行排序,去除贡献率小的特征变量,达到降维的目的。PCA方法即通过寻找一组正交基P,来表示原始数据集X,以对协方差矩阵进行优化,降低变量间的相关度,选取方差最大的方向作为判别矢量来实现数据的特征提取。具体步骤如下:

(1)设数据集为m×n的矩阵。对应n条绝缘缺陷记录,每条记录包含m个特征变量,即每条记录可表示为一个m维的行向量。

(2)在矩阵行向量上减去该向量的平均值得到矩阵X,对XXT求特征值λ和特征向量v。X的主元即XXT的特征向量。

(3)前k个主元的累计贡献率定义为

设定累计贡献率的最小值,即可选取前k个主元代替原始数据集,达到降维的目的。

3 模式识别仿真

绝缘缺陷的记录共有4种缺陷类型,每种类型各100条样本,共计400条。其中,每个样本包含20个特征参数。同时采取10折交叉验证法检验识别率。

将多层感知神经网络作为基本分类器,隐含层数目为3层,隐含层节点数为4,学习率为0.3,训练次数为1000次。

(1)调整AdaBoost算法的迭代次数,识别率随其变化的曲线如图4所示。可以看出随着算法迭代次数的增加,即神经网络基本分类器数目的增加,算法识别率逐渐增加,当到达一定值后,识别率的变化趋向于平衡。根据这一变化曲线,将迭代次数选为6次,此时,识别率基本处于最高值。

图4 识别率随迭代次数的变化曲线

(2)采用主成分分析法降维,当累计贡献率为99%,95%和80%时,维数分别降至6维,3维和2维。应用AdaBoost算法对降维后的缺陷数据进行识别,结果如表1所示:

表1 不同维数样本的识别性能

由表中数据分析,当累积贡献率在80%(2维)时,识别性能有明显下降,而当累积贡献率在95%和99%时,AdaBoost方法的识别率有所降低但仍接近最高值,而此时维数分别降至3维和6维,与原始缺陷数据相比,维数已经大大缩减。同时,当维数减少时,采用AdaBoost算法进行识别的时间也大大缩短。因此采用PCA方法对样本集进行预处理的方法能有效降低样本维数而不会对识别结果造成较大影响,并可有效地缩短训练神经网络基本分类器的时间。

从识别率对基于AdaBoost的神经网络融合算法和多层感知器神经网络单一分类器进行对比,采用经过主成分分析法的缺陷样本。仅采用多层感知器模型进行识别,识别率为84.7%,分类时间为1.03s;采用AdaBoost算法进行识别,识别率明显上升,当迭代次数为6次,识别率趋近最高值为94.7%,分类时间为2.56s。由此得出,在识别率方面,AdaBoost算法的识别率明显高于单一的多层感知器神经网络模型,说明该算法可有效地提高系统的精度;在分类时间方面,AdaBoost算法由于需对多个基本分类器进行训练,所以分类时间比单一分类器长;但由于基本分类器本身训练时间较短,所以分类时间的增加对识别过程影响不大。

4 结论

本文介绍了基于AdaBoost的多感知器神经网络融合分类模型。该方法提取相关的局放特征参数,采用主成分分析法进行降维,将多感知器神经网络作为基本分类器,采用AdaBoost算法进行训练,应用到XLPE电缆局部放电模式识别中。

理论分析和实验仿真的结果表明,本文提出的基于多分类器融合的模式识别方法的识别率明显优于单一分类器,采用主成分分析法降维后大大提高了分类效率,提供了一种用于局部放电模式识别新的可行性方案。

[1] 郭灿新,张丽,钱勇,等.XLPE电力电缆中局部放电检测及定位技术的研究现状[J].高压电器,2009(03):56-60.

[2] 陈小林,成永红,谢小军,等.XLPE绝缘电老化中局放特性试验研究[J].高电压技术,2006,32(4).

[3] 杨孝华,廖瑞金,胡建林,等.基于BP人工神经网络的XLPE电力电缆局部放电的模式识别[J].高压电器,2003,(04).

[4] Abdel-Galil,T K,SHARKAWY R M,SALAMA M M A,et al.Partial discharge pulse pattern recognition using an inductive inference algorithm[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):320-327.

[5] Mazroua A A,M M A Salama,et al.PD pattern recognition with neural networks using the multilayer perceptron technique[J]. IEEE Transactions on Electrical Insulation,1993,28(6):1082-1089.

[6] Freund Y.Boosting a weak algorithm by majority [J].Machine Learning,1990,5(2):197-227.

[7] Freund Y.Schapire R.E.A Decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1997,55(1):119-139.

[8] SAHOO NC,SALAMA M M A,BARTNIKAS R.Trends in partial discharge pattern classification:A survey[J].IEEE Transactions on Dielectrics and Electrical Insulation,2005,12(2):248-264.

[9] 杨淑莹.模式识别与智能计算:Matlab技术实现[M].北京:电子工业出版社,2008.

猜你喜欢
感知器模式识别识别率
火箭贮箱喷涂机器人直接示教运动感知器设计与分析
基于类图像处理与向量化的大数据脚本攻击智能检测
计算机工程(2020年3期)2020-03-19 12:24:50
感知器在矿井突水水源识别中的应用
中国矿业(2019年7期)2019-07-26 05:37:30
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
AI超市
环球时报(2019-04-26)2019-04-26 06:17:15
尿湿感知器
提升高速公路MTC二次抓拍车牌识别率方案研究
浅谈模式识别在图像识别中的应用
电子测试(2017年23期)2017-04-04 05:06:50
第四届亚洲模式识别会议
高速公路机电日常维护中车牌识别率分析系统的应用