赵晨时+马琪+竺红卫
摘 要:文中提出了一种基于支持向量机SVM分类器的直流电弧故障检测方法与若干可用于直流电弧故障检测的时域、频域特征量,特别是基于希尔伯特-黄变换的时频域特征。将特征值导入SVM分类器进行训练后,SVM分类器可检测出直流电弧故障。在SVM分类器的设计和训练过程中,采用遗传算法参数寻优结合K折交叉验证选取最优参数。实验结果表明,SVM分类器的分类准确率高达98%以上。
关键词:直流电弧故障检测;希尔伯特-黄变换;支持向量机;SVM分类器
中图分类号:TP18;U484 文献标识码:A 文章编号:2095-1302(2018)02-00-03
0 引 言
直流电弧故障多发于直流供电系统,倘若直流电弧发生故障,会产生比较稳定的持续燃烧环境,若未及时发现并切断火源,则易因电气设备着火而引发火灾。
目前,针对直流电弧故障的检测大多通过提取发生电弧故障时电流的时域或频域特征,采用阈值法检测电弧故障。文献[1]采用神经网络分析和快速傅里叶变换在频域检测航天器系统的直流电弧故障,文献[2]采用统计方法来研究发生电弧故障时电流在时域的波形变化特征,文献[3,4]则采用时域结合小波变换来进行特征提取。但由于实际电气设备的特性各不相同,直流电弧是否发生故障也具有随机特性,影响因素多样,各特征量的阈值难以界定,因此这些方法大多检测准确率低、误动作高。
直流电弧故障检测方法本质上是一个“有或无”的二分类问题。本文提出一种基于支持向量机SVM分类器的直流电弧故障检测方法。首先提出了若干可用于直流电弧故障检测的时域、频域特征量,特别提出了基于希尔伯特-黄变换的时频域特征,并设计了具有检测直流电弧故障功能的SVM分类器,采用特征量训练的SVM分类器可根据输入的电流特征量数据判断是否发生直流电弧故障。
1 用于直流电弧故障检测的电流特征
本文采用时间窗口对电流进行特征提取,每个窗口为0.2ms,包含1 000个电流采样数据。
1.1 时域特征
本文将以下两个时域特征作为用于直流电弧故障检测的电流时域特征。
(1)电流波动特性:在一个时间窗口中电流最大值和最小值的差值(峰峰值):
F=Imax-Imin (1)
(2) 波形因数:在一个时间窗口中电流波形的有效值和绝对均值的比值:
1.2 频域特征
本文使用快速傅里叶变换对正常工作时和发生电弧故障时的电流进行频域特性对比,确定可用于直流电弧故障检测的电流频域特征。
从原始电流采样数据里取出正常工作和发生电弧故障的电流各20 ms进行对比分析。因为数据采样频率为5 MHz,由采样定理知,只需分析0~2.5 M Hz内的谐波分量即可。将0~2.5 MHz等分为10个频段,依次用F1,F2,…,F10标注,表1所列为每个频段范围的能量值。
由上表计算知,F1,F2频段内发生电弧故障和正常工作时的能量比分别为22.04,18.71,与其他频段相比较为明显,表明可以将一个时间窗口内电流在F1,F2频段即0~500 kHz内的频谱能量值作为用于直流电弧故障检测的特征。
1.3 基于希尔伯特-黄变换的时频域特征
发生直流电弧故障时的电流是非线性、非稳定的。傅里叶变换作为一种纯频域分析方法,用频率从零到无穷大的复正弦分量进行叠加来拟合原函数f(t),即用F(ω)来分辨f(t),但此举会导致有限频域的信息无法确定任意小范围内的函数f(t)。特别对于非平稳信号而言,时域的突变会散布在整个频域上,造成诸多不便。由此可知,傅里叶变换对非平稳信号的处理存在不足。而希尔伯特-黄变换 (Hilbert-Huang Transform,HHT)基于信号局部特性,将非平稳信号分解成多个固有模态函数(IMF)分量,进而将信号的局部特征在时频平面进行描述[5],特别适用于非平稳、非线性信号分析。
小波变换虽然也同样适用于非平稳信号的局部特性分析,但文献[6]通过对小波分析与HHT各自优缺点的对比,发现HHT同样可以达到小波变换的效果,同时还具有自身数据驱动性。HHT完全依靠信号自身进行分解,不同于小波变换需事先选取合适的小波基函数,更能反映非平稳信号的局部特征,从而准确提取出非平稳信号的特征。
HHT将信号进行经验模式分解(EMD),分解成n个固有模态函数IMF。IMF在每一时刻只有单一的频率成分,为瞬时频率赋予了物理意义。IMF具有高频到低频的多尺度特征,是对信号自身“频率-时间-幅值”三种特征的分析,即信号不同的频率分量情况[7]。图1所示为一个时间窗口内对电流采样数据进行EMD分解得到的结果,电流采样数据序列分解出了IMF1,IMF2,…,IMF9由高频到低频不同的频率分量。
对每个IMF,本文采用分形维数提取直流电弧故障特征,表征电流采样数据不同频率分量的分布情况。分形维数是分形的重要特征,包含了曲线的几何结构信息,即信息特征度量。由于IMF数据是有限长度的离散序列,因此分形维数通常使用近似算法。本文选择最常见的Katzs分形维数方法[8]。
Katzs FD定义为:
d=lgL/lgD (3)
式中L是相邻点间距离的总和,D是序列第一个点与最远点之间的距离,在坐标轴上为:
综上,基于希尔伯特-黄变换的直流电弧故障时频域特征提取步骤为:以每个时间窗口为单位,对电流采样数据进行EMD分解,对每一层IMF序列求取分层维数作为特征量。由于IMF序列最前面的高频序列具有较多的局部信息,故取IMF1,IMF2,IMF3,IMF4共4层来获取其分形維数作为直流电弧故障时频域特征。IMF1-4层分形维数如图2所示。endprint
2 直流电弧故障检测SVM分类器的设计
由于提取的电流特征值量纲不同,直接导入直流电弧故障检测SVM分类器训练会导致分类效果大打折扣,因此需要对特征量进行归一化处理。归一化映射见式(5):
SVM分类器设计首先需选择核函数,本文使用RBF核函数。RBF核函数在低维度、高维度、小样本、大样本的情况下都具有良好的学习能力。此外,还需要对RBF核函数的核参数g和惩罚因子c进行优化。本文使用K折交叉验证配合启发式遗传算法来寻找最优参数c和g。得到最优参数后,便可通过训练集样本进行SVM分类器训练。
K折交叉验证是将数据分成K组,将每个子集作一次验证集,其余K-1个子集作训练集,由此得到K个模型,之后用这K个模型最终的验证集的分类准确率平均数作为分类器的性能指标。采用这种方法可以有效避免过学习和欠学习的情况发生,得到的结果也更加具有说服力。一般选择5折交叉验证。
遗传算法把自然界“优胜劣汰”的生物进化原理引入到优化参数形成的编码串联群体中,按照选择的适应度函数并通过遗传中的选择、交叉、变异对个体进行筛选,保留适应度好的个体,使新群体继承的信息优于上一代。反复循环,直到满足条件为止。
遗传算法寻找最优参数的适应度曲线如图3所示,种群数量为20,进化100代,寻优后惩罚参数c=12.61,核参数为69.73,最优准确率为99.75%。
3 实验结果
本文训练集样本数据为4 000个,包括2 200个发生直流电弧故障时的电流特征量数据,1800个正常工作时的电流特征量数据;测试集数据为4000个,包括2200个故障数据,1800个正常数据。对比采用默认参数和最优参数的直流电弧故障检测SVM分类器的分类准确率(正常分类为正常,故障分类为故障),结果见表2所列。
误判率(正常檢测为故障)是表征分类器性能的另一项重要指标,误判率越低表示分类器性能越好。误判率测试结果见表3所列。
由表3可知,采用K折交叉验证配合遗传算法优化参数的SVM分类器,训练效果更好。检测准确率高达98%以上,误判率低至0.455%,可以较好地满足直流电弧故障检测的实际要求。
4 结 语
文中提出了基于支持向量机SVM分类器的直流电弧故障检测方法。经试验,该方法明显优于神经网络分析和快速傅里叶变换及小波分析法,较好地满足了直流电弧故障检测的实际要求,具有较大的应用价值。
参考文献
[1] Momoh J A, Button R.Design and analysis of aerospace DC arcing faults using fast fourier transformation and artificial neural network[C]//Power Engineering Society General Meeting. IEEE, 2003.
[2] Schimpf F, Norum L E.Recognition of electric arcing in the DC-wiring of photovoltaic systems[C]//Telecommunications Energy Conference, 2009. Intelec 2009. International. IEEE, 2009:1-6.
[3] Yao Xiu,Luis Herrera,Wang Jin.A Series DC arc fault detection method and hardware implementation[C]//Applied Power Electronics Conference & Exposition,2013.
[4] Yao Xiu,Herrera L,Ji Shengchang,et al.Characteristic study and time domain-discrete wavelet transform based hybrid detection of series DC arc faults[J].IEEE Journals&Magazines,2014,29(6):3103-3115.
[5]熊学军, 郭炳火, 胡筱敏,等. EMD方法和Hilbert谱分析法的应用与探讨[J].海洋科学进展, 2002, 20(2):12-21.
[6]杜建卫.希尔伯特黄变换方法及其在特征提取中的应用研究[D].北京:北京科技大学,2017.
[7] N E Huang, Z Shen, S R Long, et al.The empirical mode decomposition method and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society A,1998,45(4):903-995.
[8] M J Katz. Fractals and the analysis of waveforms[J].Computers in Biology and Medicines,1988,18(3):145-156.endprint