董志文 苏晶晶
基于变分模态分解能量熵混合时域特征和随机森林的故障电弧检测方法
董志文1,2苏晶晶1,3
(1. 闽江学院计算机与控制工程学院,福州 350118; 2. 福建理工大学电子电气与物理学院,福州 350108; 3. 浙江省机电设计研究院有限公司,杭州 310051)
在家庭生活用电器中,非线性负载电器逐渐增多。这一趋势使基于电弧“零休”特性的传统故障电流检测方法无法准确识别故障现象,因此本文提出一种基于信号时域特征结合变分模态分解固有模态能量熵的随机森林故障电弧识别方法。以线路电流为分析对象,先提取其时频特征量,再采用变分模态分解算法对故障电弧电流进行分解得到模态分量并计算其能量熵。以时域、能量熵特征构成多维特征向量,输入随机森林模型中对信号类型进行分类决策,进而识别故障电弧。实验发现,相比于其他方法,本文所提方法的故障电弧识别准确率可达99%,且适用于多种典型负载和非线性负载工作的低压配电故障电弧识别。
故障电弧;能量熵;随机森林;负载分类;故障诊断
电能在社会快速发展中变得越来越重要,电力事业的发展为人们提供了方便,但管理不善或使用不当可能导致触电伤亡事故和火灾,给人民群众的生命和财产安全带来重大损失[1]。据统计,2012—2021年,全国共发生居住场所火灾132.4万起,其中电气火灾占比高达42.7%[2]。导致住宅电气火灾的一个主要原因是故障电弧的发生。在家庭配电网络中,由于线路复杂、环境复杂,未及时切断故障电弧极易引发火灾事故,因此研究故障电弧的检测方法十分重要[3-4]。随着工业、商业区电器产品类型和数量的增加,非线性负载电器逐渐普及。在非线性负载和复合负载情况下,传统检测方法难以实现准确识别[5]。借助人工智能算法解决传统方法存在的缺陷是目前故障检测领域的主要研究方向。文献[6]在时域和频域中提取特征构建电弧特征向量,使用CatBoost算法实现了电弧故障的识别。文献[7]利用自适应噪声的完备经验模态分解(complete ensemble empirical mode decomposition with adaptive noise, CEEMDAN)来分解电流信号,提取固有模态函数(intrinsic mode functions, IMF)分量的特征信息作为特征向量,输入机器学习算法中进行电流故障检测。文献[8]利用小波变换与经验模态分解(empirical mode decomposition, EMD)方法对电流信号进行分解并计算不同维度的特征信息,将特征信息作为分类算法的输入进行电弧故障诊断。综上所述,目前故障电弧研究领域的关注点已从电流信号的时域、频域和时频域分析,扩展到了故障特征值的提取及机器学习算法的优化等方面,然而低压电力配电系统中负载类型的多样性对特征提取和故障检测有较大的影响。
针对低压配电家庭用电系统中多样的负载类型,本文在提取电流波形时域特征的基础上,结合变分模态分解(variational mode decomposition, VMD)得到IMF并求取其能量熵作为故障判断的特征量。结合电流波形的时域特征和能量熵构建特征向量,输入随机森林分类器中,以实现对不同负载类型电弧故障的检测和分类识别。
随机森林是一种集成学习方法,由多个决策树组成分类器[9]。在随机森林中,每个决策树都是独立的,互相之间没有关联。当使用随机森林进行分类时,每个样本都会被森林中的所有决策树进行判断分类。所有决策树分别得出一个分类结果,最终的分类结果则根据决策树的投票来决定。当某个分类结果得票最多时,就被认为是随机森林的最终分类结果。由于随机森林考虑了多个决策树的意见,所以具有较高的准确率。随机森林算法的基本流程如下:
1)构建训练集。随机且有放回地从训练集中抽取多个训练样本,作为该树的训练集,所以每个训练集各不相同,不同训练集可能包含重复的训练 样本。
2)构建决策树。建立决策树模型,将训练集用于训练模型。重复以上步骤,直到建立完成指定数量的决策树。
3)预测并投票。当输入未知数据时,每个决策树进行预测,然后采用投票或平均的方式对每棵树的预测结果进行投票,得到最终预测结果。
随机森林模型在多特征分类问题中可以实现高准确度的预测,所以本文选取随机森林模型作为分类器进行故障电弧识别分类,提出基于时域特征融合能量熵与随机森林结合的故障电弧识别模型。
变分模态分解是一种新的时频分析方法,将多分量信号一次性分解为多个单分量调幅调频信号,避免了迭代过程中常见的端点效应和虚假分量问 题[10]。VMD将固有模态分量定义为具有带宽限制的调幅调频函数。VMD算法通过构造和求解约束变分问题,将原始信号分解为指定数量的IMF[11],这一过程相当于求解变分问题,通过优化求解使分解得到的IMF能够最好地代表输入信号。通过VMD方法可以获取原始信号的不同频率分量,并进一步进行分析和应用。
VMD变分模型构造为
通过交替方向乘子法连续更新计算,得到问题的最佳解,即
直到满足式(6)所示迭代停止条件。
能量熵可以表示信号能量的复杂程度[12]。信号经VMD分离出的IMF包含不同频段的信息,当不同的负载处于故障状态时,信号在某些分量上的能量分布就会发生改变,因此可以通过计算信号的能量熵来判断是否有故障电弧。能量熵的计算方法 如下。
每个IMF分量的能量为
每个IMF分量的能量占总能量的比例为
每个IMF分量的能量熵为
利用课题组研制的电弧故障实验平台进行实验,采样频率为100kHz,电弧故障电流采用电弧发生器生成,电弧发生器由铜电极作为可移动电极,石墨电极作为静止电极,当两个电极之间有电流流过时,通过控制电极之间的分离距离可以产生电弧。在实验线路中接入不同实验负载,以此模拟串联故障电弧。故障电弧实验电路示意图如图1所示。
图1 故障电弧实验电路示意图
实验负载类型分别为线性负载和非线性负载,共计8种负载,实验负载类型和实验标签见表1。随机选取这8种负载正常工作和发生故障电弧时的电流数据,构建数据集,样本集类别共16类,总计4 800组数据。
表1 实验负载类型和实验标签
图2所示为故障电弧发生前后4种负载电流波形。在图2(a)中,电阻负载的电流为明显的正弦波形,当发生故障时,波形在过零点处出现平肩现象。在图2(b)中,荧光灯负载包含电感镇流器电感线圈,电流变化受电感制约,导致电流波形呈现出渐变特性,为类三角波,且在故障发生时产生大量毛刺。在图2(c)中,吸尘器负载内部包含非线性元件和开关电力电子器件,导致电流产生谐波成分,正常电流波形不呈正弦波形,而且平肩现象明显,当发生故障时,在平肩处产生一些毛刺。在图2(d)中,开关电源负载包含开关管、整流装置等电力电子元件,工作在高频状态,通电时间短,电流是一系列脉冲而不是传统波形,当故障发生时,在电流波形的峰值处会出现畸变和波形不对称。
(a)电阻电流波形
(b)荧光灯电流波形
(c)吸尘器电流波形
(d)开关电源电流波形
图2 故障电弧发生前后4种负载电流波形
综上所述,故障电弧的产生会导致电流波形发生明显变化,如幅值减小、出现平肩现象等,因此电流波形的时域特征常被用于辨识故障电弧[13]。由于一些负载的正常电流波形与故障时的波形相似,或者与其他负载在故障时的波形相似,仅依赖单一电流波形特征可能会导致对故障电弧的误判。因此,本文提出一种利用多种电流时域特征结合能量熵的方法作为故障电弧特征量,以实现对故障电弧的精准识别。该方法综合考虑电流的多个特征进行分析,有助于实现对各种负载类型和故障状态的可靠识别和分类,提高故障电弧判别的准确性。
能量熵描述了系统的无序程度或不确定性,其大小表示系统的混乱程度或可预测程度。当系统的能量分布更加均匀、有序时,能量熵较低;当能量分布更加不均匀、无序时,能量熵较高[14]。所以,能量熵越高,系统的混乱程度越高,其状态变化更加不可预测和随机。电气线路发生故障电弧时,电流信号除了时域特征会发生改变外,其频率分布也会相应地发生改变,同时故障电弧的能量分布也会随之变化。因此,可以对故障电弧信号进行VMD后,计算各个IMF分量的能量熵,作为判断是否发生故障的特征向量。
图3 开关电源电流信号及其5个IMF分量
由图4可见,开关电源电流信号故障时的能量熵明显高于正常状态。各种负载电流不同状态的能量熵如图5所示。
由图5可见,各种负载电流不同状态的能量熵也有区别,主要集中在IMF2、IMF3、IMF4分量。负载的正常状态和故障状态之间存在明显的IMF分量能量熵差异,因此可以根据VMD能量熵值来识别负载的工作状态。
图4 开关电源电流各IMF能量熵
(a)电阻负载
(b)烧水壶负载
(c)手电钻负载
(d)吸尘器负载
(e)荧光灯负载
(f)空压机负载
(g)调光灯负载
然而,某些负载的IMF能量熵可能区别不大,尽管能量熵对故障状态的判别有效,但在负载类型分类方面效果较差,因此引入时域特征来进行负载类型分类。峭度和偏度用于检测信号的非正态性,波形因子、峰值因子和脉冲因子有助于检测信号中的尖峰、峰值和脉冲特性,裕度因子提供对信号安全性的评估。将这6种时域特征与VMD能量熵结合,作为故障电弧检测的综合指标。
基于随机森林的电弧故障检测算法流程如图6所示。首先对采集的电流信号数据进行预处理,然后进行时域特征提取和VMD求得IMF能量熵,得到时域-能量熵特征数据集。将特征数据集按照一定比例划分为训练集、验证集和测试集,将数据归一化后输入随机森林算法模型进行训练,得到最佳模型后进行测试。
数据集取表1中8种负载有、无故障电弧时的电流数据各16组,每种负载正常和故障各300组数据,共4 800组数据,将时域-能量熵特征数据集按8:1:1随机划分为训练集、测试集、验证集,然后训练随机森林模型。最终得到故障识别模型的训练结果如图7所示,不同特征的重要性如图8所示。
图6 基于随机森林的电弧故障检测算法流程
为了评估模型的性能,使用独立于数据集的测试数据,每种负载正常和故障各100组数据,共计1 600组数据,对模型进行验证。故障电弧负载分类识别测试结果见表2。
由表2可见,时域-VMD能量熵的分类识别率更高,时域特征识别吸尘器的准确率最低,说明一些负载正常和故障状态的区分度不明显,故障特征信息少,时域特征容易发生误判。利用VMD信号提取能量熵来获取故障特征信息,提高了故障电弧负载分类识别率。
图7 故障识别模型的训练结果
表2 故障电弧负载分类识别测试结果
将时域-VMD能量熵构成的数据集分别输入支持向量机、朴素贝叶斯、多层感知机和K近邻分类这些常见模型,不同分类模型的故障电弧识别结果见表3,可见随机森林模型的故障电弧识别率高于其他4种常见分类模型,且所需训练时间更短。
表3 不同分类模型故障电弧识别结果
针对低压串联故障电弧产生时电流受负载类型影响较大,难以通过单一特征参数对故障电弧进行准确识别分类的问题,本文利用VMD分解电流信号获得的IMF分量求取能量熵,并结合6种时域特征构成特征数据集,利用随机森林算法对故障电弧进行识别,得到以下结论;
1)在非线性负载故障电弧检测中,单独应用时域特征时,识别准确率相对较低,尤其在负载的正常电流和故障电流波形相似的情况下。结合能量熵特征后,有效地提高了故障电弧的识别率。研究结果表明,时域特征与能量熵特征的联合使用能够显著提升非线性负载故障电弧的检测准确性。
2)相比于文中其他负载,吸尘器的故障特征信息不明显,此时的识别准确率低,有较大的提升空间,后续需对这类特征信息不明显的负载作进一步研究。
3)通过对比支持向量机、朴素贝叶斯、多层感知机、K近邻分类及本文随机森林模型对故障电弧的识别准确率,结果表明本文模型的故障电弧识别准确率最高,达到99%。
[1] 王星尹, 叶益昌, 宋遥, 等. 电气防火安全的研究[J]. 自动化应用, 2023, 64(14): 251-253.
[2] 肖方. 近10年全国发生居住场所火灾132.4万起造成11634人遇难6738人受伤直接财产损失77.7亿元[J]. 中国消防, 2022(2): 10-11.
[3] 赵杰, 董继民, 张延平. 基于多种电气增量融合判据的电弧故障诊断方法[J]. 电气技术, 2022, 23(2): 79-87.
[4] 刘冲, 李佳鸿. 基于小波变换与差值能量法相结合的串联故障电弧检测方法[J]. 电气技术, 2017, 18(12): 62-66.
[5] 龙禹, 周扬, 石晓龙, 等. 交流供电系统故障电弧隐患检测方法研究综述[J]. 电力需求侧管理, 2023, 25(3): 74-79.
[6] 金翠, 刘洋, 李琦, 等. 基于CatBoost的常用电器负载电弧故障识别方法[J]. 电测与仪表, 2023, 60(7): 193-200.
[7] 宿磊, 沈煜, 杨帆, 等. 融合CEEMDAN分解与敏感IMF精选的串联电弧故障检测[J]. 电子测量与仪器学报, 2022, 36(10): 173-180.
[8] 杨洋, 黄罗杰, 李平, 等. 基于多维度特征提取的电弧故障检测方法[J]. 电子测量与仪器学报, 2021, 35(10): 107-115.
[9] 方愉冬, 郑燃, 徐峰, 等. 基于集成决策树的电力系统继电保护故障检测[J]. 高电压技术, 2023,49(增刊1): 160-164.
[10] 左思雨, 赵强, 张冰, 等. 基于VMD-SSA-GRU的船舶运动姿态预测[J]. 舰船科学技术, 2022, 44(23): 60-65, 69.
[11] 夏志凌, 胡凯波, 刘心悦, 等. 基于变模态分解的异步电机转子断条故障诊断[J]. 电工技术学报, 2023, 38(8): 2048-2059.
[12] 崔芮华, 张振, 佟德栓, 等. 基于改进经验小波变换多特征融合的航空交流串联电弧故障检测[J]. 电工技术学报, 2022, 37(12): 3148-3161.
[13] 何志鹏, 李伟林, 邓云坤, 等. 低压交流串联故障电弧辨识方法[J]. 电工技术学报, 2023, 38(10): 2806- 2817.
[14] 郑熙东, 江修波. 基于完备经验模态分解与能量熵的混合储能系统功率分配[J]. 电气技术, 2020, 21(11): 61-65, 70.
Art fault detection method based on variational mode decomposition energy entropy hybrid time domain feature and random forest
DONG Zhiwen1,2SU Jingjing1,3
(1. College of Computer and Control Engineering, Minjiang University, Fuzhou 350118; 2. School of Electronic, Electrical Engineering and Physics, Fujian University of Technology, Fuzhou 350108; 3. Zhejiang Institute of Mechanical & Electrical Engineering Co., Ltd, Hangzhou 310051)
In household appliances, nonlinear load devices continue to grow, which makes the limitations of traditional fault current detection methods based on "zero crossing" characteristics become evident. This paper introduces a novel approach for fault arc identification, combining signal time domain features with variational mode decomposition (VMD) intrinsic modal energy entropy. The analysis focuses on line current, initially extracting time-frequency features. Subsequently, the VMD algorithm decomposes the fault arc current into intrinsic mode function (IMF), and their energy entropy is computed. By leveraging both time-domain and energy entropy features, a multidimensional feature vector is employed for fault arc identification within a random forest model. Comparative experiments indicate that this method achieves an impressive fault arc identification accuracy of up to 99% and is suitable for diverse low-voltage distribution scenarios including various load types and nonlinear loads.
arc fault; energy entropy; random forest; load classification; fault diagnosis
福建省自然科学基金(2020J05170,2020J01434)
福建省高校产学合作项目(2021Y4002)
闽江学院科研项目(MYK21014)
2023-10-31
2023-11-13
董志文(1997—),男,福建南平人,硕士研究生,主要从事故障电弧检测研究工作。