谢旭峰,陈上上,潘 攀,单振飞
国网泰顺县供电公司,浙江 温州 325599
近年来,电气设备在各行业中广泛应用,但随之而来的故障问题也不断增加,给生产和运营带来了不少困扰。为提高电气设备的可靠性和维护效率,基于机器学习算法进行电气设备故障的预测与诊断成为研究的热点。本文旨在建立高效的电气设备故障预测与诊断模型,通过提前发现潜在故障,实现设备的预防性维护,降低维修成本,提高生产效益。本研究的创新点主要聚焦于对多源数据的融合应用,如结合传感器数据、工作环境参数等,构建更全面的特征空间,提高模型的预测精度。本研究将为电气设备运维提供先进的预测与诊断工具,推动智能制造与维护管理的发展,为提高设备可靠性,降低生产成本作出贡献。
电气照明系统是城市的重要基础设施,其中涉及的电气设备可分为2类,分别为配电系统和路灯节点,具体则包括配电箱、电力电缆、灯杆、灯具、主电路、控制电路。受到环境因素、人为因素、设备自身因素的影响,城市电气照明系统较容易出现故障和损坏。表1为城市电气照明系统常见故障。
表1 城市公共照明系统故障示例
城市路灯数量庞大、分布广泛,为了便于管理,相关部门主要利用数字化的监测系统掌握路灯的运行状态。在该系统中,每个路灯都成为1个节点,其运行数据包括灯杆编号、路灯状态、电压、电流、功率、电压频率、功率因数、报警信息等[1]。当路灯异常关闭后,系统会记录这一事件,并且系统中预设了一系列故障编码,通过运行数据判断故障类型,进而以编码的形式反映出故障类别。虽然现有的数字化监管系统能够识别出故障类别,但每一种故障类别通常对应多种成因,例如配电箱闸刀开关过热的原因包括导线压接不紧、闸刀开关容量小,监测系统尚不能反映出具体原因。
2.2.1 故障类别与属性字段的关系
(1)
式中:f为故障类别与属性字段之间的依赖关系,其输出结果是一个由离散值构成的连续函数,函数中的离散值与故障特征、故障维护策略形成对应关系,建模的关键是确定依赖关系f[2]。
2.2.2 路灯节点故障诊断建模
1)基于经典ELM算法的诊断模型构建。故障建模中使用的机器学习算法为极限学习机(extreme learning machine,ELM),其优点为生效时间短、更新速度快,能够适应路灯管理的实际需求。路灯节点故障诊断在本质上是分类问题,将故障类型的标识记为ti,其取值范围在集合{1,2,3,4,5}中。路灯节点运行数据用于判定故障类型,每个节点的运行数据包括20个维度的属性。因此,在ELM模型中,需要输入20个属性值,相应的故障诊断模型可表示如下。
(2)
式中:xi为第i条路灯节点数据,并且有xi=(x1(i),x2(i),…,x20(i));N为路灯节点运行数据的样本量;βj为权重;g(·)为神经网络的激活函数;aj和bj是随机生成的2个参数;L为神经网络中隐藏层节点的数量;符号“〈〉”表示对计算结果进行四舍五入;Oi为模型的输出值。
在算法模型的训练阶段,要使损失函数达到最小化,这一要求可转化为求得经验误差的最小值,其数学表示方法如下。
(3)
在ELM算法模型中,常用的激活函数为Hardlim函数、高斯函数以及sigmoid函数,在训练过程中,应该测试不同激活函数的分类效果的影响。
2)基于AG-ELM算法的诊断模型优化。在ELM算法中需要确定最佳的节点数量,如隐藏层节点数,当节点数量不同时,算法的性能也会有所差异。在ELM算法的基础上引入蒙特卡洛方法的思想,形成了AG-ELM算法。以AG-ELM算法为基础,诊断模型每经过1次迭代,即可优化1次ELM算法的结构[3]。优化过程的核心思想是不断减小模型的误差,与传统的ELM算法不同,AG-ELM算法中引入了误差εL,在初始时刻,将误差记为ε0,则有ε0=[t1,…,tn]T,即训练数据集上的目标标签。在模型训练的过程中,误差将不断发生变化,ELM算法的隐藏层节点数与误差存在紧密的联系,当隐藏层节点数为L时,误差εL的计算方法如下。
εL=εL-1-δHLβL
(4)
式中:εL-1为前一级的误差;βL为新增加隐藏层节点到输出层的权重;训练数据集在新增隐藏层节点的输出记为HL;δ为任意小的正值。为了降低误差εL,需要精确计算出新增节点的权重,计算方法如下。
(5)
2.3.1 模型检验方案
在模型性能检验阶段,利用MATLAB编写算法程序,通过高性能计算机搭建程序运行的环境,处理器为Intel i7,操作系统为Win10。模型训练和测试的数据来自某城市路灯系统的真实运行数据,其中包括一定比例的故障信息。试验过程所使用的数据采集自路灯节点,为了保证数据的质量,试验之前应进行数据清洗和归一化处理,共计获得1 000条节点运行数据,将其中的800条作为训练集,剩余200条作为测试集。在模型效果评价阶段,将准确率作为评价指标,计算方法如下。
Acc=(1-cw/ctotal)×100%
(6)
式中:Acc为准确率;cw为错误分类的样本数;ctotal为所有样本的数目。
2.3.2 检验结果分析
对于传统ELM算法,采用了4种不同的激活函数(Sigmoid、Sin、Hardlim、RBF)。在训练数据集上,这些激活函数导致了各不相同的准确率,最高为Sin函数(74%~79%),最低为Hardlim函数(21%~42%)。在测试数据集上,各个激活函数的表现同样存在差异,最高为Sin函数(67.3%~72%),最低为Hardlim函数(32%~33.2%)。对于GA-ELM算法,仅采用了Sin激活函数构建模型。该算法在训练数据集上表现出相对较高的准确率,为91%。在测试数据集上,GA-ELM算法同样取得了较高的准确率,为89.3%。对比结果如表2所示。从中可知,以传统的ELM算法为基础,Sin函数的准确率最高,将Sin函数应用于GA-ELM算法,诊断模型在训练数据和测试数据上的准确率全面优于ELM算法模型[4]。
表2 基于ELM算法的诊断模型和基于AG-ELM算法的诊断模型准确率对比 单位:%
相对于传统ELM算法,GA-ELM算法在训练和测试数据集上都表现出更高的准确率,这可能归因于GA-ELM算法通过遗传算法优化模型参数,提高了模型性能。此外,在传统ELM算法中,Sin激活函数在训练和测试数据集上都取得了相对较好的表现。同时,针对不同故障类型,不同激活函数对诊断准确率产生不同影响,强调了在特定任务中选择合适的算法和激活函数组合的重要性。
配电系统为路灯提供电力能源,其主要构成为电力线缆和分布在各处的配电箱,每一个配电箱对应一个区域的电力供应。在故障预测中,需要将配电设备的潜在故障风险与时间相结合,进而掌握其可能出现故障的时间段。机器学习算法能够根据配电系统的运行数据,预测其在特定时段内的故障风险。
3.2.1 预测模型的输入和输出
根据预测模型的设计思路,模型输入数据为按照时间排列的路灯配电系统运行数据,将数据量记为P,模型的输出结果为系统在未来的某个特定时段(通常为预测过程的下一时段)是否会出现故障,输入和输出之间的数学关系可抽象为式(7)。
yi=F(xi,xi-1,…),xi∈Rm×1
(7)
式中:yi为模型输出,代表发生故障的概率,其计算结果在0~1;F(·)为一个连续的函数;xi、xi-1、…为输入模型的数据;xi∈Rm×1,Rm×1代表m×1维向量的集合。
3.2.2 故障预测模型建模及优化
1)构建自回归极限学习机预测模型。在建立模型时,需要作出基本假设,具体包括2个方面。其一,在时间维度上,设备故障与设备异常信息的排列顺序有关;其二,在属性维度上,关键属性在当前时刻的状态量能够反映出设备故障[4]。在以上假设的基础上,路灯配电系统的故障预测可转化为自回归分析问题,利用自回归模型(autoregressive model,AR)处理故障预测模型的输入数据,可得到如下表达式。
Xt=φ1xt-1+φ2xt-2+…+φsxt-s+αt
(8)
式中:φi表示自回归系数;xt-1、xt-2、…xt-s为输入自回归模型的数据;αt为白噪声;Xt为经过自回归处理后的数据。将AR模型和ELM模型相结合,可建立自回归极限学习机预测模型(AR-ELM),其数学描述方法如下。
(9)
式中:Ot为模型的预测结果,其本质上是一个概率数值;其他参数的含义可参见式(2)。为了提高模型的预测精度,必须尽可能降低输出结果Ot与实际结果之间的误差,这一过程的数学描述方法如下。
(10)
式中:Ti表示配电系统在时刻i发生故障的结果,1表示发生故障,0表示未发生故障;Oi是1个介于0~1的概率数值。显然,Oi与Ti的偏差越小,模型的预测效果就越精确[5]。为了评价模型对配电系统故障的预测效果,将均方误差作为评价依据,均方误差的计算方法如下。
(11)
式中:R为均方误差的计算结果,N为总的时间长度。
3.2.3 故障预测模型性能检验
研究人员首先进行了数据准备,获取具有标签的故障预测数据集并将其划分为训练集和测试集。分别使用ELM算法和AR-ELM算法构建了故障预测模型,其中ELM算法采用了4种激活函数(Sigmoid、Sin、Hardlim、RBF),而AR-ELM算法使用了RBF激活函数。
在此基础上,研究人员对每个模型使用相应的激活函数进行训练,并在测试集上进行预测。为了评估模型性能,采用了均方误差(MSE)作为指标。具体实践中,研究人员运用ELM算法,分别计算了每个激活函数下的预测误差的平方,并取平均得到相应的均方误差值(Sigmoid为0.186 5,Sin为0.173 2,Hardlim为0.242 0,RBF为0.122 6)。对于AR-ELM算法,使用RBF激活函数计算了均方误差值为0.055 2。
这些均方误差值反映了模型在测试集上的性能,其中数值越小代表模型预测越准确。整个过程需要确保数据集划分、模型训练和评估的一致性,以及对表格中数值的正确计算(见表3)。
表3 2种故障预测模型的误差对比结果
从表3可知,当使用RBF激活函数时,ELM算法建立的故障预测模型达到了最高的精度,均方误差最低。因此,将RBF函数应用于AR-ELM算法中,模型故障预测结果的均方误差仅为0.055 2,低于传统的ELM算法。由此可见,经过自回归模型优化的ELM算法达到了更高的预测精度。
城市路灯电气照明系统由路灯节点和区域性的配电系统构成,其在运行过程中都可能出现各种故障,包括配电箱故障、灯具故障、灯杆故障、主电路故障、电缆故障等,每种故障又可细分为多种故障类型,传统的基于数字化监控系统的故障诊断方法具有一定的局限性,难以指导故障排除。研究过程基于ELM算法构建了AG-ELM和AR-ELM算法,分别通过这2种算法建立路灯节点故障诊断模型、路灯配电系统故障预测模型。经过性能检验,2种算法模型都取得了良好的效果。