袁天霖,田 斌,朱 刚,刘佳杰,周龙伟
(1.国网浙江省电力有限公司宁海县供电公司,浙江宁波 315600;2.宁海县雁苍山电力建设有限公司,浙江 宁波 315600)
电力设备的可靠性是保证持续供电的基础,故需对其进行定期巡检[1-4]。电力设备内部会因故障电流导致温度升高,进而造成设备的损坏,并发生意外停电、人员受伤以及火灾的危险。因此,温度是电力设备主要故障形式的重要表征[5-6]。而通过温度传感设备与红外技术,可准确判别电力设备所产生的异常热量,从而提前进行干预,以避免不必要的经济损失。
红外热成像技术能够识别电力设备中的各种问题[7-8],例如短路、过载与负载不平衡、电气连接及电气元件安装不当等。而通过热成像仪能够以热图片的形式显示出设备表面的热辐射,相比于其他温度传感技术,红外成像技术具有温度测量范围广、响应时间快、二维数据采集、温度分布分辨率高、安全可靠以及经济性突出等特点。
传统算法对图像的识别与分析计算耗时较长,故难以及时发现故障。此外,使用常规方法评估电热条件,通常仅能由经验丰富的运行人员来完成。而基于人工智能的大数据处理技术可以应用于热分布图像的识别和检测。且该方法能在保证高效率的基础上充分发挥其自主性,并基于全部数据资料来获得更为全面、准确的检测结果,进而大幅提升人工经验识别工作的效率。
综上所述,文中采用人工智能、深度学习(Deep Learning,DL)等大数据处理技术[9-12],将热分布图像转换为像素点数据,再结合深度神经网络(Deep Neural Networks,DNN),对设备内的异常问题进行快速、准确地检测及评估。
随着红外测温技术的发展及其成本的下降,基于红外图像的电气设备可靠性分析获得了广泛的应用。与此同时,针对相关设备的自动诊断系统也已有诸多研究。然而,识别电气设备热图像内热点区域的方法大多是基于局域设定的阈值。该识别方式虽具有实现简便、可提取热点区域并使用形态分割的特点,但由于其参考温度来自平均值热点区域外类似设备的灰度值,所以也存在检测结果不准确、未能充分结合整体温度分布等不足。电气设备的状况判断一般是通过比较热点和参考之间的差异温度来实现的。而当热点位于设备区域外时,便会产生故障瞒报的安全隐患。
归一化互相关算法(Normalized Cross Correlation,NCC)[13-14]可用于识别图像数据的主要内容与目标检测区域。其基本原理是通过比较两个图像数据的主要特征矩阵是否一致,来进行图像的匹配。
在基于相关性寻找相似区域检测中,以图像的每个坐标(x,y)为邻域窗口的中心,通过迭代计算来评估场景图像中每个像素的归一化相关值。将图像与特征向量归一化的结果作为相似性指数,使互相关函数归一化后处于0~1 之间,从而产生类似余弦的相关性系数。
若数据f(x,y)的自变量与所选区域的窗口坐标(x,y)存在逐一对应关系,则认为是相似数据区域。t(x-u,y-v)表示搜索区域图像所对应的图像数据,其中u、v分别代表在x和y方向上的整数像素偏移。按上述设定,所选区域与相应搜索区域之间的相关性函数γ(u,v)可定义为:
式中,μt为检测区域的均值,μu,v是参考图像区域的均值,二者的表达式如下:
式中,γ的值介于-1(匹配实体互为逆时)和1(匹配实体完全相同时)之间。其中,γ=0 表示匹配实体之间没有关系。需要说明的是,即使搜索图像中并无真正对应的实体,也会存在一部分峰值相关系数,故通常γ≠0。若γ满足相应的阈值tsim,则接受匹配区域。如下式,说明该区域为相似区域,即将要检测的目标区域:
红外图像包含了诸多信息,其中一幅大小为320×240 像素的热分布图像约有76 800 个数据。这意味着,系统必须在较短时间内完成对这些数据的处理。因此需要在图形中快速寻找到目标检测点,并针对性地进行识别与分类。图像的真实温度需通过计算获得,像素的实际温度Tr计算如下:
其中,Tmax和Tmin分别代表图像内的温度值范围,这些温度值可以从热成像仪上得到。Tgray是灰度图像中某一点的像素强度值,而Tmgv则是图像中最高的灰度值。
而另一个需提取的参数则是该区域的最高温度与其环境温度间的相对差异。由于考虑区域的温度可能会产生误导,尤其是当整个选定区域显示为相同条件时,故需要在识别图像期间对周围或环境的温度进行测量。此外,峰度也被用来测量各区域热分布的平坦度。峰度越低,说明该区域内的温度分布越均匀。
多层感知神经网络(Multilaye Perceptron Neural Network,MLPNN)[15-16]的架构由输入层、隐藏层和输出层组成,如图1 所示。其中,第一层及最后一层分别为输入与输出层。在输入层中,节点的数量对应输入特征数量,而输出层节点数量则对应于目标类的数量。神经元是信息处理单元,其是神经网络运行的基础。输入、输出和隐藏层中的神经元分别用xi、yk及hj表示。输入层到隐藏层的连接权重用wij表示,而wjk为隐藏层与输出层之间的连接权重。
图1 多层神经网络结构
网络的全连接是指每层中的每个神经元均通过连接权值与相邻前一层中的神经元相连。其数学表达式为:
其中,f(·)为s型激活函数,可定义为:
基于均方根误差最小化确定权值,输出神经元中的目标输出与实际值之间的误差为:
式中,dk为神经元的预测或期望输出,yk为神经元的实际或目标输出。RMSE 值越接近0,表示结果越好。在训练过程中,若E值低于预定阈值,则将其作为终止条件。
由于热分布图像的数据是用像素点的色彩数据所表示的,故可将其看作一个三阶矩阵。基于多层分类感知的改进神经网络采用多个特征数据矩阵,对采集到的数据进行特征分类,从而与原始数据匹配,并得到设备的运行状态。该算法采用多个隐藏层与单一隐藏层的方式进行分类,同时还充分结合采集到的热图像数据特点,提升了算法的效率及收敛性。此外,单一的输出层也进一步保证了分类感知的稳定性和鲁棒性。改进的多层分类感知算法架构如图2 所示。
图2 改进多层分类感知算法的结构
电力设备状态检测系统的流程,如图3 所示。首先要确定目标检测区域,并寻找与检测区域具有相似内容或数据的区域,再将深度学习分类算法应用于目标区域的红外图像中,以提取所需检测的目标设备特征属性。其中,每个被检测到的最高温度值和统计提取的热数据均要有对应的配置文件。最后,使用多层神经网络对提取的特征进行分类,以判断设备是否正常或处于何种故障状态。该研究采用的检测方法为基于定性及定量测量技术相结合的模式,所有相似类别的电力设备数据均可纳入计算。
图3 电力设备状态检测流程
该文使用热成像仪采集电气设备的红外图像,并将其作为状态识别的原始数据。目标设备是变电站内的电气设备,例如变压器绕组、断路器、电缆、电线与保险丝。在捕获图像时,该变电站的负载约为60%,对应的温度较为稳定。目标装置和红外摄像机之间的距离为2~5 m。摄像机则采用12.5~1 100 mm的焦距镜头,以获取最大监控范围。
所有能直接或间接影响测量精度的相关信息,如环境温度、负载、电流、目标设备的发射率以及周围效应等均已被记录且作为原始数据输入,环境温度设置在30~32 ℃之间。实验利用采集到的143 幅红外图像进行状态识别,其中56%的数据用于训练,剩余44%则用于算法测试。此外,故障状态的数据为36%,正常状态为64%。
对于MLPNN 分类算法,隐藏层、输出层分别使用了30 个和1 个节点。设学习速率为0.05,停止条件的均方误差为0.000 1。将训练神经元的最大数目设为1 000 个,并使用正弦函数作为激活函数。所有分类器的性能评价指标均为特异性、敏感性和准确性的百分比,其定义如下:
其中,TF 和TNF 分别表示正确预测的异常与正常设备,而FF 和FNF 则分别为错误预测的异常设备及正常设备。敏感性与系统正确识别故障的能力有关,而特异性是指对正常仪器的正确检测率,准确率则是正常及异常设备的正确分类占整个测试样本的总百分比。
基于上述算法步骤,图4 显示了使用不同的输入数据集对训练、测试与平均准确率的分类性能对比。由图可知,10 个数据集中,分类准确率最高的是特征集10,其平均准确率为95.804%。其次为特征集8,准确率为94.4%。基于分类性能分析,特征集5~7 不利于确定电气设备的热状况。原因在于数据集的热成像仪扫描所得图形未能体现设备的全貌,局部的热分布特性难以对设备的健康状态加以甄别。因此,在使用热成像仪分布图像进行状态参数识别时,应对输入数据进行严格管理,并确保能够将与设备相关的状态参量纳入算法中,以防设备故障瞒报、漏报情况的出现。
图4 不同数据集的分类准确率
由于特征集10 的分类效果较优,在训练和测试阶段,其准确率结果约为99.999%和90.476%,因此利用该集合来设计评价体系。特征集10 的整体性能如表1 所示。图5 显示了特征集10 的训练迭代次数对测试数据均方误差结果的影响。
表1 特征集10的测试结果
图5 迭代次数对数据结果的影响
从图中可看出,特征集10 的误差随着训练次数的增加而减少,所提算法的测试准确度始终高于传统神经网络。且无论迭代多少次,所提算法均能获得相对较低的识别误差,故具有较优的稳定性。
为进一步说明识别算法的直观性,以变压器数据为例,正常数据分布在阴影区域,异常数据则会从x、y或z方向脱离该区域,即说明变压器温度分布异常。异常点检测结果如图6 所示。由图6 可知,所提算法能够准确、直观及全面地识别设备状态,并可全面吸收原始数据中所蕴含的信息,且从多个维度对正常与故障状态进行分类,从而取得了良好的效果。
图6 异常点检测结果
文中提出了一种基于定性红外图像分析的电气设备热状态检测与分类方法。通过改进的多层神经网络算法,仅用一个隐藏层的结构,便可准确、稳定地识别设备状态。同时,还研究了MLPNN 神经网络分类器对不同输入数据集进行分类的性能。综合各种特征,得出了设备热状态分类的最佳特征选择。实验结果表明,该特征集给出的平均准确率超过95%,且结果具有稳定、直观的特点。