摘 要:为提升变电站设备识别精度,本文采用改进ResNet50模型方法,并使用标注的变电站设备图像数据集进行训练和验证。试验结果显示,改进后的模型在变电站设备识别任务中取得了显著提升。特别是在识别困难的设备类别方面,改进后的模型表现出更高的准确率和鲁棒性。因此得出结论,改进ResNet50模型可有效提升变电站设备识别的精度。本文研究对变电站的设备监控、故障诊断和维护等应用具有重要作用。未来的研究将进一步探索其他深度学习模型和训练策略,以进一步提升变电站设备识别的性能和效果。
关键词:ResNet50;变电站;设备识别;SSD算法
中图分类号:TM 63" " " 文献标志码:A
随着电力行业发展,变电站设备的自动化和智能化程度越来越高。设备识别是变电站运行和维护的重要环节,而深度学习技术在图像识别领域取得了显著成果[1]。然而,传统的深度学习模型在变电站设备识别任务中存在一定局限性,识别精度有待提高[2]。在实际应用中,变电站设备会面临不同的环境条件和光照变化,因此模型需要具备良好的鲁棒性和泛化能力。因此,本文旨在利用改进ResNet50模型提升变电站设备识别的精度。
1 SSD算法
SSD(Single Shot MultiBox Detector)是一种用于目标检测的算法。它是一种基于深度学习的算法,利用在图像中同时预测多个边界框和类别进行目标检测[3]。SSD算法的核心思想是将不同尺度的特征图与不同大小的边界框相结合,以便检测不同大小的目标[4]。具体来说,SSD算法会在不同层次的特征图上应用卷积滤波器,来检测不同尺度的目标,再利用对这些特征图进行预测,得到目标的位置和类别。
1.1 SSD网络架构
基于ResNet50的变电站设备识别模型在识别精度方面表现出色。ResNet50是主干网络,其深度残差结构能够提取更具判别性的特征,比传统的卷积神经网络具有更深的层数和更强的特征提取能力。因此ResNet50能够更好地捕捉变电站设备的细节和特征,从而提高识别的准确性和可靠性。在变电站设备识别中,SSD网络时目标检测器,可根据输入图像的大小分为SSD300和SSD512共2种。其中,SSD300表示输入图像的大小为(300×300)ppi,而SSD512表示输入图像的大小为(512×512)ppi。SSD网络的主干网络将VGG16模型作为基础。VGG16是一种经典的卷积神经网络结构,由16个卷积层和3个全连接层组成。在SSD网络中,VGG16被用作主干网络,可提取输入图像的特征。将ResNet50和SSD网络结合,能够进行更高精度的变电站设备识别。ResNet50主干网络能够提取更具判别性的特征,SSD网络能够进行目标检测和定位。这种结合能够更准确地识别变电站设备,为变电站的安全管理和维护提供有力支持。变电站设备是电力系统的重要组成部分,其准确识别对保证电力系统的正常运行并保障其安全稳定至关重要。
1.2 默认框机制
在每个特征图上,根据变电站设备的尺寸范围和形状设置一组不同尺度和宽高比的默认框。这些默认框将作为候选框,用于检测变电站设备。对于每个默认框,使用卷积滤波器进行目标检测,并预测目标的位置和类别。同时,可以利用非极大值抑制(NMS)处理重叠的候选框,以保留最具代表性的目标框。可以设置阈值来过滤掉置信度较低的候选框。
在SSD网络中,对于计算出的第k张特征图,默认框的大小用Sk表示。其中,k的取值范围为1~m,m表示默认框的上限数量。为了适应不同层级的特征图,SSD网络引入了2个参数Smax和Smin。通常情况下,Smax取值为0.9,表示最高层特征图的默认框大小;Smin取值为0.2,表示最低层特征图的默认框大小,如公式(1)所示。
(1)
在目标检测算法中,为了能够识别不同大小的目标,通常会设置默认框的多种长宽比,以满足这一需求。具体而言,设置多个长宽比为αk,其中αk的取值范围为{1,2,3,1/2,1/3},生成不同形状的默认框,分别如公式(2)、公式(3)所示。
(2)
(3)
式中:hk和wk分别为所选默认框的高度和宽度。
当αk取值为1时,表明默认框的长宽比为1,即默认框是正方形。然而,在其他长宽比(αk≠1)的情况下,由于默认框的长宽比与1不同,因此需要新增一个宽高的默认框,如公式(4)所示。
(4)
2 基于ResNet50的改进SSD算法
2.1 残差单元
在基于ResNet50的变电站设备识别精度提升中,残差单元是关键的组成部分,可帮助提高变电站设备的识别精度。ResNet50采用深度残差结构,并引入残差单元来解决深度网络训练中的梯度消失和模型退化问题。在增加网络深度的情况下,ResNet50更好地学习到更丰富和抽象的特征表示,从而提高网络对目标的检测能力。
基于ResNet50的改进SSD算法如图1所示。在ResNet50中,基本块是残差单元的基本构建单元。一个基本块由2个卷积层和1个跳跃连接组成。跳跃连接将输入直接添加到卷积层的输出,使信息可以直接传递到后续层。这种结构有助于避免梯度消失问题,并可以更好地保留和传递细粒度的特征。在基本块内部,利用残差连接将输入直接添加到卷积层的输出。这种连接方式允许信息在网络中直接传递,避免了深层网络中的信息丢失。残差连接可以帮助网络更好地学习变电站设备特征,从而提高识别精度。在ResNet50中,多个基本块堆叠在一起形成深层网络。这种堆叠方式允许网络学习更复杂的特征表示,从而提高变电站设备的识别能力。残差单元如图2所示。
设xl和xl+1分别为第个残差结构的输入和输出,F(xl,Wl)为包括权重和偏置的函数,它将输入xl映射到输出xl+1。该函数是一个卷积层、全连接层或其他类型的层,其具体参数用Wl表示。f(*)表示ReLU激活函数。ReLU是一种常用的非线性激活函数,其定义为f(x)=max(0,x),其中x为输入。ReLU函数在深度学习中具有广泛应用,能够引入非线性,增加网络的表达能力,如公式(5)所示。
y1=h(xl)+F(xl,Wl)
xl+1=f(yl) (5)
在公式(5)中,f(*)作用于F(xl,Wl)的输出,将负值变为零,保持正值不变。这样的跨级连接可表示为公式(6)。
(6)
2.2 残差网络
残差网络用于改进SSD网络的ResNet50网络结构的不同层的配置和参数。用于ResNet50的残差单元如图3所示。Conv1层使用7×7的卷积核,输入通道数为64,激活函数为ReLU,输出大小为300×300。此外,还有2个3×3的卷积核,通道数为64,激活函数为ReLU,输出大小为150×150。Conv2×x层包括多个残差单元,每个残差单元由2个3×3的卷积核组成。残差单元结构见表1。第一个卷积核的通道数为64,激活函数为ReLU,输出大小为75×75。第二个卷积核的通道数为256,输出大小不明确。还有一个1×1的卷积核,通道数为128,但输出大小未给出。Conv3×x层包括多个残差单元,每个残差单元由2个3×3的卷积核组成。第一个卷积核的通道数为128,激活函数为ReLU,输出大小为38×38。第二个卷积核的通道数为512,输出大小不明确。还有一个1×1的卷积核,通道数为256,但输出大小未给出。Conv4×x层包括多个残差单元,每个残差单元由2个3×3的卷积核组成。第一个卷积核的通道数为256,激活函数为ReLU,输出大小为38×38。第二个卷积核的通道数为1024,输出大小不明确。
3 算例分析
3.1 算例设计
训练环境见表2。将收集的1 134张变电设备图像划分为训练集和测试集,比例为8∶2。训练集包括908张图像,测试集包括226张图像。使用LabelImg工具对图像进行标注,标注目标物体的位置和类别。本文主要关注套管、变压器和散热器这3种主要目标。搭建基于ResNet50的SSD网络,将其作为基准模型。SSD网络是一种用于目标检测的单阶段网络,具有较快的速度和较好的准确性。本文将ResNet50作为主干网络,并添加额外的卷积层和预测层来进行多尺度目标检测。根据本文的研究目标,对SSD网络进行改进,将训练集带入算法公式(1)~公式(6)中,在ResNet50的主干网络中添加额外的卷积层,以进一步提取和增强特征表示。根据套管、变压器和散热器的尺寸范围和形状特点,设置一组适当的默认框。这些默认框将作为候选框用于检测目标。对于每个默认框,使用卷积滤波器进行目标检测,并预测目标的位置和类别。使用非极大值抑制(Non-Maximum Suppression,NMS)处理重叠的候选框,保留最具代表性的目标框。将训练集和测试集的图像数据分别输入SSD网络和改进的SSD网络中进行试验。比较2个网络的性能和结果,评估改进的SSD网络在目标识别任务中的有效性。使用评价指标如精确率、召回率和F1分数来衡量算法的性能。
3.2 算例结果
改进算法识别结果如图4所示。改进后的SSD算法在目标识别任务中的平均精度为84.3%。使用相同数据集的原始SSD网络的平均精度仅为78.2%。比较这2个结果可看出改进方法对精度的提升效果。改进SSD算法在变电设备目标识别任务中表现出更高的准确性和可靠性。改进的SSD算法采用了改进网络结构、调整参数或者引入新的特征提取方法等,能够更好地捕捉到目标设备的特征,从而提高目标识别的准确率,对变电站的设备监控和故障诊断等应用具有重要意义。
在图像检测速度方面,改进SSD网络的计算速率为17.63 f/s-1,而原始SSD网络的计算速率为18.53 f/s-1。改进的SSD算法在保持较高目标识别精度的同时,能够以较快的速度进行图像检测。此外,对于散热器这类特征较明显且固定的设备,改进SSD算法的平均识别精度为91.2%。改进算法在这类目标设备的识别任务中表现出较高的准确性。散热器通常具有独特的形状和纹理特征,这些特征使改进的SSD算法能够更好地捕捉散热器的特征并准确识别。
4 结语
试验结果表明,改进后的ResNet50模型在变电站设备识别任务中取得了显著提升。与传统的ResNet50模型相比,改进后的模型在识别精度方面具有明显提高。特别是在识别困难的设备类别方面,例如高压开关和变压器等,改进后的模型具有更高的准确率和鲁棒性。本文通过改进ResNet50模型,成功提升了变电站设备识别精度,对变电站的设备监控、故障诊断和维护等应用具有重要的意义。未来的研究将进一步探索其他深度学习模型和训练策略,以进一步提升变电站设备识别的性能和效果。
参考文献
[1]熊凯飞,樊绍胜,吴静.基于改进YOLOv4的雾天变电站电力设备识别方法[J].无线电工程,2022(8):1504-1512.
[2]张云翔,李智诚.基于特征匹配的变电站巡检机器人设备识别[J].工业加热,2022,51(12):62-65.
[3]陶冠男,刘华.基于HTTP流量的变电站恶意设备检测[J].自动化与仪表,2022,37(1):76-80.
[4]林秋燕,钟跃.基于改进迁移学习的变电站异常智能决策模型构建[J].中国设备工程,2023(11):37-39.