基于Cascade R-CNN 的配电网鸟巢检测

2021-04-22 09:17李继东郑静媛张淞杰
浙江电力 2021年3期
关键词:候选框鸟巢配电网

赵 锴,李继东,黄 佳,郑静媛,张淞杰

(1.国网北京市电力公司,北京 100031;2.浙江大学 电气学院,杭州 310027)

0 引言

随着我国城市现代化的发展,城市的用电量也在不断增大。为了满足城市各地区的生产生活用电需求,配电网需要承担极大的电力分配压力。配电网具有电压等级多,网络结构复杂,设备类型多样,作业点多面广,安全环境相对较差等特点,因此配电网的安全风险因素也相对较多。据统计,电力用户遭受的停电事故95%以上是由配电网引起的(扣除发电不足因素)[1]。另外,由于配电网承担为各类用户提供电力能源的责任,因此降低配电网故障对提升用户体验,提高企业形象具有重要意义。而这就对配电网的可靠运行提出了更高的要求。

配电网主要由架空线路、杆塔、电缆、配电变压器、断路器、无功补偿电容等配电设备及附属设施组成,实际运行中的配电线路故障绝大部分是架空线路故障[2]。鸟害一直是导致架空配电网故障高发的主要原因[3],鸟类活动引起的线路跳闸次数仅次于雷害与外力破坏[4]。并且由于输电线路人工巡检成本巨大,电网公司缺乏有效应对措施。

针对鸟害的预防问题,国内外都做了不少研究。传统的研究方向是对配电网架空线路进行防鸟害改装,主要可以分为三类:加装驱鸟型设备,如风轮、超声波、光波驱鸟器等;加装防护型设备,如防鸟罩、防鸟刺等;加装诱导型设备,如竹篮鸟巢等[5]。这些方法具有很多值得学习和借鉴的地方,但也存在成本高昂、维护困难、影响施工等缺点,因此实际效果并不理想。随着机器视觉以及无人机等技术的迅猛发展,配电网的鸟害预防也出现了一种通过图像方法实现的新思路。文献[6]研究并实现了两种鸟巢特征提取的方法:PCA(主成分分析方法)和Gabor 滤波方法,并分别对鸟巢图片数据进行了实验。西南交通大学的团队通过对关键区域HOG(方向梯度直方图)特征的提取,实现了对铁路接触网鸟巢区域的检测[7]。文献[8]提供了一种基于支持向量机的鸟巢检测框架。文献[9]通过搜索符合鸟巢样本的HSV(色调-饱和度-明度)颜色特征量的连通区域,检测铁塔上的鸟巢。这些算法都相对简单,对于配电网的鸟巢检测存在着稳定性较差,抗干扰能力不强等问题。

近年来,随着深度学习技术的不断发展,基于深度学习方法的目标检测与定位识别技术已经达到不错的效果,并开始大规模应用于产业。然而,针对配电网的鸟巢检测,相关深度学习方法的研究应用却十分少。因此,本文的探索对相关的研究具有一定的借鉴和启发意义。

CNN(卷积神经网络)是深度学习网络的基础,在图像检测识别领域发挥着举足轻重的作用。在此基础上,逐渐发展出了R-CNN[10],SPP-net[11],Fast R-CNN[12],Faster R-CNN[13]等一系列深度学习的算法模型。在综合考虑检测速率和准确率的情况下,本文提出了一种基于Cascade R-CNN 的配电网鸟巢检测方法。该方法通过在R-CNN 中加入一个multi-stage 的结构,使每个stage 都有一个不同的IoU(联合正负)阈值,可为配电网提供更稳定、高效的鸟巢检测结果。

1 Cascade R-CNN 神经网络

1.1 CNN 神经网络

在图像的目标检测中,特征的选择通常比分类更重要。在CNN 发展之前,各种视觉识别技术的进展都很大程度上基于SIFT(尺度不变特征变换)[14]和HOG[15]的使用,其中参考文献[7]正是使用了HOG 特征。但是SIFT,HOG 等经验驱动的人造特征通常并不能完全代表样本的特征,因此开始转而使用CNN 等为代表的数据驱动的检测方法,以此提高特征对样本的表示能力。

CNN 的工作机制是将图像作为网络输入,然后通过多个卷积层和池化层进行处理,最后输出对象类别,如图1 所示。对于每个输入图像,都会得到一个相应的对象类别。当要实现图像检测时,需要同时定位图像中的多个物体。CNN 一般是通过滑动窗口探测器来实现检测定位,为了获得较高的空间分辨率,这些CNN 都采用了两个卷积层和两个池化层。但是由于R-CNN 网络层次更深,输入图片有非常大的尺寸(195×195)和步长(32×32),这使得采用滑动窗口的方法并不可行。

图1 CNN 网络结构

CNN 与普通神经网络的区别在于,CNN 包含了一个由卷积层和下采样层构成的特征,公式如下:

式中:i,j 分别代表输入图像的长和宽;m,n 分别为卷积核的长和宽;s 为输出;W 为卷积核;X为网络的输入。特别的,如果X 是一个二维输入的矩阵,那么W 也是一个二维的矩阵;如果X是一个多维张量,那么W 也是一个多维的张量。

CNN 一般包括输入层、卷积层、激活函数、池化层以及全连接层。输入层主要对图片数据进行预处理,包括去均值与归一化,预处理后的图片才能以统一的格式进行后续的卷积操作。卷积层通过卷积运算,提取图像的高级特征。提取到的特征连接全连接层,并通过激活函数得到检测结果。在CNN 中,使用的激活函数多为ReLU(线性修正单元)函数。ReLU 激活函数的公式如下:

池化层的存在能够有效地减少计算量。池化就是将多个像素点进行求均值或最大值等操作,将输入图像进行缩小,减少像素信息,进而减少计算量。全连接层在整个CNN 中起到“分类器”的作用,即通过前叙输入层、卷积层、激活函数、池化等模块后,将得到的结果连接至全连接层,通过全连接层对结果进行识别分类。

1.2 Cascade R-CNN

在CNN 的基础上,Ross Girshick 等人将候选区域和CNN 结合起来,得到一种新的神经网络R-CNN。受滑动窗口方法的启发,R-CNN 采用区域识别的方案来进行分区检测。在R-CNN 中,对每张图片产生接近2 000 个与类别无关的候选区域,对每个CNN 抽取了一个固定长度的特征向量,最后通过专门针对特定类别数据的线性SVM(支持向量机)或softmax 分类器对每个区域进行分类。在不考虑候选区域大小的情况下,使用放射图像变形的方法来对每个不同形状的候选区域产生一个固定长度作为CNN 输入的特征向量。实验证明该方法能够有效提高检测效果,但是相应的也存在一些缺点。首先在对象检测中,需要定义IoU 阈值。随着IoU 阈值的增大,网络的检测性能下降。造成这种情况的主要原因有两个:在训练期间由于正样本呈指数消失而过度拟合;最佳检测器的IoU 与输入假设的IoU 之间的推理时间不匹配。

为了解决这个问题,2018 年研究人员提出了Cascade R-CNN。基于该网络提出了一种多阶段目标检测架构,它由一系列经过不断提高的IoU阈值训练检测器组成,可以依次对接近的假阳性更具选择性。具体的,是设计cascade R-CNN 的bbox cls/reg 机制,公式如下:

其中总共有3 个双向子网相级联,每个双向子网采用不同的IoU 阈值。

2 基于Cascade R-CNN 的配电网鸟巢检测

2.1 实验数据

为了验证提出的基于Cascade R-CNN 的配电网鸟巢检测方法的可行性与有效性,本文进行了一系列的实验验证。整个实验过程基于Ubuntu-16.04 操作系统下的TensorFlow 2.0 平台,实验图片共计有2 076 张。

在本文针对架空线的鸟巢检测中,由于背景繁杂,对图片的检测工作带来许多困难。如图2所示,现场图片中通常包含绝缘子、架空线之类的设备影响检测,且鸟巢位置通常比较隐蔽,使用传统的检测算法极易产生误检,如将架空线路或铁塔识别为鸟巢,或是将鸟巢当做架空线的一部分。为了应对这个问题,本文拟采用基于Cascade R-CNN 的检测方法,通过热力图的方式寻找鸟巢所在区域的特征,实现对架空线鸟巢的准确识别。

2.2 级联结构

如图3 所示,本文使用的Cascade 级联结构共分为4 个阶段,在训练初期,RPN(区域生成网络)提出的候选框大部分质量都不高,导致没办法直接使用高阈值的检测器,Cascade R-CNN 使用级联回归作为一种重采样的机制,逐阶段提高候选框的IoU 值,从而使得前一个阶段重新采样过的候选框能够适应下一个有更高阈值的阶段,本文中使用的IoU 阈值分别设定为递进的0.5,0.6,0.7。同时,将大于该阈值的定义为正样本,其余均为负样本。

图2 架空线的鸟巢

图3 Cascade 级联结构

在本文基于Cascade R-CNN 的配电网鸟巢检测实验中,通过该multi-stage 的结构,对检测器的候选框基于不同的IoU 阈值进行训练。在训练阶段,神经网络提出多个候选框,这些候选框被送入到Cascade R-CNN 网络结构中,通过三段不同的IoU 阈值挑选对应质量的样本用于训练与检测。通过逐级提高候选框的IoU 值,从而使得前一级重新采样过的候选框能够适应下一个有更高IoU 阈值的阶段,实现提高检测效果的目的。训练后的检测器可以快速对检测图片的候选框进行匹配计算,实现对架空线鸟巢的有效检测。

2.3 网络参数

作为对比,损失函数与Faster R-CNN 保持一致。分类器采用softmax,回归采用smooth L1 loss,并且为了防止由于边界框大小以及位置带来的回归尺度的影响,对边界框的坐标进行归一化处理。Cascade R-CNN 的参数数量随级联级数的增加而增加,其中基线检测器的参数数量呈线性增加。另外,由于与RPN 相比基线检测器的计算成本通常较小,因此在训练和测试方面,Cascade R-CNN 的计算成本相对Faster R-CNN 更小。

2.4 实验设计

在本文的实验中,实验图片共计有1 836 张。所有实验图片均已人工标记鸟巢区域并记录图片标签属性。选取部分实验图片样本作为训练样本,剩余图片样本作为测试样本。将训练样本分别对不同检测算法进行训练,并用训练后的算法模型对测试样本进行检测。通过对Cascade RCNN 和其余几种主流算法的识别准确率进行对比分析,可以得知基于Cascade R-CNN 的配电网鸟巢检测是否具有可行性和先进性。

本文的实验流程如图4 所示。在训练后的神经网络中,将测试图片输入骨干网络,通过RPN得到一系列候选框,之后进行池化得到第一级的分类器结果和回归结果,通过三级Cascade 级联结构的IoU 阈值可以快速获得最终的分类和回归结果,判断测试图片中是否存在鸟巢,并框出鸟巢所在位置。

图4 实验流程

3 实验结果

如前文所述,具体的实验结果如图5 所示,其中检测到的配电网鸟巢区域均由方框框出。基于此实验结果,可以有效地证明Cascade R-CNN算法在配电网鸟巢检测中具有良好的识别效果。

图5 实验仿真结果

为了体现本检测方案在速度和识别精确度上的优势,本文将以Cascade R-CNN 算法与多种经典的目标检测识别算法进行对比,即CNN 算法,SVM 算法[16]以及ELM(极限学习机)算法[17]。作为传统目标检测方法,这些算法均已经验证了其在目标识别与检测中的有效性和准确性。

在目标检测中,通常对样本图像分为正例与负例,正例代表与目标相关的样本,在本实验中即为包含鸟巢的图片;负例代表与目标无关的样本,在本实验中即为不包含鸟巢的图片。其中TP(真正)表示被正确划分为正例的个数,FP(假正)表示被错误划分为正例的个数,TN(真负)表示被正确划分为负例的个数,FN(假负)表示被错误划分为负例的个数。假正图片和假负图片分别如图6 所示,其中图6(a)为假正,图6(b)为假负。通过对图6(a)假正图片的观察分析,可以推断检测器误识别的原因为该视角下架空线在小块区域出现密集重叠,从而使得检测器误将该区域识别为鸟巢。通过对图6(b)假负图片的观察分析,可以看出鸟巢形状较小且存在部分遮挡,同时图片背景为相对复杂的树丛,从而使得检测器未成功识别该鸟巢。

为了评价目标检测的识别效果,将对4 种算法的检测准确率进行对比,其中准确率由以下公式得出:

其中,4 种算法的检测准确率结果见表1。

如表1 所示,本文所使用Cascade R-CNN 算法的检测效果最佳,CNN 算法仅次之,由此可见即使使用传统的深度学习算法,效果也好于传统算法。值得注意的是,相较于其他几种算法,ELM算法虽然识别效果最差,但是在训练速度上具有明显优势。

图6 实验负例结果

表1 4 种算法的识别准确率对比

4 结语

鸟害一直是造成配电网架空线故障的主要原因之一。随着无人机技术和深度学习理论的研究和发展,基于深度学习的目标检测已经能够实现一定的检测效果。本文在此基础上,提出了一种基于Cascade R-CNN 的配电网鸟巢检测的新方法,实验证明该方法具有一定的可行性。特别是,基于相关算法的目标检测方法,将会因其成本低廉,成为今后配电网智能巡检的主要研究方向之一。

猜你喜欢
候选框鸟巢配电网
重定位非极大值抑制算法
面向自然场景文本检测的改进NMS算法
鸟巢
基于深度学习的重叠人脸检测
重回鸟巢
关于城市10kV配电网自动化实施的探讨
鸟巢大作战
一种针对特定目标的提议算法
基于IEC61850的配电网数据传输保护机制
配电网不止一步的跨越