马聪,李德泉,汪培月,王兴振,侯建峰
(国网山东省电力公司济南供电公司,山东济南 250000)
随着计算机科学、智能电站的快速发展,电缆隧道巡检手段不断从人工巡检向智能巡检的方向发展。电站管理人员借助物联网等通信设备可以进行远程巡检,大幅度提高了巡检效率,降低了人员受伤的可能。
具有自主导航和环境感知能力的无人机在物流、运输、侦察等领域应用广泛,但大多数无人机并不适合在电缆隧道内使用,即使训练有素、经验丰富的飞行员也难以确保绝对安全的远程操作。
为了实现大规模的智能化隧道巡检,该文采用了可以广泛部署的低成本传感器,总体设计了基于扩展卡尔曼滤波器(EKF)的多传感器融合框架。由于隧道图像的共同背景和色彩纹理较为复杂,该文提出了一种基于卷积神经网络特征的快速深度卷积神经网络(R-CNN)方法来定位故障元件,将目标分类问题转化为目标检测和识别问题。使用转移学习的方法学习目标的基本特征,并根据学习结果在图像中准确定位故障区域。
该文设计的系统架构包括传感器、软件算法模块、基于扩展卡尔曼滤波的多传感器融合框架等[1],具体如图1 所示。
图1 自主无人机的整体系统架构
为了实现鲁棒的隧道内自主导航,无人机传感系统由一个2D 激光雷达、一个测距激光雷达、3 个摄像头(向前、向上和向下)和一个惯性测量单元组成。
在实现无人机的自主运动前,需要无人机所处的环境地图[2]。该文基于XML 标签,在坐标系中存储无人机的位置和姿态,然后将这些姿势附加到每个机架的预定位置。当无人机观察到标签时,即可根据标签识别所计算出的结果更新无人机的定位信息。
该文假设IMU 传感器的姿态与UAV 的姿态相同。EKF 的状态由以下位置组成:坐标框架{W}中IMU 的定位向量为pw,速度向量为vw,其方向四元数描述了IMU 相对于W的旋转,陀螺仪偏置为qw,加速度计偏置[3]为ba。无人机的总体状态由16 维状态向量x表示:
从而可以得出以下微分方程:
其中,Rw是与四元数qw相对应的旋转矩阵,am是IMU测得的加速度[4],na、nbω、nba是高斯噪声[5]。该文将偏置项建模为随机浮动,取微分方程式(2)-(6)的期望值,并定义式(1)的误差状态向量Δx,得到线性化的误差状态方程。测量模型将状态向量和传感器测量值关联为:
其中,z是测量向量,如位置、欧拉角和姿态;h(x)是相应的测量模型;n是高斯测量噪声[6]。该次采用模块化多传感器融合框架,其中各个传感器的测量数据更新相互融合,以获得状态的最佳估计。
文中用于更新EKF 滤波器的最小传感器系统包括:1)摄像头:测量6D 绝对姿态机架上标签的姿态。2)2D 激光扫描仪以及IMU 传感器。3)下视测距传感器:估计无人机的高度。
从理论上讲,此概念应保证足够一致的结果,因为通过组合绝对姿态和相对姿态测量,始终可以获得完整的6D 姿态。但由于系统不确定性和不完整的传感数据,系统估计不可避免地存在漂移、离群值和测量干扰。此外,相比基于视觉的自主导航,隧道环境的情况更加复杂,若不解决此类问题,则无法保障自主操纵无人机的安全,所以该文设计了鲁棒的异常数据剔除算法。
异常值通常是由传感器故障、较大的识别错误或不良的测量环境引起的。为了消除测量异常值,采用马氏规则来剔除异常数据。
在任务飞行期间,分别检查马氏规则的特定组成部分,对于机器人定位标签的偏航角、俯仰角或来自SLAM 定位的横向位置,若其中某一项或几项大于预定阈值时,该文设计的EKF 框架将拒止相应的测量部分,从而有效降低错误拒绝率。
传感器网络主要依靠视觉相机实现对隧道内有价值目标的准确检测,因此选用Faster R-CNN 检测网络实现实时巡检算法[7]。
由于电缆线路检查的复杂性,无人机不易获得真实的采样图像。但神经网络需要大量的样本,以实现高精度训练。因此采用转移学习方法,使用公开数据获得预训练模型,以构建检测网络。
为了确定检查过程中的电缆故障,将正常元件、损坏元件和干扰物图像构建为训练集,并通过包含目标和类别的最小矩形框的坐标进行标记图像。利用特征提取网络的卷积层,可以生成训练集中随机大小的正常元件、受损元件和干扰物图像的相应特征,然后添加基于滑动操作的卷积层以预测包含目标的窗口位置。
当小窗口中的信息被识别为目标时,将区域保留并转换到网络中。若将小窗口中的信息识别为背景,则将该区域丢弃。
在训练集的基础上,基于ResNet 网络中的共享卷积层提取图像的深层特征[8]。综合考虑卷积层的区域信息,使用随机抽取的方法筛选不同大小的图像输入网络池层。为了保证网络输入的一致性,将不同大小的图像标准化为固定大小的数据,并输入ResNet。然后通过两个完整的连接层连接到高维特征向量[9],第一个完整的连接层用于实现对目标的分类;网络所用的第二个连接层主要用于验证数据合理性,同时负责区域回归算法的实例化[10]。在训练过程中,神经网络的参数并非不发生改变,随着训练的进行,网络参数通过下述的损失函数进行调整:
其中,i是用于索引训练集数据的锚点,预测定义锚点i的预测概率为pi[11]。
在具体实现时,网络使用随机梯度下降法最小化损失函数的输出,以实现最小化反向传播过程中的损失函数[12-14]。算法整体流程如图2 所示,详细步骤如下:
图2 算法流程
1)基于ResNet-101 网络模型,初始化权重W和初始化神经网络的偏移b。
2)前向传播计算分下述三种情况:
①若当前层是完整连接层,则:
其中,am,l代表第l层中m个图像样本的输出值,σ为激活函数[15]。
② 若当前层是卷积层,则:
③若当前层是池化层,则需要进行降维操作。
3)对于输出层l有:
4)基于损失函数J(W,b),反向传播参数分别按照以下三种情况计算:
①若当前层是完整连接层,则使用标准随机梯度下降法。
② 若当前层是卷积层,则:
其中,rot180 是卷积核的函数,具体实现为卷积内核上下翻转,然后左右翻转。
③若当前层是池化层,则进行反池操作。
5)根据以下两种情况更新l层的Wl和bl:
若当前层是完整连接层,则:
其中,α是学习率。
若Wl和bl的所有变化均小于停止迭代阈值或达到预先设定的迭代次数,则跳转至步骤6)。
6)输出每个隐藏层与输出层的线性关系矩阵W和偏移向量b。
该文使用标记的隧道内部图片作为验证集,通过检验网络输出的预测区域信息与实际网络之间的差异,最终调整整个网络的权重[16]。经过足够的训练,Faster R-CNN 可以检测兴趣目标的准确位置和标识。
为了对该文设计的无人机巡检平台进行性能验证,选取传感器网络搭建了传感系统,在隧道环境中进行巡检实验。
文中选取低成本2D激光雷达Hokuyo UST-10LX(具有270°视场和10 m 测量范围),一维距离传感器Terabee TeraRanger One(可测高度上限为14 m)。向前和向上的摄像机是分辨率为752×480 的单色摄像机,具有全局快门功能并配备平角和广角镜头。向下的相机是分辨率为1 280×960的全局快门彩色相机,该文使用嵌入在Pixhawk3 中的IMU 传感器。无人机的长宽均为74 cm,包括电池在内的重量为3.2 kg。为了实现隧道巡检的高性能故障定位,该次实验在装有Intel Core i7-7700 K、CPU(4.0 GHz)、16 GB DDR3和1080Ti显卡、11 GB 内存的Windows PC 上进行。
在实验的隧道环境中,共有32 个检查位。隧道巡检区域长60 m,宽55 m。图3 为自主无人机执行的单个路径上的环境感知图。
图3 无人机环境感知图
该文设计的自主无人机可以完成在电缆隧道中全面检查和周期盘点的任务,能够代替人工完成常规的隧道巡检。
无人机在高压线路检查中所拍摄的图像可分为3 类,包括元件损坏的120 幅图像、杂物120 幅图像、正常元件320 幅图像。按照4∶1 的比例,训练集由448个图像组成,测试集由112个图像组成。由于计算资源的限制,将原始图像的分辨率调整为1 000×750。
如图4 所示,所有图像均以最小矩形框标记,并以VOC2007 的XML 格式保存。当识别的外围框架与标记的外围框架之间的重叠区域大于标记区域的90%时,则被认为是成功识别。该文所提出的方法性能通过分析识别精度和召回值来进行评估。
图4 数据集示例
深度学习框架基于Caffe 搭建,并选择由大数据集ImageNet 预训练的ResNet-101 作为网络模型。Faster R-CNN 的训练使用动量法进行,该次使用0.000 1 的权重衰减和0.9 的动量。前40 000 个小批次的学习率为0.001,接下来30 000 批次的学习率为0.000 1,最大步长值为70 000,训练损失如图5 所示。
图5 训练损失
为了分析所提方法的有效性,使用了一系列不同的目标检测方法进行对比实验,如表1 所示。
表1 检测方法对比实验
使用ResNet-101 预训练网络模型时,Faster RCNN 的平均识别准确率为97.6%,平均召回率为97.9%。此外,单个图像的平均时间成本为101 ms,可以有效检测出隧道中的问题元件,并且兼顾了成本开销。
该文设计了一种具有低成本传感系统和多传感器融合框架的自主无人机,其可以有效地用于狭窄和黑暗的隧道环境。为了自动定位故障元件,提出了一种基于Fast R-CNN 方法的深度卷积神经网络。将目标分类问题转化为目标检测和识别问题,可以准确实现对故障元件的检测。
在今后的工作中,如何使用有限的计算资源,实现自主巡检无人机平台的大规模部署将是研究的重点。