管道巡检机器人目标识别与定位检测技术*

2021-03-05 04:08宋雷震孙晓东

吉首大学学报（自然科学版） 2021年5期

宋雷震，孙晓东

(淮南联合大学智能制造学院，安徽淮南 232038)

管道输送具有成本低、输送方便、输送量大等优点，在石油、化工、城市供水和排水等领域发挥着重要作用.而化学腐蚀、环境变化、自然灾害和管道自身缺陷等都有可能导致物质泄漏、环境污染等事故的发生，因此管道必须进行清洁维护工作[1]，传统管道清洁维护工作主要依赖于人工完成，低效、危险.管道巡检机器人具备自动化、无人化、智能化等优点，能够减少管道作业中恶性事件的发生，改善工作人员的劳动环境，提高安全性[2-3]，通过对管道机器人赋予精准的控制算法，会使其具备更加灵活的思考、判断能力.

笔者拟针对目前管道巡检机器人对目标物的识别精度较低、定位检测结果误差较大的问题，设计一套新的视觉系统，构建一个改进的You Only Look Once(YOLO)模型以改善识别精度，构建一个测距定位模型对目标物进行测距定位.

1 新的管道巡检机器人视觉系统的设计

1.1 基于改进YOLO模型的目标淤积物识别

图1 卷积神经网络拓扑结构Fig. 1 Topology of Convolutional Neural Network

卷积神经网络(Convolutional Neural Networks，CNN)是基于人工神经网络(Artificial Neural Network，ANN)的网络拓扑结构[4].卷积神经网络能够提取输入到网络中数据信息的特征，在解决图像方面问题拥有较高的效率，因此系统采用卷积神经网络对管道内目标淤积物进行深度学习训练，并对图像进行分割.卷积神经网络的拓扑结构如图1所示.

卷积神经网络能够有效分割管道内的目标淤积物图像，同时具备较高的正确率，但针对淤积物的识别却不具有实时性，无法单独应用于管道巡检机器人的视觉系统[5].YOLO模型能够将目标淤积物的检测问题转化为回归问题，将输入到模型中的图像进行分割处理.由于YOLO模型对目标淤积物的检测过程在CNN中进行，实现了端到端的训练与检测，因此能够做到对目标淤积物的实时性检测功能[6].YOLO-CNN模型中，YOLO算法对目标物的识别在卷积网络中实现，但输出层的输出结果为张量，即输入到模型的图像会被分割成s×s个小块图像，不同的图像会对相应的目标物进行预测，由此获得一个张量.

对YOLO模型进行训练，过程如下：首先，建立数据库，获取管道内目标淤积物的图片；然后，为模型设定一个深度学习网络参数，提升模型的训练效率；最后，设置相应的训练参数，限定合理训练次数，以提高模型对目标物的检测准确率.YOLO模型能够实时性检测管道内的目标淤积物，且能保证足够的准确率，但YOLO模型的训练时间较长，当算法的迭代次数超过500后，往往模型的训练时间需要1h或者更多，因此需要对YOLO模型进行优化改进.YOLO模型的深度学习网络会用到梯度下降法：

ω∶=ω-α∂/∂ωloss(ω).

其中：α为学习率；loss(·)为损失函数；ω为神经网络中更新的网络参数.

分段常数衰减与指数衰减是较为常用的用来控制学习率的方法.这2种方法的优点是简单直接，收敛速度快，但极易陷入局部最小值.针对这一问题，为初始学习率选择一个极小值，在每一次算法迭代后，更新CNN同时增加学习率的值，并记录算法迭代后的损失函数值，最终根据学习率的变化与损失函数的变化，获得学习率的最佳值.在算法进行迭代时，学习率也随之衰减，衰减方式选择多项衰减机制[7].在这种方案下，学习率会从初始值升高到某个范围，再逐渐降低到最低值，并重复这个过程，直到找出全局最优解，方案能够有效避免CNN网络参数陷入局部最优解[8].在采用新的学习率选择策略后，能够明显提升YOLO模型的训练速度.

1.2 地平面约束测距定位模型的构建

在对管道内的目标淤积物进行识别检测后，还需要对其进行定位检测.管道巡检机器人利用相机采集的图片完成图片坐标系与管道实际坐标系的匹配，首先需要建立单目相机的成像模型.管道巡检机器人搭载的工业相机投影的方式与针孔相机一致，因此搭载相机与镜头组合为针孔成像模型，如图2所示.

图2 针孔相机模型示意Fig. 2 Schematic Diagram of Pinhole Camera Model

图2中，f为主距，即与投影中心之间的距离.根据相似三角形原理，可得投影关系：

相机到目标物之间的距离

D=WF/P.

其中：D为相机到目标淤积物的距离；W为目标淤积物宽度；P为目标淤积物在照片中的像素宽度；F为相机的焦距.对图像坐标系、成像平面坐标系、摄像机坐标系和世界坐标系之间的变化进行分析，可获得4个坐标系之间的关系，从而可以利用相机采集的图片获取到目标淤积物的世界坐标.图像坐标与成像平面坐标之间的关系为

相机内参矩阵可表述为

图像坐标与世界坐标之间的关系可表述为

其中σ=1/z，是某个满足相应条件的非零度因子.针孔成像需要知道目标淤积物的尺寸，而管道巡检机器人对管道进行巡检时，情况是未知的，显然无法满足条件.选择基于单帧静态图像的测距模型能够解决这个问题，其测距方式为

其中：d为相机与目标物之间的水平距离；h为相机在管道巡检机器人上的高度；f为机器人搭载相机的焦距；y为目标物在图像平面坐标系中的纵坐标位置；y0为摄像机光轴和图像平面交点的纵坐标.获取相机的内参数和外参数，将图像坐标系转变为世界坐标系的过程被称为相机标定.管道巡检机器人在定位检测时，相机标定作为最重要的环节之一，直接关系到定位检测的准确性[9-10].采用棋盘格标定板作为标志物，利用两步标定法对4个坐标系之间的关系进行转换与计算，获取到相机的参数.获取相机参数后，需要对图像进行特征提取，检测图像角点.图像角点的检测算法采用Harris角点检测算法.Harris角点检测算法具有较强的抗噪能力，因此算法稳定性较高，且能够同时检测不同的角点，效率较高.

单目视觉测距定位法操作简便、成本低、实用性高，但在管道巡检机器人的管道巡检过程中难以解决参照物的问题.针对这个问题，构建出一种地平面约束测距定位模型，模型结构如图3所示.

图3 地平面约束测距定位模型Fig. 3 Location Model of Ground Plane Constraint Ranging

通过地平面约束测距定位模型，即可实现实时性地对管道内的目标淤积物进行定位检测.综合地平面约束测距定位模型与改进YOLO模型，搭建系统，就能得到更为精准的管道巡检机器人视觉系统.

2 管道巡检机器人视觉系统的性能测试

2.1 学习率更新策略对YOLO模型的优化效果

为了验证新的学习率更新策略与其他学习率更新策略相比，是否能有效地提升YOLO模型的收敛速度，使用相同的数据对新学习率更新策略下的YOLO模型(模型A)、常数衰减学习率更新策略下的YOLO模型(模型B)、指数衰减学习率更新策略下的YOLO模型(模型C)及使用传统梯度下降法的YOLO模型(模型D)进行训练，对比其收敛速度.4种模型的训练结果见表1.

表1 4种模型的训练结果

从表1可知，采用新的学习率更新策略的模型A在迭代次数相同时，所需的训练时间明显要少于其他3种模型.在迭代次数为500时，模型A的训练时间为7.4 h，比模型B的8.4 h少1 h；比模型C的8.6 h少1.2 h；比模型D的12.1 h少4.7 h.在迭代次数为800时，模型A的训练时间为11.3 h，比模型B的14.5 h少2.2 h；比模型C的14.2 h少1.9 h；比模型D的16.7 h少5.4 h.这说明，新的学习率更新策略相比其他学习率更新策略，能够更好地优化YOLO模型，减少模型的训练时间，提高效率.

2.2 改进YOLO模型的性能

对管道内淤积物识别的准确率关系到管道巡检机器人的工作效率，进而影响到管道作业的工作效率.为了验证新的学习率更新策略能否有效改进YOLO模型，改进YOLO模型的性能是否优于传统YOLO模型，将改进YOLO模型记为模型1，传统的YOLO模型记为模型2，常用于目标检测识别的R-CNN模型记为模型3.使用相同的数据信息对3个模型进行训练，记录并比较其训练时间和识别准确率，训练结果如图4所示.

图4 改进YOLO模型的训练时间与准确率Fig. 4 Training Time and Accuracy of Improved YOLO Model

由图4(a)可见，相同迭代次数下，改进YOLO模型的训练时间明显少于另外2种模型.在模型迭代次数为800时，改进YOLO模型的训练时间为10.7 h；而传统的YOLO模型训练时间为12.3 h，比改进YOLO模型的训练时间多1.6 h；R-CNN模型的训练时间则需要17.4 h，比改进YOLO模型的训练时间多6.7 h.从图4(b)可见，3个模型的识别准确率均为先随着迭代次数的增加而上升，迭代次数超过600后，识别准确率随着迭代次数的增加而下降，这种现象出现的原因是，迭代次数过多会导致过拟合现象，导致模型的识别准确率降低.3种模型都是在迭代次数为600时准确率达到最高，其中改进YOLO模型的准确率最高，为96.1%；传统YOLO模型的准确率为85.3%，比改进YOLO模型低10.8%；R-CNN模型的准确率为72.1%，比改进YOLO模型低24%.这说明，改进YOLO模型的训练时间更短，识别准确率更高，更适用于管道巡检机器人视觉系统.

2.3 地平面约束测距定位模型的性能

为了验证地平面约束测距定位模型的性能，构建地平面约束测距定位模型(模型1)，针孔成像相机模型(模型2)，单帧静态图像的测距模型(模型3)，并对3种模型的定位检测结果与误差进行测试，测试结果见表2，3.

表2 3种模型的定位情况

表3 3种模型的定位误差

从表2可知，地平面约束测距定位模型的图像与实际值的图像相差不大，重合度较高，说明地平面约束测距定位模型的检测值与实际值相差不大，定位较为准确.从表3可知，地平面约束测距定位模型的检测定位最大误差为2.2 cm，最小为0 cm；针孔成像相机模型的检测定位最大误差为3.8 cm，最小为1.8 cm；单帧静态图像的测距模型的检测定位最大误差为2.9 cm，最小误差为0.1 cm.地平面约束测距定位模型10次检测定位的测量值与实际值之间的平均误差为0.97 cm；而针孔成像相机模型为2.74 cm，比地平面约束测距定位模型大1.77 cm；单帧静态图像的测距模型为1.5 cm，比地平面约束测距定位模型大0.53 cm.这些结果说明地平面约束测距定位模型的定位检测精度较高.

3 结语

目前管道巡检机器人对目标物的识别精度和定位检测精度误差较低，采用新的学习率更新策略改进YOLO模型，利用CNN进行目标物图像学习训练，构建地平面约束测距定位模型，并基于2种模型搭建新的视觉系统.结果表明，采用新学习率更新策略的YOLO模型迭代次数为500时训练时间为7.4 h，远低于其他策略下的YOLO模型；在模型迭代次数为800时，改进YOLO模型的训练时间为10.7 h，比传统YOLO模型少1.6 h，比R-CNN模型少6.7 h；在迭代次数为600时，改进YOLO模型的准确率为96.1%，比传统YOLO模型高10.8%，比R-CNN模型高24%；地平面约束测距定位模型的平均误差为0.93 cm，比针孔成像相机模型小1.88 cm，比单帧静态图像小0.63 cm.这说明，基于改进YOLO模型和地平面约束测距定位模型搭建的新的管道巡检机器人视觉系统能够有效提高对管道内目标淤积物的识别准确率与定位精度，有较高的实用性.