基于门控循环单元的障碍物检测方法

2020-12-28 02:10金旺易国洪洪汉玉陈思媛
电脑知识与技术 2020年33期
关键词:注意力机制

金旺 易国洪 洪汉玉 陈思媛

摘要:针对现有障碍物检测方法存在检测精度和速度不足的问题,提出一种基于門控循环单元(Cated Recurrent Unit,GRU)的障碍物检测方法。通过构建单向GRU网络提取障碍物的几何特征,结合障碍物的时序特征实现障碍物检测。在GRU的基础上,提出三种优化模型注意力GRU模型、正则化CRU模型以及双向GRU模型用于提高障碍物检测精度或检测速度。为了验证所提方法的有效性,在真实采集的数据集上进行实验,结果表明,相较于卷积神经网络,GRU网络能够以较高的精度和速度实现障碍物的检测,其中,正则化CRU模型收敛速度更快,检测速度更高,综合性能最好。

关键词:障碍物检测;GRU;正则化;注意力机制;循环神经网络

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2020)33-0001-03

开放科学(资源服务)标识码(OSID):

1 引言

障碍物检测是自动驾驶和工业机器人等领域的关键技术,是确保汽车和机器人以及相关操作人员安全的重要手段。目前已有的障碍物检测方法根据检测工具可分为基于相机的检测方法[1-6]以及基于激光雷达的检测方法[7-10]。基于相机的检测方法通常利用帧差法,通过判断连续帧数据的差异来完成障碍物的检测。该种方法检测设备成本更低,检测更为便捷,然而相机受环境因素影响较大,不利于室外环境的障碍物检测。黄如林等[7]提出了一种基于多特征融合的障碍物检测方法,利用激光雷达的脉冲回波宽度信息和障碍物轮廓信息描述障碍物特征,实现了大尺寸障碍物的检测,但是该方法缺乏对尺寸较小障碍物的检测能力;文献[8-9]利用障碍物的几何特征实现障碍物检测,然而单一的几何特征导致检测准确率不高;Asvadi等[10]提出了一种基于体素和平面的三维感知系统用于障碍物检测,通过结合障碍物的轮廓信息和地理位置信息实现障碍物的检测,具有较高的检测精度,然而三维感知系统检测环境构建复杂,设备成本高。

时间序列是一组按照时间先后顺序排列且内部关联的数列。通过对时间序列的分析,获取障碍物的时序特征。考虑到障碍物数据的空间特征和时序特征,将循环神经网络(Re-current Neural Network.RNN)应用于障碍物检测。RNN具有短期记忆的特点,当时间序列很长时,RNN难以将早期特征传递到后期步骤中,且RNN在反向传播阶段会出现梯度消失的问题。长短期记忆(Long Short-Term Memory,LSTM)模型弥补了RNN的梯度消失和梯度爆炸、长期记忆能力不足等问题,使得循环神经网络能够真正有效地利用长距离的时序信息[11]。随后,Stanford在2014年提出了GRU模型,相较于LSTM模型,GRU模型计算效率更高,参数规模更小,训练速度更快。目前,GRU在语音识别和机器翻译等领域取得了良好的效果[12-13],因此,将GRU应用于障碍物检测领域具有充分的可行性。同时考虑到障碍物数据样本集的规模较小的问题,为了防止出现过拟合的问题,引入正则化使模型稀疏。稀疏模型能够去除大量冗余变量,使模型具有更好的解释性。刘建伟等[14]对现有的正则化稀疏模型做了比较全面的总结。注意力机制能够使模型更多的关注障碍物关键特征,进一步加强对障碍物的检测。

为了在机器人运动过程中实现障碍物的检测,确保机器人等设备的安全,首次将GRU模型应用于障碍物检测领域,通过构建一个单向GRU网络提取样本中的障碍物特征,进而实现障碍物的检测。为了改善障碍物的检测精度和速度,在GRU网络基础上,提出三种GRU优化模型,分别为注意力GRU模型、正则化GRU模型以及双向GRU模型。最后,在真实采集的数据集中进行测试,实验结果表明,GRU检测法能够很好地实现障碍物的检测,增加正则化后,模型更为精炼,检测速度更快,综合性能最好。

2 障碍物检测

2.1感兴趣区域过滤

使用激光雷达作为障碍物检测设备,由于激光雷达检测范围偏大的原因,通常会采集到不需要的数据,称之为噪声点,而这会造成检测结果造成偏差。例如,在自动驾驶领域,车辆行驶过程中,通常对车辆前方的障碍物进行检测;在工业机器人领域,通常对机器人下方垂直方法进行障碍物检测。 通过设置感兴趣区域,确定激光雷达的检测范围,使用条件过滤的方法有效地去除噪声点,消除噪声对检测结果造成的影响,同时也能够减少计算量。

2.2 GRU检测模型

通过搭建一个单向GRU网络用以实现障碍物的检测,GRU网络结构图如图1所示。X表示输入,h表示隐藏层状态,v为输出。

GRU模型检测算法如表1所示。步骤2构造了GRU单层的网络结构,步骤3用于GRU单层结构的优化,步骤4将优化后的单层网络结构拼接成完整的GRU网络结构,步骤5计算GRU前向传播的输出值,得到输出值outputs,经过softmax,得到算法预测值和损失值。

2.3 GRU优化模型

以往的研究结果表明,通过引入注意力机制,增加正则化或构建双向循环网络能够有效提高GRU网络在语音识别等任务中的性能。基于这一原因,提出三种优化的GRU模型,分别为注意力GRU模型、正则化GRU模型以及双向GRU模型。

(1)注意力GRU模型

注意力机制是指通过训练样本数据中样本点的重要程度来提取障碍物的关键特征。在GRU网络的隐藏层中,引入注意力机制,计算各个输入的注意力概率分布值,进一步提取障碍物的关键特征。注意力机制计算公式如下:

(2)正则化GRU模型

正则化方法通常指对权重系数进行惩罚,称之为权重衰减。权重衰减通常使用L1范式或L2范式作为正则化项。L2权重衰减使最常见的形式,实验中使用L2式对权重进行约束来对模型进行优化。L2正则化计算公式如下:

式(3)中,w为网络权重参数,九为权衡参数。当九为0时表示没有进行正则化,λ越大,对于w的正则化惩罚越大。

(3)双向GRU模型

双向GRU模型由两个普通的GRU组成,包括一个正向的GRU和一个逆向的GRU。正向GRU利用过去的信息,逆向GRU利用未来的信息,这样,在t时刻,既能使用t-1时刻的信息,又能使用t+1时刻的信息。一般而言,可使用信息越多,网络预测准确率越高。

3 实验及分析

3.1 实验环境

实验环境包括两部分:数据采集和网络训练。数据采集平台配置如下:操作系统Windowsl0,Intel Core i7-8750H@2.20GHZ六核处理器,8GB内存,SICK TIM561雷达,运行环境.NET Framework4.5。网络训练实验平台配置如下:操作系统Ubuntu16.04,Intel Core i7-8750H@2.20GHZ六核处理器,8GB内存,Nvidia GTX 1050Ti 4GB GPU,深度学习框架为ten-sorflow。

3.2 实验数据集

在采集了激光雷达数据之后,需要将数据进行预处理使数据在(0,1)区间内,数据处理方法如式(4)所示,其中x表示预处理后得到的数据,d和0表示获取雷达距离值以及雷达射线与垂直平面的偏转角。

通过阈值来确定样本数据的标签,设定阈值为0.8,当x大于0.8时,写入0,表示非障碍物点,当x小于0.8时,写入1,表示障碍物点。通过这种方式,构建一个训练样本数据集,数据集大小为1355。

3.3 网络参数和评价指标

GRU网络初始参数设置如下:学习率为le-3,隐藏层數和隐藏节点数分别为1和32,最大迭代次数为100,批量大小256。

性能评价指标主要有检测精度,网络训练收敛速度,检测速度。检测精度是指障碍物检测的准确率。网络训练收敛速度是指网络收敛迭代轮次。检测速度是指在1秒内检测数据的帧数。

3.4 障碍物检测对比实验及结果分析

障碍物检测对比实验在GRU网络的基础上,分别引入注意力机制(Attention)、正则化以及将单向GRU改为双向GRU,进行对比实验,网络初始参数不变。同时,受文献[15]启发,构建一个卷积神经网络( Convolutional Neural Networks,CNN)用于障碍物的检测,与GRU方法进行对比实验。表2显示了所有对比实验的结果。

从表2中可以看出:相较于CNN检测方法,GRU检测方法具有更高的检测精度和检测速度;相较于原始GRU模型,引入注意力机制后,检测精度得到略微提升,但是检测速度大幅下降;引入正则化后,检测精度略微下降,但是检测速度得到一定的提升;双向GRU模型检测精度没有提升,然而检测速度大幅下降。综合考虑,确定正则化GRU方法为最佳的检测方法,在检测精度略微损失的情况下,检测速度得到提升。正则化GRU检测方法以较高的精度和速度实现障碍物的检测,能够满足实际工业生产的需求。

图2显示了原始GRU模型和正则化GRU模型的训练损失率。从图2可以看出,相较于原始GRU模型,正则化GRU模型在训练过程中收敛速度更快。

通过实验分析可知,使用门控循环单元网络能够以较高的精度和速度实现的检测障碍物,增加正则化后,缩减了模型的模型参数规模,提升了障碍物检测速度,达到了障碍物检测的实际需求。

4 结论与未来工作

本文提出了一种基于门控循环单元的障碍物检测方法。通过门控循环单元构建特征向量矩阵以提取障碍物的特征,通过优化对比实验,确定正则化GRU为最优的障碍物检测方法,能够以较高的检测精度和速度实现障碍物的检测。实验结果证明,相较于卷积神经网络,基于门控循环单元的方法在障碍物检测上具有更高的检测精度以及检测速度,引入正则化后,检测速度更快。

目前,由于设备限制未能在自动驾驶车辆上进行实验。缺乏如雨天、夜晚等不同环境下的障碍物样本数据,也对实验结果造成一定的影响。因此,在未来的工作中,需要扩大样本数据集的类别尤其是不同环境下的样本数据。在自动驾驶车辆上的试验也是未来重点研究的方向。

参考文献:

[1]王铮,赵晓,佘宏杰,等.基于双目视觉的AGV障碍物检测与避障[J].计算机集成制造系统,2018,24(2):400-409.

[2]杨磊,蔡纪源,任衍允,等.一种基于深度信息的障碍物检测方法[J].计算机技术与发展,2015,25(8):43-47.

[3] Nissimov S.Goldberger J,Alchanatis V.Obstacle detection ina greenhouse enwronment using the Kinect sensor[J].Comput- ers and Electronics in Agriculture,2015,113:104-115.

[4]张晴晴,林强强.盲道区域中障碍物的视觉检测方法[J].价值工程,2019,38(9):148-151.

[5]丁斗建,赵晓林,王长根,等.基于视觉的机器人自主定位与障碍物检测方法[J].计算机应用,2019,39(6):1849-1854.

[6] Levi D,Carnett N.Fetaya E.StixeINet:a deep convolutional net-work for obstacle detection and road segmentation[C]//Proced-ings of the British Machine Vision Conference 2015.Swansea.British Machine Vision Association,2015:109.1-109.12.

[7]黄如林,梁华为,陈佳佳,等.基于激光雷达的无人驾驶汽车动态障碍物检测、跟踪与识别方法[J].机器人,2016,38(4):437-443.

[8]谭宝成,杨成.激光雷达动态障碍物检测[J].西安工业大学学报,2015,35(3):205-209.

[9]张穗华,骆云志,王钤,等.基于三维激光雷达的障碍物检测方法研究[Jl.机电产品开发与创新,2016,29(6):14-17.

[10] Asvadi A,Premebida C,Peixoto P,et al.3D Lidar-based stat-ic and moving obstacle detection in driving environments:anapproach based on voxels and multi-region ground planes[J].Robotics and Autonomous Systems,2016,83:299-311.

[11]王鑫,吳际,刘超,等,基于LSTM循环神经网络的故障时间序列预测[J].北京航空航天大学学报,2018,44(4):772-784.

[12]蒋畅江,温登峰,唐贤伦,等.基于改进型轻门控循环单元的语音识别[J].计算机工程与设计,2019,40(11):3265-3268,3356.

[13]段生月,王长坤,张柳艳.基于正则化GRU模型的洪水预测[J].计算机系统应用,2019,28(5):196-201.

[14]刘建伟,崔立鹏,刘泽宇,等.正则化稀疏模型[J].计算机学报,2015,38(7):1307-1325.

[15]张舜,郝泳涛.基于深度学习的障碍物检测研究[J].电脑知识与技术,2019,15(34):185-187,193.

【通联编辑:唐一东】

作者简介:金旺(1995-).湖北天门人,硕士,主要研究方向为计算机视觉,三维物体识别;易国洪(1972-),男,副教授,硕士生导师,硕士,主要研究方向为软件测试,大数据;洪汉玉(1964-),男,教授,博士生导师,主要研究方向为图像处理;陈思媛(1996—),女,硕士,主要研究方向为高并发通信,

猜你喜欢
注意力机制
基于注意力机制的行人轨迹预测生成模型
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
基于LSTM?Attention神经网络的文本特征提取方法
InsunKBQA:一个基于知识库的问答系统