基于语义分割的车道线检测算法研究

2019-03-22 02:35张道芳张儒良
科技创新与应用 2019年6期
关键词:深度学习

张道芳 张儒良

摘  要:随着半自动辅助驾驶,全自动无人驾驶系统等人工智能技术的发展和普及,驾驶环境的检测和识别变得非常关键。文章采用语义分割的DeeplabV3+网络车道线对检测,不仅克服了传统检测方法的缺陷,而且在检测的性能和效果上要优于传统的检测方法。

关键词:车道线检测;深度学习;语义分割;DeeplabV3+

中图分类号:TP391         文献标志码:A         文章编号:2095-2945(2019)06-0014-03

1 概述

车道线检测是辅助驾驶系统和无人驾驶的重要组成部分,它们都是通过车道线检测的结果为无人驾驶的控制系统提供依据,车道线检测的研究有重要的研究价值和意义。因此,吸引了国内外众多学者对车道线检测问题进行研究。

叶美松[1]提出了一种车道线图像检测和识别算法,主要采用IPM视图转换、霍夫直线的检测、RANSAC算法和贝塞尔样条曲线拟合等方法,该算法在有短的、长的和明显弯曲的干扰因素的环境中都有很好的检测效果,但是对于存在高的立状干扰物的情况下存在误检。门光文[2]提出的车道线检测方法是先进行感兴趣区域的划分,再进行中值滤波,然后利用Canny算子提取车道线边缘信息,最后通过对传统霍夫变换添加约束条件,实现车道线的提取。该方法能检测直线车道线,但是对于曲线车道线检测效果不好。王晓锦[3]采用图像预处理技术先滤波,去除图像噪声,然后基于消失点的检测设定动态感兴趣区域ROI,最后提出利用极角极径约束的Hough变换进行基于分段直线模型的车道线检测,该方法对于过于弯曲的车道线检测效果不理想。隋靓等[4]提出一种由Hough变换与二次曲线模型相结合的高速公车道线识别算法。该算法首先对图像作感兴趣区域ROI划分; 再使用LOG算子在ROI边缘检测的基础上进行Hough变换检测直线;然后根据已检测出的直线再进一步动态划分ROI和直线检测;最后通过判断两直线段的方向变化趋势,根据判断的结果进行直线和二次曲线切换的车道线拟合。成剑[5]设计了改进的Otsu算法提高车道线识别度;针对噪声对车道线边缘识别的干扰问题,重点提出了分区域识别边缘角度,排除异常边缘线,并对去噪后的边缘线进行了补偿;车道线识别阶段,着重对概率Hough变换及RANSAC算法做了改进研究,提出了直线-抛物线型的车道线模型,并设计了模型区域分配的方法以解决曲线道路出现位置不定的问题,再利用最小二乘法求出车道线模型的参数。该算法在存在长条形噪声干扰的情况下检测效果不理想。

为了解决上诉问题,本文采用基于深度学习语义分割DeeplabV3+网络的车道线检测。将车道线数据集在DeeplabV3+网络中进行训练,学习并保存网络权重,利用保存下的權重描绘车道线。

2 DeeplabV3+网络结构

2.1 DeeplabV3+模型

DeeplabV3+模型结构是一个编码器-解码器结构。编码器旨在获得锐利的物体边界,其结构是由Xception 模型加空间金字塔池化模块(ASPP)构成。利用Xception 模型以少量参数提取丰富的特征。而空间金字塔池化模块(ASPP),通过池化不同分辨率的特征,以捕获丰富的上下文信息。解码器结构:先将编码器特征进行4倍的双线性插值上采样,在低级特征上作用1×1卷积以减少通道数,然后将上采样结果与具有相同空间分辨率的相应低级特征合并,再经过一些3×3的卷积以精炼特征,最后再进行4倍的双线性插值上采样,将分辨率恢复到原图的大小。DeeplabV3+模型结构如图1所示。

2.1.1 Xception 模型

Xception 模型由三个部分组成,入口流、中间流和出口流。入口流首先对图像作用32个通道的3×3且步长为2的卷积操作,再作用64个通道的3×3卷积,紧接着是三个结构相同的Block。第一个Block由四个部分组成:两次通道数为128的3×3深度可分离卷积、一次通道数为128且步长为2的深度可分离卷积和一次通道数为128的1×1卷积。其他两个Block的通道数分别为256和728。中间流由一个Block重复16次组成,该Block由三次通道数为728的3×3深度可分离卷积组成。出口流有两个Block,第一个Block由通道数为728的3×3深度可分离卷积、通道数为1024的3×3深度可分离卷积、通道数为1024且步长为2的3×3深度可分离卷积以及通道数为1024且步长为2的1×1卷积组成,第二个Block由两次通道数为1536的3×3深度可分离卷积和通道数为2048的3×3深度可分离卷积组成。Xception 模型结构如图2所示。

2.1.2 空间金字塔池化(ASPP)模块

DeeplabV3+模型的编码器中采用空间金字塔池化(ASPP)模块,通过池化不同分辨率的特征,捕获丰富的上下文信息。空间金字塔池化通过在多个空洞率、多个有效视野上用滤波器探测输入特征或执行池化操作,来编码多尺度的上下文信息。

DeeplabV3+模型的ASPP模块由五个部分aspp0、aspp1、aspp2、aspp3和aspp4组成。aspp0:由通道数为256的1×1的卷积加批标准化(Batch- Normalization)和ReLU函数激活组成;aspp1:由通道数为256且空洞率为6的3×3深度分离卷积加批标准化和ReLU函数激活组成;aspp2:由通道数为256且空洞率为12的3×3深度分离卷积加上批标准化和ReLU函数激活;aspp3:由通道数为256且空洞率为18的3×3深度分离卷积加批标准化和ReLU函数激活组成;aspp4:先使用全局池化(AveragePooling),再使用通道数为256的1×1的卷积加批标准化和ReLU函数激活,最后再进行4倍的双线性插值上采样,得到和ASPP其他部分一样的分辨率。

2.2 模型训练

2.2.1 训练数据集介绍

训练数据集一共有12764张图片和对应的标签图片,图片大小为80×160,数据集来源于GitHub/MLND-Capstone,标签使用绿颜色通道标注当前车道的可行使区域。标签的标定区域的下边界是图像的底部,左边界是当前车道的左车道线,右边界是当前车道的右车道线,上边界是离下边界35个像素的位置,因此标签标定区域(绿色区域)的高度与图片高度的比例是35:80。标签图像如图3所示。

2.2.2 模型训练

模型训练过程中将数据集随机分为两个部分:训练集和验证集,其中训练集的大小为数据集的90%,验证集的大小为数据集的10%。训练过程中设置的epoch=10,bach_size=4,总训练时间为316452s。训练误差和验证误差使用MSE,训练结束时训练误差收敛为0.0046,验证误差收敛为0.0045。表1为DeeplabV3+模型在车道线数据集下的训练误差和验证误差。

3 车道线检测

用保存的模型结构和权重来描绘车道。根据训練好的模型,输入道路图片,改变图片尺寸到训练图片的尺寸(80 160 3),在模型中预测车道,并用绿颜色画出与标签图片形状相同的图片,将用绿颜色绘制了车道的图片改变尺寸到原始道路图片的尺寸,然后将其与原始道路图片合并,最后在原图片中画出当前车道区域。车道线检测算法如图4所示。车道线检测结果如图5所示。

4 结束语

本文应用深度学习语义分割的DeeplabV3+网络检测车道线,从车道线检测结果可以看出,本文的方法可以有效的检测出车道线。

参考文献:

[1]叶美松.单目视觉的智能电动小车车道线识别与跟踪[D].西南交通大学,2017.

[2]门光文.基于车道偏离的防碰撞预警系统算法研究[D].辽宁工业大学,2017.

[3]王晓锦.基于单目视觉的结构化道路车道线识别和SAE算法的车道偏离检测研究[D].山东大学,2017.

[4]隋靓,党建武,王阳萍.基于分段切换模型的快速车道线检测[J].计算机应用与软件,2017,34(08):201-205.

[5]成剑.基于机器视觉的道路线识别算法研究[D].南京理工大学,2017.

猜你喜欢
深度学习
从合坐走向合学:浅议新学习模式的构建
面向大数据远程开放实验平台构建研究
基于自动智能分类器的图书馆乱架图书检测
搭建深度学习的三级阶梯
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
利用网络技术促进学生深度学习的几大策略
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究