基于深度学习的目标检测算法研究

2018-11-20 09:29丁小可
机电信息 2018年33期
关键词:边框置信度无人驾驶

丁小可

(贵阳学院,贵州贵阳550005)

0 引言

在无人驾驶技术中,对汽车周围环境的感知是无人驾驶系统的基础部分,是保证无人车安全、准确行驶的必要条件。为了达到这个目的,无人驾驶系统中使用了各种类型的传感器,其中属于“视觉”的传感器包括毫米波雷达、超声波雷达、激光雷达及摄像头。使用摄像头所采集到的二维图像来推断无人车在三维世界中的位置,这项技术和传统计算机视觉相结合,伴随着“大数据”和“云计算”的成熟,在激光雷达成本高昂的当代,必然会在无人驾驶定位中发挥更大的作用。

在基于计算机视觉和摄像头的物体检测中,卷积神经网络CNN是一种适合使用在连续值输入信号上的深度神经网络。

在深度学习出现之前,传统的目标检测方法分为三步:区域选择、特征提取、分类器。这种检测方法存在两个问题:一方面,滑窗的选择策略没有针对性,时间复杂度高,窗口冗余;另一方面,人为设计的特征鲁棒性差。深度学习出现后,目标检测技术有了重大突破,比较瞩目的有两个方面:(1)以R-CNN为代表的基于Region Proposal的深度学习目标检测算法[1];(2)以YOLO为代表的基于回归的目标检测算法。FAST R-CNN在速度上没有满足实时性的要求,而采用回归的YOLO算法计算速度较快。

1 YOLO目标检测流程

如图1所示,YOLO检测流程为:

(1)输入某个特定的图片,YOLO将图片分解成S×S个网格,如果某个目标物体的中心落在此网格中,网格就负责检测这个物体。

(2)在每个网格中,模型都会自动生成两个边框,生成边框的目的在于通过边框来预测某类目标物是否存在,除此之外还要反映此目标物存在的概率是多大,以此判断边框的预测是否准确。这个所预测的值称之为目标的置信度(confidence scores)。

置信度的公式定义为:

如果这个网格中不存在一个物体,则置信度为0;否则,置信度为预测的边框和实际边框的重合度(IOU)。

图1 YOLO检测流程

图2 YOLO网络结构

YOLO中每个网格的预测边框有五个参数:x,y,w,h,confidence。其中,x,y分别代表了预测边框相对于所在网格的中心坐标;w,h分别代表预测边框相对于整幅图像的宽和高;confidence代表了预测边框和物体所在实际边框的重合度。此外,每个网格还要预测C个条件类别概率(conditional class probability),记作Pr(Classi|Object),这个概率只考虑每个网格中的目标概率而不考虑边框中的目标。在测试阶段将条件类别概率与每个边框的预测置信度相乘,就得到了每个边框中物体属于某一类别的置信度,公式如下:

(3)依据上一步的的操作,模型建立了S×S×2个边框,然后计算出每个边框的置信度,最后采用非极大值抑制(NMS)[2]消除那些置信度较低的边框。

2 YOLO网络设计

YOLO检测网络包括24个卷积层和2个全连接层(用1×1),如图2所示。其中,卷积层用来提取图像特征,全连接层用来预测图像位置和类别概率值[3]。

3 YOLO特点

与其他基于视觉检测的模型相比,YOLO具有一系列的优点:

(1)能够迅速识别目标物体。YOLO与FASTER R-CNN具有一定的相似性,但在YOLO中精简了卷积神经网络。原来在识别图像中物体时,先要判定图像中的元素到底是背景还是目标物,然后再辨别其类别和概率。而在YOLO中采用回归的机制代替前述两步,图像被直接分解成S×S个网格,以此来替代原来的滑动窗口机制,从而使得候选框的数量减小,在牺牲一定精度的情况下使得检测速度提高。

(2)产生背景错误的概率较低。之前其他的基于视觉检测的模型在对图片进行处理时,一般使用了滑动窗口机制来找到最有可能包含检测目标的区域,而每次候选框中的图像都是独立的。YOLO是利用端到端的回归方式来处理图像,可以利用网格的联系和图像的统一更准确识别背景上的物体,从而降低检测失误率。和Fast R-CNN相比,YOLO的背景错误不到Fast R-CNN的一半[4]。

(3)模型的泛化能力较好。先让自然图像数据集在YOLO上训练,然后将训练得到的模型用于对非自然图像的检测,模型的准确率相较于YOLO之前的检测模型更高。因此模型的泛化性较好,能够适用于涉及图像识别的其他行业。

尽管如此,YOLO也有一系列缺点:

(1)YOLO中利用全连接层的数据完成对边框的定位,会丢失太多位置信息;

(2)由于在YOLO的每个网格中只定义了两个边框,当多个(大于二)物体处于一个网格中时,YOLO就不能很好地预测到。

4 结语

在采用YOLO模型对物体进行检测时,只对物体的类别作了检测,但在无人驾驶系统中,除了对物体的识别外,还需要在此基础上对所检测物体的具体位置进行判断,以达到预警或将信息供给无人驾驶决策系统使用的目的。之后笔者将结合其他传感器,采用多信息融合的方式,改进相关算法和模型。

猜你喜欢
边框置信度无人驾驶
我们村的无人驾驶公交
硼铝复合材料硼含量置信度临界安全分析研究
无人驾驶车辆
无人驾驶公园
正负关联规则两级置信度阈值设置方法
用Lightroom添加宝丽来边框
给照片制作专业级的边框
外出玩
摆脱边框的束缚优派
置信度条件下轴承寿命的可靠度分析