基于双目立体视觉的运动目标探测

2018-06-28 10:22毕凌锌杨立娜
科技创新与应用 2018年17期
关键词:三维重建

毕凌锌 杨立娜

摘 要:文章以市内道路场景下采集的图像序列为研究对象,以双目立体视觉中的立体匹配、三维重建、物体分割进行了研究和分析,提出了基于边缘索引的立体匹配算法和基于深度的物体分割算法,最后对算法进行验证,实验结果表明该方法能有效地检测出动态背景下的运动目标。

关键词:立体视觉;立体匹配;三维重建;物体分割

中图分类号:TP391.4 文献标志码:A 文章编号:2095-2945(2018)17-0014-02

Abstract: In this paper, the image sequences collected from the urban road scene are taken as the research object, and the stereo matching, 3D reconstruction and object segmentation in binocular stereo vision are studied and analyzed. A stereo matching algorithm based on edge index and an object segmentation algorithm based on depth are proposed. Finally, the algorithm is verified. The experimental results show that the method can effectively detect moving objects in dynamic background.

Keywords: stereo vision; stereo matching; 3D reconstruction; object segmentation

1 引言

先进的汽车驾驶辅助系统[1,2]是智能交通系统不可或缺的一部分,其目的就是解决驾驶员驾驶车辆时潜在的交通安全问题,让其更早的了解车辆前方的场景信息。而视觉是人类获取信息的最有效手段,车辆驾驶过程中驾驶员最依赖的感觉便是视觉,因此基于视觉的障碍物探测技术已经成为了先进驾驶系统中获取信息,并使驾驶员采取紧急措施的非常重要的手段。因此,在汽车驾驶辅助系统中实时通报驾驶员前方障碍物的准确位置信息以及运动情况,并在即将发生危险时及时提醒驾驶员采取规避措施是非常必要的。

2 双目立体视觉原理

立体视觉是由两幅或多幅图像获取物体三维几何信息的方法[3,4]。双目立体视觉的基本原理如图1所示。其中,C1与C2是焦距、各内部参数相同的两个摄像机,它们的X轴相互重合,Y轴相互平行,光轴相互平行。

其中,摄像机内部参数为ax、ay、u0、v0。u1、v1、u2、v2是以像素为单位的图像坐标,b为基线长度,d=μ1-μ2称为视差,其大小和P点的三维空间距离Z成反比。产生视差的原因是两图像采集的视角不同。由式(1)可知物体点的视差值与实际深度Z呈反比,当实际深度增加时,视差值反而减小。

3 算法分析

3.1 基于边缘索引的立体匹配方法

如图2所示为某一道路场景的左、右图像。立体匹配[5,6]的实现步骤如下:(1)用Sobel算子对左右图像进行边缘检测。(2)将左图中每个边缘点作为特征点,并在右图中相应极线上找匹配点。(3)指定一矩形区域给特征点和待匹配点。(4)计算矩形区域内匹配点簇的标准交叉相关系数并以数组形式存储。(5)求相关系数数组中的最大值,设定阈值,如果标准交叉相关系数大于预定义阈值,则该点即为左图特征点在右图中的匹配点,同时数组用二次插值来得到亚像素精度的视差估计。(6)对与最大相关系数邻近的五个连续的相关系数,用多项式函数做最小二乘法拟合,函数极值点就是在左图特征点的匹配点位置。图3所示为立体匹配的視差图。

3.2 障碍物探测中的三维重建

三维重建是一种从二维投影中恢复重建物体三维信息的计算机技术。[7]通过3.1节的立体匹配已经可以将空间任意一点P在两个摄像机C1和C2上的图像点对P1,P2分别检测出来,已知像素点视差值d=μ1-μ2,两摄像机也已经被标定完成,焦距f和基线b即已知,P点的世界坐标X,Y,Z即可根据公式(2)求出。

3.3 基于深度的物体分割

由于道路场景的复杂性,在不知道场景的情况下,利用单幅二维图像的信息进行物体分割几乎是不可行的。考虑到实际应用中目标分割应该从水平和深度方向进行,因此本文采用基于深度信息的物体分割。实现步骤如下:(1)将视差图从(X,Y)平面转化到(X,Z)平面,得到二值深度图。(2)从像素点(1,1)开始检测图像中所有像素点,如果发现某个像素点的灰度值为255则根据8连通区域增长法检测与该点相邻的四个点的像素值,根据相应准则进行连通性判断,并对该区域内的像素点进行标注,将相应区域像素点灰度值改为标号。(3)统计标号及各个区域中像素点的数目。(4)设定合理阈值,当区域像素点数目小于阈值则将该区域内像素点灰度置0。(5)对像素点数目大于阈值的连通区域距离坐标求最小值,水平和竖直坐标求最大最小值,Z值即为障碍物距车辆的距离,水平和竖直坐标的最大最小值之差即为探测出障碍物的宽度和高度信息。(6)根据坐标对应关系还原到原图,对探测的障碍物边界画矩形框。

如图4所示为障碍物分割结果图,中间图像中的障碍物存在区域对应于场景中的道路左侧树木、柱状警告牌、道路边缘凸起、车辆和道路中间的障碍物。

4 结束语

本文对立体视觉中的立体匹配、三维重建、物体分割进行了研究和分析,提出了基于边缘索引的立体匹配算法和基于深度的物体分析算法,并在Matlab开发环境下对道路场景下采集的图像序列进行了仿真实验,实验结果表明双目立体视觉对场景中的车辆障碍物的探测是实时有效的。

参考文献:

[1]刘卫平,黄富元.车辆安全辅助驾驶系统发展概述[J].汽车运用,2005,

[2]李克强,王跃建.基于ITS技术的汽车驾驶安全辅助系统[J].汽车技术,2006,3(12):32-35.

[3]游素亚,徐光 .立体视觉研究现状与进展[J].中国图像图形学报,1997,2(1):17-24.

[4]马颂德,张正友.计算机视觉[M].北京:科学出版社,1998.

[5]霍艳艳,黄影平.基于立体视觉和光流的障碍物探测方法[J].信息技术,2013(1):125-127

[6]闵琪,黄影平.基于立体视觉与光流融合的运动目标检测[J].光学技术,2016(1):28-33

[7]DaubechiesI. The wavelet transform, time-frequency localization and signal analysis [J]. IEEE-IT, 1990,36(5):961-1005.

猜你喜欢
三维重建
互联网全息位置地图迭加协议与建模制图技术
品析“飞利浦公司”基于单目视觉的三维重建技术专利
无人机影像在文物建筑保护中的应用
光编码技术在犯罪现场重建中的应用
大规模壁画拼接:使用moving DLT的新尝试
基于Kinect的轴类零件三维重建研究
一种脑切片图像分割新法
基于Kinect的3D医学影像辅助诊疗系统研究