王亚东,雷国华,安 波,于燕飞,许宪东
(黑龙江工程学院 计算机科学与技术学院,黑龙江 哈尔滨150050)
环境感知是仿人机器人系统进行决策的前提和基础。不同于传统的轮式机器人所具有的超声传感器、激光测距仪、视觉传感器等多种传感器。在当前的仿人机器人足球比赛中,通常只具有单目或双目视觉传感器。目前仿人足球机器人视觉系统的主要难题集中在以下两个方面:一方面是图像的彩色分割,常用的是阈值法和查找表法。比赛环境通常是一个已知的结构化环境,所有待识别的目标都用规范化颜色标识,因此,研究较多的是基于颜色特征来分割图像,应用比较多的有RGB、YUV和HIS三种颜色模型[1-4]。另一方面要对物体根据各自的特征进行识别,在足球机器人比赛环境中,场地内的球门、球、标识柱、场地线以及双方机器人是需要识别的特征。在仿人机器人竞赛中,机器人一般以固定的时间间隔拍照,对所获得图像序列进行处理,获得周边的环境信息,如球、机器人和门框等,进而根据所获得的球的颜色或其它信息进行运动决策。但是,由于机器人摄像头所观察的区域不能覆盖前方整个比赛区域,造成机器人无法获得正确决策所需的信息。因此,在机器人比赛中,如何获得完整的前方信息是关键。由于在一定点所获图像一般只是其前方一部分区域,但是机器人在该点可以左右转动头部,获得两侧的信息,显然这些照片通常是有交叉的,本文提出通过图像拼接技术获得完整的前方图像。
图像拼接技术就是将多张有重叠的图像拼合成一个大的图像的技术[5-7]。其基本思想是找到2幅图像的重叠部分,通过去除重叠区域拼接成1幅图像。图像拼接常可以分成图像配准和图像融合。配准的目的是根据几何运动模型,将图像注册到同一个坐标系中。融合则是将配准后的图像合成为1张大的拼接图像。目前应用比较多的是基于特征的图像匹配方法。基于特征的方法实现过程大致要经过特征查找、匹配和运动关系求解3个过程。其主要有基于Harris特征检测器、尺度不变特征检测(SIFT)算法等。
本文提出基于图像拼接技术的仿人机器人赛场环境特征提取方法,其基本流程如图1所示。
图1 算法流程
Lowe[8]总结了现有的基于不变量技术的特征检测方法,提出了SIFT算子,SIFT特征匹配算法包括SIFT特征的生成(从多幅待匹配图像中提取出对尺度缩放、旋转、亮度变化无关的特征向量)和SIFT特征向量的匹配2个阶段。本文采用SIFT算子进行拼接,基本过程如下:提取机器人A所获得的图像A与机器人B所获得的图像B的SIFT特征,生成SIFT特征,描述其特征检测基本思想:尺度空间极值检测,以初步确定关键点位置和所在尺度。1幅图像在不同尺度下的尺度空间定义为图像I(x,y)与高斯核G(x,y,σ)的卷积:
其中:L为图像的尺度空间,(x,y)为图像的像素坐标,σ为尺度坐标。在图像二维平面空间和DoG尺度空间中同时检测局部极值作为特征点,从而使特征具备良好的独特性和稳定性。DoG算子定义为两个不同尺度的高斯核的差分,是归一化LoG(Laplacian-of-Gaussian)算子的近似。DoG 算子表示为
即在图像尺度空间内遍历所有的点,并且判断其与邻域内点的大小关系,如果该点的值大于或小于邻域所有点的值,则该点为候选特征点。通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。
所谓的特征点匹配本质上是一个通过距离函数(如欧式距离)在高维矢量之间进行相似性检索的问题。最近邻搜索的基本原理:给定一个多维空间R,R中的一个向量为一个样本点。R中样本点所构成的有限集合称为样本集。对于给定样本集E以及一个样本点d,d′为d的最近邻点是指对于任何样本点d′∈E满足:
式中:di是向量d的第i个分量。
具体过程如下:对参考图像A的SIFT特征点建立K-D树。对待配图像B的每个SIFT特征点feather_node,采用最邻近点搜索算法找到最邻近点feather_node1和次邻近点feather_node2。采用近似最近邻优先搜索进行搜索匹配,通过计算feather_node与feather_node1和feather_node2的距离进行匹配。
基于K维树的SIFT特征点的匹配算法:
输入:图像1的128维向量SIFT特征点集合
图像2的128维向量SIFT特征点集合
输出:匹配的SIFT特征点对的匹配链表
1)构建K维树;
2)初始化匹配链表为空;
3)对在图像2特征点中的每一个SIFT特征点
调用最近邻优先搜索进行查找匹配点
返回最邻近点feather_node1和次邻近点feather_node2
Then
将(feather_node1,feather_node)添加到匹配链表
由上述方法得到的匹配点有误差点的存在,可称之为伪匹配点。
随机采样一致(Random Sample Consensus,RANSAC)算法[9],是一种从样本中准确拟合数学模型的算法,包括去除噪声点(外点)和留下有效值。该算法假设符合数学模型的数据点是内点,不符合的是外点。采用RANSAC剔除误点的过程如下:
1)随机从3种得到的伪匹配点中选择4对匹配点,计算变换矩阵H;
2)计算每对伪匹配点与H的距离d;
3)设定距离阈值,若内点距离小于阈值T,则为内点,并在内点域上重新估计H;
4)重复以上随机采样n次,直到获得最大的内点集合;依此集合估计拼接所需图像变换矩阵。
确定图像的拼接位置之后,简单地叠加处理会造成在图像叠加区域出现与周围明显的区别。因此,这里采用双线性插值方法对图像进行进一步的融合处理。
迄今有许多边缘检测算法,如Laplace算法、Sobel算法、Robert算法、LOG算法以及Canny算法等。Canny算子具有很好的边缘检测性能,其具有信噪比大和检测精度高的优点,被广泛应用,因此,本文选用Canny算法[10]提取边缘。
采用Canny算子边缘检测的基本步骤如下:
1)采用高斯滤波器对图像进行平滑处理。
2)计算图像的梯度和方向。
3)采用非极大值抑制,获得细化边缘。
4)通过双阈值算法检测和连接边缘。
实验中采用小型仿人机器人MOS2007,其所携带的摄像头功能有限,采用单目摄像头,能够观察的范围较小,在实际的比赛中,很难准确地获得环境信息,从而识别定位目标球与守门员。实验中机器人决策前在球门前方获取环境图,再将头部摄像头旋转30°后获得另一幅图。实验结果如图2~6所示,其中图2和图3为所获原始图像,图4为提取图像匹配特征点示意图,图5和图6为拼接后图像及进行Canny特征提取后效果。
图6 Canny处理后图像
可以看出,采用基于SIFT的图像拼接方法可以较好地获得环境图像的特征,而Canny算法能够较好地获得赛场环境(球门,跑道)的直线特征,相对于传统的单一通过颜色方法进行目标识别要更为直观和准确。这种方法的缺点是SIFT特征点的提取与处理要花费较多的时间,且如果赛场环境较单一(如只用颜色标定球门等,角点等信息较少),则效率较低。
[1]陈凤东,洪炳熔,朱莹.基于HIS颜色空间的多机器人识别研究[J].哈尔滨工业大学学报,2004,36(7):928-930.
[2]白力勇,黄鸿,赵增荣.基于RoboCup中型组足球机器人视觉图像识别的一种快速算法[J].自动化理论、技术与应用,2006,3(10):347-351.
[3]李动恒,张泽峰,陈小平,等.基于图象分割的机器人视觉系统的设计与实现[J].小型微型计算机系统,2003,24(2).
[4]杨红颖,吴俊峰,于永健,等.一种基于HSV空间的彩色边缘图像检索方法[J].中国图象图形学报,2008,6(10).
[5]钟力,胡晓峰.重叠图像拼接算法[J].中国图像图形学报,1998,3(5):365-369.
[6]王玉珍.边缘重叠图像拼接中的特征块选取[J].西北师范大学学报:自然科学版,2002,38(1):38-40.
[7]支玲玲,葛庆平,姬照中.边缘颜色匹配算法在计算机拼图中的应用[J].计算机工程与设计,2010(16).
[8]Lowe D G.Distinctive image features from scale-invariant keypoints[J].Internatioal Journal of Computer Vision,2004,60(2):91-110.
[9]周剑军,欧阳宁,张彤,等.基于RANSAC的图像拼接方法[J].计算机工程与设计,2009,30(4):5692-5693.
[10]王植,贺赛先.一种基于Canny理论的自适应边缘检测方法[J].中国图象图形学报,2004,9(8).