胡 松, 王道累
(上海电力学院 能源与机械工程学院, 上海 200090)
随着视觉传感器及计算机技术的飞速发展,机器视觉得到了广泛应用,如用于3D测量、3D物体重建、视觉导航、生物医学、虚拟现实等诸多领域。在计算机视觉技术中,摄像机的标定是关键的步骤之一。摄像机的标定是由两台不同位置摄像机或一台摄像机通过移动或者旋转拍摄同一个场景,并且确定场景中物体表面某点的3D几何坐标与其在图像中对应点的坐标之间的相互关系,以建立摄像机成像的几何模型,而该几何模型中的参数就是摄像机参数[1]。摄像机参数主要包括摄像机内部几何参数和反映摄像机坐标系相对于世界坐标系的三维坐标外部参数,如焦距、图像中心坐标、尺度因子和镜头畸变等属于内部参数;而旋转变量和平移变量等属于外部参数。这些参数需要通过试验和计算得到。在计算机视觉和3D重建过程中,摄像机标定是从二维图像获取3D几何信息不可或缺的环节,其精度和准确性会影响后续的工作。因此,计算机视觉领域的研究者不断地提出新的算法或方法来提高摄像机标定的精度。
目前,摄像机标定技术有很多种分类方法,主要分为传统摄像机标定方法、基于主动视觉的标定方法和自标定方法[2]。传统摄像机标定方法的优点是摄像机模型可以任意设定,标定理论清晰,标定精度高,可以适用于精度要求较高的场合,如三维重构、生物医学领域等。其缺点主要在于标定的过程相对复杂,计算量大,需要较高精度的标定模板,且无法实现实时标定。一般在摄像机的世界坐标系中运动参数已知的情况下,可以采用主动视觉标定技术,通常能线性求解,且获得的结果鲁棒性较好。摄像机的自标定方法不依赖标定参照物,仅利用图像与图像的对应关系来计算出摄像机模型的参数,虽鲁棒性不高,但具有很强的灵活性,应用场合广泛。
传统摄像机标定方法是指利用一个几何参数精确已知规则的标定物作为空间参照物,将参照物上的已知点坐标与该点在图像上的坐标建立对应关系即为摄像机模型,再通过建立优化算法模型计算出摄像机模型参数。传统摄像机标定方法可分为利用最优化算法的标定法、两步法、张正友标定法以及其他方法等。
FAIG W[3]提出的利用最优化算法的标定方法是传统摄像机标定方法中的典型代表。在标定过程中,他利用针孔摄像机模型的共面约束条件,引用了摄像机成像过程中出现的每一个因素,设计了一个摄像机成像模型,具备合理复杂性。此外,对于每一个图像,为了更准确地描述与其对应的三维物体空间的约束关系,至少利用了17个参数,因此使得该方法的计算量非常大,但同时能取得很高的精度。
直接线性变换法最早于1971年由ABDEL-AZIZ Y I等人提出[4],也属于这一类标定方法。它是一种对摄影测量学中传统方法的简化方法。该方法的特点是用基本的线性约束方程来表示3D物体空间坐标系与摄像机坐标系的线性变换关系,可通过简单求解线性方程就能把摄像机模型的所有参数计算出来。但由于在整个过程中没有考虑透镜的非线性畸变问题,所以该方法的标定精度不高,存在一定的局限性。
TSAI R Y[5-6]在前人的理论基础上,于1986年提出了基于径向一致的摄像机标定方法。该方法在利用径向一致约束的基础上建立线性方程,并进行求解,将所求出的参数值作为初始值,再将镜头畸变这一因素考虑进去,就可以求解出摄像机参数,但这样计算出来的结果不够精确。为了提高标定的精度,利用最优化算法可以得出更精确的结果。由于该方法是将摄像机的标定过程分为两步进行求解,因此叫做两步标定法。两步法的优点是求解参数比较容易,标定过程也相对简单,最关键的是克服了最优化算法求解中的两大缺点,即直接线性变换法中未考虑镜头的线性畸变精度不高和初始值给定不合适就很难得出正确的结果。但两步标定法只考虑了透镜的径向畸变,没有考虑切向畸变,因此其标定精度还有待提高。
WENG J等人[7-8]在两步法的基础上改进了TSAI R Y的畸变模型,同时考虑了透镜的切向畸变,并给出了相应的算法,使之能够运用于视场较大、畸变较严重的场合。徐杰[9]在TSAI R Y两步标定法基础上,综合分析了该方法的优缺点,并针对面阵CCD摄像机,提出了新的更加综合的畸变模型,使得该方法能够用于多种复杂的镜头畸变的情况。为了满足双目立体视觉对工业检测精度和实时性的要求,刘源泂等人[10]分析了摄像机成像模型的内外参数,并考虑了针孔模型的局限性,采用LENZ畸变模型,建立了基于面阵CCD的双目成像几何模型,提出了改进的双目摄像机两步标定法。同时,对于两步非线性优化问题方法,TIAN S X等人[11]提出了一种基于LM算法的摄像机标定方法,给出了线性规划的内外参数,以DLT方法得到的相机模型作为其初始值,然后用LM算法计算出本征值的精确解以及非线性模型的外部参数。该方法在一定程度上能够提高摄像机的标定精度。
张正友标定法[12]采用的是针孔成像模型,利用平面棋盘格标定板,通过摄像机从不同方法拍摄标定板图像,然后通过拍摄的标定板图像上的点与模板上点的匹配运算,得出相应的单应性矩阵,最后通过线性计算得出摄像机的内部参数,采用基于最大似然法进行非线性优化求精。该标定法的标定板成本低,容易制作,鲁棒性好,标定精度高,是一种适合实际应用的简单灵活的新方法,推动了机器视觉从实验室向实际应用的发展。但由于该方法假定模板图像上的直线经透视投影仍然为直线,因此在广角镜头畸变较大的情况下并不适合。
对于摄像机标定的研究,有许多学者提出了比传统标定方法更具有针对性、实用性的新方法。如在张正友标定方法基础上,LI W M等人[13]提出了区别于张正友标定方法的畸变模型,利用特定的超高精度的标定板和改进的畸变优化算法,可以实现较高精度的相机校准,且其鲁棒性要好于张正友标定法。MENG X G等人[14]提出了一种基于圆点的平面型摄像机标定方法,采用的是圆环模板,利用几何约束关系能够更快速地对摄像机进行标定,原理比较简单,摆脱了图像点与模板平面点之间的匹配问题。
WU Y H等人[15]提出了平行圆标定法,从平行圆的最小个数计算圆环点,不需要任何匹配,标定过程简单。张奎等人[16]提出了基于两组同心圆环点的双目摄像机的标定方法,根据左右图像的视差和射影几何内部的约束条件完成对摄像机内参数的标定。FENG H Z等人[17]提出了一种多相机校准方法,用透明玻璃板代替普通标定板,并将摄像机放置在标定板的正反两侧,采用张正友的标定方法。这是一种不同于传统方法的多重校准的新方法,其优点是多台摄像机的校准可以由一个试验完成,缺点是透明玻璃板背面的相机需要考虑光线折射,需要经过非线性迭代,若初始值误差较大,则标定结果可能不够精确。
这些新发展的传统标定方法,为摄像机标定在计算机视觉领域甚至其他领域提供了更多且针对性更强的新方向,大大促进了计算机视觉技术的发展。
此外,DONG Y等人[18]首先利用MATLAB校准工具箱获得摄像机初始内部参数,然后基于遗传算法经过几代的进化、选择和变异,最后得到摄像机内部参数最优解。在基于遗传算法的摄像机标定方法方面,还有很多学者[19-22 ]进行了研究,并取得了不错的结果。这些方法简单而有效,具有一定的理论意义和实用价值。
基于主动视觉的标定方法是指在已知摄像机的某些运动信息(如平移或旋转运动等)下标定摄像机的方法[23]。这种标定方法需要控制摄像机做某些特殊运动,如摄像机做相互正交的平移运动,在平台坐标系下朝某一方向平移,摄像机仅作纯平移或旋转运动等。该方法的算法相对简单,参数可以通过线性求解,鲁棒性较高。但该方法需要使用高精度视觉平台进行摄像机标定,系统成本较高,且不适用于摄像机运动未知或无法控制的场合[24]。根据摄像机所做运动的不同,可以将基于主动视觉的标定方法分为以下几类。
HARTLEY R[25]在1997年提出了通过控制摄像机绕光心作纯旋转运动来标定摄像机的方法。HARTLEY标定算法的优点是可以线性求解摄像机的所有5个内部参数,缺点是在实际标定过程中,摄像机光心的位置难以确定。因此,在实际应用中,要求摄像机绕光心作纯旋转运动难以做到,其应用场合比较有限。
MAS D[26]提出了利用主动视觉系统控制摄像机作三正交平移运动的标定方法。该方法属于基于主动视觉方法中目前论述较为详细的标定方法,主要优点是可以通过线性求解摄像机的内部参数,缺点在于要求摄像机作三正交平移运动,需要高精度的摄像平台来实现,系统成本昂贵,且对噪声比较敏感,在环境嘈杂的地方所得误差会较大。
文献[27-29]提出,摄像机仅作一次平移和一次任意运动,就可以通过相应运动组下无穷远平面对应的单应矩阵线性求解,且解唯一;当控制摄像机作一次平移运动和二次任意运动时(要求二次任意运动的旋转轴不互相平行),摄像机就可以进行线性标定。由于该方法只需要摄像机作纯平移运动,无需特殊的设备,因此该方法最大的优点是成本低,易于实现,从理论上来说是一种非常完整的基于主动视觉的摄像机标定方法。
杨长江等人[30]在文献[9]的基础上,研究探讨了一种以平面二次曲线的纯旋转摄像机为基础的自标定方法。该方法利用图像间二次曲线的对应关系来标定纯旋转摄像机。利用图像之间二次曲线的对应关系,可以确定摄像机的内部参数矩阵,每幅图像至少包含两个空间平面二次曲线,或两个二次曲面,或一个二次曲面和一个平面二次曲线的投影。求解过程无需迭代,同时可以获得摄像机不同方位之间的旋转矩阵。该方法的主要缺点是要求摄像机只能绕光心旋转,且不能有平移运动,在实际应用中难以实现,应用场合有限。
摄像机自标定法是指利用摄像机在运动过程中图像与图像之间对应点的关系,直接对摄像机进行标定。该方法采用的是针孔摄像模型,通过摄像机内部参数的自身约束关系进行求解。其与传统标定方法最大的区别就是无需放置标定参照物[31]。随着计算机视觉领域的兴起,摄像机自标定法于20世纪90年代得到了迅速发展。其优点是更灵活且应用范围较广。但该方法需要解多元非线性方程,所以其最大的缺点就是鲁棒性差,一般只应用于通信、虚拟现实等精度要求不高的领域。
本文介绍了近年来在摄像机标定方面的研究进展,并对不同方法的特点进行了分析,对比了各典型方法的优缺点及其应用场合。随着计算机视觉技术的发展,寻求一种快速又精确,适用于不同环境和场合的摄像机标定法显得格外重要。但如何提高摄像机的标定精度还需要作深入的研究。