戴 月
(滁州职业技术学院 实训中心,安徽 滁州 239000)
近年来,电子商务的快速发展促进了物流产业的飞速增长和物流自动化推进的步伐[1]。2016年,阿里巴巴的电子商务交易超过3万亿元,其中203万美元与分销业务有关。近年来,中国快递行业发展迅速,但行业发展依旧停留在低端产业模式上[2]。商品运输过程的复杂性越来越高,传输过程经常出现错误或延迟,也会带来更多交通安全问题和环境问题。市场对产品运输的效率和安全要求越来越高,维护成本也限制了行业的发展[3]。在这种情况下,物流智能化是不可避免的发展趋势。智能机器人广泛应用在物流公司的仓储和分拣中,并逐渐向着物流行业的运输部门和分配部门过渡。智能移动机器人具有诸如路径规划、自主避让、自主导航控制以及实时状态同步等功能。智能移动机器人的应用可以提高现代物流系统的效率,防止路径网络拥塞和人身伤害,大幅度提高行业效率,助力产业转型升级。
国外从20世纪60年代开始相关研究,直到90年代,各种配套设备和核心部件不断优化,机器人开始具备对外界环境的感知能力,使得移动机器人真正具备了实用性。移动机器人开始用于特殊的环境研究和救援行动,如在美国开发的DANTE-II八足机器人和探测机器人等。到21世纪初,移动机器人已经在军用和航天等尖端领域开辟了新的应用场景[4]。
我国对于移动机器人的研究始于20世纪70年代初。经过数十年的技术沉淀和基础工业的发展,在金属焊接、产品检查、储存和加工等机器人的结构和控制领域,取得了丰硕的研究和应用成果。堡垒系列移动机器人的成功开发使上海交大在移动机器人的教育领域先拔头筹;中科院沈阳自动化所则根据自身优势成功开发了防爆机器人[5]。
传感器收集到控制信息与主控计算机发送的命令相互匹配,之后机器人就可以执行任务。控制器是机器人系统的大脑,机器人的所有功能均由控制器进行集中处理、调度和控制。同时,由于不同类型机器人应用场景和功能的差异,控制器的设计是完全不同的。控制架构可以分为串行和并行处理结构,串行处理结构按顺序处理控制算法,其主要缺陷是控制系统受到串行架构的限制,导致实时性能低下;并行处理技术使得任务的调度处理以及算法的运行更加迅捷,使得控制系统达到实时的级别。
移动机器人在执行任务的过程中对于自身以及目标所处的位置和方向要有较为精准的判断,这就需要精确的导航控制。主流的导航控制方法按照其传感器的不同可大致分为如下五个类型。
1.2.1 惯性导航
惯性导航是众多导航方法中问世最早的,同时也是最广泛使用的导航方法。它不需要任何外部信息,完全独立于外部环境。惯性导航使用陀螺仪和加速度计这两大敏感元件来测定惯性系统的加速度与角加速度,通过计算可获得对应的速度和位置等导航信息。抗干扰能力较强,但定位误差会随着时间积累。
1.2.2 卫星定位导航
卫星导航通过通讯卫星信号,以多点测量距离来获取定位信息,其覆盖范围极广,广泛应用于军用以及民用领域。但其定位效果受到卫星信号的影响,在快速运动中很难保障实时性要求。除此之外,如果采用非本国卫星数据进行导航,安全性上很难有保障。
1.2.3 视觉导航
视觉导航是通过环境感知和实时路标导航来实现的。路标通常是简单的、容易识别的标识,需要人工设置。视觉导航相对于其他导航方式的显著优势就是传感器成本较为低廉,适用于民用领域。同时,在复杂、未知的环境下,视觉导航性能较差,不过这一点在近年来的研究中逐渐得到了解决。
1.2.4 激光导航
激光导航依赖于激光雷达测距,通过所获得的极坐标信息来描述环境的分布信息,激光雷达可扫描的角度范围较广,且抗干扰性能极强,但由于表面反光较强,导致测距效果不理想。激光雷达的价格受到北洋、sick等少数厂商的垄断控制,所以成本较高。随着近年来国内诸多厂商的廉价方案的提出使价格逐渐向着理性区间回落,但低价的激光性能仍然难以满足较高的精度需求。
1.2.5 组合导航
组合导航系统是两个或两个以上导航系统的组合,结合了每个系统测量的数据信息,将不同数据进行优化整合,以获得更精确的导航信息,提高整个导航系统的性能。组合导航可以汲取上述的四种导航的优点,扬长避短,获得更加理想的导航效果。
图1 Mecanum轮结构Fig.1 Mecanum wheel structure
全向移动机器人通过其独特的轮系结构来实现全方位移动功能,相较于传统的双轮差动式移动机器人,全向移动机器人运动更加灵活,且对于特殊位置可以保持当前姿态以平移的方式接近。
最为典型的全向移动轮系结构是Mecanum轮(见图1),有别于一般的车轮,该轮是由许多小滚轮构成的,其形状更像是一个倾斜的齿轮,它的轴与车轮轴形成一个角度。这种特殊的结构为轮子提供了额外的两个自由度。因此,前轮在一个方向上运动,另一个方向也具有速度。当发动机转动轮子时,轮子通常会向垂直驱动轴移动,轮子周围的滚轮可以自由地沿着它们各自的轴旋转。
由于辊子与轮的主轴有着45°的夹角,导致全向移动机器人的四个车轮在理论上有着四种不同的安装方法。具体如下:
1) X-正方形:轮子旋转产生的扭矩将通过相同的点,因此转轴不能积极旋转或保持与转轴的角度。这种方式很少使用。
2)X-长方形:轮子的旋转可能会导致轴的转动,但扭矩力臂通常更短。这种安装方式也很罕见。
3)O-正方形:四个车轮位于正方形的四个顶点,其正常运动并不受到限制,但其受到特殊的结构尺寸参数限制,较为少见。
4)O-长方形:轮子的旋转可能导致轴的旋转矩,而扭矩力臂相对较长。这是最常见的安装方法。
为了方便对移动机器人的全面分析,根据实际应用做出如下假设:一是在实验环境足够平坦的条件下,可忽略地面形变的影响;二是地面摩擦力足够大,不需要考虑轮子与地面的相对移动,认为没有“打滑”的现象发生;三是忽略移动机器人的装配误差,假设Mecanum与地面的接触点正好处于车轮中心的下方。
首先尝试建立运动学模型,由于Mecanum底盘的数学模型更复杂,我们分为四个阶段:
1)将车轮的运动分解,考虑多个方向上的速度分量;
2)计算轮子轴心的速度;
3)通过轮子轴心的速度计算辊子的速度;
4)通过前两者速度推算轮子的实际运动速度。
考虑最为常见的O-长方形安装配置,分析轮子的速度。
2.2.1 运动分解
任一结构在空间平面内的复杂运动均可以由三个相互独立简单运动复合而成,即在平面上两个自由度的平移和绕垂直于平面轴的转动。vtx表示X轴运动的速度大小,即左右方向,定义向右为正;vty表示Y轴运动的速度大小,即前后方向,定义向前为正;ω表示ya轴自转的角速度大小,定义逆时针为正。
2.2.2 轮轴心速度
r表示为从几何中心指向轮子轴心的矢量;v为轮子轴心的运动速度矢量;vr为轮子轴心沿垂直于r的方向(即切线方向)的速度分量;
可以计算出:
v=vt+ε×r
(1)
分别计算X、Y轴的分量为:
(2)
图2 各车轮速度矢量Fig.2 Speed vector of each wheel
其它三个轮子轴心的速度可依据相似的原理获得。
2.2.3 辊子的速度
各车轮速度矢量如图2所示。根据轮子轴心的速度,计算辊子速度,产生实际运动效果的是平行于辊子方向的速度v||,该方向的单位矢量用u表示,则
(3)
2.2.4 轮子的速度
从辊子速度到轮子转速的计算如下:
(4)
根据图2所示的a和b,则有
(5)
综上,容易求出四个轮子的转速:
(6)
与人类双眼识别过程一样,双目视觉定位方法也适用于在不同角度接收同一物体的两张图像,物体的三维信息是通过分析坐标转换产生的。双目视觉系统的目标是通过两个摄像头拍摄机器人作业场景,确定目标的位置,并通过改变坐标来重建世界坐标系。完整的双目目标定位技术主要包括相机标定、目标识别、三维匹配和三维重构。研究的主要内容如下:
1) 摄像机标定。为了恢复目标的三维信息,在不同角度拍摄两个目标。为了建立他们之间的转换关系,必须首先确定关键参数,这个过程是摄像机的标定。首先在相机上安装图像模型,然后通过摄像机校准来产生双目系统的内部和外部参数,最后在空间坐标系中的物体坐标系和图像中的坐标系之间建立联系。
2)目标识别。为了获得目标图像集合中的坐标,首先需要从图像中提取目标。双目系统接收到的二维图像不仅包含目标信息,还包含其他背景或非目标对象。识别的目标是精确定位目标和背景。
3)三维匹配。在对图像进行了有针对性的处理后,需要通过图像的特征比对,获得这两幅图像之间的相关性。三维匹配的目的是明确包含不同特征的立体图像,以避免在此过程中出现影响三维重构的不利因素。
4)三维重构。双目系统上的目标位置是世界坐标系中目标的三维坐标,坐标从左右图像中恢复。为了获得目标的三维坐标,需要将目标坐标与两个图像中的坐标建立联系。
通过上述四个步骤,可以实现双目系统定位目标的过程。
目前有两种主要的方法来校准单眼摄像机:传统的校准方法和自校准方法。传统的校准方法使用特定的校准块,基于指定相机模型的空间绑定对象。根据已知的校准对象的结构和参数,确定二维坐标和空间坐标系之间的相对位置关系。摄像机的内部参数是通过适当的数学运算获得的。这是一种非常精确的方法,但对设备要求非常严格。自校准方法则无需参照其他物体,通过拍摄的图像的相对关系来获得相机参数,较为灵活。为了兼顾准确性和灵活性,本文采用传统标定方法和自校准方法相结合的方式,即张正友标定法,主要步骤如下:
1) 在黑板上打印一个特定大小的棋盘格,作为标定板;
2) 分别转动或平移相机,拍摄一组图像;
3) 求得棋盘格中的角点;
4) 获得摄像机参数后,需要通过两者相对于世界坐标的旋转矩阵和平移向量来建立两台摄像机之间的相对位置关系。由于旋转矩阵是单位正交矩阵,三者之间的关系如下所示:
(7)
Pw坐标是世界坐标系统中的P点,相机的左边和右边分别是P1和P2。则
(8)
3.2.1 双目信息提取
双目系统的特性信息可为环境感知提供必要的补充。因此,双目立体视觉是一种利用人类双目成像原理来确定距离和实现三维信息感知的模型。三角测量法被用来捕捉两个摄像头从不同地点拍摄的相同场景,以恢复视差。通过广泛不变量空间变换(SIFT)和高斯差分求解特征点。
3.2.2 特征匹配与融合
双目视觉提取的三维空间测量齐次坐标向量是m=[X,Y,Z,1],这样将三维空间点投影变换二维平面,令m=H3×4则,
(9)
(10)
由高斯牛顿迭代法,可得
mi(pk+Δk)=mi(pk)+JpkΔk
(11)
通过如下公式寻找下一拍的迭代点,
(12)
分别用P和P′表示起始点集和目标点集,则点集的中心坐标为:
(13)
构造两个集合的协方差阵:
令K3×1=[M23,M31,M12]T,
则H矩阵为:
(14)
可通过求解H的最大特征值获取旋转矩阵,进而球的中心的偏移为:
(15)
这个实验选择了DALAS-GM1400工业摄像机。相机的参数见表1、表2,相机校准的结果如图3所示。该实验获得了7张高质量图像,分辨率为1 280×960,以提高校准准确性。
表1 摄像机参数
表2 畸变参数
图3 摄像机标定实验结果Fig.3 Experimental results of camera calibration
为验证本文所提出的双目视觉特征信息处理算法,将其应用于视觉SLAM,针对室内和室外环境进行建模,构建地图。从图4和图5可见,室内环境特征得到了良好的还原,对于室内三维模型构建效果较为良好。
图4 室内环境特征扫描Fig.4 Indoor environment characteristic scanning
图5 室内三维环境构建Fig.5 Construction of indoor 3D environment
对于室外环境,由于其非封闭的结构,仅针对其周围环境进行三维重构是不够的,所以本实验采用双目视觉对周围环境特征进行捕捉。通过SLAM建立了导航地图,如图6所示,地图可较好的还原场景的真实情况。
图6 室外地图构建Fig.6 Outdoor map construction
如何将移动机器人应用在物流行业,如何提高作业效率一直以来都是一个热点问题。本文以机器人的基础运动控制以及导航控制为切入点,通过分析全向移动机器人的结构特点,详细分析各种轮系布置方式的优劣,给出最合适的运动学模型,提供了机器人实际控制应用的基础。在此基础之上,针对双目视觉导航中的摄像机标定问题、视觉特征提取和匹配融合问题给出了算法。算法的实用价值也通过了实验得以验证。实验结果表明,采用双目视觉系统相较于传统方式能够大幅度节约成本,同时可以获得比激光雷达更为全面的环境信息,实现良好的机器人导航控制。同时,采用双目视觉系统为今后工作中的动态避障以及路径规划也提供了更多的数据参考。相信随着技术的不断革新,今后双目视觉导航控制将愈加完善。