李晓东
甘肃建投重工科技有限公司 甘肃兰州 730000
在现今社会人力成本不断上升情况下,“机器换人”步伐的加快,公共服务类机器人作为一个新兴产物可以节省人力,有效地降低经营成本。本文简单介绍了小型电动全自动导航扫路机器人的技术特点,并且从技术角度说明了服务类机器人的基本组成、基本功能、技术难点以及目前存在的问题。
本文依据行动导航方式将机器人分为有轨道与无轨道两大类。
巡线行走,按铺设导航磁条行走,定点布置RFID地标点,形成由点到线由线到面的数据地图,在特殊位置,通过内置RFID芯片触发特殊指令识别地面RFID射频编码标签(能放置在指定位置或指定物品上,可以与阅读器之间不直接接触而进行无线数据传输的数据通信标签)到指定标签位置停下,并按照对应标签数据介绍相应标签物品的情况或执行标签数据中指定的动作内容(左转、右转、转身、到达、返回等),此项技术算法容易,整体较为简单,成本较低,一般应用于一定范围内的室内场地。
与有轨道机器人不同的是,无轨道机器人没有固定路径,可以自主寻路以及避障,其一般具有自主学习能力,能在未知的环境里通过学习,并能无碰撞地从给定起点到达指定目标,在前方有障碍物时,根据不同的程序设定,可以选择另行路径或者绕行。目前较为成熟的与主流的导航定位系统有以下3种。
2.2.1 惯性导航定位技术
惯性导航定位系统(INS),物体做匀速度或者变速度直线运动,其任意时刻的瞬时位置是决定于物体的初始位置、实时速度、运动的时间和运动的角度,实时速度又是取决于起始速度、实时加速度和加速时间决定,即:实时位置是对速度的积分,而速度又是对加速度的累计积分。如下列公式[1]:
式 中,ax、 ay、 az分 别 为x、y、z方 向的 加 速 度 ,vx0、 vy0、vz0分别为x、y、z方向的初始速度。
惯性导航系统就是利用此物理规律实现对物体的导航定位,它利用陀螺仪平台建立自身的3D空间直角坐标系,每个轴系分别有自身的加速度计可测量出各自方向的加速度,并对其进行积分;叠加各自方向的初始位置,便可以测算出目标载体在坐标系中的基本位置和实时速度。此系统本身不依赖外部信息,也不向其他导航系统对外部辐射能量[2]。因此,系统的独立性和隐蔽性较强,也经常应用于隐形战机和导弹导航中。
通过网格规划,基于角动量守恒理论设计计算,依据定轴性和进动性,即:惯性保持稳定,同时反抗任何改变轴子的力量,又与外力矩方向相互垂直[3],导航更精准,能够灵敏感应方向、速度及坡度变化,灵活调整方向和路线。
然而,其缺点也非常明显,无论惯性传感器精确度有多高,由于陀螺仪与加速度计的误差会随着时间逐渐累积,而导航信息经过时间积分而产生,定位误差就会随着时间增加而增大,长期计算精度差;因此,一般情况下不单独使用。
2.2.2 SLAM导航定位技术
SLAM(Simultaneous Localization and Mapping即时定位与地图构建)技术是目前较为主流的人工智能机器人与其他无轨道行走机械定位导航技术。简单来说,SLAM技术是指机器人在未知环境中,完成自身定位、构建图纸、路径规划的整套流程,从而实现机器人的自主导航。按照主流使用的不同种类传感器分类可分为以下两种SLAM解决方案,一是使用3D激光传感器,通过传感器内置计算芯片以TOF为算法基础测量相关数据信息,再者是使用单目或多目深度视觉传感器,通过软件与图像处理算法为基础测量相关数据信息,以下将分别介绍两种不同传感器的导航技术。
2.2.2.1 基于3D激光传感器的SLAM定位系统
通过内置3D激光雷达摄像头向360°发送激光光束来获取数据,通过激光反射回来的时间(time of fly)来判断障碍物距离机器人的距离信息,在根据配置的高精度编码器与陀螺仪计算出自身移动轨迹与移动距离,可以在较为复杂的环境下绘制出已经过路径的实时地图信息,实现实时定位,对于机器人来说则是“测量四周环境与环境建模校对”(如图1)。
图1 基于3D激光传感器的SLAM定位系统
2.2.2.2 基于单双目传感器的SLAM定位算法DPVT(直接参数化的视觉追踪)
给定来自摄像机的一系列图像,观察由某些图像表示的数据模型,通过图像分析,视觉跟踪与确定模型随时间变化的参数,根据视觉自我运动跟踪整个场景,并从场景结构的感知运动中推断出视觉深度摄像机的运动。通过最小化密集像素成本函数的直接视觉跟踪方法[7]。(“直接”是指根据模型参数与视频帧之间的像素强度相关的函数来计算模型参数。直接方法的关键部分是一个生成模型,该模型可以根据给定的模型参数真实值来预测实时框架的外观。)视觉跟踪问题的真实模型参数的有效方法是考虑与预测参数和真实视图相关的光度成本函数的梯度,以适应变化的参数。在迭代框架内,视频图像中每个像素与预测之间的残差值直接对模型参数的精确估计形成线性约束。模型参数通常会随着时间而平滑变化。
利用每个像素,可以最大化从图像数据中提取的信息,并可以实现非常高精度的视觉跟踪。当然,某些像素不如其他像素提供更多信息。例如,在无纹理区域中梯度大小较小的像素,以及在一个或多个方向上具有区分梯度的像素(例如边缘和拐角),都无法将参数约束在成本空间内。
通常,由于模型的参数相对于像素观测值而言过于参数化,因此直接参数化方法会随着图像质量的下降而适度下降,并且可以在低图像分辨率下运行。以低分辨率估算参数通常可以提供具有改善的收敛特性的准确结果。估计值可以进一步用于在从粗到精策略中以更高的分辨率初始化估计值,从而有助于提高收敛性和计算效率。
单双目里程计系统与立体系统一样会遭受绝对姿态不确定性的增加,且因为存在漂移尺度的问题,不能仅凭单眼视觉确定物体的绝对大小。许多移动设备上都使用非完整的约束来打破不确定的比例漂移[8]。普通的单双目视觉测距系统在性能上仍然落后于立体激光3D系统,特别是由于难以可靠地跟踪足够的高质量特征来限制运动,但是从具有高纹理级别的视频流中可以获得很好的效果。
基于单双目传感器的SLAM定位算法利用每一帧特征数据在约束参考系中生成系统轨迹。仅基于相对局部感测(如视觉)的任何形式的运动估计一样,也会随着时间的流逝而偏离参考系,但是有助于得到可视化里程算法偏离绝对速率比[9]。在图2中,蓝色为单双目SLAM视觉里程定位导航,绿色为真实规划路径。在每个一分钟时长内,显示了轨迹的延伸,可以看到在每种情况下都与起始第一帧的地面真实路况对齐,但是随着时间的推移,计算路径会偏移真实路径。
图2 基于单双目传感器的SLAM
2.2.3 GPS导航定位技术
GPS导航定位技术与以上两种技术的使用范围相互之间各有重叠,但又有其各自的特点,GPS技术全称为全球定位系统,目前广泛应用于军事,科技,汽车定位与日常手机定位等领域,其基本构成有三个部分:空间设备部分、地面控制部分和用户设备部分。GPS目前只能在室外使用,在建筑物内部、地下设施、海底等无信号或信号不稳的环境中无法使用。目前提供民用的GPS建图在导航精度最多只能达到米级,且对于环境中突然出现的固定障碍物与移动障碍物无法识别,不能达到实时更新的技术需求,而SLAM技术却独立于GPS技术,可以在未知环境中自建地图、自定位、姿态估计和自动路径规划,在自身多维激光传感器或者视觉传感器的辅助下,可以识别未知环境中出现的固定障碍物与移动障碍物,实时更新自建地图,GPS定位技术目前主要是基于卫星与地面接收站将信息反馈到客户端。
2.2.4 SLAM导航定位、GPS导航定位与INS导航定位精度对比
由于INS导航定位系统单独使用数据漂移量较大,精度较差,因此将GPS系统与INS系统结合使用与单双目SLAM视觉里程系统进行精度对比,SLAM系统以帧频30 Hz的测量频率估算帧间运动。图3显示了系统在大约5 min的道路上与地面GPS系统和INS自定位导航系统相比较测得的线速度和角速度。视觉里程表以30 Hz绘制,而GPS系统与INS自定位导航系统以1 Hz绘制。以通过对齐的帧之间的像素误差平方和来衡量可靠性。可以得出,SLAM视觉里程计的测量精度紧随GPS导航与INS自定位导航的融合系统,并且SLAM视觉里程系统在本地测量上比GPS与INS测量更平滑,并且频率采样更高。
图3 自定位导航方式的比较
2.2.5 INS、SLAM与GPS导航定位进行系统融合的本地化定位
由于SLAM视觉定位,GPS定位与INS定位的优缺点可以互补,因此最优策略是将三种导航定位系统相互融合,SLAM视觉测距算法提供了可靠、准确和平滑的局部运动估计,而GPS提供了固定在全局地图上的粗略测量,INS导航系统确保了每个起始数据采样点短期的灵敏性与独立性。将多个测量数据融合在概率滤波器中,使用实时滑动窗口优化算法与图形优化的通用框架,以绝对GPS测量值、INS系统的起点数据积分值和SLAM相对视觉测距法测量值融合为相对于非漂移参考系的姿态实时组合估值[7][10]。在这种融合模式中,由于非连续姿态从未相互关联,因此新测量值对现有姿态的影响将随着姿态保持时间而迅速减小。而绝对GPS测量会限制轨迹的整体姿态,也即是大约10 s以上的姿态几乎不会受到新测量数据的影响,所以可以认为是固定的数据。通过在每次未固定顶点数据的总数达到阈值以上时固定图中最后的数据顶点,采用这种数据结构和相对较小的数据规模,能够非常快速地合并新的测量数据,并且将结果完全约束在实时范围内。
图4显示了传感器数据与算法融合后的最终轨迹,SLAM视觉导航系统轨迹(蓝色)与单独的GPS定位导航相比,SLAM视觉测距法和GPS的结合更准确地反映了地面真实轨迹。从中可以看到,生成的系统与地面实况系统相差很小,并且在图像的比例上很难区分它们。与单纯SLAM系统相比,GPS、INS和SLAM的结合更加顺畅,同时可以准确捕获移动车辆通过回旋处的路径。
图4 传感器数据与算法融合后的最终轨迹
第一个缺点,该技术可使用的传感器一般有:多维激光,单或多目深度视觉摄像传感器,雷达、声呐、超声波传感器等,激光类与视觉类受光照条件影响大,在强光源或镜面反射物体较多的环境下精度会呈指数曲线下降,而声呐与超声波类传感器能耗较高,且回传速度较慢、漫反射环境下数据不稳定,加滤波后数据不真实等问题。
第二个缺点,SLAM算法都是以环境或者图像特征点为基础,目前高精度高像素的图像或高采样率激光扫描特征点提取和匹配计算量大,通常是多维矩阵的乘积或者迭代卷积[5][6],如公式1,所以对GPU要求很高,一般难以到达实时性处理要求,从而影响定位的效率与精度。
式中,yi为特征点i的三维空间坐标;P表示系统误差协方差矩阵;X表示状态向量。
无论是基于3D激光传感器的SLAM定位计算,还是以单目或多目深度视觉传感器通过软件与图像处理算法为基础SLAM定位,如果是对于已知的工作环境,也可以预先在系统中加载图纸信息,例如建筑物或者房屋的AUTOCAD图纸;机器人通过自身训练系统与学习系统会匹配并且修正两个数据来源,每次训练以构建的路线,机器人将会检测它所“看到”的和存储于它“记忆”的图纸(即预先加载的AutoCAD图纸),从而得到最真实与最准确的地图信息。采用SLAM技术的导航机器人一般精度可达厘米级别。
机器人在人机交互中对于复杂结构的语法语言在断句划分和提取关键字过程中容易产生歧义,且目前的机器人只能通过语气词简单判断语气,很难通过语调和微表情判断对话者的当前情感,在输出过程中也是通过相应语法拼接数据词典中匹配单词,基本没有语调变化。
无轨机器人避障感知系统,由于传感器与程序优化问题或多或少存在扫描遗漏、激光散射或者光源吸收与图像数据分辨率过大过小内建图纸存在部分错误与盲区等问题。
无论有轨或者无轨机器人在空间过小,移动物体过多的复杂环境下效率大为降低。且只能执行数据库内已有或固定流程程序,离标准意义的人工智能差距较大。
通过以上内容针对目前主流自主定位与导航机器人的结构组成、SLAM算法与技术难点进行了简要分析介绍,相对来说,人类不仅可以通过视觉推断出具有特定形状物体的大概距离与刚性,而且同样能够推断没有特定形状气体,液体与其他透明物体的状态与体积,而对于机器人的识别功能来说这仍然是一大问题,本文仅针对刚性物体的自主定位与导航技术算法为更多相关厂家做出了简单的技术算法参考指导。