林 河,梁 潇,方勇纯,张 鹏
(南开大学人工智能学院机器人与信息自动化研究所,天津 300350;南开大学天津市智能机器人技术重点实验室,天津 300350)
对于无人飞行器的研究是近年来机器人和控制工程领域的热点方向.小型多旋翼无人机具有反应灵敏、自由度高的特点,它能够垂直起降和定点悬停,在极小的飞行空间内仍能进行全方位自由移动,适合应用于生活生产领域的多个方面,例如侦查搜救、货物运输、空中作业等.在这些领域中,无人机控制器的适用性和鲁棒性对于应用场景而言至关重要,如何设计实用的控制器这一问题也引起了学术界的高度关注.
国内外课题组对于无人飞行器的控制问题提出了多种解决方案.其中宾夕法尼亚大学的GRASP实验室最早开展这方面的工作,在文献[1]中,该实验室自行设计了无人机的硬件平台,并基于微分平坦(differential flatness)的方法进行控制器设计和轨迹规划.在此基础上,多种控制方法被提出并应用于无人飞行器控制,其中包括几何控制、自适应控制、鲁棒控制、反步法滑模控制等.文献[2]中,作者基于浸入和不变技术实现了无人机的渐进轨迹跟踪,并使用硬件在环的仿真测试平台得到了实时实验结果.文献[3]结合了反步法和滑模控制方法设计了无人机的非线性控制器,并通过仿真证明了所设计的鲁棒非线性控制器和故障评估方案的有效性.文献[4]中,作者将几何控制进一步拓展,用于多无人机的悬挂吊运控制器设计,并给出了数值仿真结果.文献[5]针对四旋翼飞行器参数不确定性和外部干扰敏感的问题,提出一种基于自抗扰控制器的控制系统设计方法,该方法在为期望姿态和高度安排过渡过程的基础上,使用扩张状态观测器对内扰和外扰进行估计并实时补偿.在实验平台方面,使用自主研发的四旋翼飞行器验证了串级PID控制器的性能.而文献[6]则针对飞行器外部干扰和通信资源受限条件下的轨迹跟踪控制问题进行了滑模事件驱动控制方法的研究,其通过仿真验证了滑模事件驱动控制器的鲁棒性.文献[7]提出了一种采用自适应不确定性补偿器的自适应动态面轨迹跟踪方法.并使用一个可实现悬停和定点飞行的室外实验平台在无风和二级风条件下与PID控制策略,基于反步法的控制策略进行了对比.
小型无人机一般配置有惯性测量单元(inertial measurement unit,IMU),而仅凭惯性测量单元无法在缺乏外部定位信息的室内环境中确定自身的位置和姿态.一些课题中,无人机通过搭载视觉传感器等设备实现室内定位[8–11],但这给无人机增加了额外的硬件限制,例如对机载处理器性能和无人机的负重能力提出一定要求,并引发额外的精度和实时性问题.另一些课题中,采用了基于光流的定位方法[12],通过光流运动模型对无人机的线速度进行估计,通过对垂直速度和高度比值积分获得高度数据,这种方法具有较快的响应特性,但对周边环境的纹理有特殊要求.而面向控制方法设计、轨迹规划、多无人机编队等研究课题更加重视数据的精确性与实时性,应用外部定位系统来确定自身的位置和姿态将更为便捷,同时也降低了实验对无人机配置的要求,提高了数据的精度,便于进一步扩大实验规模和执行更多复杂任务[13–17].
由于多旋翼无人机系统本身具有欠驱动特性,在多无人机环境中又会遇到无人机间气流、通信的相互干扰问题,因此对控制器设计提出了更高的要求.同时,对比于单无人机的实验环境,多机环境更加有挑战性.多机通信及同步、碰撞风险规避等额外问题都成为影响实验结果的潜在因素.因此在多无人机编队与协同控制的相关课题中.实验平台的设计和优化也尤为重要.
国内外课题组对于多无人机实验平台的研究中,较为著名的例子包括麻省理工学院的Raven 实验室[18].在该平台中,地面站通过遥控器信号直接与无人机通信,将预先设定的轨迹发送给无人机进行跟踪,当遇到障碍物时,地面站将引导无人机进入“交互避障”模式,在初始轨迹基础上施加一个动态偏移量,使得无人机远离障碍物.宾夕法尼亚大学的GRASP实验室[19]使用了ROS系统进行地面站中的信息处理和用户交互,而与无人机的通信是通过Zigbee进行的,为了避免无人机相互碰撞,在轨迹规划中对每个路径点添加了距离约束,此外,无人机不被允许在另一架无人机下方飞行,来保证其不受气流干扰.苏黎世大学的FMA 实验室[20]配置了巨大的室内空间(10 m×10 m×10 m),适合进行大规模的多无人机实验,并通过无线局域网使用用户数据报协议(user datagram protocol,UDP)来与无人机进行通信,测得除丢包以外的通信延迟在22~46 ms.
然而,现有平台依然难以实现利用单一控制器对多无人机悬停和轨迹跟踪性能做出更好的优化.
本文提出了一种有界跟踪控制方法,并使用多无人机轨迹跟踪实验来验证其有效性.与其他方法相比,所提方法的优势在于:
1) 通过引入有界跟踪控制理论,使得无人机能根据不同的动态跟踪误差动态调整无人机的控制性能,在提高定点悬停稳定性的同时保证轨迹跟踪中具有较好的动态性能;
2) 在多无人机飞行中,有界跟踪控制的特性确保了无人机在轨迹跟踪的任意时刻总是保持一个处于边界范围内的跟踪误差,保证了实验的安全性,从理论上避免了无人机之间彼此碰撞带来的干扰和隐患,提高了多无人机协同作业的安全性;
3) 通过实验验证所提方法在多无人机轨迹跟踪时的性能,因为该控制方法考虑了无人机实际动力学特性,且设计方案在类似的多无人机协同系统中具备良好的可拓展性,这使得该方法可为一些多无人机协同作业的实际应用场合提供更好的安全保障,例如在多无人机协同吊运中用于负载和无人机的避碰控制.
本文中实验平台的设计充分参考了各个课题组的配置情况,并结合研究经验,设计了基于机器人操作系统(robot operating system,ROS)通信协议标准,通过5 GHz频段进行无线通信,采用运动捕捉系统来获取外部定位信息,并搭载机载计算机的设计方案.该方案的优点在于:使用ROS通信协议分布式部署控制器程序和传输位姿信息,实现了动态调参.在交互性、可操作性和可拓展性上有较大的提升,可用于各种复杂的多无人机协同作业实验.
本文剩余部分组织如下:第2节给出系统建模与控制器设计;第3节进行稳定性分析;第4节给出多无人机轨迹跟踪实验的平台设计及其数据和结论.
为了对无人机进行控制,首先需要建立无人机的模型,在此基础上通过能量分析的方法进行控制器设计,本节将具体阐述模型建立与控制器设计的过程.
四旋翼无人飞行器仅需狭小空间就可完成起降、悬停、转向等动作,适用于快速高精度的目标跟随任务,因此本文采用四旋翼飞行器作为设计和验证跟踪控制方法的基本平台.
四旋翼飞行器的建模和布局方式通常有十字型和X型两种.两种建模方式均以飞行器的几何中心为坐标原点,区别在于十字型建模以机臂方向为x,y坐标轴方向,而X型建模则以两机臂的45度夹角方向为x,y坐标轴方向.十字型建模方式简单易懂,布局直观,控制方便,而X型飞行器的姿态调整更加灵活.由于目标跟踪任务更为侧重于对灵敏度的要求,本文采用X型建模方式,其模型示意图如图1所示.
图1 四旋翼飞行器X型建模示意图Fig.1 Schematic diagram of quadrotor X-type modeling
世界坐标系E表示为[e1e2e3],无人机局部坐标系B表示为[b1b2b3],其中局部坐标系B的原点位于无人机结构体的质心,无人机在E中的姿态可用旋转矩阵R[b1b2b3]∈SO(3)描述.
以牛顿–欧拉法建模和分析,可得四旋翼无人机的动力学方程如下所示:
其中:ξ,Ω ∈R3分别表示无人机在世界坐标系下的位置及无人机的角速度;f ∈R表示无人机动力系统提供的升力;R ∈SO(3)为无人机姿态旋转矩阵;τ ∈R3为无人机所受力矩;m表示无人机整体质量;g为重力加速度;e3[0 0 1]为竖直方向上的单位向量;J ∈R3×3为无人机的惯性矩阵;符号为反对称算子,表示运算关系x×y,其中x,y ∈R3.
按X型建模方式,将无人机的力和力矩映射到4个电机的推力,其映射关系如下:
其中:l ∈R+表示机臂长度在坐标轴方向的投影长度,将机臂长度表示为L ∈R+,则它们的关系为L√fi ∈R+,i1,2,3,4分别表示4个电机输出的升力;c ∈R+为一个与电机扭矩相关的常量.该矩阵表明,无人机在运动中的升力f为4个电机输出升力的合力,而无人机受到的总力矩τ[τxτyτz]则由不同电机之间的升力差产生.
进一步给出电机升力与电机转速的关系
式中:kf∈R+称为升力系数,ri ∈R+为第i个旋翼转速.该式表明,对于第i个旋翼,其产生的升力fi与其旋翼转速ri的平方成正比例关系.
由式(4)–(5),可以得到四旋翼无人机姿态动态至电机转速的对应关系.通过在无人机上安装飞控单元,可测得其姿态与角速度,进而对电机做出控制.具体的控制方案将在下文中详细叙述.
外环控制器主要负责位置和速度的调节,并将期望的姿态和升力输出至内环节点.控制器以给定无人机的期望位置ξd∈R3为输入,根据无人机当前的位置ξ和姿态R计算出期望推力fd.
根据外环子系统的动力学模型(1),可定义位置误差向量eξ ∈R3如下:
其二阶导数
一方面,对于每台无人机,位置控制必须满足基本定位目标
式中ei(t)∈R表示在时刻t,位置误差eξ在坐标轴i上的分量,即eξ[exeyez].
另一方面,在多无人机实验中,必须对无人机轨迹跟踪的安全性提出很高的要求,因为无人机的旋翼结构脆弱,相互碰撞将会造成坠毁的危险.为了防止轨迹跟踪过程发生碰撞,在轨迹跟踪过程中的任意时刻t,设如下控制目标:
其中ωi ∈R+定义为方向i上的最大跟踪误差.
以下将通过能量分析的方法来设计控制器以实现上述控制目标(8)–(9),首先定义能量函数
其中Kp∈R3×3为关于位置误差eξ的控制增益矩阵.
考虑最大跟踪误差作为有界跟踪控制的目标量之一,在能量函数E的基础上构造如下标量函数:
其中λx,λy,λz∈R+为控制增益,对其进行求导得到
参考式(12)的形式,定义如下的辅助变量:
将式(13)代入式(12)中化简得到
为了实现控制目标,设计如下的控制律:
式中:fd∈R3表示控制器产生的期望推力;Kpdiag{kpx,kpy,kpz},Kddiag{kdx,kdy,kdz}分别表示关于位置误差的比例和微分项的控制增益矩阵.从该式可见,对于欠驱动的无人机动力学系统而言,期望推力fd受到无人机当前姿态R约束,无人机仅能产生垂直于旋翼平面方向的推力,因此实际控制器所能得到的升力为fdfRe3.
控制律(15)考虑了无人机的实际动力学特性,且能够保证跟踪误差在轨迹跟踪过程中的任意时刻t总是处于边界范围内,笔者将在下一节的稳定性分析中对其进行详细证明.
内环节点为无人机姿态控制器,负责调整无人机的姿态与角速度,并将结果以力矩的形式输出至飞控单元的电机控制层.
记平行于期望推力的单位向量为b3d∈R3,注意到向量b3d与期望姿态R之间存在如下关系:
选取与向量b3d非平行的任意向量b1c,则期望姿态角Rd可表示为
其中向量b2d∈R3可根据如下关系计算:
根据期望姿态Rd,可得到期望角速度
其中vex(·):SO(3)→R3表示反对称运算的逆运算,该运算将反对称矩阵转换为与其对应的向量形式.
通过对内环输入的姿态角和期望姿态角进行计算,可将无人机姿态误差eR和角速度误差eΩ描述为如下形式:
根据所得的误差量,采用简单的PD形式控制器来进行内环控制.PD形式的控制器在无人机内环的稳定性已在文献[1]中被证明,它也应用于编队控制[13]、协同运输[10]、避障规划[21]等场合.具体而言,设计输出力矩τd满足如下形式的控制律:
KRdiag{kRx,kRy,kRz},Kωdiag{kωx,kωy,kωz}分别表示姿态误差和角速度误差的控制增益矩阵.给定期望推力fd,内环控制器通过读取IMU的数据来获得无人机当前的姿态矩阵R和当前角速度ω.通过计算式(18)–(19)获得期望姿态Rd和期望角速度Ωd,再通过式(20)–(21)得到姿态误差eR和角速度误差eΩ,最后根据内环控制律(22)得到力矩τd,并将力矩τd和期望推力fd输出至电机控制环节(4).以上就是整个无人机控制器的执行过程,如图2所示.
图2 分层控制器示意图Fig.2 Hierarchical controller
值得注意的是,由于IMU易受磁场干扰,在无GPS的室内环境不能准确给出无人机偏航角,因此本文使用运动捕捉系统产生的姿态数据对无人机的偏航角进行校正.
在这一部分中,将对所提外环控制律的稳定性进行证明.
定理1对于任意i ∈{x,y,z},控制律(15)保证跟踪误差总是处于最大跟踪误差给定的边界范围内,即:|ei(t)|<ωi,且
证将式(15)代入到式(14)可得
推导得到
将式(24)两边积分,整理可得
从式(26)不难看出
假设ei →则有
这与V(t)<+∞矛盾,因此
进而得到
因为V的各项均为非负值,当且仅当平衡点处取0,所以V是正定的.又V(0)∈L∞,因此
考虑
结合上述两种情况,可得
结合结论(29)(33)–(34)可证明
将式(15)代入式(11)可得
结合结论(33)(35)可得
展开整理得
结合式(29)和式(45),定理1得证. 证毕.
以上为外环动力学子系统的稳定性分析.结果表明,所提控制律能够保证跟踪误差总是处于给定的边界范围内,且位置误差收敛于0.
注1证明该控制系统的稳定性对于本文中讨论的多无人机系统以及更复杂的类似系统都具有重要意义,因为该控制方法考虑了无人机实际动力学特性,在类似的多无人机协同系统中都具备良好的可拓展性.例如,可将该方法拓展到多无人机协同吊运系统中,当运送贵重物品或危险品时,对负载的跟踪误差进行控制,从而避免负载在运送过程中因为运动碰撞等原因损毁.
值得注意的是,讨论外环控制律时还应考虑无人机内外环的耦合特性,因为在完整的内外环系统中,推力fdfRe3的方向决定于无人机的内环动态,即姿态特性.受到文献[17,22]的启发,可通过验证耦合项符合增长限制条件的方法,证明整个闭环系统的渐近收敛性.
这一节将详细介绍实验平台的设计并对实验结果进行讨论.
本课题使用自行设计装配的350 mm轴距飞行器,该飞行器机架为全碳纤维结构,自重约1.1 kg,搭载的锂电池重约360 g.4 个电机的转速与电压比为1400 kV.螺旋桨桨叶长度约20.3 cm,实测飞行时的悬停升力为电机所能提供最大升力的45%,配重平衡且重心位于几何中心,适合搭载一定重量的负载进行飞行.
为了保证各种复杂算法的在线运行,在使用飞控单元进行底层控制的基础上,实验中的所有无人机都搭载了基于ARM内核的微型计算机ODROID-XU4.该计算机运行64位Ubuntu16.04LTS操作系统,并在操作系统上搭建有ROS开发环境,项目中大部分的通信和数据交互都是基于ROS系统的通信协议实现的.
本文通过一台双频无线路由器架设局域网来连接所有的实验设备,整个网络环境如图3所示,包含了有线局域网和无线局域网两部分.
图3 网络环境示意图Fig.3 Schematic for the network configuration
有线局域网中的设备包含运动捕捉摄像机、运动捕捉系统服务器与地面站.运动捕捉系统使用工业级的高精度相机捕捉快速运动,能够捕捉亚毫米级的运动.本文所述的系统中,在3 m×3 m×3 m的空间周围部署了8个运动捕捉相机,以便在飞行过程中从各个角度进行观测.同时,每台无人机上都安装了被动反光标志点,使其可被运动捕捉相机观测.
在实验环境中,一台地面台式电脑作为运动捕捉系统的主服务器,用以接收运动捕捉相机得到的点云数据并进行处理,并实时计算出目标的位置和姿态.无人机的机载计算机、地面站的控制程序皆可通过ROS通讯协议实时接收到运动捕捉系统提供的信息.
实验环境中面临的通讯问题主要为实时性问题:若不能保证控制器的实时性,控制算法的精度将受到延迟影响,且会造成时钟同步问题,未同步的无人机分别跟踪设定轨迹的实际时间将与设定时间存在偏差.此外,还存在一定程度的通信干扰问题,这是由于实验环境周边的其他无线设备造成的.
就通信的实时性而言,外环控制器与内环控制器的频率不同,且外环控制器需要从外部设备上实时获取无人机的位姿信息,内环控制器则需要高频率高精度地从无人机的IMU中实时读取角速度、加速度等状态信息.数据来源的不同导致其延迟性的差异,因此,为了保证外环和内环控制器均拥有较好的实时性和通信质量,在本文的实验平台中,外环以100 Hz的频率运行在地面站上,而内环以200 Hz频率运行在无人机的机载电脑上,它们之间的通信通过ROS系统来实现.此外,通过在地面站上建立标准时间服务器,在实验中令无人机同步校准本地时间,而每个轨迹跟踪命令和姿态数据包都以带时间戳的数据格式发送至无人机控制器上.无人机在收到数据包时就能精确地测算出自身的通信延迟,并根据同步过的本地时间运行控制器.一旦指令或数据的延迟超过阈值,无人机将向地面站发送错误信息并自动降落.
对于通信干扰问题,由于无人机控制器的分布式部署,实际上受到影响的只有外环位置信号的低速传输.且由于配置了双频无线路由设备及网卡,无人机可切换至5 GHz频段,5 GHz通讯频段具备较强的抗干扰能力,在实验中有效地避免了通信干扰导致位置信号丢包的问题.在实验中,笔者对无人机与地面站之间的指令和数据交互的延迟要求相当严格,其不得超过50 ms.实际平均通讯延迟在20 ms以内.一旦延迟超过上限,无人机将自动降落以避免设备损坏.
同时,在地面站上还运行着一个动态调参节点,动态调参节点位于整个系统的顶端,负责在实验中修改和保存所有节点的参数.动态调参节点也拥有一个独立的用户界面来供实验人员在实验中实时调整参数.这使得无人机能够在飞行中更换控制算法或调整控制参数,增加了无人机控制系统的交互性,可操作性和可扩展性.
为了验证实验平台的性能,笔者根据以上控制器设计了多无人机定点悬停实验和轨迹跟踪实验.实验中使用两台规格相同的无人机,它们具有近似相同的质量m1.5 kg和转动惯量矩阵
实验中所使用的控制参数如表1所示.
表1 实验参数Table 1 Experimental parameters
两台无人机同时起飞,在平稳悬停一段时间后进行预定轨迹的跟踪,跟踪如下轨迹:
其中ωπ/10,即两台无人机跟踪同一条8字形轨迹,间隔4分之1个周期飞行,周期为20 s,如图4–5所示.为了确定所提方法的效果,将所提方法与比例–积分–微分(proportion integration differentiation,PID)控制器进行了对比,在PID控制器对照实验中,外环控制律为如下形式,控制器参数见表1.
图4 无人机1飞行轨迹3D示意图Fig.4 3D flight trajectory of UAV1
图4–5给出了无人机1和无人机2在跟踪实验中的位置轨迹,图6–7为实验中的位置–时间曲线,其中黑色实线表示期望轨迹,红色实线表示所提方法将ωi在各坐标轴的值设定为0.1 m时的位置,蓝色实线表示所提方法将ωi在各坐标轴的值设定为0.2 m时的位置,绿色实线表示PID方法的位置.可以看到,所提方法更好地跟踪了期望轨迹.且ωi取值为0.1时,无人机对误差的响应更加灵敏.
图5 无人机2飞行轨迹3D示意图Fig.5 3D flight trajectory of UAV2
图6 无人机1的位置–时间曲线Fig.6 Position-time graph of UAV1
通过图8–9给出的误差曲线,可以更清晰地观察到所提方法的特性.当误差随着时间增大时,有界跟踪方法试图将无人机在x坐标轴的误差范围限制在ωx值给定的范围内.而PID方法的位置误差则不断增大,在目标曲线的拐点处逐渐接近最大值(在x轴上约为0.4 m).出于控制变量的考虑,与PID方法使用同一组Kd参数使得有界跟踪控制在ωx0.1 m时产生了较为激烈的修正并造成微幅振荡,这是由于PID方法实现跟踪目标要求较高的微分增益项造成的,可通过调参将其消除.而在ωx0.2 m时,因为约束条件的放宽,不再产生此类振荡.
图7 无人机2的位置–时间曲线Fig.7 Position-time graph of UAV2
图8 无人机1的误差–时间曲线Fig.8 Tracking error of UAV1
为了对两架无人机的飞行数据进行量化的对比,根据实验数据统计出以下性能指标:其中E表示周期运动过程中的最大跟踪误差eξ(单位:m),σ表示误差eξ在一个周期的标准差(单位:m),反映了无人机跟踪曲线对期望位置曲线的趋近程度.A表示实际跟踪曲线达到的最大幅值与期望曲线的幅值之差(单位:m),反映了跟踪方法的幅度响应特性.ϕ表示实际跟踪曲线的相位与期望曲线的相位差(单位:°),反映了跟踪方法的相位延迟特性,如表2所示.
表2 跟踪性能Table 2 Tracking performance
图9 无人机2的误差–时间曲线Fig.9 Tracking error of UAV2
从数据可见,所提方法在整体性能指标上优于传统的PID控制算法,当ωi缩小到0.1 m(近乎达到实验环境无人机的定位精度极限)时,在跟踪误差、幅度和相位偏差上均达到了最好的效果.其中两架无人机因为硬件新旧原因存在跟踪性能的差异,在各项性能指标上无人机2的数据普遍优于无人机1的数据.从数据可见,所提方法在无人机在进行跟踪时具有较好的动态性能,且在硬件性能允许的条件下,通过改变设置,可将其位置误差控制在给定范围内.相比于传统PID方法,所提方法具有更好的动态特性.并且在多无人机协同飞行的环境下,能保证每架无人机的跟踪误差始终处于安全范围内.
注2由于室内空间受限,目前仅使用两台无人机验证实验效果.后续将会进一步拓展至更多无人机数量.
本文从模型建立与控制器设计、稳定性分析、实验设计3个方面介绍了所提的多无人机有界跟踪控制方法及其验证过程.其中模型建立与控制器设计部分阐述了系统的理论框架,并基于能量分析的方法设计了有界跟踪控制器;实验设计部分介绍了无人机及机载硬件的设计和外部实验环境的设计,讨论了控制器的分布式实现方式,通过设计多无人机轨迹跟踪实验,将有界跟踪控制方法与PID方法进行了对比,验证了所提方法在多无人机协同环境中具有良好的动态特性和安全性.
在未来的研究工作中,笔者将基于已有的控制方法和实验平台,致力于摆脱外部视觉捕捉系统的依赖,实现多无人机的自主定位.