贾 桐,李秀智,张祥银
(北京工业大学信息学部,北京 100124;北京工业大学数字社区教育部工程研究中心,北京 100124)
在地面机器人和无人机等智能体上,惯性稳定平台通过伺服控制可以有效的隔离载体的运动干扰,保证传感器工作在期望的姿态,例如对于相机获取稳定的成像非常有效,因此惯性稳定平台在安防巡检、地形勘探、大型建筑物测绘等领域应用十分广泛[1],而且对惯性稳定平台控制性能的要求也越来越高.
影响控制系统性能因素为零件的加工误差与安装误差、框架的质量不平衡与接触面间的非线性摩擦力、惯性测量装置的系统误差与载体扰动[2].针对上述影响,提升加工精度、改进机械结构、更换高精度惯性测量装置可以使系统性能提升,但不能从根本解决问题,通过设计合适的控制器可以有效的提升系统性能[3].在实际的应用中比例-积分-微分(proportion integral differential,PID)控制占据了90%以上,但PID控制是基于误差来消除误差的控制策略[4],不易满足高性能的动态跟踪要求.有很多学者尝试在控制方法上做出创新[5].比如,文献[6]提出一种基于角加速度扰动观测器的控制方法,通过双环的策略增强了系统的抗干扰性,较好的提升了控制精度和稳定性;文献[7]提出了一种基于快速跟踪微分器的多输入多输出(multi input multi output,MIMO)模糊滑模控制方法,提升了惯性稳定平台在目标跟踪状态下的稳定精度,但模糊控制难以通过理论验证系统的稳定性;文献[8]为了提升惯性稳定平台的干扰隔离性能,提出一种带有扩张观测器的超扭曲滑模控制器,实现了惯性稳定平台的稳定控制.
针对参数不确定的控制系统优化问题,Kokotovic与Kanellakopoulos等人在1991年提出反演设计法.经过近30年的发展,反演控制在不确定的非线性系统控制中有着明显的优越性[9].反演设计法是一种递归设计方法,将复杂的非线性系统分解成多个子系统,逐步回退使闭环系统达到期望的性能.大量的实验证明,将反演控制方法与滑模变结构控制[10]、模糊控制[11]、自抗扰控制[12]相结合,使被控对象具有更快的响应速度、更强的鲁棒性以及更低的动态误差.
近些年来,随着对神经网络理论不断深入的研究,神经网络已经成功解决了多种现代计算机难以解算的问题,表现了其优越的性能[13].将控制理论与神经网络相结合的智能控制方法已经成为控制领域一个新的分支,推进了非线性系统与不确定系统的发展.基于此,采用径向基函数(radial basis function,RBF)神经网络作为扰动补偿器,将滑模变结构控制与神经网络控制的优点相结合,削弱了滑模控制律输出抖振的问题,使得系统具备更加优越的动态性能.
本文结合了滑模控制的动态性能好、抗干扰性强和RBF神经网络的非线性逼近能力、实时性高的优点,以及反步法的回退解耦特性,设计了一种神经网络反演滑模控制器,用于提升车载惯性稳定平台的各项系统性能,同时针对建模过程中参数的不确定设计了前向增稳通道.其中滑模控制用于克服载体扰动,反步法的应用可以对系统进行解耦控制,而RBF神经网络可以实时的估计与补偿框架间接触面的非线性摩擦力与系统耦合造成的扰动.
本文研究所采用的惯性稳定平台为三轴三框架,如图1所示.由外到内依次是航向框架Y、横滚框架R、俯仰框架P,将相机以及其他传感器安装在俯仰框架的负载平台上.各个框架均由直流无刷电机独立驱动,通过调节框架间的夹角实现惯性稳定平台的伺服控制和姿态稳定控制.
假设1零件的安装误差与加工误差忽略不计,即俯仰框架、横滚框架和航向框架轴心交于一点.
假设2惯性稳定平台所有零部件均为刚体.
图1 车载惯性稳定平台模型Fig.1 Model of vehicle inertial stabilization platform
为了准确描述惯性稳定平台的动态响应,采用Stribeck模型[14]描述惯性稳定平台的动摩擦与静摩擦.根据该模型,摩擦力随运动速度的增加而减小.
根据欧拉方程建立惯性稳定平台的动力学模型:
其中:ε为角加速度,ω为角速度,T为作用力对刚体的矩,JC为转动惯量,通过调整力臂后,认为各框架的转动惯量为对角阵.
惯性测量装置位于俯仰框架,则其测量数值ωg与俯仰框架角速度ωP相同,通过坐标转换关系将其他框架角速度转换为ωP,转换后的方程被控量的二次项过多,不利于控制器的设计与仿真测试.
图2 坐标转换关系Fig.2 Coordinate transformation relationship
引理1类似平衡点线性化的处理,可以忽略二次项[15],将动力学方程表现为
其中:TPM,TRM,TYM为电机作用于框架的转矩;TPD,TRD,TYD为未知扰动,包括摩擦力在内.
通过式(5)-(7),将动力学模型表示为矩阵方程形式
式(9)表现为状态空间方程为
其中:δ为框架接触面间的摩擦力,dt为未知外部扰动,
θg,ωg为惯性测量装置的角度、角速度.
惯性稳定平台的具有姿态伺服和姿态锁定两种工作模式,分别用于搜索与跟踪目标、隔离车体与负载平台的振动.框架耦合使系统无法建立精确的数学模型,同时非线性摩擦与外部扰动无法准确估计,由此可见该系统为MIMO非线性系统.针对惯性稳定平台框架间的耦合,本文选用反演法对其解耦控制,反演控制可将复杂的非线性系统转化为多个子系统,分别为每个子系统设计虚拟控制量与Lyapunov函数使系统达到期望的静态、动态性能.针对外部扰动与接触面摩擦力无法准确估计,在反演控制中引入滑模面使系统具备一定的抗干扰性.可知摩擦力与角速度呈非线性相关,为估计非线性摩擦力与系统内部框架耦合,选用神经网络作为估计器,其具有优秀的非线性逼近能力,为满足控制系统的实时性选用RBF神经网络.由于无法建立精确的数学模型,同时神经网络存在逼近误差,设计前向增稳通道加强系统鲁棒性.基于此,本文设计了基于RBF神经网络的反演滑模控制器(neural network backstepping sliding mode controller,NNBSMC),使惯性稳定平台具备优秀的静态、动态性能,控制器原理如图3所示.
假设期望姿态信号为xd=[xdxxdyxdz]T.定义跟踪角度误差
其中:x1为稳定平台的惯性角度,x2为稳定平台的惯性角速度.
根据反演控制方法设计Lyapunov函数:
图3 NNBSMC控制流程图Fig.3 NNBSMC control structure
单一的反演控制无法保证鲁棒性,为克服干扰增强系统鲁棒性引入滑模面.考虑反演解耦控制中虚拟控制量的设计,结合滑模变结构控制,定义滑模面为
其中Φ,Ψ为3×3对角矩阵
基于滑模的抗干扰控制是优劣并存的,虽然拥有极佳的动态性能,但系统输出存在抖振现象.同时控制律式(24)中摩擦力δ未知,并且系统具有耦合性,难以建立数值精准的模型,可知摩擦力与角速度呈非线性关系,系统输出换向时会增强抖振现象.因此,优化系统性能的重要问题就是消除或减弱抖振.神经网络拥有优秀的非线性逼近性能[16]、环境适应性能,采用神经网络作为扰动估计器,与滑模抗干扰控制器结合以减弱抖振现象.
常用于非线性映射的神经网络有反向传播(back propagation,BP)神经网络、RBF神经网络.两种网络的学习过程相似,主要区别为使用不同的作用函数.BP网络是一种全局逼近网络,作用函数为Sigmoid函数.RBF网络隐含层到输出层是线性的,因此非线性逼近能力不如BP网络.由于BP网络具有双层权值,收敛速度慢,容易陷入局部最优,难以满足实时性要求.RBF网络是一种局部逼近网络,作用函数为高斯函数,采用其可获得更快的学习速度同时避免陷入局部最优,更易满足实时性要求.
本方法采用3-7-3的RBF网络结构建立了一种自适应律逼近非线性摩擦力δ,RBF网络算法为
建模过程中,由于零件的加工误差、安装误差、框架的耦合转动惯量难以精确测量,而控制律式(29)需要A与dt的准确数值,为增加系统的稳定性,可将状态空间方程式(10)转化为具有不确定性的状态空间方程:
其中:Λ为切换面厚度,i=1,2,3.
如果神经网络权值按照式(35)更新,可以保证闭环系统稳定,并且系统动态误差收敛为零.
为了验证所设计控制器的有效性,通过仿真实验对NNBSMC的性能进行测试.在考虑内外干扰的条件下,分别将实验结果双环PID、滑模控制(sliding mode control,SMC)[18]、反演滑模控制(backstepping sliding mode control,BSMC)[19]和NNBSMC这4种控制方法作对比.基于NNBSMC的控制参数设置如表1所示.
表1 惯性稳定平台物理参数表Table 1 Physical parameters of ISP
表中τ为无刷电机的机电时间常数.
为了量化实验对比结果,引入绝对值积分误差(integral absolute error,IAE)和平方积分误差(integral square error,ISE):
其中误差e(t)的单位为rad.
实验中的期望轨迹xd与外部干扰dt如下:
其中3个自由度的期望角度xd与外部扰动dt数值相同.
在Intel i7-4720 HQ处理器的环境下,对同样3-7-3结构的RBF网络估计器与BP网络估计器进行了在线训练,结果如图4-5所示.
图4 RBF神经网络补偿值Fig.4 RBF neural network compensate
图5 BP神经网络补偿值Fig.5 BP neural network compensate
图6 跟踪误差对比结果Fig.6 Tracking error comparison results
不难看出RBF网络的逼近误差小于BP网络的逼近误差,同时RBF网络估计器单次训练与估计的时间为65µs,而BP 网络为59 ms,在精度与运算速度上RBF网络估计器都更胜一筹,因此本文选用RBF网络作为NNBSMC控制器的扰动估计器.
图7 电机输出扭矩对比结果Fig.7 Motor torque comparison results
图8 负载平台姿态对比结果Fig.8 Attitude comparison results of load platform
根据实验数据,分析跟踪误差如表2-3所示.
表2 IAE对比结果Table 2 Comparison results of IAE
表3 ISE对比结果Table 3 Comparison results of ISE
图9 负载平台角速度对比结果Fig.9 Comparison results of angular velocity of load platform
从图6-9和表2-3可以看出,滑模控制的饱和项导致系统输出抖振,同时在高频扰动下系统输出换向,接触面之间的摩擦力也会增强系统输出抖振,采用RBF神经网络对接触面之间的摩擦力与系统耦合进行估计与补偿是可以有效降低系统输出抖振的.由于最内侧的俯仰框架只受摩擦力,而横滚框架和航向框架还会受到耦合转矩,故RBFNN扰动估计器是有效的.
通过姿态锁定实验,验证惯性稳定平台在车辆通过沟壑或减速带时的稳定性,期望姿态与车体加速度扰动如下:
根据实验数据,分析跟踪误差如表4-5所示.
表4 IAE对比结果Table 4 Comparison results of IAE
表5 ISE对比结果Table 5 Comparison results of ISE
从图10-12和表4-5可以看出,当惯性稳定平台只受到外部扰动时,双闭环PID有着较为良好的抗干扰能力,但其在姿态控制中动态误差较大;由于接触面摩擦力的存在,SMC和BSMC表现出较强的抖振;而NNBSMC则有较好的抗干扰能力.
图10 车体姿态Fig.10 Attitude of velocity
图11 负载平台角速度对比结果Fig.11 Comparison results of angular velocity of load platform
图12 误差对比结果Fig.12 Error comparison results
在两项实验中可以看出,基于NNBSMC的惯性稳定平台控制系统的动态误差更小,收敛速度更快,系统输出更加平滑,具有更好的鲁棒性.同时,仿真实验也表现出,针对系统参数不确定复杂的非线性系统,NNBSMC算法具有更好的适应性.
本文针对不确定扰动下的车载惯性稳定平台伺服控制问题设计了神经网络反演滑模控制器(NNBSMC),该方法使用反演法对系统解耦,并引入滑模面增加系统的鲁棒性与抗干扰性,同时RBF神经网络作为扰动估计器实时估计与补偿接触面的非线性摩擦力与系统耦合,针对系统建模过程中参数的不确定性加入前向增稳通道,最后应用Lyapunov方法从理论上分析了系统的稳定性.实验结果表明,在不确定的扰动情况下,惯性稳定平台采用本文提出的控制算法具有较强的鲁棒性能,系统动态误差更小,有更好的抗干扰能力.下一步工作将使用优化算法对控制器参数进行优化,并探索替代饱和函数的方法,以消除或减弱系统输出的抖振,以获取更佳的控制效果.