刘冬雨,刘 宏,黄龙飞
(1.中国空间技术研究院 北京空间技术研制试验中心,北京 100094;2.哈尔滨工业大学 机器人技术与系统国家重点实验室,哈尔滨 150080)
基于Smith预测控制的空间机器人遥操作研究*
刘冬雨1,2,刘 宏2,黄龙飞1
(1.中国空间技术研究院 北京空间技术研制试验中心,北京 100094;2.哈尔滨工业大学 机器人技术与系统国家重点实验室,哈尔滨 150080)
基于无源性理论分析机器人时延双向遥操作不稳定的原因.为保证系统稳定,提出一个结合Smith预测控制与在线修正环境参数的控制策略.针对机器人接触性操作任务中环境模型参数的辨识,通过拉弹簧试验给出了在线辨识方法,并对提出控制策略的稳定性和透明性进行仿真分析.完成了机器人在时延条件下拉弹簧遥操作试验,结果表明在结构化环境中所提出的方法可以提供操作者较好的透明性.
空间机器人;在轨服务;双向遥操作;预测控制;在线辨识.
空间飞行器在轨服务、空间站组装建造和运营维护等任务中,空间机器人的作用越来越重要,它可以替代航天员出舱活动,自主或通过地面遥操作完成危险任务,从而减小航天员出舱活动风险,降低任务成本并提高效率.随着国际空间站、ETS-VII和轨道快车等项目相继发射,空间机器人已成为开发利用空间资源的重要技术手段.
国内外专家对空间机器人双向遥操作进行了大量研究和分析.根据前沿研究[1-3]成果,本文从时延造成机器人双向遥操作不稳定的原因开展分析,提出一个基于Smith预测控制器的双向遥操作控制策略.这种控制策略与以牺牲遥操作透明性为代价换取遥操作控制系统稳定性不同,其兼顾了控制系统的稳定性与操作任务的透明性,在二者间获得了良好的折中.建立基于Smith预测力反馈的控制结构需要对机器人操作环境获取先验信息,因此本文建立了接触任务的环境模型,并给出环境参数辨识方法.通过仿真验证了控制系统的稳定性,对遥操作透明性进行了分析.最后通过机器人遥操作拉弹簧试验验证了基于预测力反馈的机器人双向遥操作方法的有效性.
时间延迟主要产生于机器人双向遥操作系统地面控制器和在轨机器人本体间的通信环节(含处理环节).很短的时延都会造成整个天地系统的不稳定,这种不稳定的原因不依赖于控制器和机器人硬件结构,全部归结于地面与在轨机器人间的时延[2].
如图1所示,采用无源性理论,以一个二端口单元描述机器人遥操作系统的通信环节.通信环节的左端连接地面控制器,通信环节的右端连接在轨机器人本体.地面对机器人控制指令的速度通过通信环节传给在轨机器人;在轨机器人与环境间的操作力通过通信环节反馈到地面,作为地面操作人员的反馈力信号.
图1 空间机器人通信环节Fig.1 Space manipulator communication segment
通信环节中的机器人各关节相互独立,本文从单自由度系统开展分析.系统的总功率为
(1)
式中,T为通信环节的时延,带下标m的为地面变量,带下标s的为在轨机器人变量,b为特征阻抗.
定义能量函数E和功率耗散函数Pdiss如下:
(2)
(3)
可以将式(1)写成储存能量变化率的形式
(4)
2.1 运动学模型
如图 2所示,机器人具有6个自由度,采用与文献[4]相同的坐标系建立D-H坐标系.
图2 空间机器人D-H坐标系Fig.2 Space manipulator D-H reference frame
(5)
式中cθi=cosθi,sθi=sinθi,cαi-1=cosαi-1、sαi-1=sinαi-1.
机器人运动学描述了机器人各关节角度和机器人末端位姿的变换关系,如式(6)所示:
(6)
2.2 操作环境模型及参数辨识
机器人与环境的碰撞采用二阶模型描述机器人平稳操作阶段的环境动力学,如式(7)所示:
(7)
二阶模型只含有3个时变参数,模型结构固定.辨识参数为me、be、ke.采取离线辨识方式建立操作环境与机器人间的平稳接触初值作为环境的先验信息.
环境参数在线辨识使用最小二乘参数估计递推算法,估计值由上一时刻的估计值加修正项组成:
(8)
(9)
本文研究空间机器人遥操作系统有3个假设:(1)机器人模型充分精确;(2)通信时延已知;(3)结构化的接触环境.
3.1 控制器系统结构
通过本文第2节分析,在轨机器人系统Gp(s)具有纯时延环节,如式(10)所示:
Gp(s)=G0(s)e-Ts
(10)
图3 基于Smith预测和在线辨识的双向遥操作系统控制框图Fig.3 Bilateral teleoperation control system diagram based Smith control and identification on line
空间机器人遥操作系统控制结构在地面控制站建立两个对在轨机器人的预测模型,其中一个预测模型增加了上行链路和遥测链路的时延,采用有时延环节的预测模型回路与在轨机器人系统进行比较.利用预测模型补偿时延影响,同时经过在线辨识修正环境模型误差.地面控制站预测模型无时延环节,这个模型作为遥操作系统的主端给操作者直接的预测力反馈.
3.2 稳定性分析
(1)理想系统的稳定性分析
Smith预测补偿若准确实现,即满足前文的3个假设条件,系统稳定性可由经典控制理论分析.将地面站的控制器简化成惯性环节,在轨机器人关节简化成惯性环节,主端控制器、从端控制器均采用PD控制器.针对机器人拉弹簧试验,将环境模型简化成一个比例环节.当补偿完全实现后,系统Bode图如图4所示.系统幅值穿越频率小于相角穿越频率,系统稳定.通过调节PD控制器,可以改善相位、幅值裕度指标.
(2) 加入扰动和在线辨识算法后的系统稳定性分析
图4 理想系统的伯德图Fig.4 Bode diagram of ideal system
图5 仿真结果Fig.5 Simulation result
3.3 透明性分析
(11)
式中Ze为环境阻抗.
在遥操作机器人拉弹簧试验中,采用基于Smith预测力反馈技术.程序模拟时延设定的发送时延和反馈时延均为3.5 s,拉弹簧的试验如图6所示.主端模拟地面給在轨机器人发送位置指令,从端机器人模拟在轨操作跟踪地面的位置输入.从试验的位置跟踪曲线图7可以看出,除遥操作主端与从端的静态位置偏差外,机器人可以跟随位置指令.造成静态位置跟踪偏差的主要原因包括关节柔性、间隙和臂杆柔性.
图6 拉弹簧试验Fig.6 Pulling spring test
图7 主从端位置跟踪曲线Fig.7 Master and slave position track curve
主端直接预测力的算法如式所示,其实现了框图 3的控制方案,利用在线辨识修正离线刚度辨识值,最后用经过时延的预测力和实际接触力的综合值加以修正.
(12)
主端经过7 s的双向时延后才能进行环境参数的在轨更新,因此图8中在主端预测的从端虚拟接触力有较大的尖峰,这个峰值的大小就取决于离线辨识的精度.图7在10 s左右主端控制器输出的位置基本保持不变,说明通过地面操作者的抑制,离线辨识不准确的干扰并没有显著影响操作人员的效果.10 s后,力跟踪曲线复现较好实现.
图8 主从端力跟踪曲线Fig.8 Master and slave force track curve
Smith预测控制结合在线环境辨识的机器人遥操作策略实现了时延双向遥操作从端接触力较好的预测,在结构化环境中可以较好的完成维护任务;同时能够克服时延影响,使得操作者力临场感得到补偿,提供操作者较好的操作透明性.
提高对环境的离线辨识精度,将进一步提高操作性能,使空间机器人系统遥操作更为可靠.
[1] 孙富春,吴凤鸽,刘华平.面向在轨服务遥操作技术的研究与展望[J].空间控制技术与应用.2008,1(34):33-37. SUN F C, WU F G, LIU H P. Research and Prospects for Tele-Operation in On—Orbit Servicing[J]. Aerospace Control and Application, 2008, 1(34):33-37.
[2] NIEMEYER G; SLOTLINE J E. Stable adaptive teleoperation[J].IEEE Journal of Oceanic Engineering.1991,16(1):152-162.
[3] SHERIDAN T B. Space teleoperation through time delay:review and Prognosis[J].IEEE Transaction on Robotics and Automation,1993,9(5):592-606.
[4] 熊有伦.机器人技术基础[M].武汉:华中科技大学出版社,1996:34-35.
[5] 方崇志、萧德云.过程辨识[M].清华大学出版社.1988:97-101.
[6] 邵惠鹤.工业过程高级控制[M].上海交通大学出版社.2003:203-205.
[7] DALE A L. Stability and transparency in bilateral teleoperation[J].IEEE Transaction On Robotics and Automation,1993,9(5):624-637.
Space Manipulator Based on Smith Predictive Control
LIU Dongyu1,2, LIU Hong2, HUANG Longfei1
(1.InstituteofMannedSpacecraftSystemEngineering,Beijing100094,China;2.StateKeyLaboratoryofRoboticsandSystem,HarbinInstituteofTechnology,Harbin150080,China)
The reason of the instability of bilateral teleoperation under time delay is analyzed. To guarantee the system stabilization,a control strategy is proposed based on Smith predictor controller and environment parameter online identification. Aiming at parameter identification in contacting operation, a parameter identification method is given combined with drawing spring experiments. The stability of control strategy and transparency of the teleoperation system are simulated. Finally, the drawing spring experiment is tested with time delay, and the validity of the control strategy is proved by the results.
space manipulator; on-orbit servicing; bilateral teleoperation; predict control; on-line identification
*载人航天领域预先研究课题(050101).
2015-04-17
TP242.3
A
1674-1579(2015)05-0019-04
10.3969/j.issn.1674-1579.2015.05.004
刘冬雨(1985—),男,工程师,研究方向为空间飞行器总体设计、空间机器人技术;刘 宏(1966—),男,博士,教授,长江学者特聘教授,研究方向为空间机器人技术;黄龙飞(1990—),男,硕士研究生,研究方向为空间飞行器总体设计.