闫 梁, 沈怀荣, 赵继广, 段永胜
(1.装备学院航天装备系,北京101416; 2.装备学院科研部,北京101416)
变轨迹制导律技术研究及发展动态
闫 梁1, 沈怀荣1, 赵继广2, 段永胜1
(1.装备学院航天装备系,北京101416; 2.装备学院科研部,北京101416)
变轨迹制导律的设计是在现代空间飞行器、高超声速飞行器、导弹设计过程中的关键技术。将变轨迹制导律划分为带末端约束的末制导律及标称制导律,概述了2类变轨迹制导律的技术难点,对带末端碰撞约束角的末制导律、标称制导律的在线规划算法,以及标称制导律的轨迹跟踪方法进行了综述,并分析了其可能的研究方向。
制导律;约束碰撞角;标称制导律
变轨迹制导律(TSVGL)[1]是指根据制导任务需要改变轨迹的形态,以达到指定约束要求。“约束”具体是指规定的轨迹初、末端约束,包括位置、速度、加速度、角度等约束限制,或者2点间的能量最省,时间最小,轨迹最短的最优化轨迹。TSVGL虽然是由文献[1]在1989年正式提出,但早已被广泛应用到航天飞机的再入制导,航空器的航迹制导,弹道导弹的制导,外星球的登陆等领域中。国内外文献尚未从主动改变轨迹的角度对其进行系统的综述,故本文首先分析TSVGL的基本问题及技术难点,着重从TSVGL的研究方法对其展开评述。
TSVGL主要侧重的是根据客观约束或使命任务主动改变轨迹的形态。一般分为2大类:一类是通过估算方法对终点进行预测,并实时校正控制量以达到终点,并满足一定的约束条件。其特点是,仅有较少的末端约束条件,计算量小,时效性强。主要应用在导弹的末制导上,如拦截弹拦截目标时需满足较大的末端约束碰撞角,以提高弹头效能。代表的制导律是偏置比例(bias proportional navigation guidance,BPNG)[2]。另一类是通过数值计算方法规划轨迹,并实时跟踪,以达到终点,并满足一定的约束条件。其特点是约束条件多,计算复杂,但制导时间充足。主要应用在航天器的航迹制导,外太空探索的轨迹制导及弹道导弹的初中段制导中,代表的制导律是标称制导律[3]2。
带约束的末制导律的主要技术难点:针对各种类型的目标,在一定范围的控制力情况下,保证精确的末端碰撞角及较小的脱靶量。这就需要设计新型的制导律满足不同类型目标的要求。
标称制导律的主要技术难点:一是研究在线实时规划轨迹算法。具有自主规划轨迹的飞行器,其优势是安全性强。可在出现故障时,迅速规划一条轨迹,使飞行器安全返回;灵活性强,具备多任务执行的能力。因此,研究轨迹的在线规划算法已经成为标称制导律的研究热点、难点。二是研究准确跟踪轨迹的方法。跟踪方法主要侧重将非线性的模型线性化,而后采用不同的控制律实施控制,将不同的模型线性化方法与控制律有效的结合是跟踪方法的研究难点。下节将针对TSVGL的技术难点对国内外研究现状展开评述。
2.1 带约束的末制导律设计方法
保证零脱靶量,并带有末端碰撞角约束的制导律设计是一项富有挑战性的任务。近年来,许多学者热衷于此,并提出了基于比例导引(proportional navigation,PN)的多种制导律。但尚未有学者以目标的类型,对制导律加以综述。故本文首先按照拦截的目标类型(低速目标、静止目标和高速目标),对3类制导律进行梳理,如表1所示。
2014年,闫梁等[4]设计一种三维联合偏置比例制导(united biased proportional navigation, UBPN)律。该制导律采用时变偏置角速率和时变比例系数,结合顺轨、逆轨拦截模式的优点,使用负比例系数拦截高速目标(顺轨模式),使用正比例系数拦截低速目标(逆轨模式)。UBPN[4]从普适性制导律的角度出发,能够适应多种类型目标拦截的制导律,使其既能拦截高速目标(顺轨模式),又能拦截低速目标(逆轨模式),并同时考虑到末端碰撞角约束限制。这将加强制导律的普遍适用性。由此可见,制导律的发展将不只针对单一的目标进行设计,向普遍性制导律发展是一种必然的趋势。
表1 针对不同目标类型使用的制导律及其特点
因此,普遍性制导律的研究将有2种研究思路:一是将单一型的制导律,通过一定的算法,将其有机的结合,使其能拦截多种类型的目标;二是设计一种制导律能拦截多种类型的目标。
2.2 标称制导律的在线规划算法
2.2.1 间接法
间接法是基于经典的变分法或者Pontryagin极大(小)值原理,将最优控制问题转化为哈密顿两点边值问题(Hamiltonian boundary value problem,HBVP)进行求解。在间接法应用中,最具代表性的是间接打靶法和有限差分法。间接打靶法[9]计算量小,属于简单的寻根方法,求解较小的变量及维数。因此,对计算机性能要求较低。且积分特性好,不易发散。适用于在航天飞机的短距离,所需约束条件较少的情况。但是随着初始猜想参数的增加,数值积分收敛性将变差,其收敛域减小,造成迭代收敛困难,故间接打靶法对初始猜想的参数要求准确性高,不适用于初值无法估计或者估计难度较大的轨迹规划中。对此,有限差分法[10]将预定的轨迹平均划分有限个时段,并通过有限差分的方法将微分方程组线性化,从而将哈密顿两点边值问题转化为代数方程组求根问题。这样有限差分法就从根本上克服了间接打靶法初值敏感的问题,并且适用于对轨道比较光滑且不易激烈振荡的飞行器轨迹。因此,间接法是在建立深入理解算法的基础上,用半解析法求解最优化问题。迭代量小,时效性强,最优性有保证,可信度好。但其推导过程复杂,对于初值估计困难及复杂的约束问题,间接法求解有一定的困难。
2.2.2 直接法
相对间接法,直接法通过将控制变量、状态变量离散化,将连续的最优控制问题转化为有限维的非线性规划问题,再利用数值优化方法进行求解。近年来,随着计算机计算性能的提高,直接法(direct method)在轨迹规划研究领域中备受国内外学者青睐。直接法通过把控制变量、状态变量离散并参数化,从而将连续的最优控制问题转换成有限维的非线性规划问题,再利用参数优化数值方法进行求解。
直接打靶法(direct shooting)[11]是直接法中的一种经典方法,该方法通过离散控制变量,在单区间上进行高阶数值积分来求取状态变量,当时间间隔增大时,积分精度会下降。若想提高运算精度,则必须增加每段的节点数,这会增大运算量,影响轨迹规划的时效性。但是对于终端时刻不固定的轨迹规划问题,可动态改变离散节点的个数,动态改变离散步长,提高节点的利用率和计算精度。另一种解决方法是同时离散控制变量与状态变量[12],在有限时间内提高计算精度,在各段逼近控制值,也有学者称该方法为多重打靶法。直接打靶法已被广泛应用在火箭上升轨迹和空间飞行器转移轨道优化等方面[13]。
在多重打靶法的基础上,学者提出了配点法。经配点法转化得到的非线性规划问题的变量维数远高于打靶法,但降低了目标函数的病态程度,提高了收敛性和精度,且对优化初值不敏感[14]。Seywald[15]对配点法加以改进,提出了微分包含法。与配点法相比,使用微分包含法转化的模型变量数目较少,求解速度更快,但在有限时域内控制变量的获取上存在局限性。为缓解优化参数敏感问题,Lu[16]提出了动态逆(inverse dynamics)方法。该方法是仅有离散控制变量的直接法,能够有效缓解参数敏感问题,且输出的初值估计比较容易,但该方法需要用到期望输出的前几阶导数信息,比一般直接法的参数化要求高。对此, Yakimenko[17-18]提出了虚拟域动态逆(inverse dynamics in the virtual domain,IDVD)方法,该方法通过引入虚拟路径,将轨迹优化问题从时域转化为虚拟域,再用动态逆的方法优化轨迹。IDVD算法与近些年来发展起来的GPM(Gauss pseudospectral method)[19]、LGLPM(Legendre-Gauss-Lobatto pseudospectral method)[20]相比:虽然IDVD算法在优化上仅能做到“近优”,但是其收敛性和鲁棒性较强,优化时间远少于GPM、LGLPM,并且对优化的初值设置要求较低[21]。正是由于具有以上优点,该算法已在飞机航迹规划、航天器的再定位及弹道导弹拦截领域有深入地研究。关于IDVD算法的研究:文献[17]探讨了近似目标函数及其阶数的选择对优化结果的影响。在反动力学计算过程中,文献[18]比较了不同的节点数对优化结果的影响,但采用等距的节点分布计算控制量及状态量使得节点的使用率不高。对此,基于过载对虚拟路径变上限积分的变节点IDVD算法具有潜在的优势,研究该算法在选定节点数的情况下,如何缩短优化时间与提高计算精度的问题具有很大意义。文献[22]提出了VNIDVD(variable node inverse dynamics in the virtual domain)方法,该方法以控制变量曲线的曲率大小划分节点数,有效提高了节点的使用率,且优化时间较IDVD小。
综上所述,直接法比间接法更早出现,但由于计算机性能较低而发展缓慢。随着数字计算机技术的迅速发展,以及航空航天领域的需求,直接法才有了较快发展。目前,传统直接法已广泛应用于各种飞行器的轨迹优化设计中。直接法相对间接法收敛域大,初值估计精度要求低,通用性好。但求解最优化问题时,只能做到“近优”。
2.3 标称制导律的轨迹跟踪方法
轨迹跟踪方法是研究准确跟踪预定轨迹的方法,其根源属于控制问题。在航天飞机的制导中,因倾侧角多次反转,导致不能完成大横程需求的飞行任务,Roenneke[23]将轨迹跟踪的控制问题转化为阻力空间中的线性调节器问题,利用LQR线性最优调节器方法和非线性控制器设计方法设计的轨迹跟踪器。Mease[24]应用近似反馈线性化技术,将航天飞机只具有局部渐进特性的纵向参考轨迹跟踪律改进成为具有全局渐进跟踪性能的制导律。Lu[25]借鉴航天飞机阻力加速度与纵程的解析关系,利用成熟的序列二次规划算法求解得到阻力加速度剖面,并应用非线性预测控制律完成轨迹跟踪。
非线性预测控制的难点主要集中在代价函数的选取及优化问题上。可分为“精确优化”及“近似优化”。所谓“精确优化”是采用序列二次规划方法求解控制量,该方法通常会导致二次规划的非凸问题,而且计算量庞大,实时性难以保证。“近似优化”成为近年来发展非线性模型预测控制的主要手段。其核心思想是近似系统模型,易得到优化解的代价函数,其最大的优势是解耦效果好,时效性强,系统参数绝对大部分为在线计算获得,适用于实时优化轨迹的跟踪。
JOOS[3]2使用雅克比矩阵线性化方法,进而采用预测控制跟踪轨迹,然而由于其复杂的计算量而不能进行实时控制。CHEN[26]使用了泰勒展开式线性化模型,其方法应用在单输入单输出控制中。Nathan Slegers[27]也是使用了泰勒展开式线性化控制模型,并将其扩展到多输入多输出系统的控制中。JUNG[13]等取5个动态平衡点,采用线性插值的方法将模型线性化,使用预测控制方法跟踪预定的轨迹。由此可见,对于航天器的轨迹跟踪问题,采用预测控制方法跟踪轨迹,首先需对模型线性化。
如前所述,轨迹规划方法有直接打靶法、配点法、微分包含法、动态逆法、伪谱法、VNIDVD。这些轨迹规划方法有一个共同的特性:先对模型线性化,而后转化为非线性规划问题。在研究轨迹跟踪方法时,借鉴轨迹规划的线性化方法,而后使用不同的控制律实施控制,跟踪预定的轨迹。
本文综述了国内外相关领域的研究成果,系统对TSVGL分类进行梳理,在深入研究各类算法的基础上,提出以下建议,可为TSVGL的设计提供参考。
1)仅针对1种典型目标(高速、低速或者静止目标)设计的制导律具有以下缺点:从导弹型号研制方面讲,需对不同类型的目标设计不同的制导律,这将会增加导弹设计员的工作量。从作战层面讲,如果导弹的制导律可以改变,即可在作战前装订到导弹中,这将会给作战人员增大负担,同时也影响作战的时效性;如果导弹装订的制导律不可改变,那么将需要贮存大量的针对不同类型目标的导弹,这将会增加作战保障难度,对于机动发射的导弹更为突出。因此,可否从制导律的普适性出发,设计一种制导律能拦截高/低速目标,并带有末端约束碰撞角限制。这将加强制导律的普遍适用性,减少导弹型号研制费用,增强作战效能。
2)随着计算机性能大幅度提高,直接法将会成为轨迹实时规划方法的主流。该方法的研究方向是实时性强、稳定性高。未来轨迹规划的发展需要对此进一步研究。轨迹在线规划可能更注重稳定性高,算法的实时性可用高性能的计算速率弥补。
3)轨迹跟踪方法的研究同样偏向于用直接法的思路。将控制系统的模型线性化,而后使用不同的控制律进行控制。轨迹跟踪方法与轨迹规划方法将有一定程度的结合,这样就能有效利用轨迹规划离散后的结果,减少计算量。
References)
[1]RAO M N.Analytical solution of optimal trajectory-shaping guidance[J].Journal of Guidance,Control,and Dynamics, 1989,12(4):600-601.
[2]BYUNG S K,JANG G L,HYUNG S H.Biased PNG law for impact with angular constraint[J].IEEE Transactions on Aerospace and Electronic Systems,1998,34(1):277-288.
[3]JOOS A,MÜLLER M A,BAUMGÄRTNER D,et al.Nonlinear predictive control based on time-domain simulation for automatic landing[C]//AIAA.AIAA Guidance,Control,and Dynamics Conference 2011.Portland,OR,United States:A-merican Institute of Aeronautics and Astronautics Inc.,2011.
[4]闫梁,赵继广,沈怀荣,等.带末端约束碰撞角的三维联合偏置比例制导律设计[J/OL].(2013-12-25).航空学报,http://epub.cnki.net/kns/detail/detail.aspx?FileName= HKXB20140115000&Db Name=CAPJ2014.
[5]RATNOO A,GHOSE D.Impact angle constrained guidance against nonstationary nonmaneuvering targets[J].Journal of Guidance,Control,and Dynamics,2010,33(1):269-275.
[6]ERER K S,MERTTOPCUOGLU O.Indirect impact-anglecontrol against stationary targets using biased pure proportional navigation[J].Journal of Guidance,Control,and Dynamics,2012,35(2):700-703.
[7]TAL S,GOLAN O M.Head pursuit guidance[J].Journal of Guidance,Control,and Dynamics,2007,30(5):1437-1444.
[8]PRASANNA H M,GHOSE D.Retro-proportional-navigation:A new guidance law for interception of high-speed targets[J].Journal of Guidance,Control,and Dynamics,2012, 35(2):377-386.
[9]李惠峰.高超声速飞行器制导与控制技术[M].北京:中国宇航出版社,2012:265-268.
[10]MATAUSEK M R.Direct shooting method,linearization, and nonlinear algebraic equations.[J].Journal of Optimization Theory and Applications,1974,14(2):199-212.
[11]OCAMPO C A,MATHUR R.Variational model for optimization of finite-burn escape trajectories using a direct method[J].Journal of Guidance,Control,and Dynamics, 2012,35(2):598-608.
[12]LENZ S M,BOCK H G,SCHÖDER J P,et al.Multiple shooting method for initial satellite orbit determination[J].Journal of Guidance,Control,and Dynamics,2010,33(5):1334-1346.
[13]HESS R A,JUNG Y C.Application of generalized predictive control to rotorcraft terrain-following flight[J].IEEE Transactions on Systems,Man and Cybernetics,1989,19 (5):955-962.
[14]SUBBARAO K,SHIPPEY B M.Hybrid Genetic Algorithm collocation method for trajectory optimization[J].Journal of Guidance,Control,and Dynamics,2009,32(4):1396-1403.
[15]SHEN H,SEYWALD H,POWELL R W.Desensitizing the minimum-fuel powered descent for Mars pinpoint landing [J].Journal of Guidance,Control,and Dynamics,2010,33 (1):108-115.
[16]LU P.Inverse dynamics approach to trajectory optimization for an aerospace plane[J].Journal of Guidance,Control,and Dynamics,1993,16(4):726-732.
[17]YAKIMENKO O A.Direct method for rapid prototyping of near-optimal aircraft trajectories[J].Journal of Guidance, Control,and Dynamics,2000,23(5):865-875.
[18]BASSET G,XU Y,YAKIMENKO O A.Computing shorttime aircraft maneuvers using direct methods[J].Journal of Computer and Systems Sciences International,2010,49(3):481-513.
[19]BENSON D A,HUNTINGTON G T,THORVALDSEN T P,et al.Direct trajectory optimization and costate estimation via an orthogonal collocation method[J].Journal of Guidance,Control,and Dynamics,2006,29(6):1435-1440.
[20]FAHROO F,ROSS I M.Costate estimation by a Legendre pseudospectral method[J].Journal of Guidance,Control, and Dynamics,2001,24(2):270-277.
[21]BOYARKO G A,ROMANO M,YAKIMENKO O A. Time-optimal reorientation of a spacecraft using an inverse dynamics optimization method[J].Journal of Guidance, Control,and Dynamics,2011,34(4):1197-1208.
[22]闫梁,李辕,赵继广,等.基于变节点虚拟域动态逆的轨迹实时优化[J].航空学报,2013,34(12):2794-2803.
[23]ROENNEKE A J,CORNWELL P J.Trajectory control for a low-lift re-entry vehicle[J].Journal of Guidance,Control, and Dynamics,1993,16(5):927-933.
[24]BHARADWAJ S,RAO A V,MEASE K D.Entry trajectory tracking law via feedback linearization[J].Journal of Guidance,Control,and Dynamics,1998,21(5):726-732.
[25]LU P.Entry guidance and trajectory control for reusable launch vehicle[J].Journal of Guidance,Control,and Dynamics,1997,20(1):143-149.
[26]CHEN H,ALLGOWER F.Quasi-infinite horizon nonlinear model predictive control scheme with guaranteed stability [J].Automatica,1998,34(10):1205-1217.
[27]SLEGERS N,KYLE J,COSTELLO M.Nonlinear model predictive control technique for unmanned air vehicles[J]. Journal of Guidance,Control,and Dynamics,2006,29(5):1179-1188.
(编辑:李江涛)
Technical Research and Development Trend of Trajectory Shape Varying Guidance Law
YAN Liang1, SHEN Huairong1, ZHAO Jiguang2, DUAN Yongsheng1
(1.Department of Space Equipment,Equipment Academy,Beijing 101416,China; 2.Scientific Research Department,Equipment Academy,Beijing 101416,China)
Designing the trajectory shape varying guidance law(TSVGL)is a key step,especially for the modern spacecrafts and supersonic flight vehicles and missiles.TSVGL is classified as terminal guidance with impact angle constraints and nominal guidance law,whose technical difficulties are stated.Moreover,a review of homing guidance with impact angular constrains,online planning algorithm and trajectory tracking method of nominal guidance law is given.The contents trends and directions are analyzed,which provides the references for developments of technology of precision guidance.
guidance law;impact angle constraints;nominal guidance law
TJ 765.3
2095-3828(2014)04-0065-05
ADOI10.3783/j.issn.2095-3828.2014.04.015
2014-03-20
国家级资助项目
闫 梁(1987-),男,博士研究生.主要研究方向:航天装备总体.yanliangbj@163.com.沈怀荣,男,教授,博士生导师.