李恒,朱申奥,张维,陈滢,王诗兵,2,赵正平,侯大有,史晓凤
(1.阜阳师范大学 计算机与信息工程学院, 安徽 阜阳 236037;2.大连理工大学 计算机科学与技术学院, 辽宁 大连 116024)
自校正控制的概念自1973年由Astrom等[1]提出以来,一直是控制理论研究领域的研究热点[2],在智能船舶[3]、电机控制[4]、三轴磁强计[5]、雷达目标跟踪[6]领域获得了较为广泛的应用。邓自立等[7]提出自校正滤波的概念,原理为用模型参数的在线辨识结果代替最优滤波器中的参数形成自校正滤波器,代表性的如自校正α-β滤波器等,模型参数估值一般由最小二乘法及其变化形式辨识得到。刘永坦等[8]的研究结果表明,α-β滤波器具有计算量小等优势。陶贵丽等[9]、Deng等[10]、张鹏等[11]结合信息融合理论提出多种情形下的多传感器信息融合自校正滤波器。史腾飞等[12]、段广全等[13]、Dou等[14]对于多种情形如带衰减观测、带丢失信息的系统等的自校正控制进行了大量的理论和实验工作。以上绝大多数文献涉及的自校正系统的有效实用性的基础都在于判断参数是否为收敛情形,参数如不收敛即默认自校正系统不实用。事实上,由于过于追求参数的收敛性,因此自校正滤波器的实用范围较为狭窄。在实用中,由于成本限制等原因,因此自校正滤波器如果能在参数不收敛的情况下发挥一定的效用,也是很有意义的。赵栎等[15]、张维存等[16-17]提出了一种自校正虚拟等价理论,得出结论是参数估计的收敛性并非是自校正控制系统的稳定和收敛的必要条件。
本文针对一个带未知模型参数的目标跟踪系统,采用自校正α-β滤波器,对于参数收敛和不收敛情形下的自校正滤波器的实用范围问题进行理论研究与实验工作,结果表明当参数估值稳定且收敛时,自校正α-β滤波器在无限时间内是收敛且有效的;当参数估值不收敛时,在一定的时间范围内,自校正α-β滤波器仍是可以实用的。对多次仿真实验工作总结,本文提出崩溃点时刻的概念,即在崩溃点时刻到来之前该自校正α-β滤波器都是可实用的,实验表明崩溃点的值和参数真实值之间具有正相关关系。本文研究成果可以将传统自校正α-β滤波器仅限于参数估值稳定且收敛情形拓展到参数不收敛情形,对于拓展了自校正α-β滤波器的实用范围有着重要的意义。
对于一个简单目标跟踪系统,可以表示为一般形式,即
(1)
y(t)=[1 0]x(t)+v(t) ,
(2)
式中:T0为采样周期;状态x(t)=[x1(t),x1(t)]T,x1(t)和x2(t)为在时刻tT0处的目标位置和实时速度;ρ为模型参数,当采样周期T0为1 s时,ρ即为目标的加速度;w(t)为输入噪声;y(t)为对目标位置的观测;v(t)为观测噪声,w(t)和v(t)为零均值且方差分别为σw2和σv2的独立白噪声,假设σw2、σv2和ρ都是未知的,假设y(t)在无限时间内都是有界的。当ρ的值为恒定不变时,可以用自校正α-β滤波器跟踪目标。目标跟踪系统模型可以在公式(1)、(2)基础上扩展,如考虑存在公共干扰噪声的情况,或者输入噪声和观测噪声为有色噪声和非线性噪声,都可以在本文基础上用相同或相似的方法来处理。
对于公式(1)、(2)确定的目标跟踪系统,可采用文献[7]中提出的α-β跟踪滤波器,将公式(1)、(2)转化为自回归滑动平均模型(autoregressive moving average model, ARMA)。
(1-ρq-1)(1-q-1)y(t)=(1+d1q-1+d2q-2)ε(t),
(3)
式中:A(q-1)=(1-ρq-1)(1-q-1)=1+a1q-1+a2q-2,a1=-(1+ρ),a2=ρ;ε(t)为零均值的白噪声,其方差为σε2。令m(t)=(1-q-1)y(t),则公式(3)可变为
(1-ρq-1)m(t)=(1+d1q-1+d2q-2)ε(t)。
(4)
利用稳态Kalman滤波器可计算得到
(5)
稳态Kalman滤波器为
(6)
(7)
对于此类自校正α-β滤波器,可引入自校正滤波器和稳态滤波器的误差z(t),
(8)
式中:z(t)=[z1(t),z2(t)]T;z1(t)为对位置x1(t)的自校正滤波器和稳态滤波的误差;z2(t)为对实时速度x2(t)的自校正滤波器和稳态滤波的误差。一般来说,目前常用的方法主要时通过考察误差z(t)是否收敛来判断该自校正滤波器是否具有实用性。在工程实践中,经常遇到z(t)不收敛的情况,而不收敛时具有一种情况,即在部分时间里,z(t)为有界的,可表示为
‖z(t)‖≤M<∞。
(9)
在这种情况下,一般可认为自校正滤波器可以局部实用。特别地,当M为一较小数时,滤波器误差z(t)很小,该自校正滤波器可以直接实用;当M为一较大数值时,也可以通过获取z(t)范围而使得自校正滤波器有一定程度上的实用性。
的概率P可记为
(10)
ρ的估值以概率1收敛于真实值,根据文献[10],可通过构造动态误差系统分析(dynamic ereor system analysis, DESA)的方法证明相应自校正滤波器可按照实现收敛于最优滤波器。按实现收敛比以概率1收敛的收敛性相对较弱,但在工程上可以采用。在无限时间里该目标跟踪系统的模型参数ρ的估值都能以概率1收敛于真实值,则在无限时间里,自校正α-β滤波器是按实现收敛于相应最优滤波器的,即z(t)是收敛的。当z(t)收敛时,意为一段时间后,自校正滤波器和稳态滤波器之间的误差稳定于某个具体值,该自校正滤波器显然是可以实用的,此时自校正α-β滤波器可以在无限时间里具有实用性。
当ρ>1时,此时ARMA模型不是平稳的,但往往存在一种情形,即存在一崩溃点t0(见仿真实验),当t (a)模型误差方差估值 (a)模型误差方差估值 (b)滤波器误差 当ρ=1.01时,参数估值的模型误差方差估值和滤波器误差如图3所示。由图可见,此时的自校正滤波器崩溃点t0达到3 000 s。 (a)模型误差方差估值 (b)滤波器误差 设ρ=1+ρ0,考察ρ0为0.001~0.100的崩溃点,本文中尝试多个ρ0取值进行仿真实验,实验皆具有崩溃点特性,考察ρ0为19个不同的数,分别为0.001~0.010,以及0.010~0.100,实验仿真考察崩溃点,可画出崩溃点时刻和ρ0的变化曲线(图4)。 (a)ρ0=0.001~0.010 (b)ρ0=0.010~0.100 在实用时,在崩溃点时刻之前可以采用自校正滤波器,当过了崩溃点时刻后,自校正滤波器将快速发散。仿真实验表明,当ρ超出1的一定范围时,在崩溃点到来之前,自校正滤波器是可以实用的。如当ρ=1.01时,崩溃点时刻t0为3 000 s,也就是50 min,说明在长达50 min的时间里,自校正滤波器能较好地跟踪目标,反映了自校正滤波器的实用空间还是很大的。 通过仿真实验可以看到,在与公式(1)、(2)相同或者类似的数学模型对应的实际系统中,在工程上可以构造初等函数来判断t0,比如可以通过构造ρ0和t0为斜率为-1的一次初等函数,来快速地预判t0的估值,这种判断方法在工程上对时间精度要求不高的场合已经够用。如需要更细化的t0的估值,可以通过构造二次、三次初等函数来预判。 实验结果表明,对于公式 (1)、(2)构成的目标跟踪系统,当未知模型参数ρ>1时,存在一个崩溃点t0,在t0到来之前的有限时间里自校正α-β滤波器具有实用性,t0可以通过建立初等函数来快速判断。 ‖z(t)‖≤M<∞ ,当t (11) 自校正α-β滤波器因其结构简单而获得了广泛应用。但人们总是追求完全收敛,忽略了其在参数不收敛时的实用性。本文从理论和实验得到结论,在未知参数估值收敛时,自校正滤波器在无限时间内可以实用;在未知参数估值不收敛的情形下,在一定的时间范围内,自校正滤波器也是可以实用的。本文根据实验观察提出了崩溃点时刻的概念,并提出了构造初等函数来快速判断崩溃点时刻的方法,可以有效拓展自校正α-β滤波器在工程上的实用范围。4 仿真实验与分析
4.1 仿真实验
4.2 实验结果分析
5 结语