基于Levenberg Marquardt 算法的列车最优黏着控制研究①

2023-11-20 08:37:02倪章棚肖广文姚林泉

高技术通讯 2023年10期

倪章棚吴兵肖广文沈铨姚林泉

(苏州大学轨道交通学院苏州215131)(苏州大学数学科学学院苏州 215006)

0 引言

高速列车的制动方式主要包含空气制动和电制动,二者皆为黏着制动,对轮轨黏着利用的要求较高。而影响黏着的因素有轮轨的轮廓和轮轨材料的特性及轮轨界面条件等[1]。在制动施加过程中车轮若进入低黏着区,接触斑内部的摩擦功和黏着区面积、蠕滑力会下降明显且易发生大蠕滑行为[2]。为尽量减少车轮打滑带来的恶劣影响,列车一般组装有车轮防滑保护控制器。最早出现的防滑器是机械防滑器,机械防滑器主要依赖于机械复位性能的好坏[3],后来电子防滑器解决了机械防滑器存在的大部分问题[4],结合防滑电磁阀微机防滑器对进行冲、排压调控[5],可进行更精准的制动控制。控制器的核心是黏着控制算法,常见的传统防滑控制方法有比例积分法[6]、组合校正法[7]、相位移法[8]、蠕滑速度法[9]等,但传统控制方法对环境的变化不能很好地应变。目前被研究最多是智能控制法,主要集中于非线性滑膜控制[10-13]、模糊控制[14]和神经网络控制[15-16]等。文献[17]提出了一种改进的超扭转滑模控制器,能在轮轨界面黏着水平不确定的情况下有效地抑制车轮滑移时间。部分学者发现将神经网络和模糊理论结合后也能良好地控制黏着[18-19],并且相比传统比例积分控制,神经控制器的响应速度更好[20]。对于对滑模变结构控制而言,抖振现象始终是不得不面对的问题。模糊控制对于非线性问题系统有很好的处理效果,但难以建立系统的模糊控制规则[21]。而神经网络控制对于鲁棒控制有着很大的优势,但传统的前馈神经网络容易陷入局部最小点[22]。而Levenberg Marquardt(L-M)算法则解决了这个问题,它既有高斯-牛顿(Gauss-Newton)算法的局部特性又具有梯度下降法(gradient descent)的全局特性,收敛性好而且收敛速度快[23]。文献[24]基于L-M 算法对蒸汽发生器进行了模拟,计算时间大大减少。文献[25]提出以L-M算法为核心的逆运动学迭代算法来对拟人机器人实时控制,算法计算消耗相比于原始算法减少了2 倍,计算速度大幅提高。考虑到列车黏着控制系统为非线性系统且具有较强不确定性,本文将基于L-M 算法的神经网络控制器应用于制动控制,实现最优黏着控制。

本文首先对轮轨作用机理分析研究,然后建立以黏着观测器为核心的蠕滑寻优模型,使在不同轨面状态下系统能估计出黏着系数和寻求黏滑最优点;其次,建立以L-M 算法为核心的神经网络制动防滑黏着控制器,使实际黏着和蠕滑向最优值靠近;最后,分别基于多组不同黏滑特性的轨面和低黏着实验轨面进行了仿真实验,使用四阶龙格-库塔(Runge-Kutta)求解器对整体模型进行求解。仿真实验结果表明,该黏着最优控制策略能够快速搜索黏滑最优峰值并让轮轨黏着稳定在最佳工作点附近,使其发挥出最大黏着作用。

1 轮轨作用机理

列车的牵引或制动行为依赖于车轮与轨道间的接触作用,即轮轨接触。低黏着条件下轮轨黏着较低,车轮容易发生空转或打滑现象,引起轮轨擦伤损坏。对于黏着最佳利用的研究需先从轮轨接触理论与车辆牵引/制动动力学理论开始。

1.1 轮轨黏着-蠕滑机理

高速列车轮轨之间的粘着滑动现象本质上表现为轮轨之间的弹性接触作用。在车体、悬挂系统等载荷作用下,轮轨接触面位置发生弹性变形,形成椭圆形接触区。在力矩的作用下向前滚动时,车轮与钢轨间有相对运动或相对运动的趋势,产生切向力,使轮轨接触面介质发生运动,此时车轮前进速度小于纯滚动时的现象称为蠕滑。图1(a)显示了黏着-蠕滑现象。

图1 轮轨黏着机理

大量的分析与实验结果表明,轮轨间黏着-蠕滑特性可用黏着系数与蠕滑速度的关系表达[26]:

黏滑特性关系曲线如图1(b)所示。可以看出黏滑曲线存在黏着峰值,以峰值点为界,左半部分为黏着区,黏滑斜率关系为正(dμ/dvs ＞0);右部分为滑动区,黏滑斜率关系为负(dμ/dvs ＜0)。

列车在复杂低黏着条件下运行时极易发生控制调整不及时的情况,从而导致轮轨间相对滑动较大。若制动系统控制能力不足,在面临突发情况时会因为制动缓解不及时而导致轮轨大蠕滑现象发生和可用黏着系数降低。此时黏着利用率不能最大化,且可能发生车轮大滑动现象,引起轮轨严重擦伤,影响使用寿命。为最大化利用轮轨黏着和防止在复杂路面下空转/滑行,需将轮轨黏着时刻维持在黏着峰值点附近。

1.2 车辆动力学模型

为简化模型,本文以中国铁路高速列车CRH2型动车参数为对象建立四分之一动力学模型,忽略横向、垂向等自由度运动,未考虑轨面不平顺和轮对垂向受力差异,如图2所示。电机侧转动方程:

图2 四分之一车辆模型

负载转矩方程:

列车运行:

黏着力方程:

其中,Jw、Jm、Jall分别为轮对转动惯量、电机转动惯量、电机轴总转动惯量,Ta为负载力矩,Tm为电机输出力矩,i为传动比,ωm、ωw分别为电机角速度、轮对角速度,r为轮半径,Fμ为与蠕滑速度vs相关的黏着力,vc为车体运行速度,Fr为运行阻力,a、b、c为基本阻力系数,M为车体质量,g为重力加速度。

2 蠕滑寻优

轮轨黏着特性复杂,无法直接测量,往往用黏着系数来量化接触黏着特性。通过速度传感器信息可建立黏着观测器来估计黏着系数。为了寻找当前轨面的最优蠕滑点(即最优黏着点),在估计出黏着系数后根据黏滑历史信息在线寻找当前轨面最优峰值。

2.1 黏着观测器

为避免噪声干扰或者测量误差对系统性能造成的影响,利用传感器得到的角速度等信息,通过配置极点的全维状态观测器即可在线观测得到黏着系数[27]。系统的状态空间方程为

由线性定常系统能观性判据可知系统的能观性矩阵N及其矩阵的秩:

可知矩阵N满秩,满足能观性要求。

根据误差反馈校正原理搭建黏着观测器,其动态方程表达式为

其中,K为增益矩阵,δ为实际黏着系数与观测黏着系数间的误差。可以得到:

若配置极点K1、K2使得(A-KC) 特征值实部小于0,则此时观测器收敛。参考文献[27]本文设置极点K1=K2=-150,最终得到黏着观测器:

2.2 蠕滑寻优

由图1(b)可知:当处于黏着区时,一开始以较大的斜率K几乎呈线性上升,越靠近峰值点K越小;当处于滑动区时,越远离峰值点斜率K绝对值越小。因此,为了快速跟踪蠕滑曲线的峰值点,参照吴能峰等人[28]提出的“最速梯度法”设置目标蠕滑速度:

其中,α=1e-3,β=1e-5。

对于斜率K的计算,采用修正遗忘因子蠕滑寻优算法[29]:

其中,λ为遗忘因子,G为中间变量。

3 最优黏着控制器

最优黏着控制的实质便是在复杂低黏着轨面上制动时,可自动且迅速搜寻出当时轨面的黏滑峰值点,控制系统快速响应,使列车轮轨黏着始终维持在峰值点的附近。

3.1 黏着控制实现原理

控制系统原理如图3 所示。

图3 控制系统原理

图4 神经网络结构

3.2 基于Levenberg Marquardt 的神经网络控制器

采用增量式控制算法修正电机力矩:

其中,u(k) 为修正力矩,e(k) 为误差,yt为期望的输出,y为实际输出,ep=e(t)-e(t-1),ei=e(t),ed=e(t)-2e(t-1)+e(t-2)。

为自适应调整Kp、Ki、Kd参数,建立4 层神经网络结构:1 个输入层、2 个隐藏层、1 个输出层。输入层的3 个输入为蠕滑速度、参考蠕滑速度、蠕滑误差e;隐藏层1 的神经元个数按照公式+c,设为8(m为输入节点,n为输出节点,c为1～10 间任意数)。隐藏层2 含3 个神经元,分别输出Kp、Ki、Kd;输出层神经元输出为转矩。其中隐藏层神经元节点的输入为

隐藏层神经元节点的输出为

网络输出层的输出为

其中,z是前一层神经元的输出,w为权值。

因为利用了近似的二阶导数,Levenberg-Marquardt 算法收敛速度更快,故本文将其作为黏着控制器的迭代更新算法。现对其原理进行如下的说明。

其中,μ为修正系数,I 为单位矩阵,e(x) 为误差,S(xk) 为第k次迭代的误差指数。J(x) 为雅克比矩阵:

上述雅克比矩阵中的偏导,可由链式求导法则[30]得到。如网络隐藏层与输出层间的权值偏导可根据链式法则表示为

网络输入层与隐藏层间的权值偏导可表示为

L-M 算法实现详细步骤见算法1。

4 仿真结果与分析

列车从初速度216 km/h 开始按照CRH2动车组制动曲线进行制动,整体数值模型采用四阶龙格-库塔(Runge-Kutta)求解。

为验证制动防滑策略在任意轨面下的控制有效性,本文基于多组黏着复杂的交替轨面和低黏着轮轨实验数据分别进行了2 组仿真实验。

(1)第1 组。选用3 组具有不同黏着特性的轨面,对轨面交替时的制动防滑控制效果,证明控制系统的适应性。

(2)第2 组。文献[7]在低黏着湿润轨面条件下进行了从低速段(40 km/h)到高速段(400 km/h)的黏滑特性分析实验,在大量实验数据基础上根据Fastsim 算法和Polach 变摩擦理论分析得到不同速度下的黏着特性关系,可用来描述列车速度-黏着-蠕滑间的相互影响。本文将此特性用于模拟列车制动过程中的轨面低黏着状态,并在第5～20 s 间插入一段干燥轨面(见表1),进一步验证干湿轨变换下控制系统的有效性。

表1 黏着特性参数

4.1 基于多交替轨面仿真

对应于式(1),选用3 组具有不同黏着特性的轨面,参考文献[31]设定黏着特性参数,如表1 所示。为验证所提方法的有效性,仿真轨面交替设置0～10 s 油污轨面,10～20 s 干燥轨面,20～30 s 湿润轨面,30～40 s 干燥轨面,40～60 s 湿润轨面。轨面特性曲线见图5。

图5 黏滑特性曲线

从图6 和图7 可知神经网络控制和比例积分微分(proportional-integral-differential,PID)控制2 种方法都能使黏着系数和蠕滑速度达到最佳,但在黏着及蠕滑的表现上可看出神经网络控制的速度更快,后者从轨面切换开始到黏着稳定过程的作用时间约为4.5 s,而神经网络控制时间约为0.6 s,同比下降约86.7%。

图6 2 种控制方式下的黏着系数

图7 蠕滑速度曲线

从图8 可以看出,黏着观测器观测的黏着系数与实际值吻合度较高,在轨面黏着环境突变时刻,观测误差最大不超过±0.08,其余制动过程中的观测误差在0.5%以内,说明黏着观测器的观测效果较好。图6 和图8 同时也表明了在第10 s、20 s、30 s、40 s 轨面交替时,神经网络控制下的轮轨黏着系数和蠕滑速度都能迅速适应当前轨面且分别迅速稳定在黏滑峰值点(0.052,0.54)、(0.14,0.9)、(0.096,1.5)、(0.14,0.9)、(0.096,1.5)附近。稳定后黏着系数的波动在黏着峰值±0.005 范围内,蠕滑波动在蠕滑峰值±0.2 km/h 范围内,说明最优黏着控制器可以很好实现黏着最优。

图8 黏着系数误差曲线

图9 显示出轨面切换时轮对速度和轮缘速度的相对变化,与图10 中制动力矩的调整相对应。可以看出在第10 s、30 s 时轨面黏着状态由低变高,导致轮轨黏着力增大、蠕滑减小,而由于惯性作用列车运行速度(即轮对速度)变化较缓,所以轮缘速度出现短暂增加的现象。同理,列车在第20 s 和40 s 时轨面黏着由高变低,蠕滑增大、轮缘速度减小的趋势更加明显。

图9 轮对速度和轮缘速度的变化曲线

图11 中的步长调整系数μ在第20 s 和第40 s(轨面黏着由高变低)时出现迅速增大的现象,说明此时蠕滑速度与目标蠕滑间的误差迅速增加,μ迅速增大以趋近最速下降法的速度快速修正神经网络控制器中的权值、阈值参数。在第20～30 s 与第40～60 s 内,列车处于低黏着轨道,轮对易出现打滑情况,此时μ变化幅度较大。而由于低速段的原始制动力相比中高速的制动力更大,且控制器需同时适应低黏着轨面,故在40～60 s 内,参数μ的变化幅度最大,制动力调整频繁。

4.2 基于低黏着实验轨面仿真

基于文献[31]的低黏着数据,本文开展了低黏着实验轨面下的黏着最优控制仿真实验,并与PID控制器作对比。为验证黏着最优控制系统依然有效,设置列车初始运行轨面为低黏着实验轨道,稳定行驶5 s 后进入干燥轨面,持续15 s 后再次进入低黏着实验轨面。

列车进入干轨时黏着系数迅速增加,此时蠕滑寻优模块计算出黏滑斜率K的实时变化,如图12 所示。当5 s 后进入干轨时黏滑斜率K为正并迅速增大到0.5 附近,同时图13 显示参数L迅速增大以增加辨识的精度。当列车在20 s 重新运行到低黏着环境时,K立即降为负数,最低为-2.24,黏着跟蠕滑表现异步,说明发生了大蠕滑行为。

图12 黏滑斜率K 变化曲线

图13 参数L 变化曲线变化曲线

而在控制系统的作用下,最终各项指标趋于稳定,其中斜率K最终稳定在0 附近。从图14、15 可以看出,制动系统能很好完成防止大蠕滑出现和达到最优黏着的任务。若给控制系统输出的修正力施加增益n,则会产生不同的控制效果。n越大,控制速度越快,到达最优黏着点的时间也越短,但同时也会增加控制过程中的波动。当n为0.5 及以上时,黏着控制效果差别不大。

图14 黏着系数变化曲线

图15 蠕滑率变化曲线

图16 显示从列车制动开始到停止,相比无控制施加,本文提出的基于L-M 算法的神经网络黏着最优控制和PID 控制作用下的制动时间分别减少21.8%和26.7%,速度衰减更快,见表2。

表2 制动效果

图16 轮对速度和轮缘速度变化曲线

通过图17 和表2 可以看出2 种控制策略下的制动距离均满足文献[32]推荐的220 km/h 速度列车的紧急制动距离限值标准,即2400 m。但相比传统PID 控制,神经网络控制下的制动距离同比降低约4.1%。

图17 制动距离变化曲线

5 结论

针对传统制动控制系统无法使黏着时刻最优的问题,在建立黏着观测器和蠕滑寻优模块基础上,提出将基于Levenberg-Marquardt 算法的神经网络控制器引入到最优黏着控制中。为验证控制器对复杂黏滑特性轨面的适应性,分别就“多交替轨面”和“低黏着实验轨面”进行了仿真实验,并与传统PID 控制器做仿真对比,得到结论如下。

(1)结合轮对角速度等传感器信息搭建全维状态黏着观测器,估计黏着系数与真实黏着系数的误差在±0.08 以内,精度较高。

(2)L-M 算法通过不断调整步长参数μ来修正转矩。在进入低黏着湿润轨道时黏着误差较大,LM 算法趋于梯度下降法,收敛速度快;反之,进入干燥轨道或在黏着平稳状态时算法趋于Gauss-Newton法,收敛精度高。对具有不同黏滑特性的轨面有很好的适应性与自调控能力,黏着稳定时间缩短至1 s内,能完成黏着最优控制的目标。

(3)相对于传统PID 控制器,本文提出的神经网络器的制动性能在制动时间上同比减小4.9%,在制动距离上同比减小约95 m,制动性能较好,且满足220 km/h 制动距离标准。