姜森浩,孙鹏飞,金 波,张佳辉
(西南交通大学电气工程学院,成都 611756)
国家铁路局印发的“十四五”铁路科技创新规划指出,我国需进一步强化先进载运装备技术研发,推动重载列车成熟运用,实现大宗货物重载化、快捷货运高速化。重载列车编组长、行车密度高、牵引质量大,且货运线路具备跨越路程长,山区多的线路特征,起伏的坡道上会形成复杂的线-车耦合关系,增加了司机人工驾驶的操纵难度与风险。列车辅助驾驶技术(drive advisory system,DAS)会帮助指导司机行车,实现安全、节能、正时和平稳的运行,辅助驾驶的核心技术之一即是列车的速度曲线规划。二次规划模型是通过重载列车模型分析的一种代表性的速度曲线规划方法,其优点是解算速度快,求解质量高,但二次最高项的限制使得模型难以进一步精细化。二次规划的目标函数是一个基于节能、正时和平稳的线性加权函数,权重的不合理分配会导致列车中途停车,达不到多目标优化的目的。文献[5]提出了一种动态分配的权重分配算法,但这种方法适用于线路环境平缓的高铁或路程站间距短小的地铁,对于重载列车这类复杂模型的多目标优化,却缺乏相应的权重对多目标量化影响的具体研究。
数据驱动方法从整体上可分为两种,一种是基于数理统计,如回归、拟合模型、贝叶斯模型等;第二种则基于机器学习,如神经网络、支持向量机等。数据驱动更关注于输入输出的关系,中间的建模过程趋于统一,如神经网路结构、多元线性回归等模型内部结构和参数设计一致,但可解决不同领域的问题。列车速度曲线建模的复杂度随考量车辆因素的增多而升高,因此数据驱动方式在速度曲线规划领域有较多的应用。文献[8]以神经网络进行速度曲线建模,但模型缺乏灵活性,仅适用于单车特例。文献[9]搭建了以降低车钩力和能耗的Q学习网络(DSQ-network),实现了稳定的收敛速度。为了在多重干扰影响下依旧保持动车组的舒适性和节能优化,文献[10]提出了一种将专家系统和强化学习融合的规划列车运行方法。既有研究已经证实机器学习方式能解决列车速度曲线规划问题,但面对高复杂度的重载铁路,数据驱动方式依然有优秀样本不足、学习特征不明显的弱点。因此以成熟的二次规划模型训练数据驱动模型成为一种有效的解决方案。
综上,本文旨在以数据驱动的方式解决速度曲线规划问题。首先建立基于二次规划的重载列车速度曲线多目标优化模型,同时提出与多目标优化相匹配的权重回归解算方法,从提高解算效率和稳定性出发,以神经网络的方式对速度曲线进行优化,以达到重载列车节能、正时、平稳运行的目的。
列车运动模型在运行过程中受到牵引力、制动力、基本运行阻力和附加线路阻力的影响。制动力包括气动制动和电制动。为了区分制动模式,这些独立的制动力被单独考虑。列车的动力学模型可用下式来描述。
其中,,是列车的速度、公里标位置和运行时间。是列车总质量,是旋转质量系数。()为列车牵引力,()为列车电制动力,()为列车空气制动力,这些力可视为由确定的函数。(,)是由列车速度和列车位置共同决定的列车运行阻力,其中变量的考量基于运行中一直固定作用的坡道、曲线等附加阻力,变量是以基本阻力为主,由与速度项一次相关的机械阻力和与速度项二次相关的空气阻力构成。在本文中(,)列车运行阻力由基本运行阻力,曲线附加阻力和坡道附加阻力组成,见下式。
重载列车动力学模型示意图如图1所示。重载列车多采用大功率交流异步电机作为传动动力,因此其受到启动电机最大电流、电机最大功率和最深磁场削弱等限制。电机的转矩通过传动装置最终传至机车轮对,因此列车的牵引特性也受到动轮和钢轨的粘着特性影响。机车设计有构造速度的相关限制,这取决于机车中各个部件的最高限速,如以齿轮箱和电机匹配的最高转速等因素。由于交流电机的可逆性,电制动力也符合机车电牵引力的相关特性的规律。列车牵引特性曲线如图2所示。
图1 重载列车动力学模型示意图
图2 列车牵引特性曲线
综上所述,重载电力列车的牵引特性表现出明显的随速度非线性变化的特征。
可以看出,列车的动力学模型是由连续的、非线性化的微分方程组成,其多目标函数存在微分和倒数形式。复杂形式的方程不利于问题求解和工程应用,因此需要对初始模型进行离散化和近似化处理。本文以运行里程作为自变量对各变量进行离散化,离散步长设置为Δ,根据运营里程将变量分为段。鉴于后文中速度变量作为一次项无法实现原问题的线性化,因此动能作为速度的替代变量。列车速度曲线模型示意图如图3所示。
图3 货运列车速度曲线模型示意图
同理,控制变量牵引力、电制动力和空气制动力可以按照离散步长叠加成一个(×1)矩阵。
基于重载列车节能、正时和平稳的优化目标,列车运行的多目标优化函数可描述如下:
其中、和分别为列车能耗、正时性、平稳性对应的非负权重值。
本文采用二次规划(quadratic programming,QP)方式对上式进行数值计算,标准二次规划如下式。
事实上,司机正常行驶都可从起始点到终点形成连续的速度曲线,这些速度曲线对应的解虽然均是非优于QP模型的最优解,但都符合约束条件,因此该算法具有较高的稳定性,可较好地用于工程实践。
为进一步探究实际线路中、、权重对各目标量的具体影响,本节基于权重建立了速度曲线多目标的回归模型。首先,设置权重值的意义在于优化问题中平衡多个目标量的标量数值。例如权重集合[6,1,2]和权重集合[3,0.5,1]得出的轨迹曲线是完全相同的。重载列车速度曲线需优化三个性能指标,但本质上仅有两个自由度,所以研究权重更有意义。本文采纳的方式是以为基准,为了避免变量冗余,设置为固定值1,、即可视为完全独立的权重变量。QP模型建立后,可将正时运行时间、能耗和列车平稳性看作和的函数。、、分别对应运行能耗,运行时间,牵引力变化量Δ,三者的统计分布如图4所示。
图4表示了独立权重因子、为变量时,对各指标的影响分布图。从图4a和图4b中可以明显看出,节能和正时是一对矛盾的变量,其性能指标随能耗权重和正时权重单调变化,这也验证了已有的列车速度曲线优化理论相关结论。从能耗指标来看,其指标分布基本处于线性分布。而列车正时性则完全不具备类似能耗的线性分布趋势,因为时间的计算具备明显的非线性因素,呈现“两头宽,中间紧”的分布态势。当、的其中之一处于较高数量值时,另一权重因子在很大的区间范围内调整但运行时间变化不大。根据实际经验比对,人为倾向的曲线一般位于“中间紧”的区段,即速度时间变化较大的区间,因为这段区间不易出现停车的问题,且速度对线路有较好的适应性。平稳性权重在上文中设置为1,在,坐标系下,平稳性指标本质是处于分母上,在很大程度上受到坡道数据的影响,因此充满了不规律性。当权重逐渐提高时,主要呈现出越接近原点平稳性指标越好的特征,这也印证了平稳性指标本质位于分母的设计。整体来讲,权重对平稳性指标的影响呈现的规律具有不确定性因素。
图4 统计分布
以上我们总结了权重对各指标的影响分布的相关规律,这些规律是我们通过权重策略因子调整行车方法的重要基础和依托,是回归模型搭建的理论依据,对替代人工手动调试参数具有重要意义。
其中为样本点的个数,为误差项,且满足()=0,()=。两侧进行对数运算,可得到对能耗的回归模型。
多元非线性回归本质上可等效成一般的线性回归方式,能耗模型本质上也是多元非线性回归的一种特例。如下式,是基于自变量权重的函数。理论上,采纳的回归函数数量、形式越多,其预测结果越精准,但在样本边缘的采样点会出现异常的震荡偏差。因此一般采用方差膨胀因子来评估回归方程式的共线性程度。
根据理想坡道的理论推导可知,运行时间的倒数平方和权重因子的比例形式成正比,因此回归方程式采纳如下形式。
经实验统计,采用上式的方差膨胀因子为6.87,符合低于10的统计标准。而如采用一般多项式的方式,一般非线性函数达到4个就会不再满足共线性标准,且复相关系数远低于上式。
支持向量回归(support vector regression,SVR)是一种基于支持向量机(support vector machine,SVM)的回归算法,它基于统计学习中结构风险最小化原则,将经验风险和置信区间最小化,这种机器学习模型善于处理具有非线性特征的小样本数据。对于低维样本空间内无法线性处理的问题,通过核函数将样本数据特征映射到高维空间,并在高维空间内建立最大间隔分类(回归)超平面。同时引入了不敏感带,以对边界数据进行校正,见图5。
图5 线性回归函数的不敏感带
优化问题可转化为:
为惩罚系数,本质上是模型对误差的惩罚度,起正则化的作用。如果不断增大,会使得处于敏感带上的样本点减少,同时支持向量也会较多,模型会更为复杂,的范数又会限制模型的复杂度,防止过拟合现象的发生。
非线性特征映射与核函数相对应,它以隐式方式定义了一个从低维到高维的特征映射,并同时具备内积相同,即(,)=()()的重要性质,因此可以不用无穷维特征空间的内积。常用的核函数可以由线性、多项式核函数、Lapcian函数、径向基函数(Gaussian核函数)和sigmoid函数等构成。最终能耗、正时和平稳度基于数理统计的回归结果见表1。
表1 回归模型结果对比
人工神经网络由多个赋有权重和激励函数的神经元组成,且彼此间存在一定顺序的堆叠和联接,通过对大量含标签的可靠数据进行训练,它可以对数据输入输出关系进行学习,以实现对未知函数的拟合计算。对于没有传统规则和复杂建模的问题,神经网络可避免复杂的数学理论推导,具备其独特的优势。神经网络仅关注输入输出关系,善于处理大量的样本数据,因此在速度曲线规划算法领域具有一定的潜力和优势。
如图6所示,神经网络一般由多层组成,通常多层前馈神经网络是最为基础的结构组成。网络接收外部数据的层是输入层,产生回归或聚类结果的层是输出层,它们之间是隐藏层,主要负责神经网络模型的计算,其层数通常可以根据问题的复杂程度进行调整。各层之间由多个计算功能的神经元组成,各层神经元通过权重向量相互连接,神经元接受外输入后,经激活函数向外部输出结果。
图6 人工神经网络结构
神经网络规划器是本文速度曲线算法的最基本组成单位,其结构组成如图7所示,输入-输出结构具有以下形式:
图7 神经网络规划器输入输出结构组成
其中、为列车实时速度和加速度,、为权重决策因子,F为未来线路的列车阻力数组,为列车运行的限速数组,为列车的追踪巡航速度数组。
首先,列车的实时信息模块由列车实时运行速度和加速度构成。列车实时运行速度是神经网络最为重要的行车参考,加速度的引入基于规划器模型对平稳性的考量,列车只有获取当前的加速度,才可以判断进行实时大制动、大牵引力转换的适度。权重决策因子模块决定了列车操纵策略倾向,对列车的正时指标有重要作用。车辆信息模块的加入是为增强神经网络规划器普适性,由于列车不同,其阻力特性、牵引计算特性也会变化,因此编组信息模块使得神经网络模型学习并适应不同类型的牵引机车、不同载重和车辆编组情况。未来线路信息是规划列车行车的考量依据,如果神经网络规划器缺乏对未来线路的考量,实时输出的决策变量将会缺乏前瞻性,在面对未来区段的长大坡道,甚至会出现列车速度触及安全保护曲线等问题。
为了验证本文所提控制算法的有效性,选取国内1万吨标准化重载机车编组,分别在虚拟和真实线路环境下进行仿真验证,仿真参数见表2。
表2 重载列车仿真关键参数
本文2.2节建立了基于神经网络的速度轨迹规划算法,这一算法的评价方式是计算QP输出的控制量和神经网络规划器输出之间的均方误差。为了验证神经网络构建的数学模型的有效性,本文设置了一段60 km的虚拟线路,区间内包含两段不同的限速和巡航速度区间。
图8为神经网络规划器输入输出结构组成,从图中可以看出,基于神经网络得到的列车控制量基本相同,控制量均方误差为0.0013,列车运行速度在安全范围以内,速度均方误差为0.187 m/s,最大速度偏差1.7 m/s,这体现出神经网络规划算法具备QP算法的速度曲线规划能力,可实现安全、节能、较好速度追踪性和平稳性的驾驶目标。同时,为了进一步验证神经网络算法的结构在实时计算方面的优越性,本文设置了基于QP的速度曲线算法作为实验控制组,使用Matlab中以内点法为原理的Quadprog方法,实验组基于神经网络算法建立在Pycharm平台Python 3.6模型中建立,并采用Keras深度学习框架。计算实验环境为2.6 GHz的Intel Core i5-9300H处理器、8 G RAM的计算机。各算法的计算时间见表3。
图8 神经网络规划器输入输出结构组成
表3 算法效率结果对比
在离散步长较大的情况下,三种方法可以在很短的时间内完成速度轨迹规划。随着维数的增加,基于内点法的Quadprog计算时间呈现出单调上升的趋势。对照组的速度曲线规划时间基本上与需要计算的离散维度成正比。神经网络的线性结构使算法更加稳定可靠,整个实验中没有出现异常长时间的计算。
图9显示了人工驾驶和神经网络规划的速度曲线对比,可以发现司机的驾驶经验与神经网络算法的部分区段保持一致,司机控制方法也与神经网络保持一致。例如,270 km处的制动,380 km处的牵引方式两者具有相同的控制规律。但在345 km处,人工驾驶方式采纳了牵引工况,对前方50 km时速限速却缺乏考量;而神经网络规划算法则一直维持惰行工况,仅在限速前进行制动。从能量消耗的角度来说,神经网络规划算法减少了牵引走行距离,也因此避免了多余的制动,因此具备节能的特点。
图9 人工驾驶运行数据和神经网络规划算法对比
最后经计算得出两种方式的性能指标结果,如表4所示。基于神经网络规划算法的速度曲线与人工驾驶的驾驶速度曲线相比具有较小的波动性,在与人工驾驶接近的区间运行时间153.7 min情况下,神经网络规划轨迹的能耗为2594.7 kW·h,远低于人工驾驶的能耗3569.2 kW·h,节能率约27.3%,且牵引力变化量仅为人工驾驶的三分之一,更能符合列车平稳驾驶的要求。
表4 人工驾驶神经网络与算法性能指标比较
以上几节中,基于神经网络算法的速度曲线规划掌握了QP速度曲线的驾驶策略,但其针对的是相同固定策略权重的轨迹曲线,缺乏相应动态时间约束下的验证。因此,本文的下一仿真实验将重点关注列车重新规划致使最优权重因子改变的场景。
重载车运行过程中,由于列控系统的影响,列车可能在区间信号机前出现临时停车、临时限速的情况。如果前车发生故障,会对后车自动生成临时限速,这是对速度曲线规划的重大干扰,既有的列车速度曲线不再适用。图10描绘了一个没有特殊速度限制的路段(固定为每小时75 km)。实线速度剖面是计划运行时间为11519.7 s的计划轨迹。列车在0~6 km之间保持正常运行。在6 km处,列车收到远方10~20 km(距前端4 km)处的临时限速信号。首先,出于安全考虑,列车速度开始下降,控制变量开始下降,列车惰行一段路程。由于临时限速,计划运行时间产生偏差,优化计算单元中的权重选择模块开始更新策略系数。根据上图比较,更新策略的速度曲线减少了速度曲线的波动,通过更高的能耗弥补了时间差异。
图10 临时限速下的神经网络规划算法结果(速度-位置)
从速度-时间图(见图11)中可明显推断出临时限速造成的时间偏差超过5 min(311.2 s)。列车运行在370 s时接收限速信号,实线曲线作为参照,默认未收到限速信息;长线段曲线收到信号,但维持相同的驾驶策略;点线曲线基于性能指标的回归方法更新了权重因子,同时弥补了由于限速导致的时间偏差。仿真结果表明,实线和点线总运行时间的偏差在30 s以内,基于性能指标回归的神经网络算法可更好地达到节能、正时和平稳的需求,且可以灵活地调整合适的权重因子来进行多策略的速度曲线规划。
图11 临时限速下的神经网络规划算法结果(速度-时间)
本文以数据驱动的方式实现了重载列车以节能、正时和平稳为目标的速度曲线规划,以列车动力学为基础模型,转化为标准二次规划问题,并以数理回归统计和神经网络的方式实现了权重选择和高效灵活的多目标速度曲线,得到以下结论:
(1)优化目标回归模型的建立,使得基于QP的多目标优化权重和速度曲线有了精确、可量化的关系,同时为基于神经网络的速度曲线规划算法提供了决策因子的相关理论基础;
(2)神经网络规划模型可以较好地学习QP规划的策略,并在节能性、正时性和平稳性上优异于司机人工行车;
(3)神经网络规划模型算法效率更高且稳定,更适用于精细化建模,且融合的策略因子模块使得模型针对突发情况具有更好的灵活性。