基于马尔科夫链的并联PHEB预测型能量管理策略研究∗

2018-09-14 01:52解少博李会灵辛宗科
汽车工程 2018年8期
关键词:马尔科夫挡位时域

解少博,刘 通,李会灵,辛宗科

(1.长安大学汽车学院,西安 710064; 2.北京理工大学,电动车辆国家工程实验室,北京 100081)

前言

配置AMT的并联插电式混合动力车辆,能够在发动机、纯电动和动力并联等工作模式之间进行选择,还可避免传统变速器换挡操作带给驾驶员的负担,已成为公交领域广受青睐的车型之一。与此同时,配置 AMT的并联插电式混合动力城市客车(PHEB)的能量管理涉及功率分配和AMT挡位选择两个控制变量,为实现最优的能耗,需要对两个控制变量进行协同优化。

针对插电式混合动力汽车,为选择最优的工作模式从而实现最小的能耗,研究人员提出了多种能量管理策略,如基于规则的策略[1-2]、全局优化策略[3]、瞬时优化策略[4]和基于人工智能算法的策略等[5]。其中,以动态规划(DDP)[6]、随机动态规划(SDP)[7]和庞特里亚金最小值原理(PMP)[8]为代表的全局优化算法应用最为广泛,但DP和PMP的不足之处是只能进行离线优化而无法面向实时应用。等效能耗最小化策略(ECMS)虽然可以实时应用[4],但最优等效因子很难直接获取,常常需要依赖于工况等信息。神经网络等智能算法需要大样本量的数据进行训练来得到预测模型,样本量对其性能有重要影响。

应用马尔科夫链模型进行模型预测控制已有研究,如文献[9]中将驾驶员功率需求看作马尔科夫链,但基于马尔科夫链得到预测车速尚需深入分析,在预测时域内针对并联插电式混合动力客车的含挡位选择与功率分配的二维状态变量优化问题仍需研究;另外,预测时域的长短对能耗、计算时间的影响有待于优化选择,与基于规则和动态规划等策略的差异也需进一步对比。

基于上述考虑,本文中针对一款装有AMT的插电式混合动力城市客车,首先应用马尔科夫模型对车速进行预测,并基于预测车速在滚动时域内进行功率分配和挡位选择的协同优化,同时分析了不同预测时域长度对预测精度和计算效率的影响;最后,与基于规则的策略、基于常规动态规划的策略进行对比分析。

1 并联PHEB结构和系统建模

1.1 整车动力系统的结构和参数

所研究的并联PHEB其动力系统如图1所示,驱动电机与5挡AMT连接驱动车辆行驶。柴油发动机与驱动电机之间连接有离合器,且通过离合器的开闭进行多种驱动模式的切换。整车和主要部件的参数如表1所示。

图1 并联PHEB动力系统结构

表1 整车与零部件参数

1.2 动力系统数学模型

柴油发动机的燃油消耗率Map如图2所示,表达为转速和转矩的函数。

主驱动电机为永磁同步电机,其系统效率如图3所示,表达为转速和转矩的函数。

1.3 电池模型

动力电池为磷酸铁锂电池,标称容量为100A·h,额定电压为537.6V。将电池组看作开路电压和等效内阻串联构成的等效电路[10],开路电压和等效内阻均表示为电池SOC的函数,单体电池特性如图4所示。

图2 发动机燃油消耗特性图

图3 驱动电机效率特性图

图4 电池单体开路电压和内阻随SOC的变化

2 基于马尔科夫链的车速预测

2.1 马尔科夫链模型

以中国典型城市客车运转循环(CCBC)[11]的速度特征为例,进行基于马尔科夫链的车速预测研究。考虑到研究对象为同轴并联PHEB,发动机和电机以转矩耦合的形式输出动力,以驱动轮需求转矩代替整车需求功率进行车速预测。假设第k时刻车速为vm,需求转矩为Ti,经l步状态转移后,需求转矩由Ti转变为Tj的概率为

概括基于马尔科夫链的车速预测过程,主要包含如下步骤:

(1)计算当前车速vk和需求转矩Tk;

(2)根据转移概率矩阵求得k+1,k+2,…,k+lmax时刻的需求转矩转移概率序列…,其中,每一步概率序列最大值对应转矩值即为该步预测转矩值,并用Tk+1,Tk+2,…,Tk+lmax表示;

(3)基于车辆动力学方程,由Tk+1求得k+1时刻的预测车速vk+1;

(4)根据vk+1和Tk+2进一步求得vk+2,以此类推求得预测速度序列。

图5给出了车速为40km/h时不同预测时域(5,10,15和20s)的转移概率矩阵。可以看出,随着预测时域的增加,概率矩阵的对角线分布特征越来越不明显,即需求转矩转移到其他转矩的可能性越来越大。

2.2 车速预测

基于马尔科夫链得到的4种不同预测时域下的中国典型城市工况的速度预测结果如图6所示。由图可见:从整体上观察,预测车速均较好地跟随了实际的工况车速;而对比不同预测时域的结果可知,随着预测时域的缩短,预测速度与实际工况测速偏差越小,预测效果越好。

3 基于动态规划的PHEV能量管理策略

3.1 目标函数

由电池模型可得

式中:Uoc为开路电压;Rb为电池的等效内阻;Qb为电池容量;Pb_out为电池输出端功率。

升降挡模型可表示为

式中:shift(k)为挡位变化值;g(k)为第k时刻的挡位,-1表示降挡,0表示挡位不变,1表示升挡。

将SOC和AMT挡位作为状态变量,发动机输出转矩作为控制变量,系统的状态转移方程为

图5 车速为40km/h时不同时域的需求转矩概率转移矩阵

图6 4种不同预测时域车速预测结果

式中:k为时间步;shift为挡位值。

本文中采用能耗成本作为指标衡量能量管理策略的性能,系统瞬时成本函数定义为第k步不同挡位和发动机输出转矩下燃油成本(元)和电耗成本(元)之和,该函数可表示为

式中:Lh,l,m为第h个SOC离散值、第l个挡位且第m个发动机转矩离散值对应的瞬时能耗成本;Cfuel和Cele分别为瞬时油耗成本和电耗成本;nice和Tice分别为发动机的转速和转矩。

油耗成本计算公式为

式中:pfuel为柴油单价;Pice为发动机输出功率;be为发动机油耗,通过发动机油耗Map查表得到;ρfuel为柴油密度。

电耗成本计算公式为

式中:pele为电价;I为电池电流。

3.2 动态规划算法

根据贝尔曼最优性原理,以能耗成本最小为性能指标的离散形式动态规划迭代格式为

当 k=kmax时,

式中:Jk为第k阶段(第h个SOC离散值、第l个挡位且所有可能发动机输出Tice)到终止阶段的最小累计能耗成本值;Jk+1为k+1阶段所有可能的离散状态下的最小累计成本;i为发动机的指标量,其集合为I。

4 预测型能量管理策略

基于预测的车辆速度,在预测区间实施动态规划从而得到最优的发动机转矩输出和AMT挡位选择,同时不断更新预测区间,从而实现滚动时域内的能量管理策略,即第k阶段预测时域为lmax时动态规划目标函数为

式中:l为预测步长,其最大值为lmax;φ()为惩罚函数。对SOC进行约束以避免SOC下限值低于参考值出现电量提前用完的情况,其表达式为

式中α为常数,计算过程中取值为105。

5 基于规则的控制策略

为与基于动态规划以及预测型能量管理策略进行比较,还进行了基于规则的并联PHEB能量管理策略的研究,其中的放电模式选择CD-CS策略。考虑到动态规划和预测型策略均为后向仿真,为使不同控制策略的比较更加公平,在换挡策略的设计过程中,选择的双参数换挡规则采用车速和驱动轮需求转矩作为挡位变化条件。综合协调动力性和经济性两方面,制定的换挡规则如图7所示。

从图7可以看出,该规则是由发散型和等延迟型换挡规则相结合而成。随着车速的增大,挡位切换阈值逐渐增大。随着需求转矩的增大,换挡延迟逐渐增大,且当需求转矩大到一定值时,换挡延迟保持不变。

图7 双参数换挡规则

图8 不同预测时域长度的SOC曲线

6 比较与分析

为验证所提出的基于马尔科夫链的预测型能量管理策略的性能,选择10个连续的中国典型城市客车运行循环(共计59km,3.65h)进行仿真分析。设定电池SOC的初值为0.7,SOC最小值为0.3。首先,分析预测时域分别为5,10,15和20s时的结果;在此基础上,进一步与基于规则和常规动态规划方法进行比较。

图8为4种不同预测时域长度下的SOC曲线。可以看出,除预测时域为5s的情况,其它3条SOC曲线彼此较为接近,即反映出相似的放电规律;同时,随着行程的增加,SOC曲线在下降过程中呈现周期性波动,这是由于选择的仿真工况为10个连续工况,即工况不断重复。相应的油耗曲线如图9所示。可以看出,油耗增长曲线与SOC曲线有相似的对应关系,原因可归结为在相同的需求功率下,相似的电池放电规律使燃油消耗也呈现出相似的增长规律。

图9 不同预测时域长度的累计油耗

定量结果如表2所示。可以看出,4种预测时域下的电耗、油耗与综合成本均较为接近,但运算时间却随着预测时长的增加剧烈增长,即随着预测时域的增大,整车的能耗成本变化并不显著,而计算时长却显著增大,主要原因为在较大的预测时域内,实施动态规划算法的时间也较长,从而导致整个行程的计算时间随着预测时域的增加不断增长;且误差效应会逐步叠加,使较长预测时段的结果没有得到显著提升。基于上述分析,选择10s作为模型预测控制的预测时域长度。

表2 不同预测时域的仿真结果

基于CD-CS,DP和MPC 3种方法的仿真曲线如图10和图11所示。

图10 不同策略SOC曲线

图11 不同策略累计油耗曲线

由图10可见,CD-CS策略的SOC曲线明显地分为CD和CS两个阶段,基于DP策略得到的SOC曲线近似呈线性变化,MPC策略所得SOC曲线存在波动特征。在行程终点,SOC末值均达到0.3左右。由图11可见:对基于规则的CD-CS策略而言,由于在CS阶段的SOC维持在0.3~0.35的区间范围内,累计油耗呈现增长—维持—增长的趋势;DP和MPC的油耗随着行程不断增长,但在同一时刻后者要高于前者。

图12为3种策略得到的电机和发动机工作点分布。可以看出,CD-CS策略下电机工作点多集中在转速1 000~2 000r/min,转矩±300N·m范围内;DP算法得到的电机工作点呈现分块集中特征,低、中和高速均有分布;而MPC策略的电机工作点覆盖范围更广。至于发动机的工作点,CD-CS策略沿着最优能耗效率线工作,DP选择的工作点数较少,MPC覆盖了更多的区域,主要是由于MPC是在局部区域(预测区间)进行寻优,而DP是在整个行驶工况进行最低能耗点的寻找。3种方法工作点分布不同的原因除了与行驶工况的特征有关外,还与能量管理算法所确定的挡位有关,因为挡位选择与能量分配两者互相关联,从而导致三者呈现不同的能耗特征和经济性。

图13为3种策略5个挡位的使用时间分布图。由图可知:CD-CS策略挡位使用频数由大到小的顺序为1-3-4-2-5;DP策略挡位使用顺序为5-1-4-3-2;MPC策略的挡位使用顺序为1-5-4-3-2。分析可知,CD-CS和MPC策略使用1挡最频繁;而对比DP与MPC可知,DP使用5挡最频繁,其次为1挡,而MPC使用1挡最频繁,其次为5挡,其余3个挡位的使用频率排序一致。

表3为3种能量管理策略的仿真结果。由表3可知:CD-CS策略产生了最大的油耗,其总能耗成本也最大;而DP策略作为全局最优策略,具有最小的能耗成本,相比CD-CS策略节省成本40.1%;MPC策略相比于 DP策略,其综合成本增加了17.3%,但同为面向实际应用的策略,MPC策略比CD-CS节省成本约29.7%。

图12 不同策略电机和发动机工作点分布

图13 不同策略下各挡位工作时间分布

表3 不同策略的仿真结果

7 结论

针对一款装有AMT的并联插电式混合动力公交车的能量管理展开研究,得到了基于马尔科夫链的预测型能量管理策略。

(1)应用马尔科夫链模型计算转矩状态转移概率,以中国典型城市工况为例,得到不同预测时域下的预测车速;基于预测车速得到了预测型能量管理策略。

(2)针对带AMT的并联插电式混合动力客车,将挡位和电池SOC作为状态变量,将发动机转矩作为控制变量,得到基于二维动态规划算法的能量管理策略。

(3)针对模型预测控制,分析了不同预测时域长度对整车能耗成本的影响。结果表明,随着预测区间的增加,能耗成本并不会显著降低,而计算耗时却会迅速增加。

(4)同时将基于规则、基于动态规划和基于模型预测控制的3种能量管理策略进行对比分析。结果表明,MPC策略能耗比DP策略增加了17.3%,与CD-CS策略相比,其能耗降低29.7%。

猜你喜欢
马尔科夫挡位时域
OFDM 系统中的符号时域偏差估计
基于三维马尔科夫模型的5G物联网数据传输协议研究
马尔科夫链驱动的带停时的超前倒向随机微分方程的适应解
基于叠加马尔科夫链的边坡位移预测研究
道路载荷谱原始数据处理算法的研究
硬件时域门技术在宽频带天线罩测试中的应用
频域滤波产生的时域端点效应及避免方法
网络分析仪时域测量技术综述
马自达6车变速器挡位错乱
马尔科夫链在企业沙盘模拟教学质量评价中的应用