孙 超 ,刘 波,孙逢春
(1.北京理工大学 电动车辆国家工程研究中心,北京100081,中国;2.北京理工大学 深圳汽车研究院,深圳518118,中国)
中国《新能源汽车产业发展规划(2021—2035 年)》中指出,发展新能源汽车是中国从汽车大国迈向汽车强国的必由之路。新能源汽车以电驱动为主要特征,是实现交通节能减排和能源结构优化的重要途径,包括纯电动汽车(battery electric vehicle,BEV)、插电式混合动力(含增程式)汽车(plug-in hybrid and rangeextended electric vehicle,PHEV)和燃料电池汽车(fuel cell vehicle,FCV)[1]等。2022 年上半年,中国新能源汽车销量为260 万辆,同比增长129.2%,在新车市场的占有率达到21.6%,销量占全球总销量的61.6%[2]。美国、日本、欧盟等世界主要发达国家和经济体也在积极推进汽车电动化转型,发展新能源汽车已成为国际共识。新能源汽车节能技术能够有效增加车辆续航里程并降低使用成本,对新能源汽车的高质量发展和推广应用具有重要意义。除了提高动力电池比能量、电机效率和轻量化水平等方式,综合运用运动规划、智能控制和车联网等技术手段[3-4],进一步提升新能源汽车的节能效果,是当前研究的重要课题。
新能源汽车节能规划与控制包括节能路径规划(eco-routing)、节能车速规划(eco-driving)、节能充电规划(eco-charging)和能量管理(energy management),其技术体系如图1 所示。围绕节能目标,新能源汽车首先根据路网拓扑和路段能耗进行导航路径规划;然后根据导航路径上的全局行驶约束进行长期车速规划,并根据局部动态环境进行短期车速规划;之后根据目标工况计算整车功率需求,具有多个动力来源的新能源汽车还需通过能量管理实现不同动力部件之间的功率分配;最后通过动力系统和转向系统控制实现整车运动;针对充电问题,新能源汽车可以在行驶或停车时根据剩余电量进行充电选址或充电行为规划。此外,由于新能源汽车节能规划与控制的不同任务之间可能存在耦合关系,如PHEV 的节能车速规划还涉及动力系统的能量管理,通过多任务集成与协同优化提升整体节能效果也日益受到众多研究者的关注。
图1 新能源汽车节能规划与控制技术体系
当前,信息化和网联化技术极大地增强了车辆的信息获取能力[5],对新能源汽车节能规划与控制技术的进步起到了重要推动作用。具备车联网(vehicle-toeverything,V2X)通信能力的新能源汽车可通过车辆对基础设施(vehicle-to-infrastructure,V2I)通信获取信号灯和交通流状态等信息,通过车辆对车辆(vehicle-tovehicle,V2V)通信和车辆对行人(vehicle-to-pedestrian,V2P)通信获取周围车辆和行人的运动状态和意图,从而进行更加精准的路径规划、车速规划和能量管理。研究表明,网联式汽车在高速场景下利用道路坡度和交通信息可节省3%~20%的能耗[6-7],在城市多交叉口场景下利用信号灯信息可节省10%~40%的能耗[8-9]。此外,车辆到电网(vehicle-to-grid,V2G)互动技术使新能源汽车成为电网中的可控充放电节点,在充电规划中不仅可以实现削峰填谷、频率调节和可再生能源的平稳集成,还能够实现车辆和电网层面的能耗优化。
本文围绕新能源汽车节能规划与控制,对路径规划、车速规划、充电规划、能量管理和多任务集成优化技术的研究现状进行综述,并提出未来的发展趋势。
节能路径规划(eco-routing),即生态路由[10],是指基于路网信息,以车辆起止点之间能耗(或排放)最优为目标,在出行前或行程中规划出满足行车约束的行驶路线,从而实现节能减排的技术,相关研究如表1 汇总所示。在不同的路网拓扑和交通条件下,相比最短时间路径,节能路径往往能够降低3%~15%的能耗,并可同步减少排放(如CO2、CO、HC 和NOx)高达20%左右[11-14]。使用多目标节能路径规划方法不仅能够降低能耗和排放,还可以有效缩短行驶时间[15]。此外,传统内燃机汽车(internal combustion engine vehicle,ICEV)的节能路径规划和车速规划技术对新能源汽车具有借鉴意义,因此本文也将其作为研究对象进行讨论。需要注意的是,新能源汽车动力系统更为复杂,对问题的建模和求解提出了更高的要求。本节充分调研了BEV 和ICEV 的节能路径规划研究进展。PHEV 和FCV 的节能路径规划与动力系统能量管理强耦合,因此在第5 节进行介绍。
表1 节能路径规划研究
路网拓扑结构可以用加权的原始图或伴随图表示,图中每条边的权重表示能耗高低。在原始图中,节点和边分别表示路口和路段。为了提高模型表征能力,伴随图将原始图中的节点转化为多个与车辆运动行为相关的边,并将原始图中的边作为节点。节能路径规划问题可以描述为加权图上的最短路径问题,并进一步建模为二元整数规划(integer programming,IP)问题。控制变量为选路决策,表示对每个路段的选择与否。约束条件包括固定的到达时间[12]、随机概率描述的到达时间[16]、动力电池荷电状态(state of charge,SOC)或能量状态(state of energy,SOE)以及CO2排放[17]等。Lagrange 松弛技术可以将约束放宽并作为Lagrange 项添加到目标函数中,从而将原约束优化问题转化为无约束多目标优化问题。不同优化目标下的最优路径之间存在一定的联系。根据碳平衡关系,CO2排放最低路径通常与油耗最低路径相同,但与NOx排放最低路径往往不同[18]。能耗最低路径通常也能减少行驶距离[11],但可能会增加行驶时间[19]。
为实现节能目标,建立准确的路段能耗模型十分关键[20]。M.Kubička 等[21]复现并比较了已有路径规划方法下的能耗最低路线、距离最短路线和速度最快路线,发现不准确的路段能耗模型可能导致错误的结论。路段能耗取决于车辆能耗特性、工况、天气和道路坡度等。车辆能耗特性通常用微观能耗模型表示,如针对ICEV 的CMEM[22]、VT-Micro[23]、VT-CPFM[24]等油耗/排放模型[25],针对BEV 的考虑再生制动效率的VT-CPEM[26]等电耗模型。一方面,路段能耗可以通过神经网络(neural network,NN)或线性回归等方式进行拟合[27]。比如,C.De Cauwer 等[28]以交通、天气和道路信息作为NN 的输入,预测正/负单位里程动能变化量和有效车速,然后将其和路段长度等信息输入线性回归模型,实现了BEV 路段电耗估计。另一方面,路段能耗可以用已有的微观能耗模型表示,并且非常依赖车速和加速度等工况信息。早期的部分研究假设车辆在每个路段匀速行驶且相邻路段间的速度可以跳变[29],通过工况简化降低了问题复杂度,但是难以达到最优效果。为了体现速度的连续性,M.Y.Nie 和LI Qianfei[17]假设车辆在路段交界处以匀加减速模式行驶。在此基础上,G.De Nunzio 等[13]提出的BEV 路段能耗模型还考虑了信号灯等交通基础设施引起的加速度项,相比基于平均速度的能耗模型,降低了27%的能耗估计误差。
节能路径规划方法分为图搜索算法、数学规划算法和元启发式算法。图搜索算法在加权图中搜索代价最小的路径,具有多项式时间复杂度,适用于无约束最短路径问题。针对有约束路径规划问题,数学规划算法和元启发式算法是常用的解决方案。数学规划算法能够获得精确解,还可以解决随机优化问题,但计算成本较高。元启发式算法是一种独立于具体问题的通用启发式策略,通过权衡全局搜索和局部搜索,能够在可接受的计算开销下得到问题的近似解,具有良好的鲁棒性、可扩展性和并行计算能力。
1.2.1 图搜索算法
用于节能路径规划的图搜索算法有Dijkstra、A*和Bellman-Ford 等算法。Dijkstra 采用贪心策略选取未被访问的最小权值节点,然后对其临边进行松弛操作,求解速度快,但要求图中无负权边。因此,Dijkstra 常用于以最短距离或最短时间为目标的传统路径规划和面向ICEV 的节能路径规划[18]。A*是Dijkstra 算法的扩展,采用启发式函数估计下一节点到目标节点的代价。胡林等[30]提出了一种考虑信号灯的路径规划方法,将通过信号灯路口的交通流近似分为4 个阶段,并结合信号灯信息和阶段通行能耗,使用A*算法求解最优路径。Bellman-Ford 算法需要对所有边进行松弛操作,计算量高于Dijkstra。但是凭借适用于负权图的独特优势,Bellman-Ford 算法在新能源汽车节能路径规划中得到了广泛应用[13,31]。实车试验表明,基于Bellman-Ford 算法的BEV 节能路径规划能够增加12%的续航里程[32]。此外,为了使图搜索算法能够处理时间约束,K 则最短路径算法基于图搜索寻找代价最小的前K 条路经直至满足约束[12],但计算量也因此显著增加。
1.2.2 数学规划算法
用于节能路径规划的数学规划算法主要涉及整数规划和凸优化方法。整数规划问题是一类非线性非凸的NP 完全问题,计算复杂度较高,可以使用分支定界法、割平面法或相应的数值求解器进行求解。M.Y.Nie 和LI Qianfei[17]考虑CO2排放约束,使用求解器CPLEX 求解能耗和时间双目标最优路径规划问题。为了降低计算难度,整数规划问题可以在合适的条件下转化为更易求解的凸问题。凸问题是定义在凸集中的凸函数最优化问题,其局部最小值必为全局最小值,因此在计算效率上具有显著优势。SUN Jie 和X.H.Liu[33]基于Markov 决策过程建立单一目标最优的随机节能路径规划问题,并将其转化为有约束的线性规划(linear programming,LP)问题,最后采用标准方法求解。假设路段能耗符合正态分布,YI Zonggen 和H.P.Bauer[34]提出了一种随机能耗感知的节能路径规划框架,通过凸松弛和变换将原问题转化为二阶锥规划(second-order cone programming,SOCP)问题,并采用内点法(interior point method,IPM)得到了最优解。
1.2.3 元启发式算法
用于节能路径规划的元启发式算法包括遗传算法(genetic algorithm,GA)、粒子群算法(particle swarm optimization,PSO)和蚁群算法(ant colony optimization,ACO)等,其中GA 和PSO 算法流程对比如图2 所示。元启发式算法能够在较短时间内获得问题的近似解,能够用于大规模路网的节能路径优化问题。R.Abousleiman 和O.Rawashdeh[35]考虑动力电池SOC 约束,首次使用PSO 算法解决BEV 节能路径规划问题,结果相比谷歌地图和MapQuest 节能9.2%以上,相比Bellman-Ford 算法大幅提升了计算效率。M.Richter 等[36]在城市交通场景下使用ACO 算法对不同车型的节能路径规划问题进行了研究。结果表明,与距离最短路径相比,ICEV 和BEV 的节能路径分别能够降低2.8%和8.5%的能量消耗。
图2 GA 和PSO 算法流程对比
节能车速规划(eco-driving),即生态驾驶[37],是指在行驶环境和车辆动力系统约束下[38],规划出能耗最优车速轨迹的技术,相关研究如表2 汇总所示。
表2 节能车速规划研究
规划得到的最优车速可以通过人机交互界面显示给人类驾驶员,也可以直接输出给车速跟踪控制器。研究表明,在不同的交通条件下,生态驾驶往往可以降低10%~30%的能耗和20%~30%的排放[37]。典型的应用场景如车辆借助V2I 通信获取前方信号灯的相位和配时(signal phase and timing,SPaT)信息,通过及时调整车速实现在绿灯窗口平稳通行,从而减少频繁加减速行为和能量损失。随着市场渗透率的增加,网联式汽车可以从以个体为中心的路权竞争转向注重车群整体利益的相互合作,通过信息共享和协同控制进一步提升节能效果[39]。在交通层面,节能车速规划还能够抑制交通流震荡,缓解城市道路交通拥堵。本节主要针对BEV 和ICEV 的节能车速规划问题和方法进行分析研究。
车辆的行驶场景分为城市和高速,可以细化为跟车、匝道合流和路口通行等,如图3 所示。环境干扰包括道路坡度[40]、限速、前车和信号灯等,可以构成跟车无碰撞和不违反交通规则等约束。在跟车场景中,自车可以通过自适应巡航控制(adaptive cruise control,ACC)系统实现。为了提高节能效果,ACC 还能够借助V2V 通信或预测技术获取前车速度和道路坡度[41]等信息,从而提前对自车速度进行适应性调整[42]。在匝道合流场景中,主路和匝道上的车辆首先在控制区域调整车速,然后在合流区域完成汇入。不同于单车道的情况,多车道主路或匝道上的车辆首先需要进行换道决策,然后进行纵向车速优化[43]。
图3 节能车速规划场景示意
在信号灯路口通行场景中,时空不连续的信号灯约束增加了问题复杂度,相应的节能车速规划方法也叫做节能接近和驶离策略[44]或绿灯最优速度建议[45]等。基于V2I 通信,多灯感知利用行驶路线前方多个路口信号灯的位置和SPaT 信息进行车速规划,能够实现比单灯感知更好的节能效果[46-47]。在多数研究中,信号灯SPaT 被视为确定性变量,但实际上可能受到随机因素的影响。为了描述信号灯的不确定性,历史定时数据被用于获取有效红灯持续时间的概率分布[9],并结合实时相位数据进行绿灯概率预测[48]。此外,信号灯路口等待队列也会对车辆行驶造成影响,可以基于交通流预测集成到扩展的信号灯模型中[49-50]。
节能车速规划问题的优化指标主要为能耗,还包括行驶时间和舒适性等。根据能量传递路径的不同,车辆能耗分为轮端能耗和动力系统能耗。使用轮端能耗忽略了动力传动系统的功率损失,能够简化问题但同时会降低结果的最优性。除了发动机MAP、VT-Micro和VT-CPEM 等模型,车辆能耗还可以表示为车速和加速度[51]、车速和电机转矩[52]以及车速和发动机转矩[53]的多项式函数。无环境约束的车速优化结果表明,以轮端能耗为优化目标时,节能的关键是降低风阻,要求车辆在较低的恒定速度行驶;以简化的动力系统能耗为优化目标时,ICEV 的最优模式为加速-滑行,BEV的最优车速为时间的抛物线函数[54]。此外,少数研究还在优化目标中考虑了动力电池的容量衰退[55]。
节能车速规划问题可以在时域或空间域进行描述。时域状态量一般为行驶距离和车速,空间域状态量一般为行驶时间和车速。引入Boolean 状态还可以限制部件功率或转矩变动,进而提高舒适性[56]或部件寿命。控制量一般为加速度,可以延伸到力或转矩,并分为驱动和制动模式,比如轮端的驱动加速度和制动减速度[57]、ICEV 的发动机转矩和机械制动力/力矩[58]、BEV 的电机转矩[59]等。传动系统的挡位可以假设为恒定[60]或由给定规则[61]确定,也可以作为控制变量进行优化[62]。
节能车速规划问题的控制对象分为单车和多车,对应单车生态驾驶和协同生态驾驶[63],后者可以由集中式或分布式控制实现。协同生态驾驶的典型应用场景包括跟车协同控制和匝道合流协同控制[64]等。在节能跟车场景中,车辆编队控制或协同自适应巡航控制(cooperative adaptive cruise control,CACC)基 于V2V信息共享,能够在满足碰撞安全和队列稳定性的同时降低车队的整体能耗。CACC 还可以考虑其他干扰因素,扩展到信号灯路口通行等场景[65]。在效果验证方面,现有研究大多使用仿真软件,少数进行了实车实验[55,61,66]。
节能车速规划方法包括解析优化方法、数值优化方法、混合求解方法和强化学习方法。解析优化方法基于Pontryagin极小值原理(Pontryagin’s minimum principle,PMP)获得最优控制的必要条件,并进一步推导出解析解,计算效率高,实时性好,但是高度依赖理想假设,仅适用于相对简单的行驶场景。数值优化方法将变量离散化,通过网格搜索或梯度下降等方式迭代获得数值解,问题适用面广,但是相比于解析优化方法,计算量显著增加。混合求解方法具有复杂的框架,多用于处理包含信号灯干扰的节能车速优化问题。强化学习(reinforcement learning,RL)基于Markov 决策过程,通过智能体与环境的互动实现累积回报最大化,在复杂决策问题中表现出色,但是需要不断探索和试错,具有很高的训练代价,尤其是随着场景数量的增多,RL 的训练成本会急剧增加。此外,模型预测控制(model predictive control,MPC)作为一种高效的滚动时域优化框架,在节能车速规划问题中得到了广泛应用。
2.2.1 解析优化方法
解析优化方法计算速度快,但要求节能车速规划问题具有简洁的形式。当坡度动态变化时,E.Ozatay等[53]基于线性的能耗模型和纵向动力学模型得到解析解,算法计算效率达到了动态规划(dynamic programming,DP)的320~560 倍。在跟车场景中,解析方法在不增加行程时间的前提下显著降低了BEV 能耗,但需要很多理想条件,如前车在优化时域内保持恒定加速度、无控制变量约束、无机械制动力、忽略传动系统和动力电池的能量损失[67]。针对高速公路场景,J.Rios-Torres 和A.A.Malikopoulos[68]将网联式车辆协同匝道汇入问题表述为无约束最优控制问题,并使用Hamilton 分析推导出解析解,提高了燃油经济性和通行效率。
2.2.2 数值优化方法
用于节能车速规划的数值优化方法包括DP、凸优化和序列二次规划(sequential quadratic programming,SQP)等。DP 适用于具有最优子结构性质的复杂非线性优化问题,能够得到全局最优解,因此经常作为其他方法的基准,但计算效率受限于状态变量和控制变量的维数。DP 对节能车速规划问题的适用性强,可以在时域和空间域灵活建模,因此可用于复杂行驶场景下的多约束多目标优化。ZENG Xiangrui 和WANG Junmin[56]在8 km 仿真道路上考虑道路曲率、限速、停车标志、前车和信号灯等干扰,使用DP 得到了BEV 的最优行驶车速,但计算时间长达10 h。为了提高DP 的计算效率,迭代动态规划(iterative dynamic programming,IDP)通过迭代逐步缩小变量搜索范围,在节能车速优化中得到了应用[55,69]。此外,云计算支撑的DP 算法相比车载计算可以降低2 个数量级的计算时间[61]。
凸优化主要包括二次规划(quadratic programming,QP)、二次约束二次规划(quadratically constrained quadratic programming,QCQP)和SOCP。由于动力系统能耗的非线性和行驶约束的多样性,原始的节能车速规划问题一般是非凸的。为了将原问题转化为凸问题,凸近似和凸松弛是常用的技术手段,并且空间域建模能够更方便地处理随距离变化的道路坡度和限速。O.Borsboom 等[62]通过使用二次多项式表示无极变速器和电机的功率损失,将BEV 赛车圈速优化问题转化为SOCP 问题并实现快速求解。在节能跟车场景中,JIA Yanzhao 等[70]将多目标车速优化问题中的非线性等式约束松弛为二次不等式约束,提出了一个基于QCQP 的空间域MPC 算法,取得了与基于DP 的MPC算法相近的节能效果。
SQP 基于Taylor 展开将原复杂非线性优化问题在迭代点处转化为相对简单的QP 问题,并将求解结果作为原问题的下一迭代方向,直至收敛。SQP 计算效率高,收敛性好,边界搜索能力强,是求解中小规模非线性优化问题的常用方法,一般用于时域建模的节能车速规划问题[71]。面向考虑动态坡度和动态限速的100 km级别超长距离行驶任务,A.Hamednia 等[72]提出了一个高效的节能车速分层优化框架,将原混合整数非线性规划问题转化为上层非线性优化问题和下层挡位优化问题,在对下层问题进行离线优化的基础上,通过PMP 分析降低上层问题的状态变量维数,最后使用基于SQP 的MPC 算法求解最优加加速度和制动力。
2.2.3 混合求解方法
节能车速规划的混合求解方法大多应用于信号灯路口通行场景,主要分为两阶段优化[52,59,73]和恒定模式优化[46,74-75]。两阶段优化方法首先确定最佳的绿灯通行窗口或通行时间,然后进行车速轨迹优化,通过问题分解大大降低了计算复杂度[76]。DONG Haoxuan 等[55]提出了一种适用于多信号灯通行场景的两阶段生态驾驶策略,首先将绿灯通行问题转化为时间最短的路径路径问题,并使用A*算法搜索最佳绿灯窗口,然后以降低能耗和动力电池容量衰退为目标,在MPC 框架下使用IDP 求解最优车速。恒定模式优化方法通常按照车辆通过信号灯路口的不同情况进行分类,并基于经验规则假设车速由匀加速、匀速和匀减速等运动模式组成,通过计算相应类别和模式下的最优曲线参数确定车速轨迹。M.Alsabaan 等[75]提出了一个综合的车速优化框架,基于4 种可能的交叉口通行场景,使用有效的启发表达式计算近似最优的参考速度,有效降低了油耗和CO2排放。
2.2.4 强化学习方法
RL 在面向自动驾驶的车速优化、换道决策以及横纵向联合控制等方面得到了广泛研究[77-78],包括传统RL 算法和深度强化学习(deep reinforcement learning,DRL)算法。传统RL 算法采用离散Q 表记录动作价值函数,受限于问题维数和离散精度,包括Q-learning和SARSA 等。Q-learning 算法在考虑道路坡度的BEV跟车控制中实现了93.8%的DP 最优节能效果[79],并在ICEV 信号灯路口通行场景中降低了CO2排放、停车时间和次数[80]。DRL 算法通过引入深度NN 克服了传统RL 算法难以处理高维输入的缺陷,包括深度Q 网络(deep Q-network,DQN)、深度确定性策略梯度(deep deterministic policy gradient,DDPG)、近端策略优化(proximal policy optimization,PPO)和软演员-评论家(soft actor-critic,SAC)算法等。其中,DDPG 算法结合了DQN 算法与确定性策略梯度算法,能够实现连续动作输出,在跟车[81-82]和信号灯路口通行[83]场景中取得了良好的控制效果。GUO Qiangqiang 等[84]还提出了一种包含DQN 和DDPG 的混合DRL 方法,实现了智能网联汽车的横纵向联合控制。双DQN(double DQN,DDQN)和双延迟DDPG(twin delayed DDPG,TD3)算法能够抑制值函数的过估计,进一步拓展了DRL 算法在节能车速优化领域的应用前景[85-86]。研究表明,基于TD3 的城市场景生态驾驶算法与智能驾驶员模型相比能够提升19%的节能效果[85]。
节能充电规划(eco-charging)是指在动力电池和电网约束下,对新能源汽车的充放电行为进行合理规划,从而实现用户成本和电网性能优化的技术,相关研究如表3 汇总所示。充电规划由最初的无序充电过渡到单向有序充电(V1G),最终向双向V2G 智能充电发展。如图4 所示,新能源汽车通过V2G 设备接受负荷聚合商提供的充电服务,从而实现与电网的互动。负荷聚合商是新兴的电力市场参与方,负责向电力公司提供需求响应资源,并向用户收取或支付充放电费用。V2G不仅能够实现电网负荷的削峰填谷,还能够降低风力和光伏等可再生能源的间歇性对电网造成的冲击,提高电网的可再生能源消纳能力[89]。研究表明,V1G 和V2G 充电策略相比无序充电可以降低32%和39%以上的充电成本[90]。车辆到家庭(vehicle-to-home,V2H)技术和车辆到大楼(vehicle-to-building,V2B)技术是V2G的变种,适用于新能源汽车作为储能中心的微电网环境,能够降低区域运行所需的电力成本。
表3 节能充电规划研究
图4 节能充电规划场景示意
大规模新能源汽车接入电网带来的充电负荷具有随机性和分散性[91],会对配电网电压、损耗和三相平衡带来不良影响,因此有必要对新能源汽车充电进行有序规划与调度。节能充电规划涉及充电用户、聚合商和电网三方,对应不同的研究层面和优化目标。在单一新能源汽车充电控制中,用户希望到达充电桩所需时间和充电排队时间短、充电速度快且费用低。在多车或车群充电控制中,聚合商希望在服务能力内用户订单多、整体效益高。在多聚合器层面的充电控制中,电网希望负荷平稳均衡、波动小。此外,电价是充电规划的关键影响因素,优化充电定价方案可以有效降低用户充电成本和充电站的服务丢失率[92]。
在功率流向方面,单向V1G 假设电能仅可以从电网流向电动汽车,而双向V2G 还允许电动汽车向电网馈电。与单向模型相比,双向模型不仅支持更高的电动汽车渗透率和可再生能源融入水平[93],还可以为充电车主提供额外的收入[90]。
在控制方式方面,节能充电规划分为集中式和分布式。在集中式控制中,聚合器收集电动汽车的动力电池参数和充电需求,并结合可用的充电时段等信息对群体充电任务进行优化。在分布式控制中,电动汽车根据聚合器的信息并结合自身需求进行个体充电优化[94]。集中式控制能够在所有信息可用的情况下计算出最优调度方案,但难以满足实时性要求。分布式控制可扩展性强,优化难度有效降低,适用于大规模新能源汽车的充电调度。
在车辆移动性方面,节能充电规划可以针对移动车辆和静止车辆。移动车辆需要考虑行驶速度和到充电设施的距离及其对SOC 的影响[94],更精确的速度控制有利于缓解充电拥塞和等待时间[95]。随着无线充电技术的发展,车辆移动感知充电还可以借助车与车之间的能量传递完成[96]。此外,充电方式和条件也是需要考虑的因素。研究表明,使用脉冲充电而非连续充电可以降低动力电池冷却的能量消耗[97],且适合充电的最佳SOC 区间为20%~80%[98]。
节能充电规划方法分为数学规划算法、元启发式算法和数据驱动的方法等。数学规划算法基于对问题的准确建模,能够获得精确解,但求解速度对问题的规模和非线性特征十分敏感。元启发式算法能够平衡计算时间,实现对大规模优化问题的近似求解,并且适用于充电速率、充电状态、定价和负荷曲线等信息不充分的情况[93]。数据驱动的方法从大量训练数据中学习最优策略,具有实时应用潜力,能够用于复杂非线性问题,但是对数据质量要求高,训练时间长。
3.2.1 数学规划算法
用于节能充电规划的数学规划算法主要包括凸优化和混合整数规划算法。凸优化算法适用于不考虑车辆移动特性和交流潮流非线性等式约束的节能充电规划问题,一般能够在多项式时间内得到全局最优解。考虑BEV 充电速率、最大充电成本和电网容量约束,LP 算法被用于求解以聚合商收益或用户充电成本为目标的静态充电调度问题[99]。J.Rivera 等[100]提出了一种可扩展分布式凸优化框架,针对QP 形式的聚合器优化子问题和电动汽车充电优化子问题,使用交替方向乘子法(alternating direction method of multipliers,ADMM)进行求解。
混合整数规划问题是一种同时包含连续和离散控制变量的NP 难问题,具有很高的计算复杂度,难以用于大规模系统的充电优化,分为混合整数线性规划(mixed-integer linear programming,MILP)和混合整数非线性规划(mixed-integer nonlinear programming,MINLP)。在MPC 框 架 下,R.Iacobucci 等[101]使 用MILP 算法对共享BEV 的运输服务和充电行为进行优化,在不显著影响等待时间的情况下大幅降低了充电成本。针对不平衡配电系统中电动汽车协调充电问题,F.J.Franco 等[102]通过对非线性的负载电流、有功和无功功率、电压和电流约束进行分段线性近似,将原MINLP 问题简化为MILP 问题,从而降低了求解难度。
3.2.2 元启发式算法
元启发式算法能够平衡求解精度和计算时间,在非凸充电优化问题中广泛应用。考虑充电站的物理和功率约束,ACO 算法被用于最小化充电延迟的电动汽车单向充电调度[103]。得益于良好的扩展性,不同元启发式算法还可以相互结合,通过优势互补提高全局搜索能力。一种改进的PSO 算法采用Gauss 变异迫使某些粒子发生突变,并应用退火机制使粒子以一定概率接受不利突变,被用于求解电网运行和动力电池容量约束的BEV 充放电问题[104]。K.A.Kalakanti 和S.Rao[95]提出了一种PSO 与萤火虫算法相结合的混合元启发式算法,用于考虑充电站快充和慢充选项的BEV 充电调度,实现了比单一算法更好的性能。
3.2.3 数据驱动的方法
用于节能充电规划的数据驱动方法主要包括监督学习算法和DRL 算法。监督学习基于带标签的最优数据集,采用NN 和决策树等模型进行训练。以时间、能耗和SOC 为输入,NN 模型可以为BEV 充电推荐不同的运行模式,如V1G、V2G 或闲置[105]。但是,大量标签样本的获取和标注存在挑战。DRL 通过智能体和环境的不断互动自行产生样本数据并能够覆盖更多的情况,摆脱了对标签的依赖,在序列决策问题中表现出更强的学习能力。DING Tao 等[106]考虑用户行为和环境变化的不确定性,利用DDPG 算法求解最优充电策略,在满足电网约束的同时实现了聚合商利润的最大化。
能量管理(energy management)是指根据整车功率需求,在满足动力系统约束的条件下对不同动力源进行功率分配,从而提高能量效率和部件寿命的技术。为了跟踪节能车速规划层输出的目标车速,PHEV 和FCV等混合能源电动汽车需要采用分层控制架构[109],包含上层能量管理监督控制和下层动力系统部件控制。工况是影响整车功率需求的关键因素,对能量管理至关重要。通过瞬时工况识别、未来工况预测和全局工况估计等技术手段,能量管理策略(energy management strategy,EMS)可以利用丰富的工况信息,显著提升节能水平[110]。
在混合能源电动汽车中,混合动力汽车(hybrid electric vehicle,HEV)是PHEV 的技术基础,因此本节也将其作为研究对象进行讨论。HEV 和FCV 的动力传动系统构型如图5 所示。HEV 包含发动机、电机和动力电池等,分为串联式(series X,S-X)、并联式(parallel X,P-X)和混联式。增程式混合动力汽车是一种串联式构型的PHEV。混联式HEV分为功率分流式(power-split X,PS-X)和串并联式(series-parallel X,SP-X)。FCV 以燃料电池(fuel cell,FC)为主能量源,还需配置动力电池(battery,B)和/或超级电容(super capacitor,SC)以克服燃料电池功率响应慢的缺点,分为FC/B、FC/SC和FC/B/SC 等构型。动力电池可外接充电的FCV 叫做插电式燃料电池汽车(plug-in FCV,PFCV)。
图5 HEV 和FCV 的动力传动系统构型
能量管理问题的输入是整车功率需求,状态变量一般是动力电池SOC/SOE,控制变量包括挡位和部件功率/转矩等,其中挡位、发动机启停或燃料电池启停等离散控制变量可以由外部程序确定[111],也可以和部件功率等连续控制变量一同优化。整车功率需求与车速、加速度和道路坡度等工况信息相关,受到驾驶员以及包括前车和信号灯等道路交通环境的影响。通过工况识别和预测等技术获取更加准确和丰富的需求功率能够有效提升能量管理的节能控制效果。驾驶风格[112]和工况特征识别可以提高能量管理控制的自适应能力,车速、道路坡度和驾驶意图预测能够提供未来短期行驶信息并用于预测能量管理控制。此外,对于公交车或摆渡车等具有固定行驶路线的车辆,全局工况构建可以估计驾驶周期内的整条工况,进而实现更加高效的动力电池全局电量规划[113]。
能耗是能量管理问题的主要优化指标,包括发动机油耗、动力电池电耗和燃料电池氢耗。PHEV/HEV油耗与发动机转速和转矩有关,一般用发动机MAP表示,也可以使用函数拟合,比如PHEV 油耗可以拟合为动力电池电流的二次函数[114]。FCV 氢耗与燃料电池系统净功率有关,可以结合效率曲线进行计算。除了对车辆能耗进行优化,现有研究还开始关注动力电池和燃料电池的循环寿命。动力电池寿命的影响因素包括充放电倍率、操作温度和放电深度等,其退化模型分为电化学模型、数据驱动的模型和半经验模型[115]。比如,一种磷酸铁锂电池的半经验容量衰退模型可以表示为活化能、通用气体常数、温度和总安时通量的拟合函数[116]。燃料电池寿命受工况影响很大,其退化模型分为基于物理的模型、数据驱动的模型和混合模型[117]。比如,燃料电池电压退化率可以表示为大范围负载变化次数、启停次数、怠速时间和高功率负载时间的线性函数[118]。
能量管理方法分为基于规则的方法、基于模型的方法和数据驱动的方法。基于规则的方法使用专家经验设计逻辑规则,实时性好,在工业界广泛应用,但难以达到最优的节能效果。基于模型的方法依赖于面向控制的车辆动力传动系统模型,需要建立能量管理最优控制问题并使用优化算法进行求解,实时性较差,但节能效果更佳。数据驱动的方法无需控制对象的数学模型,对高维复杂问题的适用性强,实时性较好,具有可迁移能力,是近年来的研究热点,但是需要大量数据样本,训练成本高,且难以保证动力电池SOC的安全性约束。
4.2.1 基于规则的方法
基于规则的方法分为确定性规则和模糊规则,典型代表是适用于PHEV 的电量耗尽-电量维持(charge depleting-charge sustaining,CD-CS)策略。丰富的驾驶信息,如驾驶员风格、行驶里程、道路类型、坡度和限速等,可以用于估计动力电池剩余电量,从而为规则的设计提供指导[119-120]。进一步地,基于DP、GA 和PMP 等优化算法求解得到的能量管理数据,提取关键的阈值参数并用于规则制定[121-124],能够有效提升规则策略的节能效果。PENG Jiankun 等[123]根据DP 优化结果对PHEV 的发动机工作区进行重新校准,硬件在环(hardware in the loop,HIL)实验结果表明,所提方法相比校准前分别降低了10.45%和4.75%的油耗和电耗。此外,工况识别和预测可以提升规则策略的工况自适应能力。YIN He 等[125]提出了一种针对电池/超级电容混合储能电动汽车的自适应模糊逻辑控制策略,根据历史驾驶模式在线调整最优的模糊隶属函数,并通过HIL 验证了算法的良好性能。
4.2.2 基于模型的方法
基于模型的方法分为全局优化方法、瞬时优化方法和滚动时域优化方法。全局优化方法能够在全局工况已知的条件下得到最优控制序列,一般具有较高的计算成本,包括DP、元启发式算法和凸优化算法等。瞬时优化方法根据瞬时工况进行实时优化,可以通过工况识别等方式提高自适应能力,包括PMP 和等效消耗最小策略(equivalent consumption minimization strategy,ECMS)。滚动时域优化方法的典型代表是MPC,基于未来短期工况预测对有限时域内的功率分配问题进行滚动优化,计算量较大,但在迅速提升的车载算力支撑下未来具有广阔的应用前景。
1)全局优化方法。DP 具有全局最优性,对问题的复杂非线性特征不敏感,其反向计算过程面临维数灾难的问题,经常作为其他EMS 的对比基准或辅助方法。现有基于DP 的能量管理开源方案主要使用Matlab 进行开发,包括通用的确定性DP 函数[126]、针对FC/B/SC 的DP 算法GUI[127]以及面向新能源汽车的标准化DP 软件包[128]。后者解决了DP 在新能源汽车应用中的维数灾难和标准化等问题,提高了计算效率和计算精度。
元启发式算法具有很强的通用性和鲁棒性,包括GA[129]、PSO 算法和模拟退火法(simulated annealing,SA)[130]等。M.Wieczorek 和M.Lewandowski[131]将 动力电池和超级电容的功率表示为需求功率的连续函数,并使用GA 优化拟合系数,显著延长了动力电池循环寿命。为了提高搜索效率,现有研究利用规则限制变量搜索空间[132]或对元启发式算法进行改进。针对考虑换挡控制的P-HEV 能量管理问题,CHEN Syuan-Yi 等[133]提出了一种收敛速度更快、更平滑的动态PSO 算法并通过HIL 验证了算法实时性和有效性。
凸优化算法计算性能好,在PHEV/HEV、FC/B[134]和混合储能电动汽车[135]的能量管理中得到了应用,但是需要对原问题进行凸化处理。P.Elbert 等[136]首先分析得出S-HEV 发动机的最佳启动条件是需求功率超过某个非恒定阈值,进而将原混合整数规划问题转化为凸问题,并使用凸优化算法迭代求解最佳功率分配。S.East 和M.Cannon[111]以P-PHEV的SOE为状态变量,使用二次多项式拟合发动机油耗和电机输入功率,并假设动力电池参数不随SOC 变化,将原问题转化为凸优化问题,最后使用ADMM 和IPM 进行求解。
2)瞬时优化方法。PMP 通过构建包含协态λ的Hamilton 函数,推导出最优控制的必要条件,并根据实时λ确定最优功率分配。ECMS 来自于工程经验,使用等效因子(equivalent factor,EF)将瞬时电耗补偿为油耗,进而得到最优控制,可以由PMP 导出[137]。PMP 分析结果表明,最优λ是与工况和动力电池特性相关的时变参数。因此,为了实现工况自适应,λ和EF 需要实时更新,相应的方法分别称为自适应PMP(adaptive PMP,A-PMP)和自适应ECMS(adaptive ECMS,A-ECMS)。C.Musardo 等[138]最早提出了一种A-ECMS 方法,根据不同工况实时估计EF。在后续研究中,EF 的实时优化使用了NN[139]和解析算法[140],还可以基于发动机状态进行二次修正[141]。在A-PMP 方法中,λ的在线更新可以基于不同工况下SOC 变化量与λ的平均关系曲线[142]或离线计算的最优工况片段特征-λ关系表[143]。但是,当车辆工作在较窄的SOC 区间时,由于动力电池的开路电压和内阻接近恒定,最优λ可以近似为恒定值[144]。
3)滚动时域优化方法。MPC 是预测能量管理的基本框架,包含工况预测、滚动优化和反馈控制等过程,相关研究如表4 汇总所示。在常规MPC 控制策略的基础上,分层MPC 方法引入了全局SOC 规划层,以实现PHEV 和PFCV 动力电池电量的全局合理分配。全局SOC 规划层基于交通流或历史行驶数据进行全局工况构建,生成SOC 参考轨迹并用于下层MPC跟踪控制。工况预测方法包括Markov 链(Markov chain,MC)、ARIMA[145]和NN 等。其中,NN 预测模型分为径向基函数神经网络(radial basis function neural network,RBF-NN)、多层感知器(multilayer perceptron,MLP)、循环神经网络(recurrent neural network,RNN)和Informer 模型[59]等。研究表明,NN 具有良好的预测效果和计算效率[146],还可以进一步结合GA[147]和小波变换[148]以提升预测性能。SOC 规划方法包括基于简单规则的距离分配法[147,149-150]、基于简化能量平衡模型的DP[151]和基于最优数据训练的NN[113]等。滚动优化方法除DP 和PMP 方法外,还包括随机动态规划(stochastic dynamic programming,SDP)[152]、QP[153]和SQP[147,154]等。
表4 基于MPC 的预测能量管理研究
4.2.3 数据驱动的方法
用于能量管理的数据驱动方法主要包括监督学习和RL 算法。在监督学习中,最优训练数据可以使用DP[155-157]和GA[158]等全局优化方法获得,学习器一般为MLP 形式的NN。由于工况的多样性,单个NN模型很难适用于所有工况类型。为了增强NN 的工况自适应能力,M.P.Munoz 等[159]针对多条工况训练相应的NN,并选取其中2 个适应性强的NN 分别用于城市和高速工况的FC/B 能量管理。进一步地,L.Y.Murphey 等[155]首先对11 类包含道路类型和拥堵程度的驾驶环境以及5 类驾驶趋势进行预测,然后以PSHEV 的车速、SOC、需求功率和驾驶趋势为输入,针对不同的驾驶环境和控制变量分别训练相应的NN,相比原始EMS 节省了3%~20%的油耗。
不同于监督学习算法对最优数据集的依赖,RL 算法,尤其是DRL 算法,可以从环境中主动学习最优策略,是能量管理领域的研究热点。LI Yuecheng 等[160]针对双电机四驱S-HEV,由累计行程信息确定参考SOC,并使用DDPG 算法进行前后轴电机的功率分配,实现了比MPC 更高的计算效率,但是针对单条标准工况的离线训练需要将近10 min 才能收敛。高昂的训练成本不利于通用EMS 的开发,通过经验嵌入或知识迁移提高DRL 模型的训练效率和泛化能力是潜在的研究方向。利用发动机在最佳曲线工作等经验规则,可以有效提高DRL 智能体的探索效率,降低问题复杂度和训练代价[161]。进一步地,迁移学习能够将基于DRL 的EMS 在构型相异的HEV 之间进行传递,且收敛效率与基准方法相比提升了近70%[162]。
新能源汽车的节能规划与控制本质上是多项节能技术的相互耦合和集成,但由于问题的复杂性,多数研究通常会将其解耦为路径规划、车速规划、充电规划和动力系统能量管理等子问题。相比子任务优化问题,多任务集成优化问题虽然控制维度和计算复杂度更高,但不仅更符合实际情况,还可以挖掘更多的节能潜力。如BEV 的节能充电导航同时涉及路径规划和充电规划,PHEV 和FCV 节能车速规划是后续动力系统能量管理的需求输入模块。新能源汽车多任务集成优化问题可以采用耦合优化或解耦优化方法求解。耦合优化方法将集成问题建模为单个优化问题并在统一的优化架构下求解,具有全局最优性,但难以实现和部署。解耦优化方法将集成问题分解为多个子问题并通过顺序优化或分层迭代等方式进行求解,降低了计算复杂度,能够以一定的最优性损失实现计算效率的大幅提升。
新能源汽车充电路径导航涉及路径规划和充电规划,可以建模为混合整数规划问题,优化指标包括行驶时间、充放电时间、充电成本和V2G 收益等,控制变量包含路径决策和充放电决策,相关研究如表5 汇总所示。耦合优化方法同时求解最优路径和充电功率,包括自适应Dijkstra[163]、A*[164]、MILP[165]和MINLP[166-167]求解器以及混合元启发式算法[168-169]等。YI Zonggen等[167]基于数据驱动的能耗模型,以旅行时间和最终电量为约束,利用MINLP 求解器SCIP 得到电耗成本最低的BEV 车队行驶路径和充电策略,证明了环境温度对能耗和充电需求存在显著影响。使用解耦优化方法,YAO Canqi 等[170]通过双线性解耦和松弛操作,将原问题分解为2 个LP 形式的子问题,即优化出行时间、费用和服务收益的路径规划与优化充电时间和成本的充电规划,并在多项式时间内获得了近似最优解。
表5 路径规划和充电规划集成优化研究
混合能源电动汽车的节能路径规划需要评估动力系统能耗,是一种以路径规划为主并融合能量管理的集成优化问题,可以建模为混合整数规划问题,控制变量包含路径和动力系统能耗估计决策,相关研究如表6 汇总所示。动力系统能耗可以通过基于模式优化或功率分配的能量管理进行计算。模式优化主要针对PHEV,假设车辆在给定模式和工况类型下具有固定的单位里程油耗和电耗[172-173],无需进行动力传动系统建模,实现了问题简化,包括纯电驱动模式、发动机驱动模式、电量维持模式和混合驱动模式等[174]。
表6 路径规划和能量管理集成优化研究
耦合优化方法同时进行路径决策和动力系统能量管理,包括DP[175]、RL[176]和MILP 算法[172,177]等。A.Caspari 等[177]假设车辆以道路限速匀速行驶,采用机械与数据驱动的混合模型将原混合整数二次规划问题简化为MILP 问题,求解效率提高了近105 倍。解耦优化方法可以分层依次求解路径规划和能量管理子问题,也可以将能量管理子问题的优化结果作为能耗代理模型集成到路径规划子问题中。A.Houshmand 等[173]首先使用Dijkstra 算法选取最优路径,然后利用LP 算法求解PHEV 动力系统不同工作模式之间的最优切换策略。G.De Nunzio等[178]将能量管理优化得到的P-HEV路段油耗作为SOC 变化量的函数,使用二分搜索和Bellman-Ford 算法计算满足SOC 约束的最优路径。
混合能源电动汽车的节能车速规划需要优化动力系统能耗,控制变量包括车辆运动和动力系统功率分配决策,相关研究如表7 汇总所示。该类问题主要面向PHEV/HEV[180]和FCV,少数涉及双电机四驱BEV[181-182]。除了动态坡度、动态限速、前车和信号灯,有些研究还考虑了后车和动态滚阻系数等其他干扰[183]。车速规划和能量管理集成优化方法主要包括凸优化、DP、MPC 和DRL 算法。凸优化在耦合优化框架下一般仅考虑动态坡度干扰,并通过凸近似和凸松弛将原非凸问题转化为空间域SOCP 问题[184-185],在解耦优化框架下可以是单层凸化[183,186]或双层凸化[187-188]。DP 可以通过辅助方法降低问题维数并提高计算效率,如分别借助PMP 和NN 减少状态变量[189]和控制变量[190]的个数。MPC 在耦合优化和解耦优化中均有应用,如基于连续/广义最小残差法(continuation/generalized minimum residual,C/GMRES)的双MPC 切换策略[191]以及基于快速投影梯度法(projection gradient method,PGM)和QP 算法的分层策略[183]。DRL 算法适用于多种驾驶场景,如考虑动态限速、前车和信号灯约束的P-HEV 城市生态驾驶[192]以及五车环境下的PS-PHEV匝道合流[193]等。
表7 车速规划和能量管理集成优化研究
新能源汽车节能规划与控制技术是近15 年来一直被持续关注的重要学术领域和产业技术,北京理工大学电动车辆国家工程研究中心在该领域开展了系统研究,成果在宇通、广汽、现代和比亚迪等车辆上得到了应用,涉及BEV、PHEV 和FCV 等多种车型。节能车速规划面向复杂交通场景,考虑多信号灯[47,59]、不确定性信号相位[9]、路口队列和交通流[50]等因素,研究团队提出了有效、鲁棒和计算效率高的车速规划系统方法,包括了基于优化和机器学习的多种探索和实践。对于能量管理问题,研究团队提出了引导式MPC 节能规划与控制理论[151]以及基于NN 的车速工况预测方法[146],并通过将FCV 能量管理问题凸化实现了凸优化方法在该动力系统构型下的拓展[134]。进一步地,在车速规划和能量管理集成优化方面,研究团队面向跟车[181-182]和信号灯通行[186-187]等复杂场景问题设计了融合凸优化的解耦优化求解方法,实现了节能效果与计算效率的平衡。
当前,复杂的行车环境和多样化的控制需求对节能规划与控制技术的实时性、鲁棒性和高效性提出了更高要求。在智能化技术和V2X 通信的快速发展和支撑下,新能源汽车节能规划与控制技术未来可能的重要发展趋势如下:
1)考虑环境时变性和行为随机性的新问题。现实交通环境受到各类交通参与者、道路条件和交通控制信号的影响,是动态变化且包含随机因素的复杂人-车-路耦合系统。以往的新能源汽车节能规划与控制技术对环境的时变性和随机性考虑不足,往往做出静态或准静态场景假设,但相关技术的产业化落地需要充分考虑现实交通环境的复杂性。
2)运用先进预测和高效求解等手段的新算法。为了表征时变随机的复杂交通环境,先进预测技术可以基于数据驱动和类人推理等方式学习微观个体行为和宏观交通行为的演变规律并对其进行精准预测,进而服务于新能源汽车的节能规划与控制。另一方面,时变随机的交通环境增加了节能规划与控制问题的复杂度,开发更加高效的求解算法也至关重要。
3)系统解决多车多任务多维度问题的新方法。在智能网联技术同步快速发展的趋势下,多车协同的多任务集成优化问题尚未被充分考虑和研究。这是由于多维度耦合给问题建模、求解、验证和实验等各个研究环节带来了困难,且智能汽车与非智能汽车的长期共存也增加了场景的多样性。当前尚缺乏综合考虑多车多任务多维度优化的系统性新方法。
4)在真实场景下可复制推广的新应用。现有节能规划与控制研究大多基于仿真环境开展,经过实车实验和验证的成果数量有限,在现实场景中的应用仍然面临诸多阻碍[197],如V2X 通信面临时延、丢包和信息安全等问题,V2G 充电会对电池耐久性造成不良影响。将理论研究成果进行工程化开发,以实现可复制的规模化应用具有重要现实意义。
新能源汽车对降低交通领域的化石能源消耗和温室气体排放具有重要意义,已经成为全球的发展共识。本文对新能源汽车节能路径规划、节能车速规划、节能充电规划、能量管理以及相应的多任务集成优化技术进行了系统调研,深入分析并总结了现有研究问题的关键特征与研究方法的主要特点,指出在智能化和网联化技术背景下,新能源汽车节能规划与控制技术能够有效提高能量使用效率,是当前和未来长期的研究热点;但对动态随机交通场景考虑不足,多任务集成与多车协同优化不够深入,且产业化应用仍面临较大挑战;为满足新能源汽车的高水平发展需求,未来的研究趋势与重点为:1)考虑环境时变性和行为随机性的新问题;2)运用先进预测和高效求解等手段的新算法;3)系统解决多车多任务多维度问题的新方法;4)在真实场景下可复制推广的新应用。