电动汽车群体互动策略的随机演化博弈分析

2024-07-11 09:31程宏波何洪李云枭程耀昆朱伟铭

华东交通大学学报 2024年3期

程宏波何洪李云枭程耀昆朱伟铭

收稿日期：2023-12-12

基金项目：国家自然科学基金项目（51967007）；江西省主要学科学术和技术带头人培养项目（20232BCJ22004）；江西省重点研发项目（20223BBE51013）

文章编号：1005-0523（2024）03-0074-08

摘要：【目的】为分析车网互动过程中电动汽车群体充放电决策的影响因素及规律，【方法】建立了电动汽车群体内部不同个体之间的决策演化博弈模型，引入用户偏好影响因子对复制动态方程进行改进，分析了电动汽车群体策略演化形成的过程，分析了各因素变化对电动汽车群体互动策略的影响规律。【结果】仿真表明，考虑用户偏好影响时，选择充电策略的电动汽车用户比例由65%提高到75%；当用户经济效益敏感程度由0增加到2时，充电和不充不放用户的比例分别减少50%和10%，放电用户的比例则增加了60%。【结论】用户偏好及经济效益敏感程度会提高电动汽车用户参与车网互动的比例，而外部环境的扰动不会对电动汽车用户最终的选择结果产生影响。

关键词：车网互动；充放电策略；演化博弈；改进复制动态方程

中图分类号：U471 文献标志码：A

本文引用格式：程宏波，何洪，李云枭，等. 电动汽车群体互动策略的随机演化博弈分析[J]. 华东交通大学学报，2024，41（3）：74-81.

Stochastic Evolutionary Game Analysis of Group Strategies for Electric Vehicles in Vehicle Network Interaction

Cheng Hongbo， He Hong， Li Yunxiao， Cheng Yaokun， Zhu Weiming

（School of Electrical and Automation Engineering， East China Jiaotong University， Nanchang 330013， China）

Abstract：【Objective】To analyze the influencing factors and patterns of electric vehicle group charging and discharging decisions in the process of vehicle network interaction.【Method】In order to analyze the influencing factors and laws of electric vehicle group charging and discharging decisions in the process of vehicle network interaction， a decision evolution game model among different individuals within the electric vehicle group was established and the replication dynamic equation was improved by introducing user preference influence factors， so as to analyze the process of the evolution of electric vehicle group strategies the impact of various factors on the interaction strategies of electric vehicle groups.【Result】Simulation shows that when considering the influence of user preferences， the proportion of electric vehicle users who choose charging strategies increases from 65% to 75%. When the sensitivity of user economic benefits increases from 0 to 2， the proportion of charging and discharging users decreases by 50% and 10% respectively， while the proportion of discharging users increases by 60%. 【Conclusion】The sensitivity of user preferences and economic benefits will increase the proportion of electric vehicle users participating in vehicle network interaction， while external environmental disturbances will not affect the final selection results of electric vehicle users.

Key words： car network interaction; charging and discharging strategy; evolutionary game; improved replication of dynamic equations

电动汽车的充电成本[Rev]与放电收益[Eev]可以表示为

[Eev=Qdrd-QdKbρdRev=Qcrc+QcKbρc] （1）

式中：[ρd，ρc]分别为放电效率和充电效率；[rd，rc]分别为放电价格和充电价格；[Qc]，[Qd]分别为由电动汽车参与充放电过程中的充放电电量；[Kb]为电动汽车电池的单位电量损耗，计算式为

[Kb=RxLcCev，iDoD] （2）

式中：[Rx]为电池成本；[Lc]为常规使用时电池的平均寿命，一般以可循环次数表示；[Cev，i]为电动汽车电池容量；[DoD]表示在正常使用中使用的电池可放电深度。

[Qc=i=1nCEVCSOC，ifc，iηc，iQd=i=1nCEV1-CSOC，ifd，iηd，i] （3）

式中：[CEV]为电动汽车的电池容量；[CSOC，i]为电动汽车[i]的荷电状态，为了满足出行需求，其范围为：20%～90%；[fc，i，fd，i，ηc，i，ηd，i]分别为电动汽车充放电电价响应概率和充放电剩余时间响应概率，根据程宏波等[14]的分析，可以得到电价、停留时间对电动汽车充放电响应概率的影响规律。

根据表1中电动汽车选择不同策略时的收益情况，可得电动汽车选择充电策略[α1]时的期望收益[U1]为

[U1=a1x+b1y+c1z=-xRev+αΔR+yRev+zRev+ΔR] （4）

选择放电策略[α2]时的期望收益[U2]为

[U2=d1x+e1y+f1z=xEev+yEev+βΔE+zEev+ΔE] （5）

选择不充不放策略[α3]时的期望收益[U3]为

[U3=g1x+h1y+i1z=0] （6）

由此可以得到电动汽车三策略选择下的平均收益[U]为

[U=xU1+yU2+zU3 =xU1+yU2+1-x-yU3] （7）

电动汽车个体按自身期望根据收益最大原则选择各自策略，个体策略的选择决定了群体策略的演化方向。电动汽车个体策略选择主要受自身的出行需求和经济利益的影响，但也会受其他个体策略的影响，如在互动初期时，电网制定较低电价，电动汽车用户选择充电居多，充电需求增加会导致电网功率不平衡，电网会调整电价对电动汽车进行引导，此时会影响到其他个体的策略选择[15]。

随着电动汽车策略选择过程的推进，选择不同策略的个体数量会随着演化过程发生变化，最终某一占优策略会演化成为稳定的策略。收益是驱动电动汽车做出策略更新的重要手段，因此，选择充放电策略的电动汽车群体数量的变化率[ni]与该策略能够获取的收益[Ui]正相关，即

[n1=η1n1U1n2=η2n2U2n3=η3n3U3] （8）

式中：[η1，η2，η3]分别为用户偏好影响因子，它表示不同用户对不同策略的偏好程度，由电动汽车用户自身需求决定；[n1，n2，n3]分别为选择充电，放电，不充不放策略的电动汽车数量。

对式（8）求导可得

[Fx=dxdt=η1xU1-xU1-η2η1yU2-η3η1zU3Fy=dydt=η2yU2-yU2-η1η2xU1-η3η2zU3Fz=dzdt=η3zU3-zU3-η1η3xU1-η2η3yU3] （9）

式（9）表示电动汽车选择充电策略的复制动态方程，它描述了电动汽车群体内各策略选择的演变转化规律。令[Fx=0]，[Fy=0]，[Fz=0]求解改进的复制动态方程式，即可得到改进条件下的电动汽车策略选择演化博弈平衡状态点。

2 电动汽车群体策略的演化

假设电动汽车群体中选择充电策略个体的个数为[i]，选择放电策略的个体个数为[j]，则选择不充不放策略的个体个数为[N-i-j]。在每一次选择中可能出现两种情况：一种是原来选择[α2]的用户转为选择[α1]；一种为原来选择[α3]的用户转为选择[α1]。因此，3种策略在演化过程中转移概率主要有以下几种趋势

[Pj，ji，i+1=ifα1ifα1+jfα2+（N-i-j）fα3?N-i-jNPj，j-1i，i+1=ifα1ifα1+jfα2+（N-i-j）fα3?jNPj，ji，i-1=（N-i-j）fα3ifα1+jfα2+（N-i-j）fα3?iNPj，j+1i，i-1=jfα2ifα1+jfα2+（N-i-j）fα3?iNPj，j+1i，i=jfα2ifα1+jfα2+（N-i-j）fα3?N-i-jNPj，j-1i，i=（N-i-j）fα3ifα1+jfα2+（N-i-j）fα3?jNPj，ji，i=1-Pj，ji，i+1-Pj，j-1i，i+1-Pj，ji，i-1-Pj，j+1i，i-1-Pj，j+1i，i-1-Pj，j-1i，i] （10）

式中：[Pj，ji，i+1]为由不充不放策略[α3]转而选择充电策略[α1]的概率，此时选择充电策略的个体个数加1，选择放电策略的用户个数不变，而选择不充不放策略的个体个数减1；同理，[Pj，j-1i，i+1]表示由策略[α2]转为策略[α1]的概率；[Pj，ji，i-1]表示由策略[α1]转为策略[α3]的概率；[Pj，j+1i，i-1]表示由策略[α1]转为策略[α2]的概率；[Pj，j+1i，i]表示由策略[α3]转策略[α2]的概率；[Pj，j-1i，i]表示由策略[α2]转为策略[α3]的概率。

用[P（i，j）]表示[i]个充电策略用户可能转化为放电策略的固定概率，根据全概率公式可以得到

[P（i，j）=P（i+1，j）Pj，ji，i+1+P（i+1，j-1）Pj，j-1i，i+1+ P（i-1，j）Pj，ji，i-1+P（i-1，j+1）Pj，j+1i，i-1+ P（i，j-1）Pj，j-1i，i+P（i，j+1）Pj，j+1i，i+ P（i，j）Pj，ji，i] （11）

这个转化过程是一个有吸收状态的马尔科夫过程，具有两个吸收状态，即[i=0]和[i=N]，以此作为边界条件，可以得到[i]个充电策略用户转化为[N-i]个放电策略用户的概率为

[Pi=1+j=1i-1k=1jfα2（k）fα1（k）1+j=1N-1k=1jfα2（k）fα1（k）] （12）

从固定概率式（11）和转移概率式（12）可以看出，二者与策略的收益和成本有关，因此，互动的收益和成本会影响电动汽车群体演化的最终结果。

3 电动汽车群体策略的演化仿真

假设电动汽车选择策略的初始状态为[xt0=yt0=zt0=1/3]，针对前述改进复制动态方程的电动汽车演化博弈模型，通过设置不同的激励系数，分析电动汽车不同策略之间的依存关系及其对博弈演化过程的影响，对改进复制动态演化博弈模型的准确性进行验证。

3.1 考虑用户偏好的演化对比

复制动态方程中个体策略选择的变化率与该策略所能获得的收益正相关，因此，最终会有一种策略成为占优策略。在给定相同初始条件下，考虑各策略选择的无偏性（[η1=η2=η3=1]），此时为传统的复制动态方程，电动汽车策略演化趋势如图1所示，考虑用户偏好（[η1=1.2，η2=0.6，η3=0.8]）时的策略演化趋势如图2所示。

图中横轴表示电动汽车策略选择演化发展的过程，纵轴表示选择各互动策略的电动汽车比例。可以看到，在某一个给定的电价下，不同的电动汽车用户会根据自身情况做出不同选择，选择不同互动策略的电动汽车用户比例最终会趋于一个稳定值。图1中当用户对各策略无偏好时，只根据不同策略可能带来的收益进行决策，依据当前电价，电动汽车用户无法通过放电获取到收益，选择放电策略的电动汽车比例最终趋于0；但当前电价较低，选择充电策略的用户可以较低的充电成本获得电能，因此，选择充电策略的用户比例最终趋于65%；选择不参与互动即不充不放策略的用户比率没有变化，即为促进电网互动所实施的差异化电价对这部分用户没有影响。而图2中考虑用户偏好后，最终选择充电策略的用户比率提高至75%，同样是充电策略占优，但选择充电策略的用户比率相对于不考虑用户偏好时要高，且选择不充不放策略的用户比率会变低，这更符合通过差异化电价调整用户参与度的实际情况。

3.2 考虑用户经济效益敏感度的演化分析

分析用户经济效益敏感程度对于群体策略演化结果的影响，能够更准确的制定相应的激励措施。不同收益敏感程度下，充放电策略的演化结果如图3所示。

从图3中可以看到，在经济效益敏感度[ω=0]时，选择充电策略的用户比例达到最大90%，选择放电的用户比例最终稳定于0，选择不充不放策略的用户比例达到10%；当经济效益敏感度增加到[ω=0.05]时，选择充电策略的用户比例最终稳定在55%，选择放电策略的用户比例最终稳定在25%，而选择不充不放策略的用户比例最终稳定在20%；经济效益敏感度增加到[ω=1]时，选择充电策略的用户比例最终稳定在40%，选择放电策略的用户比例最终稳定在58%，而选择不充不放策略的用户比例最终稳定在2%；当[ω]进一步增加到2后，充电策略的用户比例稳定在40%，放电策略的用户比例稳定在60%，而不充不放的比例则为0。

上述情况表明，不同的经济效益敏感度将导致不同的策略选择：经济效益敏感度低时，用户对于互动收益不敏感，更关注自身的出行需求，选择充电策略的比例越高；经济效益敏感度高时，互动收益对用户的吸引力大，选择放电策略的用户比例高，而选择不充不放策略的用户比例低。而且经济效益敏感度越高，各种策略的比例越快达到稳定，策略调整完成的越快，但当达到一定程度（[ω=1]）后，能吸引的电动汽车用户都已吸引到，选择各策略的用户比例趋于稳定。因此，用户经济效益敏感度越高，对用户互动的吸引越大，选择放电策略的比例就越大，且收敛的速度越快，反映出在经济利益的驱使下，可更加有效的促进车网互动的开展。

3.3 考虑外界影响的演化结果分析

电动汽车要考虑出行需求，而出行受外界环境因素如天气变化、交通拥堵等随机因素的影响，为分析外界因素的影响，引入随机扰动因子[σ]，不同扰动干扰下互动策略的演化如图4所示。

图4表明，没有扰动（[σ=0]）时，选择充电和不充不放策略的用户比例稳定的趋于0，选择放电策略的用户比例稳定的趋于最大值1；而当有扰动（[σ=1，σ=2]）时，选择充电和不充不放策略的用户比例在达到稳定的过程中存在较大的波动，但最终稳定于0，选择放电策略的用户比例经较大波动过程后最终也稳定于1。外界随机变化会对电动汽车群体策略的演化产生一定影响，扰动越大稳定过程中的波动越大；但无论是无扰动（[σ=0]），轻微扰动（[σ=1]），还是强烈扰动（[σ=2]），各种策略的用户比例最终还是会稳定到相同的结果上，表明外界干扰对电动汽车用户最终的策略选择不会产生影响。

4 结论

车网互动过程中，电动汽车个体策略的选择既相互依存，又相互独立。本文建立了电动汽车群体随机演化博弈模型，描述用户在策略选择过程中受到的各种影响因素，分析了各因素变化对演化结果的影响规律，为不同情况下互动激励措施的制定提供依据。通过分析，得到如下结论。

1）车网互动过程中，各个电动汽车用户根据自身情况选择不同的互动策略，各用户策略之间相互依存、相互影响，演化形成最终的电动汽车群体互动策略。随机演化博弈模型可以较好地描述电动汽车群体内部各个体之间演化博弈的过程，可做为车网互动背景下电动汽车群体行为规律的分析工具。

2）电动汽车群体内部不同用户对经济收益的敏感程度不同、不同用户的偏好存在差异。考虑用户偏好影响后选择充电策略的用户比率相对于不考虑时要高，且选择不充不放策略的用户比率变低，更加符合通过差异化电价调整用户参与度的实际情况。

3）收益是影响互动策略选择的关键因素，用户对互动收益的敏感度越大，选择放电的用户比例越高，参与车网互动的积极性提高，利用经济杠杆对车网互动的参与度进行调整是一种非常有效的调节手段。

4）外部环境因素扰动会对互动策略的形成产生一定的干扰，扰动越大，策略演化稳定过程中的波动越大，但对最终互动策略的选择不会产生影响。

参考文献：

[1] LI G， ZHANG X P. Modeling of plug-in hybrid electric vehicle charging demand in probabilistic power flow calculations[J]. IEEE Transactions on Smart Grid， 2012， 3（1）： 492-499.

[2] TUNDYS B， WISNIEWSKI T. Smart mobility for smart cities—Electromobility solution analysis and development directions[J]. Energies， 2023， 16（4）： 1958.

[3] 李志伟，赵书强，刘应梅. 电动汽车分布式储能控制策略及应用[J]. 电网技术， 2016， 40（2）： 442-450.

LI Z W， ZHAO S Q， LIU Y M. Control strategy and application of distributed electric vehicle energy storage[J]. Power System Technology， 2016， 40（2）： 442-450.

[4] 鲍谚，姜久春，张维戈，等. 电动汽车移动储能系统模型及控制策略[J]. 电力系统自动化， 2012， 36（22）： 36-43.

BAO Y， JIANG J C， ZHANG W G， et al. Model and control strategy of electric vehicle mobile energy storage system[J]. Automation of Electric Power Systems， 2012， 36（22）： 36-43.

[5] 李正烁，孙宏斌，郭庆来，等. 计及碳排放的输电网侧“风-车协调”研究[J]. 中国电机工程学报， 2012， 32（10）： 41-48.

LI Z S， SUN H B， GUO Q L， et al. Study on Wind-EV complementation on the transmission grid side considering carbon emission[J]. Proceedings of the CSEE， 2012，32（10）： 41-48.

[6] 程宏波，李明慧. 基于Stackelberg博弈的车-网双向互动策略研究[J]. 华东交通大学学报， 2017， 34（5）： 49-55.

CHENG H B， LI M H. Study on bilateral interaction between vehicle and grid based on Stackelberg model[J]. Journal of East China Jiaotong University， 2017， 34（5）： 49-55.

[7] 蔡国伟，姜雨晴，黄南天，等. 电力需求响应机制下基于多主体双层博弈的规模化电动汽车充放电优化调度[J]. 中国电机工程学报， 2023， 43（1）： 85-99.

CAI G W， JIANG Y Q， HUANG N T， et al. Large-scale electric vehicles charging and discharging optimization scheduling based on multi-agent two-level game under electricity demand response mechanism[J]. Proceedings of the CSEE， 2023， 43（1）： 85-99.

[8] 陈吕鹏，潘振宁，余涛，等. 基于动态非合作博弈的大规模电动汽车实时优化调度[J]. 电力系统自动化， 2019， 43（24）： 32-40.

CHEN L P， PAN Z N， YU T， et al. Real-time optimal dispatch for large-scale electric vehicles based on dynamic non-cooperative game theory[J]. Automation of Electric Power Systems， 2019， 43（24）： 32-40.

[9] 程杉，陈梓铭，徐康仪，等.基于合作博弈与动态分时电价的电动汽车有序充放电方法[J]. 电力系统保护与控制， 2020， 48（21）： 15-21.

CHENG S， CHEN Z M， XU K Y， et al. An orderly charging and discharging method for electric vehicles based on a cooperative game and dynamic time-of-use price[J]. Power System Protection and Control， 2020， 48（21）： 15-21.

[10] 刘东奇，张曦，钱奕衡. 电动汽车集群充放电演化博弈协同策略[J]. 电力系统保护与控制， 2023， 51（16）： 84-93.

LIU D Q， ZHANG X， QIAN Y H. Evolutionary game coordination strategy of electric vehicle cluster charging and discharging[J]. Power System Protection and Control， 2023， 51（16）： 84-93.

[11] 程宏波，李志成，王勋，等. 基于演化博弈的车网双向互动策略研究[J]. 中国电力， 2019， 52（7）： 40-46.

CHENG H B， LI Z C， WANG X， et al. Research on two-way interactive strategy of electric vehicle and power grid based on evolutionary game[J]. Electric Power， 2019， 52（7）： 40-46.

[12] 林国营，冯小峰，卢世祥. 基于演化博弈的V2G收益优化策略（英文）[J]. 东南大学学报（英文版）， 2020， 36（1）： 50-55.

LIN G Y， FENG X F， LU S X. Revenue optimization strategy of V2G based on evolutionary game[J]. Journal of Southeast University （English Edition）， 2020， 36（1）： 50-55.

[13] SUM P J. The optimal privacy strategy of cloud service based on evolutionary game[J]. Cluster Computing，2022，25（1）：13-31.

[14] 程宏波，商子轩，郭源曦，等. 车网互动过程的系统动力学分析[J]. 电网技术， 2021， 45（10）： 4125-4133.

CHENG H B， SHANG Z X， GUO Y X， et al. Research on vehicle-to-grid process based on system dynamics[J]. Power System Technology， 2021， 45（10）： 4125-4133.

[15] YU Y， LI G， LI Z. A game theoretical pricing mechanism for multi-microgrid energy trading considering electric vehicles uncertainty[J]. IEEE Access， 2020， 8：156519-156529.