摘要:针对传统电动汽车充电负荷预测研究未充分考虑季节性因素和预测精度低等问题,提出了一种基于随机森林的季节性电动汽车充电负荷预测模型。首先,使用某市整个公共充电站汇总负荷的公共数据集,构建了包含天气状况、温度等季节性因素以及历史充电负荷数据的输入特征矩阵。其次,采用主成分分析法和卡方检验对输入变量进行筛选。最后,利用随机森林算法对电动汽车充电负荷进行预测,将其应用于测试集并与支持向量机(SupportVectorMachine,SVM)方法进行对比。在测试集上的应用结果表明,与SVM方法相比,该模型的决定系数精度提升了66.93%,平均绝对误差(MAE)和均方根误差(RMSE)分别提升了37.19%和46.30%。以上结果证明该方法可以有效地预测电动汽车充电负荷,能够精准反映出充电负荷随着季节性变化的趋势。
关键词:电动汽车;季节性;随机森林;负荷预测
中图分类号:TP181文献标志码:A
0引言(Introduction)
电动汽车行业的迅猛发展引起了政府、汽车制造商和能源企业的广泛重视。随着电动汽车的大规模推广应用,电力系统将面临挑战和机遇并存的局面,其中巨大的充电需求造成的冲击负荷将会影响到配电网运行的稳定性和原有配电网的升级与规划等,并且这种影响会随着电动汽车渗透率的增大而将进一步加剧[1]。因此,构建有效的电动汽车充电负荷预测模型尤为关键,它能够为更好地规划和调度电动汽车充电设施提供有力支撑。然而,当前大多数研究只考虑了车辆和充电站方面的信息[2]和相关因素,预测方法得到的结果通常仅能捕捉日内的短期充电负荷演变[3]情况,却忽视了负荷曲线在不同季节间展现出的显著差异性。
针对上述背景,本文关注季节性因素对车主充电习惯的影响,将天气状况和温度与待分析的变量联系起来,采用随机森林算法构建充电负荷预测模型。结果表明,充电负荷预测模型能够有效预测各季节的充电负荷曲线,验证了充电负荷预测存在季节差异性,为电动汽车充电设施和电网的规划和建设提供了参考。
1预备知识(Preparatoryknowledge)
1.1国内外研究现状
由于电动汽车充电负荷在时空上表现出随机性、波动性和周期性的特点,因此建立有效的电动汽车充电负荷预测模型尤为关键。现有的负荷预测模型主要有基于充电时段的蒙特卡洛负荷预测模型[4]、基于充电概率的统计学负荷预测模型[5]、考虑时空分布基于出行链的预测模型[6]等。但是,使用这些模型进行预测时,通常缺乏对具体充电站实时负荷变化情况的分析,限制了它们对未来充电系统适应性的提升。
随着电动汽车的普及和充电数据的积累,机器学习技术的发展为电动汽车充电负荷预测提供了重要工具。其中,支持向量机是预测相对稳定的充电站日负荷的有效方法,例如刘敦楠等[7]针对聚类后的相似日负荷,采用最小二乘支持向量机预测电动汽车充电站的短期负荷。然而,SVM的缺点是缺乏通用性和对数据类型的局限性。同时,长短期记忆(LongShort\|TermMemory,LSTM)神经网络也被广泛应用于时间序列预测,例如CHANG等[8]针对电动汽车快充充电站电力需求的波动,提出了基于LSTM神经网络的预测模型。然而,电动汽车负荷的随机性是大多数时间序列预测算法面临的一大难题,因为一天的充电容量与前一天的充电容量并不一定相关。此外在复杂的现实世界中,一些时序数据往往可能出现多元化、不规则的现象,加大了对其进行预测的难度与误差。与上述方法不同,在一些研究领域,随机森林算法提供了准确的短期电力负荷预测,例如冯忠义等[9]构建了随机森林模型用于预测短期电力负荷需求,他们发现随机森林模型具有较高的预测精度和稳定性。充电负荷预测与电力负荷预测存在相似性,目前随机森林方法已被证明可以有效地应用于电动汽车充电负荷预测领域。毛为真等[10]提出了一种基于针对单一充电站负荷的随机森林电动汽车充电负荷预测方法,能有效地跟踪充电站每15min的预计充电量。VENKATESAN等[11]对机器学习模型进行了全面分析,以期预测电动汽车充电站的每小时能源需求,他们发现随机森林模型的表现优于其他模型。但是,以上研究未考虑天气、温度等季节性因素的影响,只关注日内峰值负荷预测的准确性,缺乏对长期趋势的预测和鲁棒性的关注,这可能导致模型在捕捉季节性变化和准确预测充电负荷方面存在一定的局限性。
1.2随机森林算法
随机森林是通过训练多个决策树建立的分类和预测算法模型。通过重采样(Bootstrap)方法从原始训练集N中重复随机选择n个样本并进行替换,以生成新的训练集和相应的决策树。随机森林执行回归分析时,根据所有树的预测值估计最终的输出值,对于分类问题则是通过投票确定最终的分类结果。随机森林算法结构如图1所示。
随机森林由多个回归树组成,这些回归树是描述性决策树。感兴趣变量所在的节点称为根节点,每个树底部的节点称为叶节点或终端节点。每个叶节点都有一个因变量值,除叶节点外的所有节点都是自变量。回归树可以定义为在此分叉处具有连续节点的因变量的平均值。由于随机森林算法在训练时遵循样本随机和特征随机的规则,因此它具有泛化能力强、不易过拟合、模型简单且准确率高等特点[12]。随机森林回归模型具体实施程序如下。
(1)构建初始训练集,N={([WTHX]X[WTBX]1,Y1),([WTHX]X[WTBX]2,Y2),…,([WTHX]X[WTBX]k,Yk)},[WTHX]X[WTBX]和Y分别为输入矢量及目标变量,在原训练集中利用Bootstrap抽样方法,随机且有放回地重新选择n个样本,作为该决策树的训练子集。
(2)对于每个节点,将最佳分割方法应用于m(m<k)个随机选择的变量。
(3)不设定分裂次数,不对树进行剪枝,直至每棵树无法再分裂,最终形成由多棵决策树构成的随机森林结构。
(4)使用剩余样本作为测试样本,在随机森林中的每棵决策树上进行回归预测。随机森林回归模型估计的值是每棵树输出的平均值。
2数据处理(Dataprocessing)
2.1数据描述
本文使用的电动汽车充电数据来自美国博尔德公开的26个公共充电站。采集数据的时段是2020年1月1日至2021年3月31日。每条充电会话包含以下信息:站点ID和位置、连接端口时间、开始和结束时间、连接持续时间、充电时长、消耗的千瓦时、温室气体减排和汽油节省及唯一的驾驶员标识。在剔除参数不全或有明显错误的无效充电行为后,剩下的有效充电会话共计5622次,其中工作日为3949次,双休日为1673次。考虑季节效应对电动汽车用户的充电行为具有多重影响,例如温度对电池性能的影响、不同天气状况对充电站访问的影响,以及在极端天气条件下可能出现的驾驶和充电需求模式。本研究在对数据进行预处理时,根据星期、工作日等时间特征添加天气状况的分类变量,并添加了与温度数据相关的连续信息。数据集特征描述如表1所示。
由于在处理非数值字段时存在数字化差异,因此本文对离散型数据的特征采用独热编码(One\|HotEncoding)的方式将分类变量转换为二进制向量的形式,从而提高模型的执行效率。例如,对是否为工作日,选择使用两位编码量化,分别表示为[10]和[01]。对分类型数据天气状况进行独热编码时,统计天气状况种类,将晴天、多云、阴天、雨天、雾雪天、雷雨天6种天气状况量化表示为[100000]、[010000]、[001000]、[000100]、[000010]、[000001]。
对数据集的初步分析显示,冬季期间,电动汽车消耗的能量比夏季多且充电时间更长,充电负荷和温度呈现季节性变化趋势,一年中各月份充电负荷和温度变化如图2所示。从图2中可以清晰地看到充电负荷与温度之间的季节性关联,证明了季节因素对电动汽车充电需求具有显著影响。此外,充电负荷随着季节变化而呈现出显著的波动,一年中不同天气类型下的负荷曲线对比如图3所示。在冬季,晴天时人们的出行意愿明显增强,而寒冷气候驱使人们更倾向于驾驶汽车出行。在夏季,多云天气的充电负荷较高,可能是由于气温适中,人们更愿意外出活动,从而提高了充电需求。在雾雪天和雷雨天,由于天气恶劣,人们出行减少,因此充电负荷相对较低。
2.2特征筛选
本研究采用Origin2021软件进行主成分分析(PrincipalComponentAnalysis,PCA)并进行绘图。针对包含充电时长、负荷、起始时刻、持续时长和温度5个数值型观测变量的数据集进行主成分分析。分析结果显示,前3个主成分(充电时长、负荷、起始时刻)的累计贡献率达到了87.4%,显示出了主要累计贡献率达到85%以上的能力,因此选取前3个主成分输入负荷预测模型中。图4直观地展示了这5个主成分在整个充电数据集中的贡献度比例。尽管新引入的温度特征的贡献值较小,但是考虑到本文关注季节效应下温度对充电负荷的影响,保留这个特征是合理的。此外,特征持续时长在原始数据中仅占11.1%的信息量,因此考虑去除该特征,以简化随机森林计算的cf180ffc1e0a3f131594386e109136e7复杂性。
电动汽车用户的充电起始时刻是决定充电负荷的关键参数之一,因此对其进行详细分析至关重要。通过对不同季节中电动汽车用户充电开始时刻进行分析,旨在识别季节性的充电模式和用户行为差异。观察发现,不同季节中电动汽车用户从到达充电站充电开始时间的概率分布呈正态形态,这反映了季节性充电行为具有一定的规律性,可以用高斯拟合对其进行平滑处理。不同季节中用户充电开始时间的概率分布如图5所示。分析图5可知,冬季受寒冷天气的影响,电动汽车的充电行为变化显著,表现为充电开始时间相对较晚且波峰最高,相较于其他季节出现明显的延迟现象。而在夏季,由于气温较高,人们更愿意在夜间进行充电,以避免高温对电池产生的潜在损害,因此夏季夜间充电概率较大。春季则处于冬季和夏季之间,波峰较高但充电开始时间相对较早,呈现出一种平衡状态。
此外,本文将负荷值分成多组,采用Pearson卡方检验验证电动汽车的负荷分类变量与时间因素之间的关系,即星期、工作日。结果显示,电动汽车充电负荷与特定的星期几(周一、周四)等无关,而是与工作日这一时间因素有关,卡方值分别为(χ2=37.723,p=0.390)和(χ2=13.305,p=0.038)。由于p>0.05,说明星期这个特征对该预测因子没有显著影响,因此选择移除该特征。
通过综合考虑主成分分析和卡方检验结果,最终保留7个特征作为后续预测模型的输入数据。
3预测算法(Predictionalgorithm)
本文考虑电动汽车充电站充电负荷受多种因素影响的复杂性,提出基于随机森林模型的充电负荷预测方法,其模型流程图如图6所示。
4实验与分析(Experimentandanalysis)
4.1模型训练
为了验证随机森林模型的有效性,在2020年12个月的数据中,利用前3个季度的充电负荷数据预测下一个季度的负荷需求。1月到9月的数据用于训练和验证模型,其余月份的数据用于测试模型。根据分割好的数据集和建立的模型,通过Python实现对训练集数据进行模型训练,以验证电动汽车充电负荷的预测准确性。
4.2模型评估
本文采取MAE、RMSE和决定系数R2作为评价指标对模型的预测精度进行验证。较小的MAE和RMSE以及接近于1的R2值,均反映出更准确和可靠的预测结果,计算方法如公式(1)至公式(3)所示:
其中:n为有效充电会话的数量,[AKy-]为实测负荷的平均值,y′(i)和y(i)分别为日充电负荷的预测值和实测值。
4.3结果分析
本文不仅提出了基于随机森林的电动汽车充电负荷预测模型,还对所提模型的预测结果与实际数据拟合情况进行了可视化展示。为了突出本文提出算法在负荷预测精度方面的优势,采用SVM算法进行对比实验。根据前文提到的3种评价指标,分别对随机森林模型和SVM算法模型得到的预测值与真实值进行计算,结果对比如表2所示。从表2中可以看出,在每日数据集的RMSE和MAE指标方面,随机森林模型的表现优于SVM。此外,随机森林模型的R2值为0.8602,说明该模型在对观测数据进行拟合时表现相对较好。测试组预测拟合图如图7所示,从中可以看出,随机森林模型的预测结果更加接近真实值,这证明了其能够捕获电动汽车充电负荷数据的基本动态,并提供更准确的预测结果。综上所述,本文的研究不仅凸显了随机森林模型在电动汽车充电负荷预测领域的应用潜力,也为该领域的深入研究提供了新的思路和方法。
5结论(Conclusion)
本研究对美国博尔德公开的26个公共充电站一年的充电事件的数据集进行了分析,综合考虑了星期、工作日等时间特征,并引入了与日平均温度和天气类型相关的连续信息。在此基础上,提出了基于随机森林的季节性充电负荷预测模型,并采用主成分分析和卡方检验等方法,挖掘了温度、天气类型等变量之间的关系。通过对充电开始时间进行分析,识别出季节性充电模式和用户行为的差异,并证实了电动汽车充电负荷与工作日之间的关联。利用前3个季度的数据预测下一个季度充电站的负荷需求。本文通过实验证明,相比于SVM,随机森林模型的决定系数精度提升了66.93%,在MAE和RMSE指标上分别提升37.19%和46.30%。结果表明,随机森林模型可以有效地预测电动汽车充电负荷,能够捕捉到充电负荷随季节变化的趋势。未来的研究可以继续改进随机森林模型,以提高其预测的准确性。
参考文献(References)
[1]陈男,孙晓东,马志鹏.电动汽车接入电网对电网谐波的影响[J].电子测试,2021(17):122\|123.
[2] 周珊珊,林永君.考虑充电行为的电动汽车充电负荷时空分布预测[J].工业技术创新,2022,9(3):120\|126.
[3]牛牧童,廖凯,杨健维,等.考虑季节特性的多时间尺度电动汽车负荷预测模型[J].电力系统保护与控制,2022,50(5):74\|85.
[4]任明远,姜明军,宋玉峰,等.基于蒙特卡洛法的城市电动汽车充电负荷预测[J].电气应用,2023,42(4):18\|23.
[5]张宇轩,郭力,刘一欣,等.电动汽车充电负荷概率分布的数值建模方法[J].电力系统自动化,2021,45(18):61\|70.
[6]程杉,赵子凯,陈诺,等.计及耦合因素的电动汽车充电负荷时空分布预测[J].电力工程技术,2022,41(3):194\|201,208.
[7]刘敦楠,张悦,彭晓峰,等.计及相似日与气象因素的电动汽车充电负荷聚类预测[J].电力建设,2021,42(2):43\|49.
[8]CHANGM,BAES,CHAG,etal.Aggregatedelectricvehiclefast\|chargingpowerdemandanalysisandforecastbasedonLSTMneuralnetwork[J].Sustainability,2021,13(24):1\|17.
[9]冯忠义,王咏欣,袁博,等.基于随机森林和改进局部预测的短期电力负荷预测[J].水利水电技术(中英文),2021,52(S2):300\|305.
[10]毛为真,李永攀,陆轶祺,等.基于改进随机森林算法的电动汽车充电预测[J].上海节能,2019(11):920\|925.
[11]VENKATESANPKAG,ANEESAFARHANMA,SUBRAMANIANGS,etal.ForecastingofEnergyDemandforElectricVehiclesusingMachineLearningTechniques[C]∥ProceedingsoftheIEEE:2023IEEEInternationalConferenceonEnergyTechnologiesforFutureGrids.Piscataway:IEEE,2023:1\|6.
[12]邓艺璇,黄玉萍,黄周春.基于随机森林算法的电动汽车充放电容量预测[J].电力系统自动化,2021,45(21):181\|188.