颜中原,苏晨飞,常 灵
(1.国家电网河南省电力公司,河南 郑州 450000;2.国家电网河南省电力公司新乡供电公司,河南 新乡 453000;3.河南九域腾龙信息工程有限公司,河南 郑州 450000)
短期电力预测(short-term energy forecasting, STEF)是对未来几小时到一周的能源需求的预测。STEF对于电力和能源系统的高效运行至关重要,特别是在能源平衡、能源市场交易和能源储备管理方面。在分布式能源系统、微电网和能源交易方面的新发展也拓宽了STEF在地方、分类层面的新应用[1-2]。先进计量基础设施(advanced metering infrastructure,AMI)或智能电表(smart meter,SM)数据的可用性提供了比过去更详细的电力终端使用信息,大大增加了地方一级精确STEF的潜力[3-4]。
STEF在电力市场和传动系统操作方面应用广泛。这些预测通常集中在大规模的总负荷上,例如整个国家或地区的电力需求,或输电系统运营商控制下的大型电网区域[5]。文献[6]提出了一系列不同的STEF方法,包括成熟的回归方法、基于神经网络的方法、混合预测的方法以及集成预测的方法。近年来,主动配电网和微电网中的应用推动了地方一级对STEF的研究[7]。STEF应用包括:预测需求侧管理、储能优化(最佳充放电时间和速率的选择)、电动车辆集成、微电网和虚拟发电厂应用[8]。此外,地方一级的STEF还可用于提供配电系统状态的负荷估计。在分发级别的STEF中,自上而下(top-down ,TD)方法广泛应用于多个节点的需求预测。在实际应用中,使用载荷分布系数(load distribution factor,LDF),用父节点(例如主节点)对配电变电站预测,然后分配给子节点(例如连接下游的二次变电站)[9]。自下而上(bottom-up, BU)的方法应用在对每个单独子节点的预测。随着智能计量的广泛应用,关于用电量的更详细、本地化的数据,为STEF创造了新的可能性[10]。
本文首先研究了聚合对电力需求建模和多节点需求预测的影响;其次,对影响电能需求的变量进行了详细评估,以及这些影响在需求聚合的不同级别是如何变化的;最后,概述了在地方一级将AMI或智能电表数据纳入STEF的方法,以便为分布式能源系统、微电网和交易性能源的应用提供更准确的STEF。本文所提出的测试是使用大型AMI数据集进行的。这些数据集为来自我国西南地区的需求记录和当地天气数据。
AMI和智能计量基础设施的发展,使得公用事业的数据更详细、精确,并且包括了各个用户的能源需求水平[11]。聚合级别较低的能源需求(例如单个用户的能源需求)的波动性通常比聚合总需求大。聚合需求在大量用户上的平均效应使得需求时间序列的波动性较小,短期内也更容易预测。
在较低的聚合级别下增加需求波动性的能量需求时间序列如图1。
图1 能量需求时间序列
图1(a)显示了大约2周内1 000个用户的总能量需求,清晰地表明了在该时间序列中的测试结果,即在傍晚时分达到高峰。图1(b)显示了在相同的2周时间内,随机选择的个人用户的能量需求。随机选择的个人能量需求模式的时间序列的波动性比较大,没有清晰的日变化规律,因此想要精确预测该时间序列将更加困难。
对来自不同层次的线性自回归预测模型需求汇总的测试结果表明,STEF精度在低水平聚合时会降低。这是因为分类后的负荷产生了更高的波动性和可变性。本文将对这种聚集效应进行详细研究。
本文采用的2个大数据集来自智能电表的数据记录。第一组数据集为重庆数据集,是重庆某地区1 400家客户连续24个月的智能电表需求数据,其单位设置为1 h。相应地,当地天气预报数据(包括典型的24 h提前预报误差)是通过气象研究所获得的。第二组数据集为四川数据集,是来自四川某地区智能计量系统的电力用户行为测试。在18个月的时间里,该数据集记录了该地区6 500名客户的半小时智能电表需求数据。气象局按要求提供相应的天气数据。
短期内影响电能需求的变量通常分为3类:与时间相关的变量;与历史数据相关的变量(例如、前一周的同期负载,前24 h的平均值);与天气相关的变量(气温的影响最大,但是其他天气因素,例如湿度、降水、太阳辐射、风等也有影响)。这些相关效应根据能量需求的聚集水平而变化。
在多元回归模型中,因变量表示为几个独立变量的函数。自变量的选择非常重要,因为它是模型质量的保证。通过分析了重庆数据集中1 400个用户的总需求量(兆瓦级别),可知需求与气温、露点呈负相关,与上周同期负载、前一天同期负载呈正相关。然而,负荷与小时数之间并没有显示出明显的线性相关性。
对于重庆数据集和四川数据集,考虑了气温、小时数、上周同期负载及前一天同期负载4个回归变量(自变量)的线性模型。模型训练结果表明,4个回归变量在1%显著性水平上具有重要性。相反,与气温有关的参数及之前24 h的平均需求不那么显著。决定系数(R2= 0.958)的高值表明模型具有良好的拟合性。
线性模型中的重要问题是多重共线性。多重共线性是指2个或多个预测变量具有高度相关性的现象。在本文使用的2个数据集中,气温和露点回归系数之间的相关性很高(相关系数为0.95),表明可以从露点估算温度,反之亦然。此外,数据集可以从气温和前一天同期负载中高度准确地预测以前的24 h平均需求量。
先前收集的信息用于选择最合适的回归变量。图形分析表明,露点及之前24 h的平均需求与变电站需求之间存在明显的线性关系。在线性回归中观察到的这些回归因子的低显著性是多重共线性检测到的结果。根据研究结果,在不考虑露点、工作日和之前24 h的平均需求的情况下,重复线性回归。
线性模型参数t统计如图2所示。
图2 线性模型参数t统计
线性回归的结果如表1所示。得到的t统计和P值数据表明了所选自变量的重要性。此外,与第一次回归相比,决定系数R2=0.958没有降低。
表1 线性回归的结果
可以采用不同的图形和数值方法来检查同构性、残差独立性和其他特性。试验分析表明,重庆数据集回归残差与自变量之间并未存在任何显著相关性。
对重庆数据集中地理区域的二次配电变电站的30个样本中的每个样本重复多元回归分析。每个变电站的用户数量各不相同,平均每个下游连接47个用户。详细数据分析显示,次级变电站需求(预测变量)与气温、小时数、上周同期负载及前一天同期负载之间存在很强的线性关系。事实证明,对于几乎所有的二次变电站,估算的模型参数(截距和5个回归因子)在1%显著性水平上都是显著。对于二次变电站模型,获得的平均决定系数为R2=0.748。
聚集效应对能源预测的影响是用多元线性回归来检验的。多元线性回归模型在STEF中有着非常广泛的应用。多元线性回归模型可以用式(1)表示。
yi=β0+β1xi1+β2xi2+...+βkxik+ei
(1)
式中:y为观测值与平均需求值μy的偏差;x1,x2,...,xk为预测变量(例如温度、上周需求、前一天需求);β1,β2,...,βk为预测变量的系数;β0为截距;e为观测值的模型误差;i=1,2,...,N。
模型参数b0,b1,...,bk是通过最小二乘误差最小化拟合数据样本计算的。 样本回归模型可以用式(2)表示。
(2)
式中:bk为βk的样本估计值。
系数测定R2可用式(3)表示:
(3)
R2是变量y中的量度,可以说是模型中的x变量。本文中,R2表示线性预测模型的拟合度。
图3显示了大数量用户(四川数据集中的1~1 400个用户)绝对百分比误差(mean absolute percentage error,MAPE)中R2预测误差。同样地,少用户数量的R2也是呈指数增长,直到在大约200个用户处开始收敛。收敛处大约为R2=0.96。与此同时,预测误差呈指数级下降。
图3 大批量用户下聚集对决定系数R2和24 h超前预测误差的影响
以上的多元回归分析可以深入了解聚合对模型拟合和预测精度的影响。通过这种分析,可以确定在每个聚合级别上的预测精度级别。例如,20个用户聚合在一起时R2可能的结果值为0.85,提前24 h MAPE在15%的范围内;而50个用户聚合在一起则得到R2>0.9,MAPE约为10%。以上分析也说明了在少量个人用户的情况下进行预测的难度较大。当用户数小于10时,模型拟合存在问题,R2<0.8,MAPE较大,在20%以上。
本节概述了用于预测配电网络中多个节点需求的预测方法,并比较了传统的TD预测方法和基于智能电表数据的BU预测方法。
父节点和子节点的需求示例如图4所示。图4显示了在1周内父节点(例如在配电网变电站)和相应的下游子节点(例如,单个配电馈线)处测试的需求示例。
图4 父节点和子节点的需求示例
预测方法如图5所示。
图5 预测方法示意图
在TD预测方法中,父节点的负荷预测Lp使用模型Mp进行。然后,使用LDF在下游的子节点(例如分配馈线)之间按比例分配或划分父节点预测。
本节研究了STEF在配电网多个节点上应用的结果,并比较了TD预测方法和BU预测方法在二级变电站级别聚合的智能电表数据。这种聚合水平的STEF对于分布式电网运行、微电网和交易能源的应用越来越重要。重庆数据集中,地理位置和每个用户连接的网络节点都是已知的。四川数据集中,智能电表数据定位是随机的,且位置是未知的。
考虑在居民区嵌入大量电动汽车的情景,电动汽车充电负荷被增加到居民需求中。分析中考虑的电动汽车的电池容量为16 kWh,额定功率为3 kW。在3.1节的分析中,将电动汽车充电负荷作为分析因素之一。
本文采用测试电动汽车项目中的实际电动汽车充电数据,分别使用TD预测方法和BU预测方法对10%和20%的电动汽车渗透率进行相同的预测分析。
电动汽车普及率误差统计如表2所示。
表2 电动汽车普及率误差统计表
二级变电站24 h超前预测误差汇总如图6所示。
图6 二级变电站24 h超前预测误差汇总
由表3和图6(a)可知,与TD预测方法相比,BU预测方法的平均误差提高了8.8%,误差的标准差提高了23.3%。使用两次样本t统计发现,使用BU方法的预测误差改善在30个二级变电站节点中的21个有统计学意义。
由表3和图6(b)可知,BU预测方法与TD预测方法相比,平均误差提高了8.6%,误差标准偏差提高了22.9%。在30个次级变电站节点中的20个中,使用BU方法进行预测误差的改善在统计上具有显著意义。
与TD预测相比,BU预测方法要进行更多的单独预测,所以需要更多的计算工作量。BU预测方法需要在所有子节点进行预测,而TD预测只需要在父节点进行预测。为了计算图6(b)所示的结果,在1个父节点和30个子节点的情况下,使用TD预测方法和BU预测方法分别需要0.014 s和0.083 s。由此可知,BU方法的计算量随着子节点数的增加而线性增加。
本文讨论了在配电网层面上应用AMI或智能电表数据进行多节点短期电能预测。使用来自国家西南地区的大型AMI数据集表明,模型拟合和预测精度高度依赖于聚集在一起的单个用户的数量。这些结果清楚地表明了标准预测模型在应用于较小用户群体时的局限性,对交易能源和微电网等应用具有重要意义。该分析可用于更好地量化适合不同用户数量的模型,而使用AMI数据为能源预测选择合适的聚合级别。
根据本文分析结果,均表明BU预测方法具有更好的性能。 由于每个节点都需要单独预测,BU预测方法需要更多的计算工作。 但是,本文提出的线性预测模型足够快,以至于不会将此额外的计算负担作为考虑的因素。TD预测方法和BU预测方法表现出轻微的季节性变化。通过开发季节性多元线性回归模型,可能会提高模型预测精度,但会增加复杂性和建模工作量。