基于马尔可夫链的智能微电网光伏发电预测

2023-05-08 03:02冯俊琨王黎光

计算机应用与软件 2023年4期

冯俊琨王黎光

(四川水利职业技术学院四川成都 611231)

0 引言

微电网作为分布式发电、可再生能源、储能系统应用的主要技术手段,可在两种模式下运行:并网模式和孤岛模式[1]。处于孤岛模式的微电网通常建在与配电基础设施和输电基础设施空间距离较大的地区。对于并网模式的微电网,其并网位置被称为公共耦合点(Point of Common Coupling,PCC)[2],通过PPC接收所需的能量。微电网最重要的特点是当发生某些事件时,如故障、电压降等,能够与配电系统隔离。在并网模式下,主要的挑战是最小化微电网内部资源的成本。除了内部资源外,其还可以通过配电网提供电能来满足部分电力需求。由此,中央控制器将确定各时段的能源供应的来源,以便在未来一段时间内降低成本。

近年来,空气污染危机引发了诸多争议,加剧这场危机的因素之一是石化燃料造成的污染。因此,作为石化燃料的替代品,太阳能等可再生能源的应用不断增加[3]。尽管太阳能有许多优点,但也带来了许多挑战,其中最重要的是它的出力不确定性。主要解决方案是采用一个合适的模型来预测太阳能性能并通过储能控制其电能输出。

在关于太阳能电池和电力需求建模与预测的相关研究中,文献[4]对供能和负荷需求预测领域相关的方法进行了分类。主要方法包括:(1) 极短期预测:在此模型中,负荷/发电预测为几秒钟、几分钟和几小时[5-6],该类模型通常用于实时调度;(2) 短期预测:该模型预测时间单位为数小时至数周,这些模型通常用于适应生产和需求[7-8];(3) 中、长期预测:这种预测可能因月而异。这些模型通常用于提供规划服务[9]。目前,最常见的预测模型的范围主要是每周、每天和每小时。上述三种模型之间最显著的差异是变量的时间范围。

另一方面,模型可以根据预测变量的数量进行分类。因此,主要有两类:第一类是只预测一个值的方法,比如第二天的负荷、下一个高峰日、第二天的总负荷等;第二类是预测多个值的方法,如峰值负荷和总负荷。

预测过程包括许多线性变量和非线性变量,这些变量和事件首先需要被检测出来,然后转化为方程模型。其中,线性模型主要可分为两类:时间模型和动态模型。其中:时间模型定义了来自指定时间序列的任何离散时间点的负荷,并带有预测周期,该模型存储基于先前观察的值,并在其基础上进行预测;动态模型则假定负荷不仅取决于一天中的时间,而且还取决于天气变量和随机输入。动态模型包括自回归模型和ARMA模型[10-11]。然而相比于上述线性模型,非线性模型具有更少的约束。其中,神经网络由于具有自适应学习、容错、易于集成等独特优势,引起了人们的广泛关注。在神经网络中,有两种主要的网络训练模式:有监督的学习和无监督的学习。在非线性模型组中,一些研究者通过应用温度、湿度和辐照度等气象标准的分类方法,预测了太阳能发电量和用电量。为了预测太阳能,文献[12]使用了Nave Bayes(NB)分类法,在应用过程中选择了三种连续变量,并利用马尔可夫链模型,估计了电池从一种充电状态向另一种充电状态的转变。文献[13]提出了一种根据温度和湿度对历史负荷曲线进行分类的层次聚类技术。通过一种无监督分类方法,文献[14]采用一种常见的消费行为模式来识别天数。文献[3]则将温度和太阳辐照度作为划分光伏系统不同运行条件的重要特征。此外,文献[7]和文献[15]还根据太阳能在各种运行条件下的分类历史数据,建立了一个高阶马尔可夫链。文献[15]则借助于历史数据,采用马尔可夫链对光伏发电进行建模。文献[16]提出了一种基于离散状态齐次递推马尔可夫过程的太阳辐射和云量预报方法。

综上所述,本文主要思路和方法如下:

(1) 进行基于马尔可夫链簇的光伏发电建模:计算特定月份中每天的太阳能出力,并根据该能量对天数进行排序。β%最低的日被称为“坏”日,其余的日被称为“好”日,并提出一个具有好态和坏态的两态链。此外,在所提出的马尔可夫链模型中,目前的工作是基于METAR准则和云体积状态来定义链状态,这在预测太阳能电池生产率的研究中还没有得到发展。因此,为了获得更准确的预测,本文根据季节和一天中的时间对链进行了聚类。

(2) 通过聚类链和权重分配减少发电量预测误差:目前的研究已经通过马尔可夫链聚类改进了太阳能发电量的预测。这些聚类使预测模块能够通过利用季节和时间因素以及权衡历史数据来减少误差。

(3) 基于环境特点的个性化模型训练:本文基于从真实云覆盖数据接收到的反馈不断训练所提出的模型。这种训练可以帮助模型适应其环境。为了训练该模型,将每个马尔可夫链的预测误差作为确定链的权值的准则。

最终通过算例验证了本文方法的有效性。

1 系统模型

1.1 微电网元件

每个微电网由许多元件组成,如发电系统、负荷和存储系统。微电网电能主要可能来自可变的分布式能源,包括太阳能电池和化石燃料发电机。微电网在需要的时刻可以利用太阳能电池等内部资源来满足用电需求,也可以通过控制PCC来维持功率平衡。本文假设太阳能电池和上级电网为电能来源,本地微电网用户为负荷,此外还考虑储能系统。

图1给出了微电网结构。这种结构将太阳能电池建模为分布式电源(Generation sources,DGs)。目前的研究暂时仅考虑分布式太阳能电池的并入。在未来的工作中,该结构可以增加其他分布式能源,如风力机。

图1 微网系统架构

在每个微电网中,能源管理的任务由微电网中央控制器(Microgrid Central Controller,MGCC)负责。MGCC根据供能和负荷需求情况以及下一阶段每种资源的成本,确定功率分配情况。除了考虑不给主要生产网络带来挑战外,MGCC还试图通过能源管理系统降低成本。如图1所示,微电网中央控制器由三个模块组成:发电预测、需求预测和优化模块。

1.2 光伏发电模型

本文策略使用马尔可夫链来预测未来一段时间内太阳能电池的发电量。通常而言,天空中云的覆盖量将直接影响发电量,因此通过云层的覆盖情况可以预测可用太阳能。为了模拟太阳能发电,本文提出一组马尔可夫链群(Cluster of Markov Chains,CMC)。将12个马尔可夫链聚类作为一级聚类,每组代表一年中的一个月。每一个集还包含m个马尔可夫链的子簇作为二级簇,其中m决定一天中划分的数目。在每个子簇中,根据历史数据生成n个马尔可夫链。n的值随着历史数据集的增长而增加。图2描绘了聚类后某一簇马尔可夫链的结构。其从晴朗的天空到完全的云层覆盖,主要包含了五种可能的状态。由于每个子簇中都有n个马尔可夫链,因此将子簇k中马尔可夫链l的状态i到状态j的转移概率定义为Pij(k,l)。历史数据有助于形成每个MC的转移矩阵(Transition Matrix,TM)。

图2 聚类后马尔可夫链实例

一组具有相同性质(如季节和时间)的n个马尔可夫链构成一个子簇。每一个子簇都可能包含大量的新旧历史数据。每个子簇包含一个月的数据并对其进行建模。本文模型(CMC模型)的总体方案如图3所示。在系统建立之初,借助于一组原始历史数据,建立了模型。为了产生具有一定容错率的预测,初始模型需要不断更新。每个马尔可夫链由一系列历史数据表示,这些数据决定了链传输矩阵的初始精度。为了考虑到新数据所带来的变化,这些数据将以一定的间隔连续输入模型。换言之,模型是基于随时间变化的数据进行训练的。

图3 基于马尔可夫的太阳能发电模型(CMC模型)

为了获得未来某时间段的预测出力,每个链提供一个预测值,其最终结果将根据所分配的权重进行计算。每条链历史数据的时间,初步决定了每条链的具体权重。其中,云量数据在时间上更接近预测期的链被赋予了更多的权重,并通过维护模块确定权重向量元素(Weight Vector Elements,NWV)的新值。

每次运行后,预测模块根据获得的误差更新每个链的权重。为了在模型增长过程中优化存储空间和降低预测模块实现的复杂程度,在子簇中去除权重小且预测误差相同的链。

2 能源调度

能量调度模块的输入是负荷需求、发电量、配电网购电价格和发电成本。在能量调度模块中,将储能系统的最大允许购电量和充电状态作为优化问题的约束条件。

2.1 供需预测

太阳能电池产生的能量取决于多种因素,最显著的是太阳能电池板安装区域的云层覆盖量。太阳能电池板i在时间段h内的发电量可通过式(1)计算[17]。

(1)

式中:c、e、K和Rh分别表示面板中的电池数量、各自的效率、临界辐射点(W/m2)和太阳辐射量。云的历史数据通常可以通过气象站获得。所得数据可以用来预测未来的云量。目前提出的模型由12个MC组成。每个MC状态空间由5个状态组成,即S:{CLR,FEW,SCT,BKN,OVC}。基于式(2)的系列相关历史数据集计算MC转移矩阵。在式(3)中,ti*表示从状态i转移到其他状态。

(2)

(3)

(4)

(5)

转换矩阵的概率是根据与序列相关的历史数据集计算的。式(3)中,k表示数据集中一天中的小时数,其值是由数据集大小决定的;Ld为数据总数。如式(4)所示,tij表示存在或不存在从状态i到状态j的转换。基于当前状态的概率向量和时间t-1中每个MC的转换矩阵,根据式(6)得到时间t的状态概率。换言之,通过链转移矩阵,就可以预测得到下一次迭代中的系统状态。

π(t)=π(t-1)×TM

(6)

为了预测下一个时间段的云量,首先根据白天和季节确定子簇。选定的子簇由n个链组成。基于链的权值向量对预测值进行聚合,从而确定云覆盖预测的最终值。

本文采用线性预测滤波器系数(Linear Prediction filter Coefficients,LPC)方法来估计负荷需求。LPC通过最小化最小二乘预测误差来确定前向线性预测器的系数。通过接收x和p项,LPC函数可以确定p阶线性预测系数,该系数基于过去时间序列x的实际值预测的。

a(p+1)x(n-p)

(7)

式中:p为预测滤波器多项式的阶数。

2.2 模型优化

本文的目标是通过考虑太阳能出力的限制和在给定时间段内从上级电网(配电网)电能的上限,使微电网的成本(cMG)最小化。在优化问题中,tk为起始点,该时间点可以根据一天中计划的开始时间采用不同的值。

(8)

(9)

(10)

∀i,t|i∈{1,2,…,l},t∈{tk,tk+1,…,T}:

αi(t)+βi(t)=1

(11)

0≤αi(t)≤1

(12)

0≤βi(t)≤1

(13)

微电网成本cMG可分为两部分:内部能源发电成本(cb)和在每个时间段t内从配电网购买能源的成本(cg)。所提优化问题中的决策变量为αi和βi,它们决定了必须由微网内部资源或配电网提供的电能(EDi)。式(9)和式(10)为存储容量限制(即时间段t内的可用存储功率,由荷电状态SOC(t)和电池以恒定电流放电时所具有的容量CCb决定),这分别由电池在时间段t的荷电状态以及微网在时间段t从配电网引入的功率限制来确定。此外,在时间段t内,每个电力需求i的αi和βi之和应等于1,且αi和βi的值必须介于0和1之间(式(12)和式(13))。限制从配电网购买能源对于防止电网电价下跌时出现电力需求高峰至关重要。此外,由于微电网的目标是合理控制分布式能源发电,并且能够在发生故障、电压降和断电等事件时将自身与配电系统分离和隔离,因此,能源购买的控制在调节微电网行为方面发挥着重要作用。本文的优化问题在日前进行解决,每天分为T-tk个时段。根据对各时段发电量和需求量的预测,对问题进行初始化和求解。

3 实验与结果分析

3.1 光伏发电预测

本文采用从爱荷华环境网(Iowa Environmental Mesonet,IEM)气象站收集的数据[18]。IEM收集了世界各地各站的气象数据(温度、风速和云量等),这些数据为用户提供了大约小时级尺度数据(少数站提供分钟级尺度数据)。首先,本文对IEM的数据进行了初步的细化,包括对云覆盖的METAR值进行数字化。然后利用细化后的数据构建马尔可夫链预测模型。

本文通过对一个气象站2010年至2015年期间的数据集的概率函数求平均,建立了一个概率质量函数。然后将该概率函数与2018年在同一个月和同一个小时内获得的概率质量函数进行比较。图4(a)为所获得的函数。如果这两个概率函数值之间的差异被视为误差,则在这种情况下,平均绝对误差将为0.064 878。在类似的比较中,当计算平均概率函数时,当前的研究为每个概率函数分配了与所收集云量数据的时间成比例的权重。如图4(b)所示,在这种情况下,MAE值较低(MAE为0.057 949 576)。因此,分配给不同马尔可夫链的权值向量可以在减少预测误差方面发挥关键作用,因此,权值向量在维护模块中被不断更新。图4(c)提供了经过10次迭代后根据训练的链权重向量计算出的pmf图。其中,马尔可夫链新权向量值的误差阈值εw取0.09。

(a) 2010年至2015年PMF和2018年PMF的平均值(MAE为0.057 949 576)

(b) 2010年至2015年PMF和2018年PMF的加权平均值(MAE为0.064 878)

3.2 负荷预测

为了选择一种预测能源需求量的方法,本文对英国家庭用电量数据进行了分析。该数据集分别为每户提供用电量数据。考虑到微电网的规模,将式(8)中的电力负荷需求视为家庭需求,或者是一个地区的家庭和其他用户的电力需求的累积效应。图5(a)显示了30 000 h的家庭用电量样本。图5(c)为这些数据的5次等效多项式曲线图。为了提取这些数据之间的关系,研究了2012年11月至2015年4月期间1 000户家庭累计用电量的自相关情况。图6(a)至图6(d)分别示出了一天、48 h、一周和一个月的功耗数据的自相关情况。LPC方法预测了系统的功耗。图7为图5(b)中数据的预测结果。平均绝对误差为24.549 9。此外,对100个数据集的子集进行了重复,平均预测MAE为31.5。

(a) 采样3×104 h的住宅用电量

(b) 周一(175 h)的功耗 (c) 多项式曲线估计图5 负荷数据

(b) 连续两天

(d) 一个月图6 居民用电量数据的自相关性

图7 基于LPC方法的功耗预测结果

3.3 模型优化

本文将每一天划分为24个时段,解决了接下来24个时段的优化问题。对于每个时段,荷电状态SOC(t)的估计是基于CMC模型对太阳能发电量的预测得出的。LPC方法还可以预测电力需求量。对于式(5)中的分时单价,其模型可分为五类:使用时间定价(Time of Use Pricing,TOUP)、临界峰值定价(Critical Peak Pricing,CPP)、极端日临界峰值定价(Extreme Day Pricing,EDP)、极端日定价(Extreme Day CPP ,ED-CPP)和实时定价(Real Time Pricing,RTP)。使用时间(TOUP)和实时定价(RTP)的区别在于前者预先确定价格和时间段,而后者两者都不预先确定。因此,分时费率可以被认为是静态的,而RTP费率是动态的,即使在特征价格时变之前也是如此。其他费率设计弥补了这两者之间的差距。虽然这些模型在确定定价细节和宣布消费高峰时间方面的作用不同,但TOU、CPP、EDP和ED-CPP可以归为同一类别。目前的研究假设宏网格根据TOUP模型提供能量。在该模型中,高峰时段电价为平均电价的2.5倍;非高峰时段电价为平均电价的三分之一。这里使用高峰时间设置为12点到18点、20点到23点,而非高峰时间则是23点到次日7点。

本文将微网用户的基本用电需求,如照明,划分为5个用电需求组,即ED1-ED5。采用LPC方法估计对于这5个组第二天的电力负荷需求。图8(a)显示了α与β的合计比率。图8(b)和图8(c)显示了用于电力需求电源分配的两个示例。如图8(a)所示,在用电高峰时段,蓄电池进行最大功率出力。此外,由于一天结束时电池充电状态的降低,在太阳能电池产生更多电能而能源成本较低的时段,电能需求由配网提供,以降低供电总成本。重复实验30次后的结果表明,能源成本平均降低了12%。

(a) 五组负荷

(b) 第二组负荷(ED2)

成本降低是由于对一整天进行了规划,并考虑到所有时段的资源和成本状况。表1比较了本文电源分配方案和常规方案在6天内的总能源成本。

表1 总成本值对比

常规方案仅根据每个时段的能源价格确定电源。也就是说,这个决定只是根据当前的情况和太阳能发电量做出的,未考虑下一个时间段的电池充电状态的影响。由表1可见,与常规方案相比,本文方法将总能源成本的降低值从8.8%提高到了15.5%。

4 结语

作为化石燃料的替代品,逐步引进太阳能等可再生能源的趋势日益明显。太阳能的利用具有许多优点,同时也带来了许多挑战。本文采用马尔可夫链对太阳能电池发电进行建模,并对模型进行聚类,与不进行聚类的模型相比,本文方案能得到更低的预测误差率。此外,研究采用新收集的数据(包括权重向量和链)连续训练CMC模型。结果表明,所提出的训练和维护模块将随着时间的推移降低预测错误率。

在未来工作中,笔者团队计划通过进一步分析从每个马尔可夫链、模型训练和维护模块获得的预测值,计算出太阳能发电最终量,从而降低错误率。