纪昌明,刘 源,王 弋,张验科,陈 平,王丽萍
(1.华北电力大学 水利与水电工程学院,北京 102206;2.雅砻江流域水电开发有限公司,四川 成都 610051)
在水电站短期优化运行中,电站管理者需要以调度期内确定性预报径流序列为输入,根据电网、水电站及水库运行状况编制调度期发电计划,并将发电计划上报给电调部门进行审核。若审核通过,电站管理者以此为据在次日水电站运行中执行该计划,一般不得随意修改[1]。通常,由于短期径流预报不确定性较低,因此认为预报的径流序列与实测径流序列相同,在编制短期发电计划时不考虑预报的不确定性[2-3]。但已有研究表明,短期径流预报不确定性对于短期发电调度的影响难以忽视,其会导致制定的优化运行方案与实际运行结果产生偏离,造成水库弃水或水电站出力不足的风险[4-5]。在水电站实际运行过程中,若预报值偏小,则会造成弃水,使水资源得不到有效利用。若预报值偏大,则会造成出力不足,发电方需要外购电量而造成经济损失[6]。因此,在编制水电站发电计划时,应考虑径流预报不确定性的影响,在提高水电站发电效益的同时,保证水电站的实际发电过程与编制的发电计划尽可能的吻合,减小发电风险。
以贝叶斯随机动态规划(Bayesian Stochastic Dynamic Programming,BSDP)为代表的随机优化模型能够将径流预报不确定性信息显性地考虑到算法中,并且BSDP求解过程与水库多阶段决策的特点耦合性较高,计算过程的物理含义明确,因此受到广大工作者的关注研究和不断改进[7-9]。然而,现有的BSDP只能根据当前时段预报径流、前一时段实测径流以及当前时段初水位状态制定当前时段发电计划,然后通过逐时段的更新实测径流,进行逐时段的发电计划编制,最终得到整个调度期发电计划,其通常用于水电站中长期优化调度,其结果可为短期调度提供指导[10-11]。对于短期发电调度而言,需要以调度期内各时段的预报径流为输入,直接决策出调度期内各时段的运行计划,因此BSDP无法适用。并且,已有研究表明,以相似水文信息为基础的短期径流预报,各个时段间的预报不确定性存在相关性[12-14]。如何在水电站短期优化调度中考虑径流预报的不确定性及相关性,是值得深入探讨的问题。
基于此,本文对用于编制水电站短期发电计划的预报径流序列不确定性进行分析,以传统BSDP中的径流描述为基础,推导出预报误差序列与预报径流序列之间的关系,将预报径流序列的不确定性看作一个整体,提出了用于指导水电站短期发电计划编制的耦合整体预报不确定性的水电站短期优化调度模型。考虑到模型求解的复杂性,本文采用聚类分析、copula函数对建立的高维联合分布进行了简化处理,并采用统计模拟法描述预报不确定性。同时以锦西水电站为例进行实例研究,对比传统确定性优化模型与本文所建模型的区别。
对于水电站短期(通常以1日为调度期)发电运行而言,电站管理者根据预报的调度期内各时段的水库入流制定调度内各时段的发电计划。假定调度期时段数目为T,调度期内各时段预报径流值分别为ft(t=1,2,…,T)、实测径流值为qt,用于编制水电站发电计划的预报径流序列为F=(f1,f2,…,fT),相应的实测径流序列为Q=()q1,q2,…,qT。基于预报径流的水电站短期优化运行模型,模型输入通常为预报径流序列F,其取决于预报时刻的降水、流域水文条件等信息,预报过程如图1所示。
图1 短期径流预报示意图
对于电站管理者而言,在编制发电计划的过程中,通常需要面临两种不确定性:(1)径流不确定性。采用一阶马尔科夫链对径流不确定性进行描述时,径流的不确定性可以表示为先验概率。表示t-1 时段实测来流为i时,t时段实测来流为j的概率,反应了径流的随机性。(2)预报不确定性。预报不确定性可以表示为似然概率或,其表示t时段预报来流为k时,实测来流为j的概率,可以反应径流预报的水平。上述概率值均可以通过对历史径流数据统计得到。基于先验概率和似然概率,分别采用贝叶斯定理和概率乘法定理,即可计算得到后验概率和可测概率。其中为BSDP中描述径流预报及其不确定性的后验转移概率矩阵,其表示t-1时段实测来流为i且t时段预报来流为k时,t时段实测来流为j的概率。则表示t时段实测径流为j时,t+1时段预报径流为l的概率值,反映了未来时段径流预报不确定性受预报时段实测径流的影响。
式中:R(F)为水电站在调度期内的总发电量;Et[Nt(·) ]为t时段预报入流为ft时的期望发电量;Nt(Vt,ft,Vt+1) 为t时段的出力函数;Vt为t时段初库容;∆t为t时段的时段长度;Bt(Vt,i,k)为在t时段初库容为Vt、t-1时段实测径流为i且t时段预报径流为k时的余留效益值。式(4)通过后验概率考虑径流不确定性与预报不确定性对于优化运行方案的影响。如图2(a)所示,对于后验概率,其仅反映了当前时段的预报不确定性,忽略了调度期内不同时段m、n(m≠n)之间预报不确定性与的联系。由于预报径流序列F是采用预报时刻相似的水文信息,因此随着预见期的增加,预报信息的有效性随之降低,径流预报的不确定性随着增大[15]。采用径流预报误差et反应t时段的预报不确定性,则上述规律可以表示为,随着调度时段t的向前推进,et的统计参数方差随之增大,并且同一调度期内不同时段之间的预报误差em和en存在相关性[16]。
图2 不同模型对于径流不确定性描述方法
上式给出了调度期内当预报径流序列F已知时,径流预报误差序列E的后验联合概率密度。其既考虑了不同时段径流预报的不确定性,同时兼顾了不同时段不确定性之间的相关性。由于Pr|F的计算十分复杂,其变量数目为2T,高维情形下联合分布的参数估计具有相当大的不确定性[17],因此难以求解。考虑到短期径流序列各时段间预报径流量级十分相近,因此本文对上述联合分布进行简化处理,通过对预报径流序列分为不同的级别M(M=1,2,…,N),建立不同级别M下径流预报误差的联合密度PE|M,将2T维联合分布分解为N个T维联合分布,降低求解难度。
3.1 目标函数 水电站短期优化运行的目的是通过水库的调蓄作用,对调度期内的入库径流在各时段间进行合理分配,进而在保证水电站安全运行的前提下,提高水电站的发电效益。因此本文以调度期内期望发电量最大为目标建立模型,模型的目标函数为:
区别于传统的期望发电量最大目标函数(3)分别考虑各时段预报不确定性,使得各时段期望发电量最大,将各时段的期望发电量之和作为调度期内期望发电量最大。本文的目标函数则将调度期内预报径流序列的不确定性看作一个整体,在优化运行方案下使目标函数的期望发电量最大。
3.2 约束条件 模型考虑的约束条件如下。
(1)水量平衡约束:
(2)水位约束:
(3)边界约束:
(4)出力约束:
(5)流量约束:
式中:ot、st和rt为t时段发电引用流量、弃水流量和出库流量;Zt为t时段初水位;Nt为t时段平均出力;、分别为t时段初水位下限和上限,其下限通常为水库死水位,上限对应为汛期的防洪限制水位或非汛期的正常蓄水位;∆Zt为t时段的水位变幅上限;Zstart、Zend分别调度期始、末水位,可以通过中长期优化调度得到;、分别为t时段出力下限和上限,其下限对应水电站保证出力,上限则表示水电站的预想出力;、分别为t时段出库流量下限和上限,其下限为下游生态流量约束,上限则受制于水库的泄流能力和下游防洪泄量约束。
本节将模型的求解分为两个阶段进行。第一阶段对预报径流序列的级别进行划分,并拟合出不同径流序列量级下的联合分布函数。第二阶段则是以第一阶段的联合分布为基础,制定出预报径流序列为F时的最优运行方案。两阶段下求解流程图如图3所示。
图3 模型求解流程
4.1 联合分布建立 采用式(7)分析预报径流序列不确定性需要获得预报径流序列F的量级FM。已有研究表明径流预报不确定性与预报径流值存在联系,且随着预报径流值增长,预报不确定性随之增加[15]。因此,分类结果须体现各量级在预报径流值上的区别。本文采用K均值聚类法对高维变量进行分级。采用欧式距离d(F,FM)作为样本的相似性度量。K均值聚类法的凝聚点FM分别为各类径流序列的均值,各类预报径流序列之间的区别取决于其于凝聚点之间的距离,因此随着凝聚点均值的增加,类中径流序列的量级也会增加,可以反映预报径流值随量级增长的属性。进一步,根据分类结果得到的各级凝聚点,采用函数(18)计算预报径流序列F的量级MF。
根据聚类分析结果,本文采用copula函数建立不同级别M下维变量E的联合分布函数ρM和联合密度函数ϕM。在建立ρM和ϕM之前,需要确定各时段预报误差的边缘分布函数。由于径流预报误差的影响因素众多,采用参数估计时,其具体的联合分布需要通过在多种分布中进行遴选才能给出,并且有时选择结果并不理想[18]。因此,本文采用非参数估计中的核密度估计法建立et边缘分布函数:
式中:n为样本数量;h为窗宽;γ(t)为核函数。
当随机变量et边缘分布函数Gt(et)已知时,根据Sklar定理,其联合分布函数ϕM(e1,e2,…,eT)和联合密度函数ρM(e1,e2,…,eT)可以表示为:
式中:C为copula分布函数;c为copula密度函数;ut为et的边缘分布函数值;ut~U(0,1) 。
4.2 优化运行方案制定 就式(8)而言,因需要获得不同可能来流下的确定性优化运行方案及该方案对应的期望总发电量,难以根据传统的确定性优化理论或随机优化理论进行求解,因此本文采用统计模拟法,通过随机模拟生成量级MF下服从联合分布ϕMF的随机序列E来描述径流预报的不确定性及不同时段之间不确定性的相关性,在已知预报径流序列F的条件下,优化运行方案的具体求解过程如下:(1)确定联合分布形式。将F代入式(18)计算F的量级MF,确定MF对应的联合分布ϕMF。(2)生成可能实测径流序列。根据ϕMF随机模拟生成K个径流预报误差序列,k=1,2,…,K,然后根据式(9)计算得到K个可能实测径流序列,由于模拟生成的误差序列包含了预报径流的不确定性特征,因此可以认为,生成的可能实测径流序列Qk为预报径流序列F下的所有可能实测来流情况。(3)生成可能最有运行方案。基于可能实测径流序列,采用确定性动态规划求解得到第k个可能实测径流序列Qk对应的最优运行方案,依次求解后,即可得到全部的K个可能最优运行方案。由于Qk(k=1,2,…,K)为全部的可能实际来流情况,因此Zk(k=1,2,…,K)为全部的可能最优运行方案。(4)计算目标函数值。对于第k个运行方案Zk,根据式(8)即可计算运行方案Zk对应出力过程及期望总发电量Rk。在所有方案中选取出期望发电最大的运行方案Z*即为所求方案,即直接使目标函数的期望发电量最大的优化运行方案。
本文选取四川省雅砻江流域锦西水电站进行实例分析。锦西水库具有年调节能力,是流域梯级水电站的龙头水库,具有重要调节作用。本研究采用锦西水库2014—2018年各日的预报、实测入库径流序列进行不确定性分析。各日预报径流序列为逐6 h的径流值。锦西电站参数见表1。
表1 锦西水电站基本参数
5.1 联合分布建立 采用聚类分析法对预报径流序列进行分级,根据聚类分析结果对不同量级下的预报径流序列区间进行划分,并计算不同量级下误差序列在各时段的标准差用于度量其预报不确定性,结果如表2所示。
表2 预报径流序列分级结果
由表2可知,预报径流序列共分为三个量级,不同时段下预报径流值随着量级的上升而增长。同时,随着预报时段和预报量级的增长,标准差总体上均呈现递增趋势。因此,分类结果是合理的。此外,考虑到不同量级下的计算方法相同且预报不确定性较高时对于水电站运行更加不利,因此,本文后续只对预报不确定性最高的量级3进行分析,以验证所建模型的有效性。
采用K-S检验对建立的边缘分布函数拟合结果进行检验,检验结果在6 h、12 h、18 h、24 h下的p值分别为0.33、0.54、0.62、0.74,均明显大于阈值0.1,建立的边缘分布函数可以通过假设检验。为分析不同时段预报误差的相关性,分别采用斯皮尔曼秩相关系数和肯德尔秩相关系数用于度量不同时段预报误差间的量级相关性,皮尔逊线性相关系数则用于度量不同时段预报误差间的线性相关程度,计算结果如表3所示。由表3可知,不同预见期下径流预报误差均具有较强的相关关系,并且相关性随着相隔时段的增加递减,短期径流预报序列E在不同时段间的预报误差et之间存在显著的相关性。
表3 量级3下预报误差相关性分析结果
由上述分析可知,不同时段预报误差et之间存在多种相关关系,因此本文采用Studenttcopula函数建立各时段预报误差的联合分布,其能够较好的构建变量之间复杂的相关性特征。Studenttcopula函数拟合参数及K-S检验结果见表3。由表3可知,拟合结果可以通过假设检验。可以将其用于耦合模型的求解中。
表4 量级3下Student t copula函数拟合检验结果
5.2 短期运行结果分析 本文以1日为调度期长度,计算时段数为24,各计算时段长为1 h。量级3下,各时段径流预报误差et的统计特征均值均大于0,这说明当预报的径流序列属于量级3时,实际预报往往会高估实测径流,因此以2018年10月17日为典型日,其各时段预报径流值均高于实际径流值,能够代表量级3下的预报径流序列特征。将典型日4时刻的预报径流数据插补延长为24时刻预报径流数据,以调度期总发电量最大为目标,建立锦西水电站短期优化调度模型。为了更好的分析和评价本研究所建模型的适用性与优势,本文分别建立传统的确定性优化模型(简称“确定性模型”)和耦合整体预报不确定性的优化模型(简称“耦合模型”),同时采用实测径流序列根据确定性优化模型制订“理想方案”,用于比较两种模型计算结果与理想方案之间的区别。
如图4 所示,确定性模型计算得到的控制水位过程位于另外两种水位过程的上方,这是由于确定性优化模型忽略了预报不确定性的影响,直接将预报径流看作实际径流,充分利用预报的可用水量尽可能抬高水头以增加调度期总发电量。耦合模型计算得到的水位过程与理想方案相同,同时其时刻0-21的控制水位低于确定性优化模型结果,这说明其考虑到径流预报的不确定性,认为实际可用水量小于预报可用水量,其抬升水位过程较低且缓慢。时刻22-24 则是受到泄流能力及水位变幅的影响,各运行方案均快速降低水位以满足时段末水位要求,因此各方案运行水位重合。由此可知,本文所提出的耦合模型比传统模型更符合实际过程。
图4 各方案控制水位过程对比分析
进一步对各方案的计划出力过程与实际出力过程进行对比,以分析各方案的实际效益与运行风险。对于水电站而言,若当前时段预报值偏大,实际出力低于计划出力,发电方需要外购电量以维持电网的安全稳定运行,这会造成发电方的损失。若预报值偏小,即当前时段可用水量大于计划可用水量,则当前可用水量能够在满足发出指定负荷的同时发出多余负荷,这些多余负荷也不易被电网吸收,会造成资源浪费。因此,在实际生产过程中要求水电站的实际发电过程与计划的发电过程尽可能的吻合。本文采用实际发电量衡量各方案的实际效益,同时采用海明贴近度作为风险指标,度量不同方案的实际运行风险,其值越大,表明实际出力过程与计划出力过程偏离程度越高。
表5给出了各种方案下的总发电量与贴近度。对于理想方案而言,其直接采用实测径流序列制定优化运行方案,因此计划发电量与实际发电量相同且贴近度最高,这是管理者追求的最理想情况,但在实际运行中无法实现。对于确定性模型而言,其计划总发电量为6161.99万kW·h,高于耦合模型计划总发电量的6146.52万kW·h,且更加接近于理想方案。但确定性模型的实际总发电量为5755.45万kW·h,低于其计划总发电量406.54万kW·h。耦合模型的实际总发电量为6176.71万kW·h,高于其计划发电量30.17万kW·h。因此,对于该典型日而言,采用确定性模型制定方案将导致发电方采用外购电量的方式弥补不足发电量,造成经济损失;而对于耦合模型而言,其总发电量高于计划发电量,因此不造成发电方的经济损失。假定对于发电方而言,其售电电价与购电电价相同,则采用总发电量作为其效益指标时,确定性模型实际收益为5348.91万kW·h,低于耦合模型实际收益797.61万kW·h。可见,相较于确定性优化模型而言,耦合模型在该典型日能够更有效的增加发电效益。对两者的贴近度进行对比分析,确定性优化模型计算结果的贴近度为-16.54,这表示确定性模型的实际出力在各时段平均偏离计划出力17.54万kW·h;耦合模型贴近度为-0.26,表示其实际出力在各时段平均偏离计划出力1.26 万kW·h,其结果远小于确定性模型制定方案的偏离程度,因此,其运行风险(弃水或出力不足风险)远低于确定性模型。
表5 各方案实际发电量与贴近度
为了进一步分析,图5给出了两种优化模型计算的出力过程与实际出力过程。由图5可知,采用确定性模型制定优化运行方案时,其实际出力过程与计划出力过程偏离较大,而耦合模型的实际出力过程与计划出力过程偏离较小,这与贴近度指标的分析结果相同。就确定性模型而言,其在时刻0-18的实际出力值均小于计划出力值;结合图4中确定性模型的水位过程进行分析,时刻0-18的水库水位处于抬升趋势且其计划出力并未达到预想出力,由于实际来水小于计划来水,导致时段的可用水量减少,因此各时刻实际出力小于计划出力;而对于时刻18-24而言,时刻18-24的水库水位处于下降趋势,各时刻可用水量为各时刻来水与水库蓄水,可用水量较高,各时刻均能达到预想出力且有弃水。当实际来流小于预报来流时,实际泄流量减少、发电水头增加,出力增加。对于耦合模型而言,时刻0-20水位处于上升趋势,当实际来流大于预报来流时,时刻0-20可用水量增加,实际出力增加。其时刻0-24实际出力增加原因与确定性模型原因相同。
图5 各模型计划出力过程与实际出力过程对比分析
对于期望值模型而言,其实际运行效果通常表现长期计算结果的统计均值上。因此,为进一步验证所提理论的有效性,本文选取2016—2018年共300场量级3下的预报径流序列,分别采用确定性模型和耦合模型编制运行方案,并与理想方案进行对比,对不同方案下的实际效益和运行风险进行分析,计算结果如图6所示。
图6 各方案下300场计算结果对比分析
图6中展示了三类方案在各场次下的实际总发电量与海明贴近度。可以看出理想方案的实际发电量与海明贴近度指标在各场次下均高于另外两种模型所制定的方案;此外,由图6可知,相较于确定性优化模型而言,耦合模型的实际发电量与海明贴近度整体上均较好。300 场计算结果下,理想方案、确定性模型、耦合模型的实际发电量均值分别为5646.30万、5561.70万、5630.17万kW·h。相比于确定性模型,耦合模型实际发电量增加1.25%,且仅低于理想方案0.27%;理想方案、确定性模型、耦合模型的海明贴近度均值分别为1、-2.70、0.35,耦合模型的海明贴近度均值要高于确定性模型,且更接近理想方案,因此耦合模型的实际运行风险要小于确定性优化模型。对图6进一步分析可知,确定性模型在多数场次下出现海明贴近度较小且发电效益较低的情况,而耦合模型在这些场次中均有效增加了发电效益并降低了运行风险。这说明,对于一些采用确定性模型容易造成极端风险的场次,耦合模型都能够对这些风险进行有效较小。因此,整体而言,耦合模型对于提高发电效益和方案可靠性都有显著作用。
本文从水电站短期优化运行的实际生产过程出发,提出一种耦合整体预报不确定性的水电站短期优化调度模型。其将各时段预报径流的不确定性转换为预报径流与径流预报误差之间的关系,进一步耦合不同时段之间径流预报不确定性之间的相关性,将径流预报的不确定性看作一个整体。进一步,考虑到所建分布的复杂性,采用聚类分析和copula 函数对建立的分布进行简化,并提出了相应的求解方法,最后将所提模型与传统的确定性优化模型进行对比。通过实例运算和对比结果表明,简化处理后的联合分布仍然能够反映预报不确定与预报径流量级以及预见期之间的关系,简化结果是合理的。通过选取典型日和多场模拟结果的求解结果进行对比,验证了所提模型对于发电效益提高以及降低运行风险的有效性。因此本文所提出的新优化模型具有一定的理论性和可行性,为解决径流预报不确定性对于水电站短期优化运行的不利影响提供了新的研究思路。