(国网河北省电力有限公司 石家庄 050021)
目前,光伏发电行业正处于快速发展阶段,在整个配电网中也形成了更高的渗透率,考虑到光伏出力功率具有明显随机变化的特征,这就要求采取更加合理的调控方式来实现电力系统的规范化发展,从而更加高效地适应功率的波动现象。为了更加精确掌控光伏出力的规律,需要对其时间序列生成算法进行深入研究,由此合理规划电力系统的结构并有效控制系统的运行过程。同时,还要统计分析光伏系统的出力数据并对其进行进行准确预测,建立可靠的光伏出力功率预测模型,确保可以通过分析有限的实测数据便可以得到光伏出力的特点,以此实现对各项出力数据的深入了解,将影响光伏出力的各项因素都考虑在内。到目前为止,应用较广泛的光伏序列随机生成算法有马尔可夫链算法等[1~2]。有学者通过研究发现,利用一阶马尔科夫链可以对风光发电功率实现准确预测,并与原始序列预测模型达到良好的吻合程度,使概率特征和波动性都满足要求[4~8]。
根据相关文献研究结果可知,关于光伏出力功率的研究通常只是对单个光伏电源出力序列进行模拟测试[9~10]。文献[11]通过日算方法对无云状态下的太阳辐照特征进行了分析,并采用向量自回归模型来准确预测出力数据变化特征及其处于不同时间尺度下的波动规律,由此实现各光伏电站达到密切相关的状态。由于向量自回归模型具有特定的限制条件,利用该模型只能模拟分析短期阶段中的光伏出力时序,不能对电力系统实施灵活控制。文献[12]提出了一种利用双链马尔模型对负荷和可再生能源出力序列预测方法,从而不能同时得到可再生能源和负荷时间序列。
本文主要研究了多链马尔科夫-蒙特卡洛(MCMC)算法,利用一致的离散状态定义方法把光伏出力序列转变为可以表现大气特征的离散序列,从而大幅减小仿真复杂度,并在此基础上建立符合条件分布规律的马尔科夫链来模拟分析光伏电站与大气环境的变化特点,使各光伏电站间达到紧密关联的状态。经测试发现利用本算法来分析光伏电站出力序列可以实现对相关性的精确模拟,由此得到的序列统计参数可以与历史序列形成良好吻合的状态,由此可见利用本文算法分析多光伏电站出力时间序列是可行的。
光伏发电效率受到地球公转和自转的明显影响,这是因为日地距离与太阳的高度角都表现为周期性变化的规律,因此光伏出力也具有规律变化的特点。与其他可再生能源相比,光伏出力呈现明显的季节与日周期变化特点,同时受到大气环境因素的影响而表现为随机变化的现象[12~13]。
为提高数据分析的准确性,首先应做好光伏电站历史出力数据的预处理,并全面去除错误的测试数据以及实现空缺数据的补齐。为了解决数据空缺的问题,可利用线性插值方法来实现空缺数据的插入;只存在少量空缺数据时,可选择非邻均值生成方法进行填补。如果出现一个离散时序的当前状态由之前时刻状态决定时,可对该时序采取马尔科夫进行处理。在无云条件下进行光伏出力序列测试时,大气状态对于不确定性具有明显影响,并且当前大气状态受到之前大气状态的密切影响,此时可利用马尔科夫链对大气状态序列进行分析。
相邻区域光照条件较为接近,各地区大气条件将对该区域中的光伏电站出力具有明显影响,为了对光伏电站出力的各项影响因素进行综合分析,并对多个光伏电站出力状况进行模拟。采用多链马尔科夫模型进行分析时,并且也会受到该时刻下的其它链状态的关联作用。当各光伏电站形成明显的出力关联性时,则实际出力状态除了受到前期状态影响外,其它光伏电站的出力状态也会对其产生明显影响。这时可选择多链马尔科夫模型对光伏电站相关性进行分析并对光伏电站出力序列进行模拟。
对光伏出力预测模型进行修正时,总共包含了离散分类、蒙特卡洛抽样、状态转移学习、生成光伏序列共四部分。图1显示了实现上述过程的流程,如下所示。
图1 多链MCMC算法组合预测模型流
本研究利用多链马尔科夫模型离开完成历史数据状态转移特征的学习,之后通过蒙特卡罗抽样算法计算出离散状态序列,最后再对其进行还原得到光伏出力结果。在云层出现随机漂移、聚集以及消散的情况下,将会引起大气状态的明显变化而出现瞬时扰动的结果,为综合考虑上述随机波动特征,可以选择叠加白噪声序列ψ的方式来提高状态序列的修正精度。当某时刻光伏电站处于离散状态s(t),且这一时段属于第m个时期的第i个时段,可以把该时刻的光伏发电功率表示为下述形式:
表1给出了对本文各光伏出力进行测试得到的出力序列相关性结果。对表1数据进行分析可以发现,Port区域中相关性高于0.9的光伏电站出力序列总共有3个,呈现高度相关的特点;其中,Port、Bend、Ash区域中光伏电站出力序列相关度都高于0.7,最小的是Port的三个电站的相关性;进一步分析可以发现,宁夏区域也具有更小的光伏出力相关系数,这是因为这两个区域间的维度比较接近,导致两个区域在光伏电站出力方面具有相关性特征。同归对比可知,在地理位置上与光伏电站越靠近的地方更易受到大气状况的影响,由此表现为与光伏出力序列的显著相关性。
表1 光伏电站相关程度
图2 生成光伏序列概率密度和累积概率密度
利用多链MCMC算法对3组光伏电站出力序列进行仿真测试,计算得到图2序列参数结果。可以发现,通过多链算法生成的序列概率密度度达到了和历史序列非常接近程度,有效反映了对历史序列实施统计的情况。表2显示了分别以两种算法进行预测的序列和历史序列进行比较得到的平均绝对百分误差(MAPE),可以发现,在光伏电站达到较高的相关性时,采用多链算法计算出的预测序列均值和标准差比历史序列误差更小,因此能够保持明显的历史序列统计特征。这是因为相关性低的光伏电站具备更远的地理间隔,更不易受到大气和云层的影响。通过多链MCMC算法对光伏电站出力进行分析可以得到比单链算法更优的结果。
表2 不同相关系数下预测序列的基本统计结果
表3给出了分别利用两种算法来预测光伏电站出力序列生成的相关系数。经计算得到,在较大的光伏电站相关程度下,采用多链算法生成的预测序列能够有效保留原始序列的相关性。当光伏电站的相关性降低后,以上两种算法都能够继承历史序列的相关性。利用两种算法计算得到的预测序列相关系数,采用多链算法可以得到比历史序列更优的自相关曲线,有效保留了原序列的时间相关性。
表3 预测序列的相关系数对比
1)通过多链算法生成的序列概率密度达到了和历史序列非常接近的程度,有效反映了对历史序列实施统计的情况。在光伏电站达到较高的相关性时,采用多链算法计算出的预测序列均值和标准差比历史序列误差更小,因此能够保持明显的历史序列统计特征。
2)利用两种算法计算得到的预测序列相关系数,采用多链算法可以得到比历史序列更优的自相关曲线,有效保留了原序列的时间相关性。