考虑时空相关性的光辐照度序列估计方法

2017-12-22 09:02龚莺飞
电力系统自动化 2017年22期
关键词:晴空测光辐照度

李 兢,乔 颖,龚莺飞

(1.中国能源建设集团有限公司,北京市 100022;2.电力系统及发电设备控制和仿真国家重点实验室,清华大学,北京市 100084)

考虑时空相关性的光辐照度序列估计方法

李 兢1,乔 颖2,龚莺飞2

(1.中国能源建设集团有限公司,北京市 100022;2.电力系统及发电设备控制和仿真国家重点实验室,清华大学,北京市 100084)

完整可靠的太阳光辐照度数据是光伏研究的前提与基础。文中提出了如何在测光站布点稀疏、异常数据比例高等不利条件下估计或重构辐照度序列的方法。利用相关系数法分析了甘肃河西走廊多个测光站的光辐照度在晴空和云层运动时的时空相关性规律。考虑盛行风影响,利用Voronoi多边形法建立了全区域相关系数模型。引入时间相位延时,建立了基于异步序列的数据重构模型。选择相关性最强的测光站数据作为输入,折算盛行风下的延时参数,估算待求位置的辐照度序列。数据检验表明,区域相关系数模型和重构方法的精度都可以达到较高水平。

光伏发电;光辐照度;相关性分析;数据重构;神经网络

0 引言

完整可靠的太阳光辐照度数据是研究光伏并网问题和光伏电站精细化评估的基础。现阶段光辐照度数据存在两方面的问题:一是异常、缺失情况普遍,识别剔除后的可用数据率偏低;二是测光站的布点稀疏,而光伏电站的规划和建设则呈大范围密集排布,亟须估算特定区域内所有坐标点上的光辐照度。因此,有必要研究在有限数据条件下光辐照度数据的估计或重构的方法,最大限度还原辐照度序列。

常见的时间序列缺失数据重构方法有随机回归重构法、趋势得分法[1]、马尔可夫链[2]、三次样条插值法等。可参考的还有风电数据重构方法:多点三次样条插值方法[3]和自回归滑动平均(ARMA)模型[3-4]。地理位置相近的风电场风速、风向的变化特征相近,文献[3]也提出了直接采用相邻风电场数据延时替代的重构方法,重构时间尺度为1.5 h。

太阳光辐照度数据同样具有时空相关性。文献[5]对光伏数据序列相关系数进行了计算,认为光伏数据相关性随着距离的增加迅速衰减,且随经纬度变化明显;文献[6]利用空间距离和时间尺度的比值作为自变量来模拟区域内不同地点的太阳辐照度的空间相关系数;文献[7]采用相关系数大的光伏电站数据作为目标光伏电站辐照度超短期预测模型的输入,认为光伏数据空间相关性很大程度上受到云层移动的影响。总体来讲,中国的光伏发电研究进展要滞后于风电研究,上述文献并未述及如何利用时空相关性来估计或重构太阳光辐照度序列。

现有研究的两个局限在于:①待求点上必须有观测点,没有该点历史数据,方法就无法使用;②基于时间序列方法的重构精度都受限于缺失数据的长度。对于光辐照度序列而言,有云层快速移动的非晴空日超过1 h的数据缺失,方法就可能失效。针对上述问题,本文拟从光辐照数据的空间强相关性出发,建立全区域相关系数模型,实现任意指定位置上的持续的光辐照度序列重构。

本文首先研究不同地点光辐照度数据序列的相关性随地点间距离和盛行风向的关系,提出了一种基于空间数据插值外推法的相关系数估计算法。选择相关系数最高的观测点作为输入,考虑辐照度序列互相关系数最值出现的延迟时间,进行人工神经网络训练,建立数据重构模型。最后,利用甘肃河西走廊地区的实测辐照度数据进行的算例分析表明,若测光站布置合理,在不超过350 km水平距离下,日光辐照数据重构模型是有效的。

1 光辐照数据的时空相关性分析

1.1 主要影响因素

太阳辐照度具有较强的昼夜周期性,不同地区辐照度曲线在晴空日具有相似的形状。当不同点之间空间距离较小时,大气层外太阳辐照度曲线的幅值和相位都较接近,具有较强的相似性。

在非晴空日,气象因素如云、温度、湿度等都是影响太阳辐照度的因素。其中,地理位置相近的光伏电站往往处于同一天气系统中,故气温、湿度等气象因素较接近,云层成为影响辐照度波动的主要因素。

随着云层的运动,同一区域不同光伏电站接收的辐照度可能会先后产生相似的波动,从而使得不同的辐照度曲线存在一定相位差,波动的时延性依赖于两地点间的空间距离以及云层的运动速度。

1.2 辐照度序列的相关系数时空规律

通过互相关系数,可以分析区域内不同测光站处总辐照度的相关程度和辐照度序列之间的延迟情况。

假设R1(t)和R2(t)是区域内两个光伏电站接收到的太阳总辐照度序列,可利用R1(t)和R2(t)的皮尔逊相关系数来描述二者的相关程度,公式如式(1)所示:

(1)

(2)

选取甘肃省河西走廊某地距离相近的3个测光点A,B,C(B测光点位于A和C西南方向,相对位置参见附录A表A1)。典型晴空日和非晴空日A测光点归一化后的辐照度序列、与B测光点和C测光点总辐照度序列之间的互相关系数如图1所示。相关系数越大,则说明序列之间相似程度越大,序列之间相互表达的能力越强。

从图1(a)中可以发现,晴空日大气透明度高、云量低,不同地点总辐照度相关性强,同步数据的序列相关系数接近于1,A和B测光点之间的距离为56.91 km,在经度上60 km以内的测光点接收到的太阳辐照度序列的时间相位差小于3 min。在测光站的数据时间分辨率为5 min时,可以忽略由于经度差异导致的相位差。

当区域天气系统变化明显,特别是云量的变化明显时,随着云层的移动和变化,会导致区域内不同地点接收的总辐照度随着云层的移动依次发生变化,体现在辐照度曲线中则是先后发生相似波动。图1(b)中当日为多云天气、风向西偏南。在风向上,A测光点与C测光点都位于B下游,云层到达A和C的时间差不多。A和C之间辐照度序列的互相关系数情况与晴空日时类似,图从略;而A与B测光点的互相关系数延迟40 min后出现最值。B并不在A的正上游,故A和B的辐照度曲线形状并不完全一致,所以互相关系数最值下降。

图1 总辐照度序列互相关系数规律Fig.1 Cross-correlation coefficient rule of global irradiance sequence

显然,云层的移动是导致小区域范围内各地点总辐照度波动关联性的重要因素。经调研[8]发现,该地区冬季盛行西风和偏西风。B测光点位于A测光点的西面,在盛行风的作用下,云层的基本移动方向是由B测光点移向A测光点,进而导致了在这两个地点地面总辐照度先后出现波动,并体现在序列互相关系数中。而A测光点和C测光点的位置关系与该地区盛行风向不一致,两地区云层情况关联性不强,因此互相关性程度不太稳定。

因此,地理相近的两个地点的辐照度序列的相关性规律可以总结为:辐照度序列的时间相位差等于相关系数最值出现的延迟时间T。T的大小与地理方位和云层实际运动情况(特别是盛行风向)相关。

1.3 区域辐照度相关系数规律

以甘肃省若干测光站数据为基础,研究大范围内多个测光站(相对位置参见附录A表A2)接收的辐照度序列的时空规律。图2是6个主要测光站的分布示意图。从图中可以看出,由于甘肃河西走廊的地理特点,测光站的整体横向分布与常年盛行风向(偏西风)较为接近。计算采用2014年全年测光数据,时间分辨率为5 min。

统计测光站之间全年的相关系数。距离与相关系数的关系如图3所示,可以看出,辐照度序列之间的相关关系与距离和盛行风向因素有关,大致随距离呈线性下降,但是同时受风向的影响。H-I距离最小,相关系数最大。两点连线与2014年整个区域盛行风向较为平行时,距离小的相关系数最高(例如F-G高于D-E);当距离相当的时候,方位对相关性的影响明显,即两地点之间的空间距离较大,但是两地连线与盛行风向较为平行,此时两地测量得到的辐照度序列的相关性依旧较强(例如I-J高于D-E和E-F)。

图2 甘肃省部分测光站分布示意图Fig.2 Location schematic diagram of partial metering stations in Gansu Province

图3 测光站距离与相关系数的关系Fig.3 Relationship between correlation coefficients and distances between metering stations

2 辐照度数据重构方法

2.1 方法流程

基于辐照度的时空相关性规律,本文将提出一种能够重构区域内任意坐标(xi,yi)上辐照度序列的方法。

晴空日或云层运动不明显条件下,可以采用周边相关系数最高的测光站的同步辐照度序列作为重构模型的输入;在非晴空日或云层迁移条件下,不同位置点辐照度序列相关系数在非同步情况下达到最大,则加入考虑延迟的输入有助于提高重构模型的准确度。利用D和F站数据计算任意坐标(xi,yi)重构数据的流程图见附录A图A1。

步骤1:依据区域内已有测光站的历史辐照度数据建立全区域相关系数模型。

步骤2:依据步骤1所得到的全区域相关系数模型,搜寻与待重构地点(xi,yi)相关系数最高的测光站(xm,ym)(即图2中的D站)。

步骤3:如果是晴空日,以(xm,ym)的历史辐照度序列为(xi,yi)的重构序列,结束;如果是非晴空日,继续搜寻与(xm,ym)在盛行风向上最近的测光站(xn,yn)(即图2中的F站),转到步骤4。

步骤4:利用式(1)所示互相关函数,计算(xn,yn)和(xm,ym)的时间相位差Tn。

步骤5:利用(xn,yn)和(xm,ym)的历史数据训练基于异步序列的重构模型。

步骤6:折算(xi,yi)与(xm,ym)的时间相位差T。分别计算(xi,yi)与(xm,ym)和(xn,yn)与(xm,ym)在盛行风向上的距离d1和d2。假设云层匀速移动,云层从(xn,yn)到(xm,ym)的时间相位差为Tn,(xi,yi)与(xm,ym)的时间相位差T=(d1/d2)Tn。如果(xi,yi)和(xn,yn)在盛行风向的上下游关系相反,则d1和d2符号相反。

步骤7:以研究时间内(xm,ym)的历史辐照度序列、时间相位差T输入步骤5中的神经网络模型,得到(xi,yi)的重构序列,结束。

2.2 全区域相关系数模型

本节说明2.1节中步骤1建立全区域相关系数模型的方法。

一般地,测光点之间的空间距离、方位与辐照度序列相关性之间的关系较为复杂,很难用简单的函数进行拟合。同时,由于测光点分布稀疏,不是所有地点之间的辐照度序列相关性都可以通过历史数据的分析得到,因此利用气象学中常用的空间数据插值外推方法(又称Voronoi多边形法)[9]生成全区域范围内不同地点之间的辐照度序列的相关系数。Voronoi多边形法是荷兰气象学家Thiessen提出的一种分析方法。最初用于从离散分布气象站的降雨量数据中计算平均降雨量。本文利用Voronoi多边形法计算相关系数的步骤如下。

1)计算所有测光站两两之间的相关系数。

2)所有相邻测光站连成三角形网(也称为Delaunay三角网)。

3)连接相邻三角形的外接圆圆心,即得到Voronoi多边形。边缘部分用三角形垂直平分线与图廓相交。每个Voronio多边形中有且只有一个测光站。

4)任意两个Voronio多边形内地点的相关系数就等于各自所包含的测光站的相关系数。

这样就可以得到覆盖整个区域、任意两点之间的相关系数。

2.3 基于异步序列的重构模型

本节说明2.1节中步骤5中建立异步序列重构模型的方法。

可用于数据重构模型的算法有很多,如神经网络算法[10-11]、回归算法等。考虑到影响光伏数据的因素复杂多变,很难用简单的线性拟合函数来描述不同地点的辐照度关系。本文采用反向传播(BP)神经网络算法,该方法是常用的神经网络算法,具有良好的非线性映射能力。

本文采用神经网络模型来得到重构模型。训练模型时采用(xn,yn)和(xm,ym)的历史数据训练。输入神经元为:①每日(xn,yn)和(xm,ym)的辐照度序列互相关系数最大值的时间,即时间相位差T;②每日互相关系数最大值,即式(1)中的最大值;③(xm,ym)的延时后参考点的辐照度序列(按延时T得到的异步时间序列)。输出神经元为(xn,yn)在同时刻的辐照度。

按文献[12]方法通过优化隐含层神经元个数来优化神经网络模型。在试验过程中,保持模型的输入和输出神经元不变,训练样本不变,改变两个隐含层的神经元个数,重构同一地点的太阳辐照度序列,以均方根误差为衡量精度的指标。仿真发现,随着隐含层神经元个数的变化,本例的模型精度变化并不明显,第一、二层隐含神经元可分别选取4和8。

3 算例分析

算例部分将首先检验全区域相关关系模型的准确性,然后验证利用辐照度的时空相关性进行数据重构的有效性。

3.1 全区域相关关系模型验证

利用空间数据插值外推法可以得到整个区域的相关系数模型,如图4所示。抽取若干测光站对比估算误差,整体均方根误差为1.41%,效果良好,详细对比数据参见附录A表A3。

图4 辐照度序列相关系数与方位和距离的关系Fig.4 Relationship between correlation coefficients of irradiance sequence and direction/distances

3.2 辐照度序列重构验证

选取附录A表A1中B站2014年1月的辐照数据验证重构方法的有效性,距离该站最近的是D站(56.91 km,方位256°)、盛行风向上最近站点为F站。

训练BP神经网络重构模型时,采用两种不同的方案:方案1的输入神经元为D站和F站的同步辐照度数据和重构时刻;方案2的输入神经元为D站和F站的异步辐照度数据和重构时刻。方案2相对于方案1的改进主要体现在非晴空日,误差统计如表1所示。方案2中的7天重构曲线如图5所示。

表1 方案1和方案2的重构误差对比Table 1 Comparison of reconstruction errors between scheme 1 and scheme 2

从图5中可以看出,当实际日辐照度曲线波动较小,即D测光站天气状况良好时,重构的辐照度曲线与实际曲线接近,而在非晴空日时,重构曲线和实际曲线有一定偏离。以第4日为例,分析气象日志可以看出造成误差的原因。该日风向为西风,而待重构的B站并非在D站和F站风向的正下游。也就是说,B站上空的云并不是直接从D站和F站漂移过来的,而是从其附近漂移过来的。云层在移动过程中也可能发生变化。因此,如果选取的参考测光站与待重构点与风向并不平行,在云层覆盖不均匀的情况下,可能引起较大误差。纠正这一偏差需要风向和云图的详细数据,已超出本文所依赖的数据范围。

图5 方案2辐照度重构曲线Fig.5 Reconstruction curve of irradiance in scheme 2

从对比结果来看,在区域辐照度曲线波动明显的日子里,方案2的重构均方根误差和绝对误差较方案1有明显的改善,而无论方案1还是方案2得到的重构平均绝对误差都较小。这说明考虑天气状态迁移及互相关系数最值情况可以有效提高数据重构模型的准确度。此外,方案2对少云日的改善效果最佳,主要是因为少云日云层移动较为平缓,云层形状在移动过程中变化小,而对多云日的改善效果较差,主要是因为多云日对流较多,云层形状在移动过程中变化大。

4 结论

太阳光辐照数据具有很强的时空相关性。本文提出了一种利用时空相关性与距离和方位的联系重构辐照度序列的方法。该方法适用于区域范围内的任意坐标点上持续时间的辐照度序列重构。得到的主要结论如下。

1)空间距离接近点之间的辐照度具有较强相关性,晴空日同步辐照度序列的相关性最强,非晴空日具有一定延迟的异步辐照度序列相关性最强,延迟时间与空间距离和云层移动情况有关。

2)在盛行风的作用下,方位和距离是影响辐照度数据时空相关性大小的重要因素。不同地点之间的辐照度相关系数可以用Voronoi多边形法估算,估算的平均均方根误差可控制在5%以内。

3)基于异步辐照度序列建立的数据重构模型是有效的,均方根误差可以控制在10%以内。

本文研究仅依赖廉价且布点密集的测光站数据,方法基本假设较为简单,受这两方面的局限,无法考虑受强对流天气影响的辐照度瞬时波动。本文适用于小气候条件相似、云层可以持续移动的区域。考虑到目标区域甘肃省河西走廊地区具有边界层对流不剧烈,云层相对较高,遮蔽效应对地表的辐照度影响较为简单的特点,方法仍具有可操作性。针对微地形复杂、云层变化的场合,需要更加密集的测光站点,并在构建相关系数模型前,先按风向、天气类型(如多云日、少云日)对输入BP神经网络模型的训练样本进行分类,可以弥补本文方法的不足。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx)。

[1] 张熙,李济宾,张晋昕.含有周期性的时间序列中随机型缺失数据的填补方法[J].中国卫生统计,2012,29(4):475-477.

ZHANG Xi,LI Jibin,ZHANG Jinxin.Imputation methods for missing values in time series with significant periodicity[J].Chinese Journal of Health Statistics,2012,29(4):475-477.

[2] YANG Jun,WANG Yinglong.A new outlier detection algorithms based on Markov chain[J].Advanced Materials Research,2012,366:456-459.

[3] 朱倩雯,叶林,赵永宁,等.风电场输出功率异常数据识别与重构方法研究[J].电力系统保护与控制,2015,43(3):38-45.

ZHU Qianwen,YE Lin,ZHAO Yongning,et al.Methods for elimination and reconstruction of abnormal power data in wind farms[J].Power System Protection and Control,2015,43(3):38-45.

[4] 张东英,李伟花,刘燕华,等.风电场有功功率异常运行数据重构方法[J].电力系统自动化,2014,38(5):14-18.DOI:10.7500/AEPS20130518005.

ZHANG Dongying,LI Weihua,LIU Yanhua,et al.Reconstruction method of active power historical operating data for wind farm[J].Automation of Electric Power Systems,2014,38(5):14-18.DOI:10.7500/AEPS20130518005.

[5] 张曦,康重庆,张宁,等.太阳能光伏发电的中长期随机特性分析[J].电力系统自动化,2014,38(6):6-13.DOI:10.7500/AEPS20131009012.

ZHANG Xi,KANG Chongqing,ZHANG Ning,et al.Analysis of mid/long term random characteristics of photovoltaic power generation[J].Automation of Electric Power Systems,2014,38(6):6-13.DOI:10.7500/AEPS20131009012.

[6] LAVE M,KLEISSL J,STEIN J S.A wavelet-based variability model (WVM) for solar PV power plants[J].IEEE Trans on Sustainable Energy,2013,4(2):501-509.

[7] YANG Chen,THATTE A A,XIE Le.Multitime-scale data-driven spatio-temporal forecast of photovoltaic generation[J].IEEE Trans on Sustainable Energy,2015,6(1):104-112.

[8] 王勇,王澄海,陶健红,等.甘肃酒泉地区近地层风场特征[J].干旱气象,2012,30(3):393-403.

WANG Yong,WANG Chenghai,TAO Jianhong,et al.Characteristics of wind field near ground layer in Jiuquan of Gansu Province[J].Journal of Arid Meteorology,2012,30(3):393-403.

[9] 李政,苏永秀,丁美花.基于台站温度资料对不同空间插值方法的比较[J].广西气象,2006,27(增刊1):90-91.

LI Zheng,SU Yongxiu,DING Meihua.Comparison between two spatial interpolation method based on ground temperature metering records[J].Journal of Guangxi Meteorology,2006,27(Supplement 1):90-91.

[10] 阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2005.

[11] 周志华,曹存根.神经网络及其应用[M].北京:清华大学出版社,2004.

[12] 王立威.人工神经网络隐层神经元数的确定[D].重庆:重庆大学,2012.

EstimationMethodofSolarIrradianceSequenceConsideringTemporal-SpatialCorrelation

LIJing1,QIAOYing2,GONGYingfei2

(1.China Energy Engineering Corporation Limited,Beijing 100022,China;2.State Key Laboratory of Control and Simulation of Power System and Generation Equipments,Tsinghua University,Beijing 100084,China)

Complete and reliable solar irradiance data is the prerequisite of photovoltaic generation research.A new method is proposed to estimate or reconstruct the solar irradiance sequence with constraints of sparse meters and high ratio of outliers.The temporal and spatial relationship of ground irradiance metering from various metering stations in Hexi Corridor in Gansu Province is analyzed by the correlation coefficient method on sunny and cloudy days.In consideration of the prevailing wind,the area correlation model is developed by Voronoi polygon method.By using time phasor delay,the data reconstruction model is built based on the asynchronous sequence.The absent irradiance sequence could be recovered by choosing the metering data with the highest correlation and equivalent time delay in the prevailing wind as inputs.The data test has shown that both the accuracy of the area correlation model and reconstruction model have reach a relatively high level.

This work is supported by National Natural Science Foundation of China (No.51677099).

photovoltaic power generation;solar irradiance;correlation analysis;data reconstruction;neural network

2017-05-17;

2017-07-05。

上网日期:2017-09-01。

国家自然科学基金面上项目(51677099)。

李 兢(1983—),男,通信作者,博士,高级工程师,主要研究方向:电力和能源行业宏观政策、能源战略规划。E-mail: lj1983427@gmail.com

乔 颖(1981—),女,博士,副教授,主要研究方向:新能源、分布式发电、电力系统安全与控制。E-mail:qiaoying@tsinghua.edu.cn

龚莺飞(1992—),女,硕士研究生,主要研究方向:可再生能源发电技术。E-mail:gongyingfei_eea@163.com

(编辑蔡静雯)

猜你喜欢
晴空测光辐照度
冬日的晴空(外一首)
WATING FOR THE SUNSET
本月话题机内测光系统
夏雨
中国典型地区水平总辐射辐照度频次特征*
不同种手机测光类软件在林业中的试用探析
太阳模拟器辐照度修正方法的研究
相机探秘测光指南
太阳光辐照度概率分布参数对电网可靠性的影响
应用计算几何的月面太阳辐照度仿真模型