肖 博, 朱 海, 张素君, 张 幼, 赫卫国, 莫绍凡
(1.上海工程技术大学, 上海 201620; 2.绩元(上海)数据科技有限公司, 上海 201107; 3.中国电力科学研究院有限公司, 江苏 南京 210003; 4.旻投电力发展有限公司, 江苏 南京 211100)
在可再生能源光伏领域, 太阳辐射数据是光伏项目的设计、 工程收益评估及后期运维的重要基础数据[1],[2]。 我国地缘辽阔,地面太阳辐射观测站点稀少且分布不均, 目前中国气象局(China Meteorological Administration,CMA) 仅有110 多个气象站点观测太阳辐射参数, 站点数量远不能满足高精度太阳能利用的需求[3]。 大部分光伏电站通常安装地面辐射计来辅助电站的运维管理,但辐射计的等级不高,且缺乏定时的校验及维护。对分布式或户用光伏, 由于电站数量巨大和成本限制,往往不会安装辐射计,这给后期的运维带来了困难。 通过卫星反演技术可获取全球范围内高时空分辨率的地表太阳辐射数据, 可以解决地面观测资料稀缺的问题, 还可以用于预测光伏电站的功率、太阳辐照强度,改进预测的精度[4],[5]。
可以用来反演地面太阳辐射的卫星数据有CERES (Clouds and the Earth's Radiant Energy System), ISCCP (International Satellite Cloud Climatology Project),葵花-8、风云-2,4 系列等[6]。美国国家航空航天局的CERES 的辐射反演产品是基于美国环境卫星Terra 和Aqua 反演得到。ISCCP 主要研究全球云层分布及其日、 季节和年变化特性, 云层对辐射能量交换及全球水循环的影响。 日本的葵花-8 卫星搭载了16 个波段的可见光/红外辐射计,包含5 km 和1 km 两种空间分辨率[7],[8]。 中国的风云-4 卫星的辐射成像通道有14 个,可见光空间分辨率0.5 km,具有更高的时空和光谱分辨率[9]。 除了卫星反演的辐射数据之外, 还有基于大气同化模型和历史观测资料建立的再分析辐射数据, 如NCEP-DOE(National Centers for Environmental Prediction-DOE),ERAInterim(European Centre for Medium-Range Weather Forecasts Re-Analysis-Interim)和ERA5[10],[11]。
国内外学者利用卫星遥感资料, 评估了不同天气条件下卫星辐射数据的质量,Yan[12]研究了无云、有云、白天和夜晚不同条件下Terra/Aqua 卫星短波辐射的数据质量;Kratz[13]研究了太阳高度角和云的变化对CERES 反演辐射精度的影响。针对中国区域,Jia[14]利用地面观测辐射数据,评估了风云-2C,CERES 以及再分析资料NCEP-DOE 和ERA-Interim 的数据精度,结果表明,风云-2C 和CERES 与观测误差较小,但是风云-2C 与观测的相关系数较低,与ERA-Interim 相当。也有学者对葵花-8 卫星辐射产品在东亚地区的精度进行了研究[7],[8],结果表明,在该区域葵花-8 卫星辐射产品的结果优于其他辐射数据产品, 可在一定程度上弥补辐射气象站稀疏带来的问题。
目前,尚无在中国区域内对葵花-8 卫星辐射数据质量的评估,本文基于葵花-8 卫星的太阳辐射反演产品、 中国气象局的地面辐射站点观测资料作为评估数据, 评估了9 个中国气象站点上空的葵花-8 号卫星反演产品的精度。将卫星和气象站观测数据按照相应的天气类型,分为晴天、多云和阴雨天3 类数据,分别计算不同天气条件下,卫星和气象站观测数据的误差分布特性。 基于葵花-8 卫星辐射数据产品与气象局地面观测数据的高相关性及低偏差特性, 尝试将卫星辐射产品用来检验光伏电站地面辐射计观测数据是否存在异常,对电站地面辐射计的数据质量进行评估,研究卫星辐射数据应用于光伏智能运维的适用性。
本研究使用的是葵花-8 卫星的SWDR 短波辐射产品,数据更新频率为10 min,空间分辨率为5 km,短波辐射参数化方法参考文献[15]。 地面辐射观测来自中国辐射资料定时值数据集的日累计辐射数据, 本文选取了9 个东部观测站点的逐时和日总辐射数据作为验证数据, 时间为2019 年1-11 月。 此外,还选取了4 个光伏电站的辐射计数据,经过数据筛选剔除异常数据后,与葵花-8卫星辐射数据进行对比分析。
本文对葵花-8 卫星数据的评估流程包括以下步骤:①将葵花-8 辐射数据双线性插值到气象站辐射计位置;②对比葵花-8 的总辐射数据与气象站辐射计的总辐射数据之间的差异, 评估指标包括:平均偏差(MBE),均方根误差(RMSE)和相关系数 (r); ③引入晴空因子 (Clear Sky Index,CSI)作为天气类型划分依据,研究葵花-8 辐射数据在不同天气状态的数据精度。 最后需要将卫星的水平辐射转换到一定倾角上倾斜辐射, 再对比葵花-8 数据与光伏电站辐射计数据的差异,检验光伏电站辐射计的可靠性。
CSI 是指水平日总辐射量与天文日总辐射量之比, 它可以用来描述大气对太阳短波辐射遮挡的影响程度。 CSI 越大,表示地面太阳辐射受大气的影响越小。通过对历史数据的大量分析,本研究将CSI>0.8 的天气定义为晴空天气,CSI 为0.4~0.8 定义为多云天气,CSI<0.4 则为阴雨天气。 当CSI<0.4 时,地面辐射受云层的遮挡严重,卫星辐射的精度也较低。
卫星反演得到的太阳辐射是水平总辐射,而光伏电站上安装的辐射计给出的是倾斜辐射。 在将卫星的辐射和电站上的观测数据进行对比时,需要将卫星的水平辐射转换为倾斜辐射。 本文利用PVLIB 软件,将卫星水平总辐射转换为与电站辐射计相同倾角的辐射数据, 再进一步分析卫星和辐射计数据的一致性。
水平辐射到倾斜辐射的转换, 需要考虑光伏组件的跟踪模式的不同, 地面反照率及天空散射和地面反射辐射的计算模型。 POA (Plane of Array)辐射(IPOA)的计算式如下:
式中:Ib为光束辐射;Ig为地面反射辐射;Id为天空散射辐射,一般由半经验模型给出;DNI 为直接辐射;AOI 为太阳入射角;GHI 为水平总辐射;a 为地面反照率;θT,suf为光伏组件或辐射计的倾角。
本文进行误差的统计分析的指标有平均偏差和均方根误差,其计算式分别为
式中:Is为卫星辐射数据;m 为参与对比的样本个数。
2.1.1 逐时太阳辐照度和日总太阳辐射量分析
首先, 对9 个站点的逐时太阳辐照度数据与相应的卫星辐射数据分别进行线性拟合, 结果如图1 所示。 从图1 可以看出,9 个站点的逐时太阳辐照度和葵花-8 卫星数据一致性非常高,线性相关系数在0.95 以上,但在不同地区的数据离散度有一定的差异。 当太阳辐照度低于400 W/m2时,数据分布较为集中。
图1 葵花-8 卫星辐射和地面辐射计的逐时太阳辐照度的相关性分析Fig.1 Correlation analysis of daily radiation observed by Himawari-8 and CMA stations
将地面辐射计和卫星逐时太阳辐照度分别累加为日总太阳辐射量,对日总太阳辐射量数据也同样进行线性拟合,结果如图2 所示。 图中N 为拟合样本数。对比图1 可以看出,日总太阳辐射量数据的拟合效果明显优于逐时数据, 数据离散度相对较低,相关性更高。这是因为将逐时辐射数据累加到日总太阳辐射量的过程, 有一定的数据平滑作用。 9 个站点的逐时太阳辐照度和日总太阳辐射量的相关系数、 平均偏差和均方根误差统计结果如表1 所示。
图2 葵花-8 卫星辐射和地面辐射计的日总太阳辐射量的相关性分析Fig.2 Correlation analysis of daily radiation observed by Himawari-8 and CMA stations,N represents number of samples
表1 葵花-8 卫星辐射和地面辐射计的逐时太阳辐照度和日总太阳辐射量的统计指标对比Table 1 Comparison of hourly irradiance and daily radiation of Himawari-8 and stations from CMA
不同站点的数据对比表明,莒县、合肥和固始3 个站的逐时太阳辐照度和日总太阳辐射量的MBE 高于其他站, 逐时太阳辐照度的MBE 在30 W/m2以上, 日太阳辐射量MBE 在2.8 MJ/m2以上, 其中, 合肥站的逐时太阳辐照度MBE 高达44.71 W/m2,是9 个站点中偏差最大的站。 另外,9个站点的MBE 均为正偏差,说明卫星反演的逐时辐照数据和日总太阳辐射量基本都高于地面辐射计的数据。
RMSE 可以反映出观测数据和模型值之间的离散程度。 从表1 中的逐时太阳辐照度和日总太阳辐射量RMSE 的对比结果可以看出,郑州站的逐时太阳辐照度的误差最小;吕泗、南京及淮安3个站的日总太阳辐射量RMSE 均低于2 MJ/m2,合肥站最高,高达4.3 MJ/m2。
对葵花-8 卫星和气象局地面辐射计的逐时太阳辐照度和日总太阳辐射量的分析结果表明,卫星数据产品与地面观测数据的整体趋势一致,相关性较高,逐时数据的相关系数都高于0.94,日总辐射量相关系数高于0.97, 其中数据符合程度比较低的是莒县、固始和合肥3 个站。卫星辐射和地面辐射计的误差主要来自季节性气溶胶光学厚度引起的反演结果偏差, 以及复杂地形导致的局地天气变化。 刘军建[6]利用2015 年的国家气象局91 站 和CERES,ERA-Interim 及FY-2G 辐 射 产品进行对比,相关性最高的是CERES,相关系数为0.93,日均辐照量为32.14 W/m2。本文中9 个站点的日总太阳辐射量平均值为2.5 MJ/m2,转换为日均辐照量为29.3 W/m2, 平均相关系数为0.98。这说明葵花-8 卫星反演的辐射数据的精度高于CERES。
2.1.2 典型月的日总太阳辐射量分析
为研究葵花-8 卫星数据的季节性特征,本文选取了1,4,7,10 月4 个典型月的日总太阳辐射量进行对比分析。 表2 统计了9 个站点的日总太阳辐射量的平均偏差MBE。
表2 典型月的日总太阳辐射量平均偏差Table 2 Mean deviation of daily radiation of typical months MJ/m2
从表2 可以看出, 所有观测站的1 月相对偏差普遍偏高,济南、固始、上海3 个站7 月偏差最小,莒县、合肥、南京10 月偏差最小,其他站点除了1 月以外,其它月份偏差特征不明显。除吕泗站10 月出现负偏差以外,其他站点所有月份均为正偏差, 说明卫星数据普遍高于地面辐射计站的数据。 站点的辐射计观测值受地形及周围环境的影响较大,受太阳高度角的影响,冬季地面接收来自太阳的辐射较小, 会出现卫星辐射低于辐射计的情况,且误差相较于其他季节也偏大。
2.1.3 基于晴空因子分类的日总太阳辐射量分析
根据前文,求出所有站每日的晴空因子序列,并根据CSI 的分类标准,将数据分为晴天、多云和阴雨天3 类。图3 为9 个站点2019 年的晴空因子的日变化曲线。 从图中可以看出,9 个站点的天气均存在较大变化。 进一步对各个站3 类天气出现的天数及比例进行统计,结果如表3 所示。
图3 9 个站点的CSI 日变化曲线Fig.3 Daily variation of CSI from CMA stations
表3 各类型天气出现的天数Table 3 The number of days each type of weather occurs
由表3 可以看出,合肥的晴天天数偏少,多云天气偏多;吕泗的晴天天数明显多于其他站点。
基于CSI 的天气分类标准, 分别对3 种天气类型下的卫星和地面辐射的偏差情况进行统计,结果如表4 所示。 晴天的卫星反演结果与地面观测值的相关系数最高,MBE 和RMSE 也最小。 多云和阴雨天的MBE 及RMSE 可以达到晴天水平的2~3 倍。 合肥、莒县的多云及阴雨天气偏多,分别为93%和84%,这也导致了反演精度远低于平均水平。
表4 基于CSI 分类的不同天气条件下的数据统计结果Table 4 Statistical results with different weather conditions
从前文分析可知,葵花-8 卫星辐射数据和气象局地面辐射计数据的相关性非常高,9 个站点的日总辐射量相关性平均为0.98,MBE 平均为29.3 W/m2。 两种数据较高的相关性和较低的偏差,说明了葵花-8 卫星辐射数据分析光伏电站上的辐射计数据的时空变化特性的可行性。
为进一步评估辐射计的数据质量, 本文选取了位于中国东部的4 个光伏电站的辐射计数据进行评估分析,利用PVLIB 转换工具将卫星辐射转换到相应的倾斜面上, 然后对比两者倾斜辐射的相关性。 图4 为辐射计观测数据和卫星数据。
图4 4 个光伏电站上的辐射计观测数据和卫星数据的拟合结果Fig.4 Comparison of daily radiation observed by Himawari-8 and PV stations
从图4 可以看出, 站点1~3 的相关系数较高,都达到了0.98。 站点4 的数据离散程度较高,尤其是在日总太阳辐射量低于15 MJ/m2的情况下,卫星数据明显低于地面观测数据。
由前文可知,晴天条件下,卫星反演的可靠性较高, 选取CSI>0.8 的部分数据进行分析,4 个光伏电站的辐射计和卫星数据的统计分析结果见表5。 从表5 可以看出,4 个光伏电站上的辐射计数据和卫星数据的相关性都低于气象局9 个辐射计站的统计结果,其中电站1 的相关系数只有0.85,低于其他站,MBE 也远高于其他电站。 因此基本可以判断电站1 的辐射计数据有系统偏差, 需要返厂检修。
表5 4 个光伏电站的辐射计和卫星数据的统计分析结果Table 5 Statistics of daily radiation observed by Himawari-8 and PV staions at 4 locations
本文通过将葵花-8 卫星数据与地面气象站观测数据进行对比, 分析了不同天气条件下二者的误差, 并评估了卫星辐射数据应用于光伏智能运维的适用性,得出以下结论。
①9 个气象站点的逐时太阳辐照度、 日总太阳辐射量和葵花-8 卫星数据的一致性非常高,平均相关系数分别为0.96 和0.98。 日总太阳辐射量数据的离散度相对较低,数据相关性也更高,是因为对逐时辐照数据累加后,起到了数据平滑效果。
②卫星反演的逐时辐照数据和日总太阳辐射量都高于地面辐射计的相应数据,说明葵花-8 卫星辐射数据存在高估的情况。
③对典型月的数据分析表明,9 个气象站的7月夏季的辐射偏差普遍较低,1 月冬季的辐射偏差普遍较高, 说明卫星辐射产品在冬季的误差较大,夏季误差较低。
④对4 个光伏电站上的辐射计数据和卫星数据进行对比分析, 发现个别电站的辐射计数据和卫星数据存在很大的系统偏差, 或存在不同时间段内数据偏差不一致的情况, 初步判断这些站点的辐射计数据有质量问题,需要返厂检修确认。
⑤葵花-8 卫星数据和气象站观测数据和气象局地面辐射计数据具有高相关性及较低的平均偏差, 可以将卫星辐射数据近似代替地面观测数据, 并应用到光伏电站的发电量分析和智能运维等多种场景中, 解决了分布式和户用光伏的电站数量众多,安装辐射计成本高的问题。同时可以对光伏电站已有的辐射计进行质量评估和故障诊断, 通过数据分析的手段主动筛查可能存在问题的辐射计, 为光伏电站的智能运维等场景提供了数据参考。