湖北省气象科技服务中心 ■ 成驰 陈正洪
武汉区域气候中心 ■ 张礼平
我国太阳能资源丰富,理论储量大,近年来发展势头强劲。但与常规能源发电相比,太阳能发电具有固有的间歇性和不可控的缺点,易对电网造成冲击。由于太阳能发电量与到达地面的太阳辐射量密切相关,受天气因素的影响显著,随着国内光伏装机容量的迅速扩大,气象部门有责任及早做好技术准备,发展太阳辐射及发电量预报技术,为电力系统调度、电力负荷配合、常规能源发电计划和光伏发电规划提供指导[1],以降低发电企业运营成本,保障电站和电网安全运行等。
太阳辐射的影响因子有很多,包括所在地的地理纬度、太阳方位参数、云量、云状及云和太阳的相对位置、城市大气环境污染状况、大气含水量等[2,3]。这些因子有的可通过几何代数计算得到确定值,有的要素本身具有随机性,部分气象要素则只能利用天气类型预报参数化,并且这些因子对太阳辐射的影响也具有非线性的特点。
神经网络模型是一种处理非线性问题的强大工具,已有不少研究者将其用于太阳辐射的估算中[4,5]。本模型结构拟采用3层前向网络。网络结构确定后,由已知的样本反复调节各层各神经元的连接权和阈值,直至使预先设计的代价函数极值化。这一系列过程被称为网络的学习训练。曹双华等将神经网络模型引入到太阳逐时总辐射预测中,得到了比美国ASHRAE模型和时间序列模型更准确的结果[6,7]。本模型尝试引入遗传算法取代传统的BP算法[8],并尝试在神经网络模型中加入量化的天气类型预报参数,且部分选用EOF主分量作为模型网络的输入和输出,提高了计算效率和阴雨天辐射预测的准确性,不失为一种合理、高效的逐时辐射预测方法。
影响地面接收到太阳辐射的因素有很多,包括地理纬度、太阳赤纬角、太阳时角、周边遮蔽等天文地理因子,也包括天气气候状况、大气环境质量等气象环境因子。受这些因子的综合影响,太阳辐射的变化既具有随机性,又具有周期性,包括日变化周期和年变化周期。而这些因子对辐射量的影响方式、影响程度、可预测性都不相同,尤其是气象环境因子,更是随着时间和空间的不同而具有极大的变化。
因此,我们在设计预测模型时需要考虑模型的输入项应具备的特点为:(1)可预测性。选择因子必须是在目前科技条件下能够进行可信的短期预报。(2)关联性。所选因子必须与地面太阳辐射密切相关。(3)精炼性。由于输入因子的增加会带来模型运算时间的大幅延长,因此必须选择尽量少的预报因子。
由于太阳辐射时间序列周期性的存在,因此辐射序列本身具有高度自相关性。在同一地理纬度,类似的太阳赤纬角、时角和天气状况下,地面的太阳辐射量和日变化将十分类似。因此,利用过去的辐射资料序列和天气状况要素进行辐射预测的方法是可行的。
在常规天气预报中,日类型预报和最高、最低气温预报是气象部门比较重视且较为准确的一种方式。由最高、最低气温得到的温度日较差也是天气类型和辐射量的反映因子。通常情况下,在天气类型相同的连续几天,其辐射量的大小和日变化也较类似。而当天气类型发生转折时,温度日较差和天气类型的提前预报又可反映这种转折。因此,本模型预测初步方案设计为:与被预测日同一天气类型的上一日逐时总辐射,同一类型上一日和预测日的日最高温度、温度日较差、日天气类型数值作为模型输入因子,预测同一天气类型下一日逐时总辐射。其中影响辐射量的天文因子隐含在上一日的辐射量数据中,而气象和环境因子则隐含在天气类型、温度日较差和最高气温预报中。
在常规天气预报中,天气类型是用“晴”、“阴”、“雨”这样的模糊词语描述的,必须将这样的术语转换为可被神经网络算法接收的精确值。本文采用云量、降水量两个量化指标数据将天气类型数值化,初步采用的分类标准见表1。由于目前气象部门云量观测每日只有四次,因此取对辐射影响最大的每日14时的云量作为当日的分类指标。
表1 天气类型数据分类表
对于3层前向网络,网络结构包含输入层、隐含层和输出层,各层需要确定节点的数量。由于实验所用的武汉站每日日照时数在10~14h,直接将逐时辐射资料输入到网络中将使网络变得极为复杂,运算代价极大。为使输入、输出即含有大量信号,个数又不繁多,这里对每日的逐时辐射序列进行EOF分解,取其累计方差贡献率达到80%以上的前3个主分量与天气预报因子(日最高气温、温度日较差、天气类型)作为模型的输入,对输出的主分量再进行还原即可得到预测日的逐时总辐射。因此,网络结构确定为输入节点6个、隐含节点2个、输出节点3个,如图1所示。当网络结构确定后,就可由已知的样本反复调节各层各神经元的连接权和阈值,直至使代价函数极值化。
由于不同季节太阳辐射各影响因子的影响方式和权重不尽相同,因此本预报模型每月分别建立。预报实验采用武汉站(57494,30.62N、114.13E)2007年8月和2008年8月共62个训练样本作为模型的回算训练样本,经过训练的网络预报2009年8月共31天每日逐时辐射量。
首先对各输入因子进行方差标准化,取武汉站8月有日照的太阳时06时至19时逐时总辐射进行EOF处理,取其前3个主分量和天气预报要素进入网络,输出层得到的3个主分量,经过计算还原成预报日的逐时总辐射序列。
按照以上方案,对2009年8月的每日逐时辐射量做了预报实验,并与同期武汉站的逐时观测资料进行分析,以检验模式的预报能力。武汉8月在一年中属于天气变化最剧烈的时期,预报难度也最大,经常出现的午后雷阵雨等天气在前一天进行的常规预报中很难表现。因此,考察模型对8月的预报能力极具挑战。
图2分别给出了8月上半月和下半月的预测值和实际值的对比。经验分析可得到的结论为:(1)模型在不输入任何天文、地理要素的情况下能给出精确的辐射日变化分布,在天气条件稳定的晴天时,预测值和实测值基本吻合。(2)模型对于天气转折第一日的预报能力有局限,如图2a的8月10~12日所示,天气类型阴晴相间,导致模型不能及时响应,预测值误差较大。8月12~13日连续两天阴天时,模型对第二日也就是13号的模拟又十分精确地描绘了其辐射日变化。(3)该模型对于连续阴雨天的模拟量级较好,但不能给出辐射值为0的预报。如图2b显示的8月28~30日连续3天阴雨天,由于辐射测量仪器加盖的原因,实测辐射大部分时段均为0,虽然模型给出了较低的辐射量级预测值,但仍有早晚小、中午大的日辐射变化,而不能给出辐射量为0的预测。
分别选择8月3日、31日、30日代表晴、多云、阴有雨三种天气形式,误差分析见表2。由于实测辐射量存在加盖后显示为0的数据,因此误差分析中常采用的相对误差在这里无法计算,因此我们选用绝对误差结合日平均小时辐射量作为新的相对误差衡量标准。
表2 3个代表日误差分析表
表2中“日平均绝对误差/日平均小时辐射量”得到的百分数即为本文提出的衡量误差的相对指标,该指标避免了某几个时刻实测辐射量为0带来的相对误差无穷大的问题。
由表2可知,日平均误差晴天最小,阴雨天最大,多云天其次,阴雨天相对误差可达150%。日最大绝对误差是多云天气最大,阴有雨天气次之,晴天较小,这表明多云天气辐射量日变化情况最为复杂,预报难度超过整日阴雨的天气。本模型难以对其进行准确的逐时预测。
本文采用遗传算法神经网络模型,结合常规天气预报和辐射量资料序列,利用辐射资料序列存在的自相关性建立了一种预测第二日逐时辐射量的模型。针对辐射资料的特殊性,设计了预测因子选择方法、输入资料的处理方法和结果误差评估方法。通过一个月的模拟实验对模型预报能力进行了验证,表明模型能较为准确的预测逐时辐射。
由于模型本身和所采用资料的缺陷,模型对于阴雨复杂天气和剧烈变化天气的预报能力有限。模型可精确地描绘晴天状况或稳定天气类型时的辐射量量级和日变化。由于我国太阳能丰富地区均位于晴朗干燥的西北、华北和高原地区,因此该模型在这些地区应大有用武之地。
气象部门在辐射观测中,出现降水时应将辐射表加盖,这时测量辐射值为0,而实际在降水天气时是有辐射量的,因此会导致雨天日平均辐射量实测值偏小,相对误差计算值变大。这是测量方法自身问题所导致的,不能完全由预报方法负责。
在今后的研究工作中,将尝试从以下方面改进该模型,以提高其预测能力:(1)增加天气类型和改进天气分类算法,以提高模型对复杂天气适应性;(2)改进输入因子的处理算法,提高对阴雨无辐射天气的预测能力。
[1] 李芬, 陈正洪, 成驰, 等.太阳能光伏发电量预报方法的发展[J].气候变化研究进展, 2011,7(2):136-141.
[2] 沈钟平, 张华.影响地面太阳辐射及其谱分布的因子分析[J].太阳能学报, 2007, 30(10):1389-1395.
[3] 林正云, 刘孟珠.福州城市发展对太阳辐射的影响[J].太阳能学报, 1997, 18(1):41-45.
[4] 周晋, 吴业正, 晏刚, 等.利用神经网络估算太阳辐射响[J].太阳能学报, 2005, 26(4):509-512.
[5] 周勃, 陈长征, 宋楠.应用盲分离神经网络预测逐日太阳辐射能[J].太阳能学报, 2007, 28(9):1008-1011.
[6] 曹双华, 曹家枞.太阳逐时总辐射混沌优化神经网络预测模型研究[J].太阳能学报, 2006, 27(2):164-169.
[7] 曹双华, 曹家枞, 刘凤强.小波分析在太阳辐射神经网络预测中的应用研究[J].东华大学学报, 2004, 30(6):18-22.
[8] 张礼平, 丁一汇, 李清泉, 等.遗传神经网络释用气候模式预测产品的实验研究[J].气候与环境研究, 2008, 13(5):681-687.