张 佩,高 苹,谢小萍,拉 巴,江 旭,陈诗瑶,吴洪颜**
(1.江苏省气象局 南京 210008; 2.拉萨市气象局 拉萨 850000; 3.美国塔夫茨大学 波士顿 02155; 4.福建省烟草公司龙岩市公司 龙岩 364000)
农田生态系统的各个部分与太阳辐射均密切相关,如作物生长和产量模拟、土壤水分蒸散估算等都需要引入准确的太阳辐射量。然而与温度、降水、日照等常规气象要素相比,太阳辐射仅在少数气象观测站点进行连续观测。如江苏建有71 个国家级地面气象观测站点、1800 个区域气象观测站点,但可观测太阳辐射量的站点仅有3 个。因此,建立太阳辐射估算模型显得尤为重要。
近些年,基于不同估算因子和不同估算方法的不同空间尺度的太阳辐射估算方法被相继提出。如基于日照资料建立了Ångström 模型及由其发展而来的Ångström-Prescott 模型、Bahel 模型; 基于温度资料建立了Hargreaves-Samani (H-S)模型、Bristow-Campbell (B-C)模型。综合考虑海拔、地理及大气环境等其他因素和借助卫星遥感资料等新数据资料,通过采用不同的新方法,一些学者改进发展了多种其他辐射估算模型。综合来看,基于日照资料能较准确地估算太阳辐射量,其估算精度普遍高于其他估算模型。而目前大部分研究也多将有日照(当天观测记录的日照时数大于0 时,为有日照)和无日照(当天观测记录的日照时数为0 时,为无日照)样本混在一起进行建模。多数结果显示,现有的大多数模型对有日照情况的太阳辐射估算准确度普遍明显高于无日照情况,无日照情况的太阳辐射估算准确度普遍较低。
无论是有日照还是无日照情况下,太阳辐射均存在,它是影响植物生长及地表能量收支的关键环境因子。吴鹏等研究发现,无论是晴天还是阴天,影响喀斯特区天鹅槭()不同时间尺度的树干液流量的主要环境因子均是太阳辐射; 冀健红等揭示了不同天气条件下气温和风速对温室番茄()植株蒸腾的影响主要是通过太阳辐射和水汽压差实现的; 陈东旭等研究指出,虽然阴雨天条件下长江中下游地区稻田的土壤热通量日变化特征与晴天有较大差异,但它也与太阳辐射呈极显著相关。近些年来,一些学者发现我国大部分地区的日照时数明显下降,无日照日数则有增加趋势,而目前无日照情况下太阳辐射量估算方法的研究仍较少见。因此,探索如何科学准确地估算无日照情况下的太阳辐射尤为迫切。本文以江苏为例,基于不同日照天气情况,分别梳理分析了太阳日辐射估算的高度相关因子,采用基于最小二乘法的逐步回归方式,依次以当前常用的太阳日辐射(GR)和大气透明系数(太阳日辐射与天空辐射的比值,GR/SR)为因变量建立了不同日照情况下太阳日辐射估算模型。通过比较模型对建模集、组间验证集和组外验证集太阳日辐射的估算效果,确定太阳日辐射最佳估算模型,以期为太阳辐射与农田生态系统关系的相关研究提供基础。
江苏省地势平坦,区域范围为116.58°~121.65°E和31.07°~34.85°N。区内有69 个国家气象观测站和3 个辐射观测站(淮安、吕泗和南京),站点分布情况如图1。站点信息、辐射观测数据和气象观测数据均来源于江苏省气象信息中心,其中站点信息即3个地理因子,包括经度()、纬度()和海拔()。辐射观测数据为2005−2020年逐日太阳总辐射。气象观测数据为24 个气象因子,包括2005−2020年逐日平均总云量()、平均低云量()、平均气压(,hPa)、最高气压(,hPa)、最低气压(,hPa)、平均水汽压(,hPa)、最高水汽压(,hPa)、最低水汽压(,hPa)、平均气温(,℃)、最高气温(,℃)、最低气温(,℃)、气温日较差(,℃)、平均地表温度(,℃)、最高地表温度(,℃)、最低地表温度(,℃)、露点温度(,℃)、日照时数(,h)、日照百分率(,%)、相对湿度(RH,%)、降水量(,mm)和蒸发量(,mm)。
图1 江苏省3 个辐射观测站和69 个国家气象观测站空间分布Fig.1 Spatial distribution of 3 radiation observation stations and 69 national meteorological observation stations in Jiangsu Province
为了减小年代对辐射拟合的影响,选取淮安、吕泗和南京3 个站奇数年份(2005年、2007年、2009年、2011年、2013年和2015年)逐日资料样本(样本数6565)为建模集进行太阳辐射的拟合建模,选取淮安、吕泗和南京3 个站的偶数年份(2006年、2008年、2010年、2012年、2014年 和2016年)逐日资料样本(样本数6574)为组间验证集、其他年份(2017年、2018年、2019年和2020年)逐日资料样本(样本数4377)为组外验证集进行模型效果验证。
在建立太阳日辐射估算模型之前,需首先计算各站点的逐日天文辐射(SR)值。参照Iqbal的方法,某一时刻的天文辐射由太阳常数、当时太阳天顶角的余弦和日地距离订正系数三者相乘得到,1 天的天文辐射总量则由各时刻的天文辐射积分得到:
式中:为太阳常数,取1367 W∙m,为日地距离订正系数,φ为地理纬度(弧度rad),δ为太阳赤纬(弧度rad),ω为时角(弧度rad),ω、ω分别为日出、日落时角,它们的计算公式依次如下:
式中:为地理经度(°),为地理纬度(°),为日出标准时间(北京时间),为日落标准时间(北京时间)。
将建模集样本以无日照和有日照分成2 组样本,分别采用SPSS 对太阳日辐射与其对应的逐日气象因子(24 个)、地理因子(3 个)进行Pearson 相关分析。应用R 语言绘制相关系数的热力饼图。
将建模集样本以无日照和有日照分成2 组样本分别建模。采用SPSS 软件,分别以太阳日辐射(GR)和日大气透明系数(GR/SR)作为因变量,以气象因子(或气象因子和天空辐射)作为自变量,采用基于最小二乘法的逐步回归方式建立线性模型F1、F2、F3、F4 (表1)。当回归方程显著性检验≤0.05 时,自变量移入回归方程; 当回归方程显著性检验≥0.1 时,自变量移出回归方程。同时,对备选回归模型进行决定系数优选、回归模型及回归系数显著性检验、回归模型自变量共线性诊断,最终确定最佳回归模型表达式。
表1 有无日照天气情况下基于气象因子和天空辐射的太阳日辐射回归估算模型结构Table 1 Structure of regression estimation models for daily global radiation under with and without sunshine conditions based on meteorological factors and radiation
为了验证拟合模型的准确度,分别运用模型对建模集、组间验证集和组外验证集的太阳日辐射进行拟合估算,并对其估算准确度进行计算,如式(9)所示:
式中:PA 为模型拟合准确度(%),GR为模型计算得到的太阳辐射拟合值,GR 为太阳辐射实测值。当PA∉ [0,100%],则将其判定为异常点。应用R 语言绘制 估算准确度数据分布箱图及数据密度曲线。
分别对无日照情况和有日照情况下气象因子、地理因子与太阳日辐射进行相关分析后发现(图2),在2 种不同日照情况下,太阳日辐射都与各气象因子呈极显著相关(<0.01),且除水汽压类(、及)、湿度(RH)、降水()和纬度()等因子外,有日照情况下太阳日辐射与各因子的相关系数普遍高于无日照情况。
由图2A 可以看出,无日照情况下太阳日辐射与气温类(、、及)、地表温度类(、及)因子相关系数较高,其中与最高地表温度()的相关系数最大,达0.64。与气压类(、及)、水汽压类(、及)、露点温度()和蒸发量()的相关系数的绝对值普遍在0.29~0.36之间。与云量类(、)、湿度(RH)和降水()的相关系数的绝对值为0.17~0.29。太阳日辐射与地理因子中的纬度()呈现极显著相关,与经度()和海拔()相关未达显著水平。
由图2B 可以看出,有日照情况下太阳日辐射与日照时数()的相关系数最大,达0.77,与日照百分率()的相关系数也达0.59 。与蒸发量()的相关系数为0.70。与气温类(、、及)、地表温度类(、及)因子相关系数为0.37~0.66,其中也以最高地表温度()的相关系数最大。与气压类(、及)、水汽压类(、)、露点温度()的相关系数的绝对值普遍在0.31~0.45 之间; 与云量类(、)、湿度(RH)和降水()的相关系数的绝对值为0.12~0.32。太阳日辐射与地理因子中的海拔()呈现极显著相关,与经度()和纬度()相关未达显著水平。
图2 无日照(A,n=1515)和有日照(B, n=5050)天气情况下太阳日辐射与环境因子的相关性Fig.2 Correlation between daily global radiation and environmental factors under without sunshine (A,n=1515) and sunshine (B,n=5050) conditions
在无日照和有日照两种情况下,分别以太阳日辐射(GR)和大气透明系数(GR/SR)作为因变量,运用多元逐步回归法构建拟合方程,并综合考虑各方程的拟合优度及共线性检测结果,最终得到最优回归模型F1、F2、F3、F4 及其模型表达式,结果如表2 所示。无日照情况下,以GR 为因变量直接构建的估算模型F1 的自变量由日最高地表温度()和日露点温度()构成,以GR/SR 为因变量直接构建的估算模型F2 的自变量由日总云量()、日相对湿度(RH)和日最高地表温度()等3 个气象因子构成。在有日照的情况下,以GR 为因变量直接构建的估算模型F3 的自变量为逐日日照时数(),以GR/SR 为因变量直接构建的估算模型F4 的自变量则由逐日日照百分率()和日照时数()构成。
表2 有无日照天气情况下基于气象因子和天空辐射的太阳日辐射回归估算模型Table 2 Estimation models of daily global radiation under without sunshine and sunshine conditions based on meteorological factor and radiation
从模型的拟合参数来看,在无日照和有日照的两种情况下,以太阳辐射(GR)和大气透明系数(GR/SR)为因变量构建的拟合方程的Sig=0.000<0.05,均通过显著性检验。其中无日照情况下,以GR 为因变量构建的模型F1 的决定系数为0.650,高于以GR/SR 为因变量构建的模型F2 (0.382)。而有日照情况下,以GR 为因变量构建的模型F3 的决定系数(0.592)小于以GR/SR 为因变量构建的模型F4 (0.769)。
应用模型F1−F4 分别对建模集、组间验证集和组外验证集的太阳日辐射进行拟合估算,统计估算准确度并进行比较分析,结果如表3 及图3 所示。总体看来,无论是以太阳日辐射(GR)还是以大气透明系数(GR/SR)为因变量构建的拟合估算模型,有日照情况下的模型估算准确度普遍高于无日照情况。
图3 无日照(A,F1 和F2 模型)和有日照(B,F3 和F4 模型)天气情况下对建模集和验证集太阳日辐射的估算准确度Fig.3 Estimation accuracies of models for daily global radiation estimation under without sunshine (A,model F1 and F2) and sunshine (B,F3 and F4 models) conditions based on establishment and validation datasets
表3 有无日照天气情况下不同太阳日辐射回归估算模型在不同数据集估算效果Table 3 Estimation effects of models of daily global radiation under without sunshine and sunshine conditions in different datasets%
无日照情况下,以太阳日辐射(GR)为因变量构建的模型F1 对建模集的估算准确度为75.11%,较以大气透明系数(GR/SR)为因变量构建的模型F2 高6.82 个百分点,异常点占总样本比例则减少4.48 个百分点; 模型F1 对组间验证集的估算准确度为74.41%,较模型F2 高4.90 个百分点,异常点占总样本比例则减少5.46 个百分点; 模型F1 对组外验证集的估算准确度为73.98%,较模型F2 高4.70 个百分点,异常点占总样本比例则减少3.27 个百分点。总体来看,无日照天气情况下,模型F1 对太阳日辐射的估算准确度平均为74.57%,较模型F2 高5.57 个百分点,而异常点占总样本比例则减少4.62 个百分点。
有日照情况下,以大气透明系数(GR/SR)为因变量构建的模型F4 对组内验证样本的估算准确度为87.93%,较以太阳日辐射(GR)为因变量构建的模型F3 高10.62 个百分点,异常点占总样本比例略多0.04 个百分点; 模型F4 对组间验证样本的估算准确度为88.44%,较模型F3 高11.24 个百分点,异常点占总样本比例减少0.22 个百分点; 模型F4 对组外验证样本的估算准确度为85.87%,较模型F3 高8.93 个百分点,异常点占总样本比例减少0.56 个百分点。总体来看,有日照情况下,模型F4 对太阳日辐射的估算准确度平均为87.60%,较模型F3 高10.42 个百分点,而异常点占总样本比例则减少0.21 个百分点。
进一步对模型F1−F4 的估算准确度分布情况进行分析,结果见图3。从模型对建模集、组间验证集、组外验证集的估算准确度分布集中程度来看,模型F1 较模型F2、模型F4 较模型F3 更高,表现在对3个数据集的估算准确度百分位数25%~75%分布箱体及95%置信区间上,即模型F1 较模型F2、模型F4 较模型F3 更短,拟合结果的数据密度模型F1 较模型F2、模型F4 较模型F3 更为集中; 从分布中位数来看,模型F1 较模型F2、模型F4 较模型F3 更高,数据密度最高峰也同样表现为模型F1 高于模型F2、模型F4 高于模型F3。这说明无日照情况下,模型F1 拟合结果总体优于F2,且分布更为集中靠近Y轴100%端; 有日照情况下,模型F4 拟合结果总体优于F3,且分布更为集中靠近Y 轴100%端。
从2.3 节中可以看出,无日照情况下,以太阳日辐射(GR)为因变量构建的模型F1 对建模集、组间及组外验证集的估算效果普遍优于以大气透明系数(GR/SR)作为因变量构建的模型F2; 有日照情况下,以GR/SR 为因变量构建的模型F4 对建模集、组间及组外验证集的估算效果普遍优于以GR 为因变量构建的模型F3。因此,确定在江苏地区可根据日照情况采用模型F1 及F4 对太阳日辐射进行分别估算。
依次对比模型F1、F4 对建模集、组间及组外验证集太阳日辐射的估算值和实际值也可以发现,无日照情况下,模型F1 对建模集、组间及组外验证集的估算值和实际值间的相关系数分别为0.8223、0.8167 和0.8380 (图4a、c、e),有日照情况下,模型F4 对建模集、组间及组外验证集的估算值和实际值间的相关系数分别为0.9259、0.9296 和0.9236 (图4b、d、f)。
图4 建模集和验证集基于模型F1 和F4 的太阳日辐射模拟值-实际值的散点分布图(a:无日照建模集基于模型F1; b:有日照建模集基于模型F4; c:无日照组间验证集基于模型F1; d:有日照组间验证集基于模型F4; e:无日照组外验证集基于模型F1; f:有日照组外验证集基于模型F4)Fig.4 Scatter distribution diagrams of actual and simulated daily global radiation of models F1 and F4 based on establishment and validation datasets (a:model F1 based on establishment dataset under without sunshine condition; b:model F4 based on establishment dataset under sunshine condition; c:model F1 based on between-group validation dataset without sunshine condition; d:model F4 based on between-group validation dataset under sunshine condition; e:model F1 based on outside-group validation dataset without sunshine condition; f:model F4 based on outside-group validation dataset under sunshine condition)
综合来看,根据日照分段采用模型F1 及F4 对太阳日辐射的估算准确度平均可达84.71%,异常点占总样本比例为2.04%。其中,对建模集的估算准确度平均可达85.11%,异常点占总样本比例为2.28%; 对组间验证集的估算准确度平均为85.23%,异常点占总样本比例为1.99%; 对组外验证集的估算准确度平均为83.33%,异常点占总样本比例为1.74%。
太阳辐射对农田生态系统非常重要,无论是否有日照,太阳辐射都是影响农田生态系统中的作物生长、能量平衡等各方面的关键因子。而当前可对其进行连续观测的气象观测站点非常少。不同的估算方法对有日照情况下的太阳辐射均能实现较高的估算准确度,但针对无日照情况下的太阳辐射估算研究仍较少。
本文梳理了气象站点可观测得到的与太阳日辐射可能相关的所有气象因子,通过相关分析确定了无日照和有日照2 种天气下太阳日辐射的高度相关因子。无论是在无日照情况还是有日照情况下,太阳日辐射都与各气象因子呈极显著相关。与大部分研究结果相似,有日照情况下,太阳日辐射与日照因子的相关性最强,两者之间的相关系数居众多因子之首; 而在温度类因子中,则以日最高地表温度表现出与太阳日辐射最强的相关性。无日照情况下,太阳日辐射与日最高地表温度的相关系数较其他气温类因子都高。而目前有关温度与太阳辐射的相关研究仍主要集中在气温因子上。利用遥感数据可反演地表温度,这一研究结果为利用遥感数据进行太阳辐射量估算提供了思路。地理因子与太阳日辐射的相关性弱于气象因子,无日照情况下的太阳日辐射仅与纬度极显著相关,有日照情况下的太阳日辐射则仅与海拔极显著相关。经度、纬度最终未参与太阳日辐射估算模型的构建,主要是由于天空辐射的计算已经包含了这两个地理因子的信息; 而海拔因子最终未参与太阳日辐射估算模型的构建,可能是因为研究对象江苏省地势总体较平坦,各地海拔差异较小,在进行建模因子选择时会放弃这些 “无”差异化因子。
太阳日辐射与环境气象因子的高相关性为辐射估算模型的构建提供了数学基础。在众多模型构建方法中,多元回归法由于原理简单、使用便捷,被普遍使用。而由于用于建模的各气象因子间也存在不同程度的相关性(图2),本文采用基于最小二乘法的逐步回归方式建模,这样可保证最终模型中的解释变量集既是最优的,又没有严重多重共线性。分别以当前大部分学者采用的大气透明系数(太阳辐射与天文辐射的比值)和太阳辐射为因变量,依次对建模集中无日照和有日照的样本进行太阳日辐射估算模型的构建。通过比较模型的拟合优度及模型对建模集、组间验证集和组外验证集的太阳日辐射的估算效果,确定在无日照情况下选择以太阳日辐射为因变量直接构建的估算模型F1,它主要是由日最高地表温度和日露点温度两个变量解释,模型的决定系数为0.650; 有日照情况下选择以日大气透明系数为因变量构建的估算模型F4,它的自变量则由逐日日照百分率和日照时数构成,模型的决定系数可达0.769。同时,模型对建模集、组间验证集和组外验证集的太阳日辐射均具有较高的估算准确度和较低的异常点占比,其中无日照情况下模型F1 的估算准确度平均为74.57%,异常点占比为5.89%,且模型F1 的估算准确度较以日大气透明系数为因变量构建的模型F2 更集中地分布在靠近Y轴100%端的区间; 有日照情况下模型F4 的估算准确度平均为87.60%,异常点占比仅为0.88%,且模型F4 的估算准确度较以太阳日辐射为因变量构建的模型F3 更集中地分布在靠近Y 轴100%端的区间。综合来看,根据日照分段采用模型F1 及F4 对江苏地区太阳日辐射的估算准确度平均可达84.71%,异常点占比为2.04%。
当前,地面气象观测站网密度越来越大,如江苏已达到7 km,利用本文建立的基于日照时数的2 个估算模型可得到较高分辨率的太阳日辐射分布情况,这可为太阳辐射与农田生态系统关系的相关研究提供基础。但随着研究水平的不断深入及相关业务服务精细化水平的不断提高,一些研究模型可能需要更小时间尺度的太阳辐射值的输入。因此,小时、分钟尺度太阳辐射的估算方法研究将是下一步的研究重点。
本文以江苏为例,探索了不同日照情况下太阳日辐射的估算方法,结果如下:
1)太阳日辐射与各气象因子普遍呈现极显著相关。有日照情况下,太阳日辐射与日照因子的相关系数最大。在温度类因子中,太阳日辐射与日最高地表温度表现出最强的相关性,两者之间的相关系数较其他气温类因子都高。
2)分别以太阳日辐射和大气透明系数为因变量,采用基于最小二乘法的逐步回归方式依次对无日照和有日照情况下的建模集进行估算模型的构建,得到的模型的拟合优度均通过了显著性检验。
3)无日照情况下,选择以太阳日辐射为因变量、以日最高地表温度和日露点温度为自变量的估算模型为最优模型; 有日照情况下,选择以日大气透明系数为因变量、以逐日日照百分率和日照时数为自变量的估算模型为最优模型。其中无日照情况下太阳日辐射估算模型的准确度平均为74.57%,异常点占比为5.89%; 有日照情况下太阳日辐射估算模型的准确度平均为87.60%,异常点占比仅为0.88%。根据日照时数是否为0 分别采用这2 个估算模型,江苏地区太阳日辐射的估算准确度平均可达84.71%,异常点占比为2.04%。