李世娟,刘升平,诸叶平,张 杰
(1. 农业农村部信息服务技术重点实验室,北京 100081;2. 中国农业科学院农业信息研究所,北京 100081)
随着数字农业或智慧农业的飞速发展,对其核心研究内容环境—作物系统模拟的要求越来越细致、精准。此类模型通常需要逐日天气数据,尽管可以使用历史逐日天气数据,但其较难获取且成本高昂。来自全球气候模型和区域气候模型的数据经常降尺度以匹配水文模型所需的空间和时间分辨率,但数据精确性不高。随机天气发生器(Weather Stochastic Simulator,SWG)是基于研究区域天气特征的数值工具,可以产生与历史观测在统计上相似的长期气候变量系列,主要用于生成区域气候模型、水文模型和作物生理模型的输入值,以评估气候变化对田间规模的作物生产、水文和土壤侵蚀方面的影响。针对SWG已开展了多年持续研究。
天气发生器通常涉及多个变量,如降水、太阳辐射、温度等,其中降水是关键变量,每日最高、最低温度和太阳总辐射根据降水量进行建模。一种方法是采用一阶或二阶马尔可夫链模拟降水发生概率日降水由一定的概率分布模型模拟,如指数分布、伽马分布、混合指数模型、对数正态分布。该方法使用参数控制降水概率分布,可提升天气发生器功能。因此,研究人员在日降水概率模型、日降水概率分布模型、利用传统平均气候特征进行参数估计等方面进行了研究。WGEN(Weather Generator,WGEN)是Richardson等提出的一类实用、应用广泛的天气发生器,采用二态一阶马尔可夫链框架模拟降水,即某一天降水发生的概率取决于前一天是否降水,降水量采用双参数伽马分布建模。在此基础上多种天气发生器相继发布,例如CLIGEN、USCLIMATE、CLIMAK、ClimGen、CWG、VS-WGEN和NCC,都是对WGEN做的移植工作。基础性工作是基于 WGEN 的参数本地化,深入性工作是对一些参数和算法进行改进,比如涵盖更多变量或放宽对一些变量的正态约束。本团队早期开发的天气模拟器(Daily Weather Stochastic Simulator,DWSS)就属于此类。
但研究表明,WGEN类型发生器产生的干湿期序列统计误差较大。Dastidar等认为一阶马尔可夫链足以模拟降雨发生,但低估了干旱地区最长的干旱期,使用高阶模型的效果更好。Chin得出结论,阶数选择取决于地方气候和季节,同时增加参数估计会加大参数和模型的不确定性。因此,许多学者通过模拟干湿期来模拟降水,即假设连续干湿期的长度是独立的,它们的分布也不同。Racsko等基于半经验分布开发了LARS-WG(Long Ashton Research Station Weather Generator)模拟干湿期长度,并且利用多种分布模型拟合干湿期分布。研究人员期望以干湿期为随机变量,能够降低干湿期序列统计误差。
由于长时间序列对区域天气特征的依赖性,天气发生器很难直接应用于模型构建区域以外的地区,尤其是高度区域性和模拟极端天气条件。高淑新等利用东北三省15个气象站逐日气象数据评价了CLIGEN天气发生器,结果显示对日均温度模拟效果较好,但不能较好地模拟温度的连续性和渐变性。随着应用场景需求和研究方法的逐步完善,天气发生器研究呈现细致化和多样化趋势。比如在降水方面深入关注降水幅度和面积,开发多站点多变量天气发生器以揭示时空之间的内在关联;为了推进天气发生器在大空间尺度的应用,Najibi等研究了不同类型气候下发生器的选择方法,以及多个发生器协同工作的可能性。
中国气候类型复杂多样,气候稳定性差、干旱和雾霾持续发生。为了反映持续干旱和暴雨对作物生长的影响,生成长序列的逐日天气输入数据,研究团队构建了基于干湿期的天气发生器(Weather Generator based on Dry and Wet Spells,WGDWS)。本文选取覆盖中国五种主要气候类型共16个站点的逐日气象数据,对 WGDWS 进行测试和评估,通过比较模拟数据与真实数据确定其有效性;与团队早期开发的天气发生器DWSS进行对比,以验证WGDWS的准确性。期望通过本项研究,为作物生理模型提供长序列天气数据输入,以提升站点或区域范围农业生产模拟能力。
WGDWS定义了6个随机变量,分别是干旱天数(简称干期)、降水天数(简称湿期)、日降水量、日最高气温、日最低气温和太阳总辐射。其中,干湿期为主要变量,其随机值由干湿期模型独立生成。其他变量是因变量,它们在某一天的值取决于该天是处于干期还是湿期。
干湿期由干湿日组成,将日降水量大于或等于0.1 mm的某天定义为湿日,小于该阈值的某天定义为干日。连续多个干日为干期,连续多个湿日为湿期。传统的参数化分布函数并不能很好地匹配干湿期的频率,因此使用经验分布函数来建立干湿期随机模型(公式(1))。
其他气象要素(日最高、最低温度以及太阳总辐射)使用连续多元随机过程计算,每日平均值和标准偏差以日状态为条件。通过消除周期性均值和标准偏差,将每个变量的时间序列减少为残差元素的时间序列。首先从历史天气记录中确定所有变量干湿2 d的均值和标准差,然后执行快速傅立叶变换方法以平滑日均值和标准差,最后计算剩余元素。通过谐波分析,可获取日最高温度、日最低温度和日总辐射平均数和标准差的均值和振幅。通过这些参数及相应公式,可生成最高温度、最低温度和太阳总辐射的逐日序列。
残差变量值由以下公式生成:
模型验证的气象数据来自中国国家气象局(http://www.cma.gov.cn),包括全国16个站点1959-2015年共57 a的逐日数据,气象要素包括日最高温度、日最低温度、日降水量、日太阳辐射。本研究选取的站点涵盖了中国的五大主要气候类型,具有较好的代表性,因此利用这16个站点来验证模型在中国的可用性与准确性。具体的站点名称和代表性气候类型如表1所示。
表1 16个气象站的地理位置和所属气候类型Table 1 Geographical locations and climate types of 16 meteorological stations
分月统计各站点的干湿期经验分布、日降水量Gamma 分布参数,并按逐日干湿状态,对日最高温度、最低温度和日辐射作谐波分析,获取相应参数,建立所有模型参数库。使用WGDWS分别生成16个站点100 a的逐日天气数据,并统计1-12月各月的干湿期长度、降水量、降水日数、最高温度、最低温度和太阳辐射值。由于基于干湿日的WGEN类型天气发生器被广泛使用,在世界范围内得到了充分验证,本文目的也是为了验证WGDWS 的准确性,并不局限于特定的建模方法。因此同时应用WGEN类型天气发生器—DWSS,依照上述步骤处理。然后,通过比较WGDWS生成值与实测值分析所建模型的有效性,通过比较WGDWS与DWSS的性能分析所建模型的准确性。
Boulanger等认为,日降水量随机建模最关键的是要保持月和年统计值的均值与方差一致。本文采用独立样本检验分析WGDWS气象要素月生成值和实测值的显著性;采用Kolmogorov-Smirnov(K-S)检验方法分析WGDWS产生的干湿期生成值和实测值的显著性。在比较WGDWS和DWSS时,分别计算生成值和实测值相对误差,建立相对误差分布曲线,比较两类发生器在等概率条件下的相对误差。
2.1.1 WGDWS生成的气象要素序列月统计值检验
对各个气象要素逐日时间序列的月统计值进行独立样本检验,结果显示,在0.05水平上月统计的生成值与实测值无显著差异(表2)。16个站点每个气象要素共有192个月统计值,月最高气温和月最低气温生成值与实测值绝对误差≤0.1 ℃的比例分别为53.1%和56.8%,≤0.5 ℃的比例达到了93.8%和96.4%。最大绝对误差在青海西宁和青海格尔木的2月份(0.86 和0.66 ℃),但两者均未超过1 ℃。月降水日数绝对误差≤0.5 d的比例占71.9%,≤1 d的比例占95.8%,最大绝对误差出现在新疆乌鲁木齐的12月份(1.23 d)。月降水量绝对误差81.3%的站点≤5 mm,91.7%的站点绝对误差在10 mm之内,绝对误差超过20 mm的站点有湖北武汉、广西南宁、江苏南京和海南海口,前3个站点属于亚热带季风气候,海南海口属于热带季风气候。月太阳总辐射绝对误差≤1 MJ/m的比例占70.3%,≤2 MJ/m的比例为90.1%,云南腾冲和广西南宁的误差较大,这两个站点都属于亚热带季风气候。
表2 五大气候区代表站点生成和实测气象要素月统计值t检验结果(t0.05/2=2.074,df=22)Table 2 t-test results of monthly values of generated and measured meteorological variables of representative stations in five major climate regions (t0.05/2 =2.074, df=22)
2.1.2 WGDWS生成的气象要素序列干湿期长度值检验
表3列出WGDWS针对16个站点干湿期生成值的绝对误差。月最长干期平均绝对误差为4.16 d,对温带季风气候、亚热带季风气候的模拟效果较好,平均绝对误差分别为2.52和1.77 d;对温带大陆性气候、热带季风气候的模拟效果较差,平均绝对误差超过了5 d。月最长湿期、平均干期、平均湿期的模拟与实测值非常相近,吻合性很好,平均绝对误差≤1.00 d,尤其月平均湿期的平均绝对误差仅为0.15 d。月最长湿期有87.5%的站点小于1.00 d,仅云南腾冲、海南海口高于1.00 d。除新疆和田和甘肃民勤外,大多数站点的平均干期绝对误差小于1.00 d。平均湿期的最大误差也仅有0.34 d(海南海口)。
表3 五大气候区代表站点干湿期统计值绝对误差Table 3 Absolute errors of statistical values of dry and wet spells for representative stations in five major climate regions d
WGDWS生成的干湿期是在实测历史数据干湿期经验分布基础上,进行随机抽样生成的,理论上生成和实测的干湿期分布之间应该无显著差异。Kolmogorov-Smirnov(K-S)检验是比较两个经验分布之间差异是否显著的较好统计方法,能检验两个样本分布之间的所有差异,包括极值差异。因此本文采用K-S检验对月干湿期分布进行了差异显著性检验。五大气候区16个站点各月干湿期分布的统计值计算结果显示,生成和实测的干湿期经验分布之间没有显著差异(<,>0.05)。由于通常干旱出现在1月份,降水出现在7月份,因此列出16个站点1月干期长度和7月湿期长度生成值和实测值经验分布的K-S统计值(值),见表4。
表4 五大气候区代表站点生成和实测的干湿期分布K-S检验结果(D0.05/2=0.545, df=11)Table 4 K-S test results for comparisons of the distributions of dry and wet spells generated and measured for representative stations(D0.05/2=0.545, df=11)
2.2.1 WGDWS与DWSS生成气象要素序列月统计值比较
DWSS 是基于干湿日转移概率的天气发生器,此类发生器应用广泛。为了比较WGDWS与DWSS模拟干湿期的性能,对两类天气发生器生成的逐日天气数据进行了统计分析。针对五大气候区16个站点的气象要素、干湿期的月统计值,绘制相对误差绝对值的累积频率(图1、图2)。
图1 WGDWS和DWSS生成的各气象要素月统计值相对误差累积频率Fig.1 Cumulative frequency of relative deviation of monthly statistics of meteorological variables generated by WGDWS and DWSS
两类发生器生成的月最高温度、最低温度和太阳总辐射相对误差绝对值分布曲线非常接近,没有显著差异(其中黑龙江哈尔滨站点11月份最高气温趋于0,相对误差无法估计,故剔除);而月降水日数和月降水量有较明显差异,这与作者利用较少站点检验WGDWS发生器性能时的结果一致。在等概率(即累积频率)条件下,与DWSS发生器相比,WGDWS发生器生成的月降水日数往往具有更小的相对误差,而生成的月降水量则具有更大的相对误差。同时,按照不同气候区的模拟结果进行了分类统计分析(图1),温带大陆性气候下两类发生器生成的各个气象要素相对误差绝对值分布曲线一致性最好,其余4种气候类型下月最高温度、最低温度、太阳总辐射的分布曲线两类发生器非常一致,月降水日数和降水量分布曲线有明显差异。对于月降水日数,高原山地气候下两类发生器生成值的相对误差绝对值非常相近,温带大陆性气候下DWSS优于WGDWS,另外3种气候类型下WGDWS模拟误差小于DWSS。对于月降水量,温带大陆性气候下两类发生器生成值的相对误差绝对值非常相近,其余4种气候类型下DWSS误差小于WGDWS。
2.2.2 WGDWS与DWSS生成干湿期统计值比较
图2列出两类发生器生成的16个站点干湿期相对误差分布。两类发生器月平均干期误差分布非常接近,对于最长干期、最长湿期和平均湿期,WGDWS的相对误差小于DWSS。针对不同气候类型(受篇幅限制未列出),WGDWS生成的最长干期和最长湿期相对误差都小于DWSS。对于平均湿期,温带大陆性气候下,两者误差分布非常接近;亚热带季风、高原山地和热带季风气候的模拟趋势与图1一致;温带季风气候下,低概率时WGDWS误差小于DWSS,高概率时反之,但WGDWS 的平均相对误差(概率为50%时的相对误差)小于DWSS。对于平均干期,温带季风气候下两者误差分布很接近,温带大陆和高原山地气候下WGDWS小于DWSS,而亚热带季风和热带季风气候中则相反。
图2 WGDWS和DWSS生成的干湿期相对误差分布Fig.2 Relative error distribution of dry and wet spells generated by WGDWS and DWSS
不同天气发生器采用的算法和适用地区有差异,因此很难直接对比它们在不同气候区的表现。Vu等评估了5种不同的随机天气发生器模型,发现不同气候下其表现存在差异,需根据天气模式以及模型对不同水资源部门的适用性进行验证。本文对针对中国地区构建的天气发生器(WGDWS)进行了适应性验证。WGDWS气象要素月生成值与实测值无显著差异,热带季风和亚热带季风气候条件下月降水量绝对误差较大(>20 mm),亚热带季风气候下(云南腾冲)月太阳总辐射绝对误差较大(>4 MJ/m)。从WGDWS生成的干湿期长度值来看,WGDWS对温带季风气候、亚热带季风气候的模拟效果较好,对温带大陆性气候、热带季风气候的模拟效果较差,但K-S检验表明WGDWS生成值和实测值的月干湿期经验分布之间没有显著差异。
以干湿日为随机变量的建模方法是一种应用广泛且广为接受的建模方法,DWSS即基于该方法构建。温带大陆性气候各要素月统计数据模拟结果一致性最好,高原山地气候除月降水量以外,其余各气象要素月均值一致性较好。对于温带季风和亚热带季风气候,月最高气温、月最低气温和月总太阳辐射的误差分布非常接近。月降水日数WGDWS模拟效果好于DWSS,月降水量DWSS模拟效果好于WGDWS。这与Tseng等的研究结果一致。对于热带季风气候,除DWSS模拟的月最高气温优于WGDWS外,其他规律均符合上述特征。
在模拟干湿期方面,所有站点的统计结果显示,两类发生器生成的月平均干期误差分布一致,其余3个参数WGDWS的相对误差均小于DWSS。对于不同的气候区,WGDWS对最长旱期、最长湿期和平均湿期的模拟效果优于 DWSS,但平均干期两类发生器差异较大。温带季风气候条件下两者一致,亚热带季风与热带季风下DWSS误差小于WGDWS,温带大陆性气候与高原山地气候WGDWS误差小于DWSS。正因如此,所有站点总统计结果中,出现了两类发生器生成的平均干期误差分布很接近的情况。
作者在2014年曾利用9个站点30 a的数据进行过测试,这次测试增加了近1倍站点和近1倍数据,同时对站点也有所要求,涵盖了中国五大气候类型,能够代表中国典型气候特点。从WGDWS生成的各个气象要素逐日时间序列的月统计值来看,增加站点和数据量可以明显提高生成值的准确性。5个气象要素月生成值与实测值更接近,比如月最低温度绝对误差在0.5 ℃以内的比例由94.0%提高到了96.4%,月太阳总辐射绝对误差小于1 MJ/m的比例由64.0%提高到了70.3%。从两类发生器的对比结果来看,增加站点和数据量后,两类发生器生成的月降水量误差分布差距变小,但月降水日数的误差分布依然有较大差距。增加站点和数据量后,两类发生器生成的平均干期误差分布具有更好的一致性,最长干期、最长湿期和平均湿期的误差分布差距都变小。虽然站点和数据量增加抵消了部分差异,但对于干湿期统计量模拟,WGDWS还是优于DWSS。
本文利用中国16个站点1959—2015年共57 a的逐日数据对基于干湿期构建的天气发生器进行了检验,得出以下结论:
1)基于干湿期的天气发生器(Weather Generator based on Dry and Wet Spells, WGDWS)气象要素月生成值与实测值之间没有显著差异。除亚热带季风气候区外(有3个站点月降水量绝对误差超过20 mm),WGDWS产生的气象要素月均值与实测值均有较好的一致性,月最高、最低气温绝对误差≤0.5 ℃的站点比例分别达93.8%和96.4%,月降水日数绝对误差≤1 d的比例达95.8%,月降水量绝对误差91.7%站点在10 mm之内,月太阳总辐射绝对误差2 MJ/m以内的比例达90.1%。WGDWS对温带季风和亚热带季风气候干湿期长度值的模拟要优于温带大陆和热带季风气候,平均绝对误差分别为2.52和1.77 d。
2)WGDWS对最长干期、最长湿期和平均湿期的模拟性能要好于随机天气模拟器(Daily Weather Stochastic Simulator,DWSS),相同误差下WGDWS三要素累积频率都要高于DWSS,能更准确地反映长期干旱或长期阴雨天气。
3)相对误差累积频率对比结果显示,不同气候类型下,WGDWS在模拟月降水日数方面优于DWSS,在模拟月降水量方面DWSS优于WGDWS。
4)增加站点和测试年份可以抵消部分差异,提高模型生成值的准确性。与DWSS相比,WGDWS月最低温度绝对误差在0.5 ℃以内的比例由94.0%提高至96.4%,月太阳总辐射绝对误差小于1 MJ/m的比例由64.0%提高至70.3%。总体上WGDWS干湿期模拟性能优于DWSS。