马玉平 王培娟 王 达 俄有浩 李 莉 孙琳丽 杨建莹 霍治国*
1)(中国气象科学研究院,北京 100081) 2)(广西壮族自治区崇左市扶绥县气象局,崇左 532100) 3)(广西壮族自治区气象科学研究所,南宁 530022) 4)(内蒙古自治区通辽市气象局,通辽 028000)
作物生长模型从农业生态系统物质平衡、能量守恒以及物质能量转换原理出发,以光、温、水、气、土壤等条件为环境驱动变量,应用数学物理方法和计算机技术,对作物生育期内光合、呼吸、分配、蒸腾等重要生理生态过程及其与气象、土壤等环境条件以及耕作、灌溉、施肥等技术条件的关系进行定量描述,再现作物生长发育及产量品质的形成过程[1-5]。作物生长模型综合大气、土壤、作物遗传特性和田间管理等因素对生产的影响,克服传统作物-天气统计模型的缺点,是一种面向生长过程,机理性和时间动态性很强的模型。20世纪60年代以来,国际上已经发展了众多有影响力的作物生长模型[6-10]。近年作物生长模型也已广泛应用于田间生产管理、气候变化对农业生产的影响评估、农业气象条件评价、产量预测及作物育种等方面[11-22]。
作物生长模型的机理描述主要包括作物发育进程和生长过程。发育进程与作物的形态变化相联系,是作物生长达到质变的标志性阶段。作物生长过程依赖于发育进程,发育进程的合理描述是提高作物生长模型模拟能力的前提。作物发育进程主要与品种、光周期和气候因素有关。尽管土壤水分也会影响发育[23-24],但温度是造成作物发育年际变化的最重要因素[25]。有关作物发育进程模式,1735年Reaumur提出积温学说,认为作物生育期内的积温为一准常数,据此人们建立积温模式并在温度影响方面不断改进。发育单位模式认为作物发育速率与最低气温呈线性而与最高气温呈非线性关系[26-28];热量单位模式描述作物发育速率与温度呈非线性关系[29],利用日平均气温可进一步修正[5,30];传统模型中还发展了多种曲线函数[31];钟模型综合作物遗传特性与环境因子对发育的非线性影响[8,32],并利用非线性β函数对其改进[33];最近发展的响应适应模式,通过引入日序参数描述作物发育进程对环境的适应[34]。尽管国内外众多学者研发了不同的作物发育模式,并在作物生长模型中广泛应用[5-10],但发育模型模拟能力还难以满足作物生长模拟的需求。这些模式只是关注某时段(日)气象条件对作物发育的影响,相同的气候条件就有相同的发育速率,并未考虑作物所处发育期,这可能是模拟精度偏低的一个重要因素。
甘蔗是世界上重要的糖料和经济作物。中国是蔗糖生产和消费大国,蔗糖产量居世界第3位,蔗糖消费居世界第2位[35]。当前气候变化及频发的气象灾害对甘蔗生产造成了严重影响[36-39],我国甘蔗主产区广西每年因旱灾而损失的甘蔗产量超过18%[40]。利用作物生长模型开展甘蔗生长监测及灾害影响评估,对于甘蔗产业健康可持续发展有重要意义。目前世界上应用较多的甘蔗生长模型主要包括APSIM sugarcane[41-42],QCANE[43]和CANEGRO[44-45]等,它们的发育进程模拟仍基于积温学说,因此同样面临未考虑作物所处发育阶段的问题。中国农业气象模式(CAMM)是面向业务应用的作物生长模型,主要反映中国农业种植特色及灾害影响过程[5,46],其发育进程尚未经甘蔗的适应性检验。
本文将根据作物发育速率不仅与气象条件有关、还与其所处发育期有关的理论假设,结合现有模式机理过程重构作物发育进程,利用中国甘蔗发育实测数据比较不同模式的适应性,进一步明确作物发育机制,提升发育模式的模拟精度,不断完善中国农业气象模式(CAMM)[5,46],以促进作物生长模拟理论发展。
研究收集1980—2019年我国30个农业气象观测站不同年份的新植蔗和宿根蔗发育数据(表1),包括播种期、出苗(新植)/发株(宿根)期、茎伸长期和工艺成熟期等,其中少量站点个别年份发育期数据缺失。数据来源于国家气象信息中心和广西气象科学研究所。
表1 研究数据概况Table 1 Overview of research data
续表1
本文对目前常用的发育进程模式进行理论改进并重构。传统作物生长模型中常用的发育模式有积温(TSUM)、热量单位(THU)[29]和发育单位(CHU)[27-28]等,近年发展了热量单位修正(THUa)[5,30]和响应适应(RAM)[34]等模式。RAM为逐日发育速率,其他模式为完成某发育阶段所需积温或热量。
参照热量单位修正(THUa)模式原理构造发育单位温度修正(CHUa)模式(式(1)),参照响应适应(RAM)模式原理构造发育单位响应适应(CHUr)模式(式(2)):
(1)
(2)
HUi=0.5[(Tmin-4.4)+a(Tmax-10)-
b(Tmax-10)2],
(3)
Ta=(Tmax+Tmin)/2。
(4)
其中,Dr为发育速率,i为某发育阶段的年内日序,HUi为每日的发育单位,Edoy是发育初期日序,Tmax和Tmin分别为日最高和最低气温(单位:℃),Ta为日平均气温(单位:℃)。a,b,c,d,e为参数。
假定作物在某一日的发育速率不仅与当日的气象条件有关,还与所处的发育期有关。以发育日期的年内日序(Di)表示甘蔗所处发育期,由此构造温度日序(TAd)模式(式(5))和发育单位日序(CHUd)模式(式(6)):
(5)
(6)
根据观测数据将甘蔗发育进程节点确定为播种、出苗(新植)/发株(宿根)、茎伸长和工艺成熟。以THU模式为例,新植蔗发育进程分为3个阶段,分别为播种到出苗(THUEM)、出苗到茎伸长(THU1)、茎伸长到工艺成熟(THU2);宿根蔗发育进程分为2个阶段,分别为发株到茎伸长(THU1)、茎伸长到工艺成熟(THU2)。模式中定义出苗/发株期、茎伸长期、工艺成熟期分别为0,1,2。
利用中国各地实测甘蔗发育数据对积温(TSUM)、热量单位(THU)、热量单位修正(THUa)、发育单位(CHU)、发育单位温度修正(CHUa)、发育单位日序(CHUd)、温度日序(TAd)、响应适应(RAM)和发育单位响应适应(CHUr)等9个模式进行模拟检验,分析它们的适应能力,进而确定适宜的甘蔗发育进程模式。模式检验在站点基础上针对新植蔗和宿根蔗(同一站点的发育参数唯一)展开,适应性评价主要采用模拟值与实测值的相关系数、平均误差(误差绝对值的多站点平均)、均方根误差以及两者的1:1线和线性回归方程等实现。
模式适应性初步分析:鉴于某些农业气象观测站点甘蔗发育观测数据年份较少,利用1980—2019年中国甘蔗发育数据的全部样本,对TSUM,THU,THUa,CHU,CHUa,CHUd,TAd,RAM和CHUr等9个模式模拟的甘蔗发育期进行回代模拟检验,通过考察模拟值与实测值的相关系数和均方根误差,初步筛选适应能力较强模式。
初筛模式再检验:将各站点的甘蔗发育观测数据分为两组,一组用于模式参数率定及回代检验,另一组用于独立样本检验。比较两次回代检验过程中,样本量变少时各发育模式模拟能力的变化。通过考察模拟值与实测值的相关系数、均方根误差以及两者的1:1线和线性回归方程,评价各模式模拟能力。
图1为新植蔗全样本发育实测数据对TSUM,THU,THUa,CHU,CHUa,CHUd,TAd,RAM和CHUr等9个模式模拟不同发育期的回代检验。可以看到,相较其他模式,CHUr模式模拟值与甘蔗发育期实测值的相关系数极低而均方根误差极高,表明这一模式的理论描述基本不成立。其余8个模式在模拟甘蔗播种到出苗时能力基本相当;在模拟出苗-茎伸长期时以RAM,CHUd和TAd模拟效果最好,相关系数分别为0.92,0.91和0.91(均达到0.01显著性水平),平均误差分别为7.7 d,8.7 d和8.7 d;均方根误差分别为12.5 d,13.0 d和13.1 d;在模拟茎伸长-成熟期时,THUa,CHU,CHUa,CHUd,TAd,RAM模式明显强于其余模式,而又以CHUa,CHUd能力最强,相关系数均达0.86(达到0.01显著性水平),平均误差均约为8.0 d,均方根误差均约为16.0 d。
进一步分析模拟甘蔗茎伸长-成熟期误差较大的个例发现,TSUM,THU,RAM和CHU等模式模拟成熟期偏晚较多。原因在于发育后期气温越来越低,较小的积温差距换算为日数差距较大。因此,根据多站点多年甘蔗观测数据,设置最晚成熟期为播种后第2年的2月底,强制模式模拟发育结束(图略),则多数模式模拟值与实测值的相关系数均有所提高,均方根误差均有所降低。其中,以RAM模式改善效果最为明显,相关系数由0.79升至0.86(达到0.01显著性水平),均方根误差由21.1 d降至16.5 d。由于强制模拟发育结束无法体现甘蔗发育循序渐进及相应生长过程,因此下面的模拟检验不讨论该方式。
同样,利用1980—2019年宿根蔗全样本发育实测数据进行9个模式发育模拟能力回代检验。结果与新植蔗的表现类似,在模拟发株-茎伸长期时以RAM,CHUd和TAd模拟效果最好,相关系数分别为0.94,0.92和0.92(均达到0.01显著性水平),均方根误差分别为6.7 d,7.8 d和7.8 d。在模拟茎伸长-成熟期时以CHUa,TAd,CHUd最好,相关系数分别为0.92,0.91和0.90,均方根误差分别为11.0 d,11.5 d和12.1 d。因此,根据全样本回代检验效果(均达到0.01显著性水平),初步筛选出适应性较好的甘蔗发育模式为CHUd,TAd,RAM,CHU,CHUa和THU。
图1 新植蔗全样本发育实测数据对不同发育模式的回代模拟检验Fig.1 Test of different development models based on the whole sample development data of new planted sugarcane
根据全样本回代检验的适应性初步分析结果,开展THU,CHU,CHUa,CHUd,TAd,RAM模式对甘蔗发育进程模拟的适应性分析。表2为利用站点部分新植蔗发育实测数据对发育模式的参数率定值。其中,RAM模式的3个多元回归参数值略,其余5个模式为出苗-成熟期所需累积的积温或热量。RAM参数值在区域上并无明显分布规律,而其他模式参数值与站点所处纬度相关显著(图2)。
图3为各模式利用参数率定值对新植蔗回代模拟值与实测值比较,表3为各模式模拟误差。可以看出,当样本量减少时,6个模式模拟新植蔗播种-出苗期能力相当,模拟值与实测值相关系数为0.82~0.84(达到0.01显著性水平)、均方根误差为8.6~9.1 d。模拟出苗-茎伸长期时仍以CHUd,TAd模式的能力最强,模拟值与实测值相关系数超过0.90,均方根误差在13.6 d以内。而对于RAM模式,如果某一年的发育初值明显异于常年,则模拟结果偏差很大,其他模式无该情况。模拟茎伸长-成熟期时,仍以CHUd,CHUa的模拟效果最好,模拟值与实测值的相关系数均为0.86(达到0.01 显著性水平),均方根误差均为16.5 d,其余模式模拟值和实测值的相关系数、均方根误差分别为0.33~0.76(达到0.01显著性水平),23.0~43.0 d;由图3还可以看到,CHUd和CHUa的模拟值与实测值较好地维持在1:1线附近,其余模式则出现很多散乱点,表明这两个模式能够很好地反映特殊年份甘蔗发育进程。
表2 发育模式在部分站点针对新植蔗的参数率定值Table 2 Calibrated parameter of development models at some sites for new planted sugarcane
图2 发育模式参数值与站点所处纬度相关关系Fig.2 Relationship between parameters of development model and latitude of the station
同样地,利用宿根蔗部分发育数据,对参数率定后的THU,CHU,CHUa,CHUd,TAd,RAM进行回代模拟检验(图略)。结果表明:RAM,CHUd和TAd模式的表现更好,发株-茎伸长期3个模式模拟值与实测值的相关系数均大于0.90(达到0.01显著性水平),平均误差均小于6.0 d,均方根误差均小于7.9 d。茎伸长-成熟期3个模式模拟值与实测值的相关系数均超过0.92(达到0.01显著性水平),平均误差均小于8.8 d,均方根误差均小于11.2 d。
图3 发育模式对新植蔗回代模拟与实测值比较Fig.3 Measurements and simulations of development models based on back training for new planted sugarcane
续图3
表3 发育模式对新植蔗回代模拟误差Table 3 Back training simulation error of development model for new planted sugarcane
表4为利用新植蔗数据对THU,CHU,CHUa,CHUd,TAd,RAM模式进行独立样本检验误差,图4为各模式模拟值与实测值的比较。可以看到,多数模式对独立样本与参数率定样本的模拟能力大体相当,未出现明显下滑迹象。在模拟出苗-茎伸长期时,以CHUd,TAd,THU,CHU的模拟能力最强,模拟与实测值的相关系数均大于0.92(达到0.01显著性水平),均方根误差小于12.9 d。在模拟茎伸长-成熟期时,仍以CHUd,CHUa的模拟效果最好,模拟值与实测值的相关系数均大于0.85(达到0.01显著性水平),均方根误差均小于17.3 d。但RAM的模拟精度明显下降,在模拟出苗-茎伸长期时,模拟值与实测值的相关系数由0.86降至0.73(达到0.01显著性水平),均方根误差由16.5 d升至23.2 d;在模拟茎伸长-成熟期时,模拟值与实测值的相关系数由0.55(达到0.01显著性水平)降至0.21(RAM模拟茎伸长-成熟期,仅达到0.1显著性水平),均方根误差由36.1 d升至70.1 d。究其原因,RAM是发育进程与发育初期及温度的多元线性回归模式,当样本量较少时,个别发育初期明显异常的特殊样本对统计回归模式的模拟效果影响很大。
表4 发育模式对新植蔗独立样本模拟误差Table 4 Development model simulation errors based on independent samples for new planted sugarcane
图4 发育模式对新植蔗独立样本模拟值与实测值比较Fig.4 Measurements and simulations of development models based on independent samples for new planted sugarcane
续图4
同样地,利用宿根蔗发育数据对THU,CHU,CHUa,CHUd,TAd,RAM进行独立样本模拟检验(图略)。结果表明,CHUd和TAd模式的表现更好。在模拟发株-茎伸长期时,CHUd和TAd模拟值与实测值的相关系数均为0.89(达到0.01显著性水平),平均误差均小于6.2 d,均方根误差均小于7.8 d,但RAM的模拟精度有所降低。在模拟茎伸长-成熟期时,CHUd,TAd和RAM模拟值与实测值的相关系数均大于0.92(达到0.01显著性水平),平均误差均小于7.3 d,均方根误差均小于16.5 d。
表5 发育模式在不同检验中的模拟能力Table 5 Simulation ability of development models in different tests
研究表明:
1)作物发育速率不仅与气象条件有关,还与所处发育期有关,基于这一理论构造的发育单位日序和温度日序模式对模拟甘蔗发育进程的适应性强。
2)对于后期温度不断升高的发育进程(如甘蔗出苗-茎伸长期),各模式的适应能力差异不大。对于后期温度不断降低的发育进程(如甘蔗茎伸长-成熟期)或低温年型,各模式的适应能力差异明显增加。如果考虑模拟日期所处发育期的信息,则模拟能力明显提升。
3)总体上,各模式对甘蔗发育的模拟能力强弱依次为发育单位日序、温度日序、响应适应、发育单位、发育单位温度修正和热量单位模式。
本文重构的发育单位响应适应、发育单位温度修正、发育单位日序和温度日序4个发育进程模式中,发育单位响应适应模式是在发育单位的基础上增加初值对发育进程的影响,但检验显示该模式模拟效果不理想,原因需进一步探讨。发育单位温度修正模式是利用发育阶段的平均温度对发育单位修正,在甘蔗出苗-茎伸长期,前者的适应能力略有下降,但在甘蔗茎伸长-成熟期,前者的适应能力明显提升,表明发育不仅与温度累积有关,还与阶段内的整体温度强度有关,尽管累积温度达到标准,如果发育阶段的整体温度强度(平均温度)达不到某个阈值,发育仍难以完成。发育单位日序和温度日序模式均考虑作物所处的发育期,即便某日的温度等环境条件完全一致,但如果作物所处发育期不同,则发育速率也不同,因而它们在甘蔗出苗后的各个发育阶段均有较优异表现。对于低温年或前期发育期推迟较多的个例,发育单位日序模式模拟效果仍然很好,而其他模式则偏差较大,表明重构的发育单位日序模式适应范围更广。另外,发育单位日序模式、温度日序模式和发育单位温度修正模式的参数值与站点所处纬度相关关系很好,为参数区域化提供了便利。目前发育单位日序模式和温度日序模式仅用日序定位发育进程,下一步还可寻找更丰富的描述方法,同时各模式的模拟能力尚需其他作物发育数据验证。近年发展的响应适应模式[34],如果某一年的发育初值明显异于常年,则模拟结果可能偏差较多,但对于正常年份,其表现十分突出。响应适应模式中引入的发育初始日期实际上也部分确定了作物在某日所处的发育阶段,因而模型拟合能力得到提升。实际应用中,可根据各模式在作物不同发育阶段的模拟能力进行选择。
由于目前收集的发育数据不含品种及田间管理方式等信息,因此无法针对品种进行模式参数率定。一般情况下,适应某地的作物品种为一个气候生态型,其发育进程大致相仿,而且确定站点参数就可以通过分区或插值实现区域(格点)化,因此开展站点参数率定很有意义。