康晓凤, 邬定荣, 田 琪, 谭姣姣, 马玉平, 于 强,4**
(1.西北农林科技大学资源环境学院 杨凌 712100; 2.中国气象科学研究院 北京 100081; 3.中国科学院大学 北京100049; 4.西北农林大学水土保持研究所黄土高原土壤侵蚀与旱地农业国家重点实验室 杨凌 712100)
IPCC第六次评估报告指出全球气候变暖仍将持续, 中国自1980年起变暖趋势也很明显。在变暖趋势为主的气候变化背景下, 准确预测未来作物的产量是制定气候变化适应战略的必要前提。而作物发育期预测是准确预测作物产量的基础。在过去数十年里, 科学家们发展了多种不同类型的发育模式。利用观测值校正后, 各模式普遍能获得较好的模拟效果, 但由于机理的不同, 应用在变暖环境时, 不同模式的模拟能力可能会出现较大差异。而变暖环境下模拟发育期的差异对预测产量有较大影响, 因此评估变暖环境下发育模式表现的差异, 对于准确预测气候变化环境下的作物产量具有重要意义。
现有发育模式大多基于积温理论构建, 该理论假设作物完成发育阶段所需要的积温/光热时是常数, 考虑的机理主要包括温度响应、光周期、春化和水肥状况影响等。模式间的差异主要体现在描述这些机理采用的具体方法。近年来, 发展了一些基于非常数积温假设的模式。例如Wu等假设发育速率与温度呈线性关系, 以发育阶段始期日序为表征适应环境因子, 建立了耦合响应与适应机制的发育模式。该模式具有参数少、参数化过程简单和精度高等特点。此外, 随着信息技术的不断发展, 有关机器学习算法用于模拟发育期的报道越来越多。研究发现, 由于机器学习算法通过建立环境因素与作物发育及产量的深度关系, 在利用历史数据对不同模式进行训练时, 能较好地预测发育期和产量。已有研究表明机器学习算法应用在发育期模拟、作物发育生长及产量研究等方面时, 表现较为突出。
发育模式的重要应用场景之一是预测发育期对变暖环境的响应。但目前对变暖环境下不同类型发育模式的表现还缺乏综合比较。虽有报道指出机器学习算法在校正阶段表现突出, 但应用到变暖环境下时, 变暖环境的气候条件很可能没被包括在训练集中, 这给机器学习算法的表现带来一定的不确定性。而机理发育模式虽然有机理性较强的优势, 但参数化阶段涉及的非线性过程普遍弱于机器学习模式, 因此哪种模式更适合变暖环境目前还不确定。
本研究以东北春玉米(Zea mays)和华北夏玉米为研究对象, 选择3个代表性的机理发育模式和1个机器学习模式, 将观测年份划分为冷、暖年, 冷年的发育资料用于校正, 暖年资料用于验证, 根据模式在冷暖年表现的差异评价模式在气候变暖情景下的适用性, 以期为气候变化下的发育期模式的选择及模式改进提供科学依据。
以我国东北和华北为研究区域(图1), 以春玉米和夏玉米为研究对象。东北属于寒温带、中温带湿润(半湿润)气候, 种植制度是一年一熟制。春玉米一般在4月下旬种植, 7月中下旬开花, 9月初成熟, 主要是雨养, 个别年份可能会遭遇较严重的干旱。华北属暖温带季风气候, 种植制度是一年两熟或两年三熟制, 夏玉米生长期间雨热同期, 通常不需要灌溉,一般在6月上中旬播种, 8月上旬开花, 9月底至10月成熟。
图1 研究区域和农业气象站点的分布Fig.1 Study area and location of agrometeorological observation sites
东北春玉米和华北夏玉米物候资料来自国家气象信息中心。资料时段为各站建站起至2020年。从中选择具有20年及以上发育期观测的站点, 共包括36个春玉米站和25个夏玉米站(图1), 站点平均观测年数分别为29年和28年。收集每年出苗、开花和成熟等3个发育期的日期。根据常用的发育阶段划分方法, 将出苗—开花归为营养生长阶段(vegetative growth period, VGP), 开花—成熟归为生殖生长阶段(reproductive growth period, RGP)。
气象数据来自国家气象信息中心, 选取与农业气象观测站对应的国家级地面气象观测站的逐日气象数据, 包括平均气温、最高气温、最低气温、日照时数和降水量等。数据时间与物候资料相同。缺失的气象数据使用Python编程进行修订。缺测序列小于5 d时缺测值采用线性插值法计算, 缺测序列大于或者等于5 d时采用同一日的多年平均值代替。假设某站1980年7月14—20日, 连续7日缺测平均气温数据, 而1981—2020年这7日均有观测数据, 则用1981—2020年的同日平均值代替缺测的7日数据。各站资料的开始时间各异, 各日缺测年数也不尽相同, 计算多年平均值的年数因站点而异。本文采取的数据插补方法是气象数据常规处理方法。此外,气象数据的缺失量非常小, 总体上不会对研究结果产生较大影响。
1.4.1 发育模式简介
选择3个机理发育模式和1个机器学习模式进行比较。3个机理发育模式是前人研究表明具有较高精度的模式, 分别为MAIS (maize simulation)、Beta和RAM (response and adaption model)。机器学习算法选择多层感知器 (multi-layer perceptron, MLP)。
在机理发育模式中, MAIS既不考虑光周期现象,也不考虑三基点温度, 而是使用日平均气温的二次和三次函数计算积温的逐日增量。Beta模式不仅考虑了光周期和三基点温度, 还用非线性关系描述温度和发育速率的关系。RAM模式由Wu等开发, 该模式假设发育速率与温度呈线性关系, 且线性倾向率与发育阶段始期的日序线性相关。由于每年的发育阶段始期和温度都不尽相同, 因此RAM认为完成发育阶段所需的积温不是常数。
机器学习模式是一种基于统计关系建立的模式,在对输入数据进行复杂训练后, 可以进行准确预测。不同的训练算法有不同的特点, 适用于不同的应用方向。由于预测发育期通常需要将作物发育依据时间序列展开, 因而常采用神经网络算法。有研究表明神经网络模式比基于气候适宜度的发育模式具有更高的精度。因此, 本研究选择多层感知器神经网络作为代表性的机器学习模式。4个发育模式介绍如下:
参考已有的研究, 采用通用的框架介绍发育模式。玉米发育到某一阶段的进展采用玉米发育指数(DVI)表示。将出苗的DVI定义为1, 开花定义为2, 成熟定义为3。
1) MAIS模式
MAIS模式中生长发育主要通过日平均温度的二次和三次函数计算累积热量单位的日增量(GTI)实现。公式如下:
式中: DVR为日发育速率, GTI, GTI分别是VGP和RGP的热时(℃·d), T是日平均温度(℃),T和T分别是日最高和最低气温(℃)。
2) Beta模式
Beta公式如下:
式中: T为日平均气温(℃), T为该发育阶段下限温度(℃), T为该发育阶段适宜温度(℃), T为该发育阶段上限温度(℃), K为基本发育系数, P为增温促进系数, Q为高温抑制系数, G为感光性系数, D为天文日长(h), D为发育阶段临界日长(h)。Beta模式中的T和MAIS中的T不完全相同。前者是气象数据中的日平均气温, 后面是依据日最高和最低气温计算到的日平均温度。Beta模式参数较多, 为便于参数化, 参照前人研究, 本研究将T、T和T分别取8 ℃、34 ℃和44 ℃, D取12.5 h。
3) RAM模式
RAM模式是一种耦合响应与适应机制的模式,计算公式如下:
式中: DVR为发育阶段始期后的逐日发育速率, α、β和 γ是从出苗到开花阶段的系数, α、 β和 γ是开花到成熟阶段的系数, D OY和D OY分别是一年中的出苗和开花日期的日序。
4)多层感知器神经网络模式
多层感知器神经网络是一种监督式学习算法,可对线性函数或者复杂的非线性函数进行学习, 通常由输入层、隐藏层和输出层3部分组成。算法基于一种多层前馈网络结构, 模拟时先输入学习样本,样本在MLP网络中逐层前馈(从输入层到隐藏层到输出层), 逐层计算出结果。本研究使用反向传播算法对网络的权重和偏差进行反复调整训练, 使输出的向量与期望向量尽可能地接近。本文使用Python 3.7版本sklearn.neural_network包中的MLPRegressor函数, 神经网络的激活函数使用整流线性单元(ReLU), 梯度下降采用Adam算法进行优化。
选择5个特征因素作为MLP神经网络的输入数据:日平均气温、日照时数、降水量、日长和高温度日(heat degree days, HDD)。高温度日依文献 计算。东北春玉米和华北夏玉米在VGP和RGP阶段的最高温度均为35 ℃。由于同一站点同一生长阶段的天数在不同年份存在差异, 本研究按照各年最大时间长度输入逐日数据。VGP阶段的最大时间长度为最早出苗期到最晚开花期, RGP阶段为最早开花期到最晚成熟期, 以确保神经网络能够获得相同长度的输入序列的同时将玉米不同发育阶段经历的气候条件尽可能包括在内。
1.4.2 模式参数化方法
根据气候要素异常度(C)将发育期资料分为冷年数据和暖年数据, 冷年数据用于校正模式参数, 暖年数据用于验证模式在气候变暖背景下的模拟能力。参考中华人民共和国国家标准《农业气候影响评价:农作物气候年型划分方法》(GB/T 21986—2008), 气候要素异常度计算公式如下:
式中: Y 为逐年玉米生长季平均温度(℃), Y为 研究时段内玉米生长季平均气温的多年平均值, s为标准差。
根据玉米生长季平均气温的异常度划分等级,为了在校正和验证时有尽可能多的数据, 同时使冷暖年记录数尽可能一致, 参考文献[32]的划分标准,将C>0定义为暖年(正常年+高温年), C<0定义为冷年(正常年+低温年)。区分后, 春玉米冷暖年生长季平均温度分别为18.91 ℃和19.95 ℃, 暖年生长季均温较冷年高1.04 ℃; 夏玉米冷暖年生长季平均温度分别为23.21 ℃和24.32 ℃, 暖年生长季均温较冷年高1.11 ℃。为便于比较, 春玉米生长季统一定义为5月1日—9月30日, 夏玉米为6月10日—10月10日。
MAIS模式和Beta模式以均方根误差(RMSE)最小化为原则, 在站点尺度用“穷举法”对不同模式的参数进行全局寻优。对于VGP阶段, 从出苗期开始, 模拟开花期。对于RGP阶段, 则从开花期开始,模拟成熟期。各参数的寻优空间略大于公开报道的值, 以在确保得到最优参数的同时减少计算量。RAM模式的参数可根据观测值直接求出。除RAM模式外, 其他模式优化的参数、取值范围和步长如表1所示。MLP采用网格搜索算法进行超参数寻优,使用每组超参数训练模式并挑选验证集误差最小的超参数组合。研究采用Python 3.7版本Grid SearchCV函数调整超参数, 包括隐含层的节点数、最大迭代次数、随机种子, 通过五折交叉验证获得最佳超参数组合。
表1 发育模式参数/超参数取值范围Table 1 Parameter / hyperparameter value range of phenological models
1.4.3 统计分析
采用归一化均方根误差(NRMSE)、平均偏差(MBE)和系统偏差等指标评价模式表现。NRMSE是均方根误差与实际观测数据平均值之比, 主要体现模拟值与观测值的差异程度, 值越小模拟越好。MBE是模拟偏差的平均, 主要用于估计模式偏差的方向, 正偏差表示模拟值高于实测值, 负偏差表示低于实测值。发育模式经常用于预测未来气候变化背景下发育期的变化, 模拟误差的系统偏差可指示变暖环境下模拟的偏差程度, 因此本文还比较了模拟误差随发育阶段平均温度的趋势, 以此作为模式的系统偏差。各指标的计算公式如下:
2.1.1 归一化均方根误差
在春玉米的VGP阶段, NRMSE最小的模式是MLP (3.5%), 其次是RAM (4.5%)和Beta (4.8%), MAIS最大(5.3%) (图2a)。在RGP阶段, NRMSE最小的仍是MLP (4.6%), 其次是RAM (8.6%)和Beta (10.1%),最大的是MAIS (10.4%) (图2b)。
夏玉米的结果与春玉米类似, VGP阶段也是MLP最优(4.5%), 其次是RAM (4.7%)和Beta (4.8%),NRMSE最大的模式是MAIS (5.7%) (图2c)。RGP阶段是MLP模式最优(8.3%), 其次是RAM (8.9%)和Beta (9.1%) , 最大的是MAIS (9.8%) (图2d)。
图2 不同发育模式冷年模拟发育期的归一化均方根误差(a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段; c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段)Fig.2 Normalized root mean square error of simulated maize growth period of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.
各模式在RGP阶段的模拟误差普遍高于VGP阶段。平均而言, 模式在冷年调参后的模拟表现中,最优的模 式 是MLP (5.2%), 其次是RAM (6.7%)、Beta (7.2%)和MAIS (7.8%)。
2.1.2 平均偏差
在春玉米VGP阶段, 各模式均很好地模拟了开花期。Beta和MAIS模拟开花期与观测值接近,MBE分别为0.0 d和0.1 d。RAM和MLP模拟开花期略晚于观测值, MBE分别为0.4 d和0.7 d (图3a)。各模式在RGP阶段的表现普遍次于VGP阶段。MAIS、Beta、RAM和MLP的MBE分别为—0.2 d、—0.9 d、0.4 d和0.6 d (图3b)。
与春玉米类似, 各模式在夏玉米VGP阶段也表现较好。Beta和MAIS模拟日期与观测值接近,MBE分别为0.0 d和—0.1 d, RAM和MLP模拟开花期晚于观测值, MBE分别为0.4 d和0.6 d (图3c)。在RGP阶段, Beta和MAIS模拟成熟期接近观测值,MBE分别为0.0 d和—0.1 d, RAM和MLP模拟成熟期均晚于观测值, MBE分别为0.3 d和0.7 d (图3d)。
图3 不同发育模式冷年模拟发育期的平均偏差(a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段; c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段)Fig.3 Mean bias error of simulated growth period of different phenological models in cold years.a: vegetative growth period (VGP)of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, MAIS和Beta模拟趋于提前, MBE分别为—0.1 d和—0.2 d, RAM和MLP模拟趋于推迟, 其值分别为0.4 d和0.7 d。
2.1.3 系统偏差
在春玉米VGP阶段, Beta和RAM模式所有站点系统偏差均不显著(图4a), MAIS模式有显著系统偏差的站点比例为11.1%, 系统偏差最大的是MLP模式(36.1%) (图4a)。RGP阶段则几乎相反, MLP模式系统偏差最小(22.2%), 其次是Beta (25.0%)和RAM (33.3%), 系统偏差最大的是MAIS模式(58.3%)(图4b)。
夏玉米VGP阶段的结果与春玉米类似, Beta和RAM模式所有站点模拟误差随发育阶段均温的趋势均不显著(图4c), 其次是MAIS模式, 有显著趋势的站点比例为8.0%, 系统偏差最大的为MLP模式,有显著趋势的站点比例为24.0% (图4c)。夏玉米RGP阶段, Beta模式的系统偏差最低, 有显著趋势的站点比例为4.0%, 其次是RAM模式(8.0%)和MAIS模式(20.0%); 系统偏差最大的是MLP模式, 有显著趋势的站点比例为44.0% (图4d)。
图4 不同发育模式在冷年模拟时的模拟误差随发育阶段均温的趋势[a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段;c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段。实心点为站点趋势显著(P<0.05)]Fig.4 Trend of simulation error against growth period average temperature of different phenological models in cold years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize;d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在冷年模拟时, 机理发育模式RGP阶段的系统偏差高于VGP阶段的系统偏差, 但MLP系统偏差表现较稳定。平均而言, 系统偏差最小的模式是Beta(7.3%), 其次是RAM (10.3%)和MAIS (24.4%), 系统偏差最大的是MLP (31.6%)。
2.2.1 归一化均方根误差
和冷年的模拟结果不同, 在春玉米的VGP阶段,表现最好的模式是MAIS (6.8%), 其次是Beta和RAM (均值均为7.4%), NRMSE最大的模式是MLP(8.9%) (图5a)。在RGP阶段, NRMSE最小的是MLP(10.0%), 其次是RAM (11.7%)和Beta (12.2%), NRMSE最大的是MAIS (14.8%) (图5b)。
夏玉米的结果与春玉米相似, VGP阶段是Beta最优(7.1%), 其次是RAM (7.3%)和MAIS (7.5%),NRMSE最大的模式是MLP (10.7%) (图5c)。RGP阶段差异较大, Beta模式最优(14.0%), 其次是MLP(14.1%)和MAIS (16.5%), 最大的是RAM (17.2%)(图5d)。
图5 不同发育模式暖年模拟发育期的归一化均方根误差(a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段; c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段)Fig.5 Normalized root mean square error of simulated growth period of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d:RGP of summer maize.
在暖年的模拟精度明显低于冷年, 不同发育阶段的模拟结果也存在差异。4个发育模式RGP阶段的模拟误差普遍高于VGP阶段。平均而言, 最优的模式是Beta (10.2%), MLP虽然在RGP表现最好, 但受VGP阶段表现的影响, 综合表现(10.9%)次于Beta,RAM 综合表现与 MLP 相同, MAIS 表现稍差, 为11.4%。
2.2.2 平均偏差
在春玉米VGP阶段, MAIS和Beta模拟开花期均呈提前趋势, 平均偏差值相同, 均为—1.7 d; RAM和MLP模拟开花期均呈延迟趋势, 平均偏差分别为2.1 d和2.4 d (图6a)。RGP阶段各模式模拟成熟期较观测值普遍提前: MAIS、Beta、RAM和MLP的平均偏差分别为—5.7 d、—4.0 d、—2.8 d和—1.7 d (图6b)。MAIS模式平均偏差最大, MLP模式平均偏差最小。
在夏玉米VGP阶段, MAIS和RAM模拟开花期与观测值接近, 平均偏差值相近(图6c), Beta和MLP的平均偏差分别为—0.1 d和2.6 d (图6c)。RGP阶段各模式模拟成熟期普遍较观测值呈提前的趋势:MLP的表现好于3个机理发育模式, MBE为—1.2 d;机理发育模式中, 表现最好的是Beta, 平均偏差值为—2.7 d, 其次是RAM模 式, 平均偏差值为—3.8 d,MAIS模式平均偏差最大, 平均偏差为—4.3 d (图6d)。
图6 不同发育模式暖年模拟发育期的平均偏差(a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段; c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段)Fig.6 Mean bias error of simulated growth period of different phenological models in warm years.a: vegetative growth period(VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.
平均而言, 机理发育模式模拟趋于提前, MAIS、Beta和RAM的平均偏差值分别为—2.9 d、—2.1 d和—1.1 d; MLP趋于延迟, 均值为0.5 d。
2.2.3 系统偏差
春玉米VGP阶段, Beta模式有显著系统偏差的站点比例最小(8.3%), 其次是MAIS模式(11.1%)和RAM模式(19.4%), MLP模式有显著趋势的站点比例达47.2%, 系统偏差较大(图7a)。RGP阶段表现与冷年模拟时表现一致, MLP模式有显著趋势的站点比例最低(11.1%), 其次是Beta (30.6%), RAM模式有显著趋势的站点比例为44.4%, 系统偏差最大的是MAIS模式(61.1%) (图7b)。
在夏玉米VGP阶段, MAIS和Beta模式系统偏差有显著趋势的站点比例均最低(20.0%), 其次是RAM模式, 有显著趋势的站点比例为32.0%, 系统偏差最大的为MLP模式(56.0%) (图7c)。夏玉米RGP阶段, 系统偏差最小的是MLP模式(12.0%), 其次是Beta模式(40.0%), MAIS模式有显著趋势的站点比例达60.0%, 系统偏差最大的是RAM模式(64.0%)(图7d)。
图7 不同发育模式暖年模拟时的模拟误差随发育阶段均温的趋势。a: 春玉米营养生长阶段; b: 春玉米生殖生长阶段;c: 夏玉米营养生长阶段; d: 夏玉米生殖生长阶段。实心点为站点趋势显著(P<0.05)。Fig.7 Trend of simulation error against growth period average temperature of different phenological models in warm years.a: vegetative growth period (VGP) of spring maize; b: reproductive growth period (RGP) of spring maize; c: VGP of summer maize; d: RGP of summer maize.Solid point indicate the trends are statistically significant at P<0.05 level.
在暖年模拟时, 机理发育模式RGP阶段系统偏差高于VGP阶段, MLP表现相反。平均而言, 系统偏差最小的是Beta模式(24.7%), 其次是MLP (31.6%),随后是MAIS (38.1%)和 RAM (40.0%)。
本研究使用了站点20年以上的长期发育期观测资料, 研究时段内玉米品种变化频繁, 气候明显变暖,春玉米年均温随年份变化的平均倾向率为0.28 ℃∙(10a), 夏玉米平均倾向率为0.43 ℃∙(10a)。本文未区分品种, 直接用发育期数据驱动模式, 其中隐含的假设之一是品种变化对发育期影响较小。大量研究认为品种变化对发育期有明显影响, 但研究结果多基于统计关系和复杂程度不一的发育模式模拟得到, 未经过同一品种连续种植多年的实际资料的验证。此外, 统计关系和发育模式在捕捉变化环境下作物发育与环境因子关系方面还存在一定的问题。例如在分析三大主粮作物[小麦、玉米、水稻(Oryza sativa)]同一站点15年以上品种不变的实测发育期数据后发现, 在发育期、发育阶段日数、有效积温的变化趋势, 以及发育速率对温度的敏感性等方面的结果与其他站品种变化时的结果无明显差异, 表明品种变化对发育的影响可能远小于基于统计关系和发育模式的结果。此外, 不少研究也认为品种变化对物候的影响并不如已有研究报道的大,进而不区分品种, 直接使用这些数据去订正发育模式参数。在分析气候变化对于物候的影响时, 有研究也倾向于不考虑作物品种特性的差异, 或者将差异主要归因于生长条件气候差异。综上所述, 我们认为本研究中品种变化对发育期影响较小的假设, 对发育模式表现的影响应该在可接受范围内。
本研究根据生长季平均温度划分为冷年和暖年,而在表示模式的系统偏差时使用了发育阶段的平均温度。其原因是生长季的长度远大于VGP和RGP的实际经历。与生长季平均温度相比, 发育阶段的平均温度更能真实地反映VGP和RGP阶段所经历的真实气温。此外, 在生长季平均气温相同的情况下, 逐日气温在不同发育阶段有不同的分布, 可能会导致VGP和RGP模拟误差产生明显差异。但气候变暖导致发育期相应往前平移, 生长季因此处在比平移前相对更冷的环境中, 而生长季平均温度尚不能反映这种变化。如何更准确地表示模式的系统误差还需要进一步研究。
RAM和Beta在冷年和暖年的模拟中均有比较稳定的良好表现, 尤其是变暖背景下, 表明机理发育模式具有良好的外推能力。马玉平等参考RAM构建了甘蔗(Saccharum officinarum)发育模式, 近40年实测数据表明该模式的适应性较好。本文研究结果认为冷年校正时RAM表现较好, 优于Beta模式,但在变暖环境弱于Beta模式。也有文献表明, 用大量数据同时订正RAM和Beta模式时, RAM的表现好于Beta, 表明RAM中的耦合关系需要大量数据的训练才能稳定建立。
MLP模式将降水、日照等气象因素及日长输入模式, 同时还考虑生长发育过程中极端高温事件对物候的影响, 加上MLP可获得极其复杂的多元回归关系, 因此MLP在冷年模拟时表现突出。但当生长季温度升高时, 模式的模拟表现明显降低, 原因为MLP模式本质上是根据输入数据获得的多元回归关系, 而回归关系天然存在外推困难的问题。但是, 与机理发育模式相比, MLP没有考虑作物生长发育的生理机制, 这可能是MLP暖年模拟能力明显弱于机理发育模式的原因之一。典型的机理之一是, 高于上限温度时, 发育就会停止, 不经大量数据训练,MLP可能难以捕捉到这一过程。因此, MLP输入样本量会直接影响模式优化的结果。研究中单个站点数据较为有限, 可能导致MLP模式泛化能力不高。本研究结果表明MLP模拟有过拟合现象。有报道认为输入差异显著的气象数据能显著提高模式的表现, 因此应尽可能多用数据训练机器学习模式, 以包括多的环境变化条件, 提高MLP的泛化能力。值得关注的是, 发育模式的一个重要应用方向是预测未来变暖环境下的物候, 而未来变暖条件下的气象数据, 很可能无法体现在训练数据中, 这在一定程度上限制了机器学习模式在变暖环境中的应用。在RGP阶段, MLP表现突出, 表明现有的机理发育模式对RGP阶段机理的认识可能还存在不足。如研究发现, 在RGP阶段加入光周期的影响可显著提高Beta模式模拟玉米成熟期的精度, 经改进后的Beta模式模拟效果提升明显。RAM在暖年的RGP阶段表现突出(图5), 原因之一可能是RAM考虑的适应过程在形式上类似于光周期。此外, MLP在RGP的输入特征也包括日长。因此, 在进一步的研究中, 应加强RGP阶段这种类似于日长影响的研究。
本研究基于实测历史发育期数据比较了3个不同的机理发育模式和1个机器学习算法在变暖环境下的适用性。冷年校正结果表明MLP模拟精度优于3个机理发育模式, 机理发育模式中精度最高的是RAM, 其次是Beta和MAIS。MAIS和Beta模拟值普遍稍提前于观测值, 其他2个模式则略晚于观测值。3个机理发育模式的系统偏差均低于MLP,机理发育模式中, Beta系统偏差最小, 其次是RAM和MAIS。应用到变暖环境后, 各模式的模拟误差均有所上升, 其中Beta精度最高, 其次是MLP和RAM,MAIS表现较差。机理发育模式模拟值较观测值呈提前趋势, 而MLP趋于推迟。除MLP以外的模式系统偏差较冷年时增大。4个模式中Beta偏差最小,其次是MLP, 随后依次为MAIS和RAM。
机器学习通过输入数据获得复杂多元回归关系对玉米物候进行模拟, 冷年校正时模拟表现优于机理发育模式。但当生长季温度升高时, MLP模拟表现明显下降, 而机理发育模式中Beta和RAM模拟表现较为稳定。
没有一个模式在冷年校正和暖年验证时均占优势, 因此应根据应用场景选用发育模式。关注准确反演历史气候变化对作物发育期的影响时, 建议采用MLP; 而更关注预测未来气候变化对发育期影响时, 应以机理发育模式为主。