陕西苹果花期机理性预报模型的适用性评价

2019-09-16 01:23:58邬定荣霍治国2王培娟王景红姜会飞柏秦凤杨建莹
应用气象学报 2019年5期
关键词:方根花期校正

邬定荣 霍治国2)* 王培娟 王景红 姜会飞 柏秦凤 杨建莹

1)(中国气象科学研究院, 北京 100081)2)(南京信息工程大学气象灾害预报预警与评估协同创新中心, 南京 210044)3)(陕西省经济作物气象服务台, 西安 710015)4)(中国农业大学资源与环境学院, 北京 100193)

引 言

苹果是中国最重要的作物之一,种植面积和产量均居世界首位[1]。然而苹果种植区的气候波动剧烈,种植区地形地貌复杂,未来气候变化背景下苹果遭遇气象灾害的风险较大[2-7]。气象灾害对作物产量和品质的影响,普遍存在关键影响时段和敏感期[8-12],加之气候变化背景下苹果物候期具有逐渐提前且年际波动较大的特点[13-14],因此利用固定时段分析灾害影响,得到的结果误差较大。建立一个适用于苹果主要种植区的物候模型,预测未来苹果物候期的变化,对于评估气候变化背景下气象灾害对苹果产量和品质的影响具有重要意义。

苹果物候模型可分为统计模型和机理模型。统计模型主要是基于物候事件发生时间与气候因子的相关性而建立。机理模型是通过数学方法再现生物过程与气候要素的关系,试图从机制上探讨物候期发生条件的模型[15]。在影响树木发育的机制上,目前普遍认为存在冷驱动和暖驱动两种机制。根据对这两种机制不同描述,机理模型主要分为以下3种类型:顺序模型(Sequential Model, 简称SM)[16-17]、平行模型(Parallel Model, 简称PM)[16-17]和深度休息模型(Deepening Rest Model,简称DRM)[16-20]。此外,不考虑冷驱动作用的热时模型(Thermal Time Model, 简称TTM)[21]因参数较少便于应用也备受关注。许多研究表明:上述机理模型具有较好的适用性,并被广泛用于模拟气候变化背景下树木的物候期[22-25]。

在国内,主要利用统计模型研究苹果物候期对气候变化的响应,其中最主要的研究对象是花期。如蒲金涌等[26]分析了1971年以来甘肃黄土高原温度变化与花期的关系,指出受气候变暖影响,花期提前了14 d左右;孟秀美等[27]计算了3个苹果品种开花期与旬积温之间的相关性,建立的预报模型检验效果良好;毛明策等[28]利用苹果物候观测和气象数据分析了温度对苹果初花期的影响;李美荣等[29]应用统计学方法建立了基于气象因子的始花期预测模型,得到的预测结果与实际较为吻合;柏秦凤等[30]利用统计模型建立了陕西不同区域花期对气温的响应模型,模型模拟效果良好,准确率在70%左右;张艳艳等[31]采用偏最小二乘回归法对甘肃西峰苹果始花期与光、热、水气象因子进行分析,在此基础上预测始花期。这些研究得到的花期与气象要素的相关关系,为防御气象灾害提供了必要的科学依据。

统计模型在历史气候条件下虽能较好地拟合花期,但在外推应用时易产生较大偏差。而气候变化背景下气候波动剧烈,极端气候事件频发,统计模型可能难以满足业务需要,建立机理性苹果花期模型势在必行。

本研究拟以苹果传统种植区陕西省为研究区域,利用观测站花期观测数据,以模型参数校正中常用的均方根误差最小为原则确定上述4个模型的参数,并对模型进行内部检验、交叉验证和外推验证。在此基础上,筛选适合模拟苹果花期的机理模型,以期为防御花期灾害提供科学参考。

1 数据和方法

1.1 数 据

陕西苹果种植区域可分为关中果区、渭北西部果区、渭北东部果区和延安果区[32](图1)。每个果区内均有2个花期物候观测站,区域内共8个观测站。机理性花期模型参数较多,观测序列越长越有利于参数的校正。因此,在每个果区内,选择具有较长花期观测序列的观测站作为模型参数校正的站点,简称校正站,较短观测序列的观测站为模型参数外推验证的站点,简称外推站。校正站包括礼泉(关中果区)、旬邑(渭北西部果区)、白水(渭北东部果区)和洛川(延安果区),这些站分别有21,21,13年和17年的花期观测。外推站包括凤翔(关中果区)、长武(渭北西部果区)、铜川(渭北东部果区)和宝塔(延安果区),这些站分别有9,8,8年和6年的花期观测。各站点具体观测年份如表1所示。

图1 研究区域和观测站分布(苹果分区参照文献[32])Fig.1 The target area and location of sites(regional division of apple planting from Reference [32])

表1 各站的观测年份和年数Table 1 Years and number of observations at each site

校正站中,除礼泉2008年前数据来源于果农记录外,其他站和其他年份的数据均来源于陕西省经济作物气象服务台[30]。外推站的数据来源于文献[33-35]。上述8个站的逐日平均气温数据来源于国家气象信息中心。

1.2 研究方法

1.2.1 模型简介

4个模型均采用相同的假设模拟花期,即认为花期受冷驱动(Rc)和热驱动(Rf)两个过程的影响,且两个过程都是逐日气温的函数。冷驱动和热驱动的状态由累加各日的冷、热驱动速率得到,

(1)

(2)

其中,Sc和Sf分别是第D日冷、热驱动的状态,T是日平均气温,Rc和Rf分别是温度T下冷驱动和热驱动的速率,t1c和t1f分别是开始计算冷驱动和热驱动的日期(以日序表示),研究表明:多数树木的t1c均可设为11月1日[16],D是一年中的日序。

此外,模型使用C*和F*两个遗传参数分别表示完成冷驱动和热驱动过程所需的阈值。在SM和PM中,当Sc累积到阈值C*时,就中止休眠,进入热驱动期,开始累积Sf。Sf累积到阈值F*的日序就是花期的日序。

1.2.1.1 顺序模型

顺序模型(SM)假设在冷驱动累积到C*后才开始累积热驱动。SM中Rc的计算如下:

(3)

式(3)中,Tmin,Topt和Tmax分别是计算冷驱动时的最低、最适和最高气温。Rf由以下公式计算:

(4)

式(4)中,a,b,c是模型参数。

1.2.1.2 平行模型

平行模型(PM)假设即使在冷驱动阶段,温度对物候也有热驱动作用。PM对Rc的计算和SM一样,但由下式计算Rf:

(5)

式(5)中,T0是开始计算热驱动的下限温度,K的计算如下:

(6)

式(6)中,Km是模型参数。

1.2.1.3 深度休息模型

深度休息模型(DRM)将SM中的冷驱动阶段细分为深度休息阶段和休息解除阶段[36]。休息解除后,进入热驱动阶段。模型对冷驱动的计算与SM相同。在计算热驱动时,与PM相同,但K值由下述公式计算:

(7)

式(7)中,K是竞争函数,即花芽对热驱动的响应,取值为0~1;Kmin是未经历冷驱动的花芽对热驱动的最小响应速率;Cdr是冷驱动状态的阈值,高于这个值,树木的状态就从深度休息阶段转为休息解除阶段。

1.2.1.4 热时模型

热时模型(TTM)是另一种普适性的模型,在多种作物中均得到了广泛应用[21,37]。模型假定冷驱动的阈值C*为0,即不考虑冷驱动,而直接从热驱动开始计算。在指定日期之后就开始计算并累积热驱动。TTM实质上是从固定日期(t2)开始计算的高于下限温度的有效积温。具体公式如下:

(8)

Rc=1。

(9)

(10)

其中,Rfrc是热驱动的速率;K是竞争函数,即花芽对温度驱动作用的响应,取值为0或1;Tb_f是计算热驱动的下限温度;T是日平均气温;t2是静止期的始期;t是时间。

1.2.2 参数估计

以模拟值均方根误差最小化为原则对4个模型进行参数优化。SM,PM和DRM参数较多,且响应关系多为非线性,难以推导出解析解,因此运用遗传算法(Genetic Algorithm, GA)进行最优参数的估计[38]。TTM参数较少,在较宽的参数取值范围内以较小的步长直接全局寻优。

对于SM,PM和DRM,依据文献[22-24]报道,采用如表2所示的参数空间进行寻优,TTM的参数空间和寻优步长设置如下:Tb-f取值范围为0~5℃,步长为0.1℃;t2取值范围为1~120,步长为1。4个模型的参数空间基本覆盖了现有报道中各参数的主要取值范围。

1.2.3 模型检验

采用内部检验、交叉验证和外推验证相结合的方式对模型参数进行检验。内部检验和交叉验证只在校正站进行,内部检验是用全部观测年份拟合出的参数模拟物候序列,交叉验证是利用大部分年份数据拟合模型参数,并留小部分数据对模型参数进行检验。本文采用交叉验证中的留一验证(Leave One Out Cross Validation, LOOCV),即将某年份数据剔除后,利用其他年份的数据拟合参数,模拟出被剔除年的物候期;将每一年份的观测值逐一剔除后,即得到用于交叉验证的序列。外推验证是将在校正站获得的参数,用于模拟外推站的花期。本文采用两种方法进行外推验证。第1种是单站外推,即将校正后的参数外推至属于同一果区的外推站,检验参数在果区的适用性。第2种是求平均后外推,即将4个站参数的平均值外推至4个外推站,检验一套参数模拟陕西省整个种植区花期的能力。

表2 SM,PM和DRM的参数寻优空间Table 2 Parametric optimization spaces of SM, PM and DRM

将模拟花期序列与物候观测序列作对比,计算均方根误差和方差解释率(R2),评估各模型的适用性。

2 结果及分析

2.1 内部检验

表 3是内部检验时4个机理性模型在4个站模拟苹果花期的均方根误差和R2。由表3可见,各站最适模型各不相同。旬邑站的最低均方根误差来自于TTM,为3.63 d,其他3个模型的均方根误差均在4.0 d以上。洛川站的最低均方根误差来自于DRM,为2.78 d。礼泉站的最低均方根误差由SM给出,为2.86 d,然而TTM给出的均方根误差也很接近(2.88 d)。白水站的最低均方根误差由SM给出,为3.50 d。模型在4个站的平均均方根误差分别是3.30,4.20,3.62 d和3.30 d,可见TTM和SM的模拟精度相同。

此外,由表3还可以看到,各站最高解释率的模型各不相同。对旬邑、洛川、礼泉和白水解释率最高的模型分别为PM(0.446)、SM(0.618)、TTM(0.836)和SM(0.638)。模型在4个站的平均解释率分别是0.63,0.50,0.59和0.58。

由观测值与模拟值的时间序列曲线(图 2)可见,除个别年份外,4个模型均能较好地模拟各站的变化特征,其中对礼泉的模拟整体最好,基本反映了观测值的年际波动。对旬邑的模拟次之,多数年份的年际波动均得到了良好反映,个别模型在个别年份均方根误差较大。对洛川和白水的模拟稍差,有些年份所有模型的均方根误差均较大,如洛川站的2000年和2002年以及白水站的2013年和2014年。

表3 4个模型在校正站的内部检验结果Table 3 Internal validation results of 4 models at 4 parameter-calibration sites

注:*,**和***分别表示达到0.05, 0.01和0.001显著性水平。

图2 4个校正站开花期观测值和内部检验的模拟值Fig.2 Observed flowering date at 4 parameter-calibration sites and values given by 4 models in internal validation

2.2 交叉验证

表4是交叉验证时模拟值的均方根误差和R2。与内部检验一样,各站点的最适模型各不相同。旬邑的最低均方根误差来自于PM,为4.75 d。洛川的最低均方根误差来自于DRM(3.48 d),TTM次之(3.79 d)。礼泉的最低均方根误差由TTM给出,为3.53 d。白水的均方根误差由DRM最低(4.21 d),TTM次之(5.19 d)。模型在4个站的平均均方根误差分别是4.39,4.45,4.52 d和4.73 d,因此,模型精度差异不大。在解释率上,模型在4个站的平均值分别是0.39,0.44,0.47和0.41,因此,DRM略占优势。

由观测值与模拟值的时间序列曲线(图3)可见,与内部检验相比,各站的模拟偏差都有所增大。其中模拟最好的仍是礼泉,模拟值基本反映了观测值的年际波动。洛川和白水的模拟均方根误差较大。

表4 4个模型在校正站的交叉验证结果Table 4 Cross validation results of 4 models at 4 parameter-calibration sites

注:*,**和***分别表示达到0.05,0.01和0.001显著性水平。

图3 4个校正站开花期的观测值与交叉验证的模拟值Fig.3 Observed flowering date at 4 parameter-calibration sites and values given by 4 models in cross validation

交叉验证结果表明4个模型各有优势,没有表现特别突出的模型。考虑到TTM原理简单,仅需3个参数,参数订正过程简单,方便应用,而其他3个模型需要7~9个参数,且参数化过程复杂,计算工作量大,因而在应用上TTM具有明显优势。从另一方面看,其他3个模型采用了更复杂的机理,计算耗时更大,但模拟结果未获得明显提升,表明在实际应用中可以不考虑更复杂的机理。已有研究表明:在模拟北方温带地区植物花期时,TTM的模拟效果更优[39],本研究结果与此一致。

2.3 外推验证

基于模型内部检验和交叉验证结果,综合考虑准确率和模型复杂程度,推荐使用TTM模拟陕西苹果花期。该模型内部验证获得的参数取值如表 5所示。在这些取值的基础上,采用2种方法对TTM进行外推验证。

表5 TTM内部检验时4个校正站的参数取值、热驱动阈值F*和准确率Table 5 Parameter values, thermal threshold(F*) and simulation accuracy in internal validation of TTM at 4 parameter-calibration sites

两种外推方法得到的结果如图 4和表 6所示。在单站外推中,旬邑的参数外推至长武时,拟合效果较好,模拟值基本反映了花期随时间变化趋势 (图4a),但个别年份模拟均方根误差较大(6.24 d),在2000年的均方根误差达到了11 d;洛川的参数外推至宝塔时,模拟效果最好,均方根误差仅为5.08 d (表 6);礼泉的参数外推至凤翔时,虽均方根误差也较低(5.34 d),但模拟值普遍高于观测值,这可能是气象站观测到的气象要素与果园所处的小气候存在系统偏差所致;白水的参数外推至铜川时的均方根误差也较低(5.34 d),且存在模拟值普遍低于观测值的情况。除凤翔外,求取平均后外推的精度均有不同程度的降低,长武降低得尤其明显。4个站合计,单站外推的均方根误差为5.90 d,求平均后的外推为7.21 d,精度下降幅度较大,因此,建议分果区进行模拟。

图4 TTM参数在4个外推站应用的模拟结果 (a)单站外推,(b)参数求平均值后外推至4个站Fig.4 Simulated flowering date applied by TTM at 4 parameter-validation sites(a)based on values of a single site,(b)based on average values of 4 sites

表6 TTM参数在4个外推站应用时的均方根误差(单位:d)Table 6 Root mean square errors of simulated flowering date applied by TTM at 4 parameter-validation sites(unit:d)

3 结论与讨论

本文基于陕西4个主要苹果种植区共8个花期观测站的花期数据及同期的逐日气象数据,以均方根误差最小化为原则,优化4个物候模型(SW,PM,DRM和TTM)的参数,并通过内部检验、交叉验证和外推验证评估对苹果花期模拟的适用性。得到以下主要结论:

1) 在内部检验中,4个校正站的最适模型各不相同,总体上SM和TTM略优。旬邑、洛川、礼泉和白水的最适模型分别是TTM,SM,DRM和SM。4个模型在4个站的平均均方根误差分别是3.30,4.20,3.62 d和3.30 d,模拟结果对观测数据的平均解释率分别是0.63,0.50,0.59和0.58。

2) 交叉验证时,没有在4个校正站表现均突出的模型。在旬邑、洛川、礼泉和白水的最适模型分别是PM,TTM,DRM和DRM。4个模型在4个站的平均均方根误差分别是4.39,4.45,4.52 d和4.73 d,平均解释率分别是0.39,0.44,0.47和0.41。考虑到模型的复杂性与模拟精度,本研究认为TTM更适合模拟陕西苹果的花期。

3) TTM在外推站应用的结果表明:与求平均后外推相比,单站外推可获得更高的模拟精度。在单站外推中,延安果区的外推均方根误差最小(5.08 d),关中和渭北东部果区的参数虽然均能较好地外推,但模拟值普遍高于观测值。渭北西部果区的参数外推的均方根误差最大,个别年份的均方根误差高达11 d。

研究中8个站的苹果均为红富士系,因此,理论上可以用一套参数模拟8个站的花期,但实际上苹果花期受多个环境因素的影响,用一套参数模拟不同站的花期时会产生较大的均方根误差。如Darbyshire等[25]基于全球南北半球不同区域的14个站同一品种的花期数据,评估了4个花期模型,结果显示:均方根误差多在10 d左右。在本研究中,TTM在站点尺度的内部检验均方根误差为3.30 d,将参数外推至果区时均方根误差为5.90 d,而将参数求平均后外推至整个种植区时,均方根误差为7.21 d。虽然本文研究结果(7.21 d)略优于国外同类研究(10.0 d),但原因之一很可能是本文站点跨越的空间尺度较小,不同站点间的气候波动幅度低于跨越南北半球空间尺度。综合本研究和国外研究可以发现,模型参数所代表的区域范围越小,模拟精度越高。

研究还发现,更复杂的模型并没有带来更高的模拟准确度。4个模型中最复杂的DRM本质上是对SM和PM的进一步深化,理论上模拟准确度应该更高,而实际上却没有得到更高的准确度。但该模型在机理上考虑得较为全面,若能收集各个子过程的详细观测数据,逐过程地对模型进行参数化,可能获得更好的模拟结果,只是这种方法需要更多物候观测项目,如现芽期、展叶期等,参数校正也需要花费更长时间。

与主粮作物如小麦[40]、玉米[41]和水稻[42]的模拟结果相比,苹果花期的模拟均方根误差较大。造成这种现象的主要原因包括:首先,模型机理可能还存在一定不足,如现有花期模型均只描述了冷热胁迫对发育速率的影响,而其他机理如光周期和水分胁迫对树木的发育可能也有影响[17]。这可能是导致4个模型在有些年份的均方根误差均较大的主因。其次,苹果是多年生树木,花期的影响因素较一年或二年生的主粮作物复杂。再次,在气象数据上,气象站位置与果园位置不完全一致,气象站与果园所处的小气候可能存在差异,且果园多处于山区,地势崎岖不平,这种差异较主粮作物更明显。避免这种差异的方法之一是使用格点气象数据代替站点数据。但苹果种植区地形地貌破碎,对格点数据的空间分辨率要求较高。另一种可行的方法是先建立气象站与果园小气候的推算关系,基于这种推算关系反演果园的历史气候,基于历史气候校正模型参数,可能获得较好的效果,但这要求有1年以上果园小气候的观测。为了在以后更好地模拟苹果花期,建议对花期开展长期定位观测,各项观测均按观测规范进行,同时对果园各项气象要素以及土壤水分状况进行监测,在积累高质量观测数据的基础上,分析苹果花期的影响机理机制,进而提出更好的模型。

总体上,本研究推荐使用TTM模拟陕西苹果花期。在模拟陕西苹果花期时,由于单站外推比求平均后外推具有更小的模拟均方根误差(表6),因此,建议每一个苹果种植分区采用一套参数,以便在保证模拟准确性的同时减少对观测数据的要求。

猜你喜欢
方根花期校正
方根拓展探究
大豆:花期结荚期巧管理
今日农业(2021年15期)2021-10-14 08:20:24
劉光第《南旋記》校正
国学(2020年1期)2020-06-29 15:15:30
一类具有校正隔离率随机SIQS模型的绝灭性与分布
机内校正
Current status and challenges in sentinel node navigation surgery for early gastric cancer
均方根嵌入式容积粒子PHD 多目标跟踪方法
自动化学报(2017年2期)2017-04-04 05:14:28
揭开心算方根之谜
容颜盛放,花期未至香谢凉
汉服有礼——陌上又花期,相思又一年
火花(2015年7期)2015-02-27 07:43:45