户雪敏,李 辉,伏松平,陆可心,李宇翔,胡小平
(1.西北农林科技大学 植物保护学院/农业农村部黄土高原作物有害生物综合治理重点实验室,陕西杨凌 712100;2.甘肃省植保植检站,兰州 730020;3.甘肃省天水市植保植检站,甘肃天水 741020)
小麦条锈病是由条形柄锈菌(Pucciniastriiformisf.sp.tritici)引起的重要的世界流行性气传病害(Moshou等,2004;Zheng等,2018),严重威胁小麦安全生产。2020年,中国农业农村部颁布的《一类农作物病虫害名录》中把小麦条锈病列为一类病害[1]。中国是世界上小麦条锈病流行面积最大的国家,曾于1950年、1964年、1990年、2002年和2017年5次大流行,发生面积均超过556万hm2,共造成小麦减产138亿kg[2-5]。
甘肃是中国小麦条锈菌最重要的周年循环区之一,也是中国小麦条锈菌新小种的策源地[6]。小麦条锈菌除了在区内往返传播循环外,还能通过孢子的远程传播影响到中国广大东部麦区条锈病的发生和为害[7]。小麦条锈病的流行程度取决于寄主感病性、菌源数量和气象条件等因素,寄主的感病性是小麦条锈病发生和流行最关键的因素,但在生产实际中,寄主的感病性的变化幅度较小[8],而菌源数量和气候条件的影响往往起到关键作用。因此,建立基于菌源数量和关键气象因子的预测模型对小麦条锈病精准预测和有效防控至关重要。
近年来,许多学者建立了小麦条锈病发生程度预测模型,如蒲崇建等[9]建立了基于温度、降水量、感病品种种植面积、上一年秋苗病叶数等因子的甘肃省天水市小麦条锈病流行程度多元线性回归模型,准确率达82%~91%;胡小平等[10-11]建立了基于菌源量、感病品种面积比例和关键气象因子的汉中市小麦条锈病流行程度的多元线性回归和BP神经网络模型,预测结果和实际发生情况高度符合;蒲崇建等[8]建立了基于越夏菌源量和秋苗发生面积的甘肃省小麦条锈病预测模型,预测准确率为88%;王鹏伟等[12]建立了陇东、陇南和关中地区小麦条锈病远程预警系统,该系统的长、中、短期预测准确率分别为85.7%、92.6%和92.6%,可实现小麦条锈病准确远程预测和数据管理;邹一萍等[13]建立了基于越冬活体菌源量、品种抗冻性和温度的返青期小麦条锈病发病株率预测模型,预测准确度可达85%以上;姚晓红等[14]建立了基于甘肃河东地区气象因子的小麦条锈病发生程度预测模型,其中秋季预测准确率为89%,春季预测准确率为91%;Hu等[15]预测了中国中部和西北部的小麦条锈病越冬的概率,结果表明,在春季所有观察到条锈病的地区都位于越冬潜力预测值较高的区域(预测成功越冬的概率>0.50),在春季没有观察到条锈病的田块中,预测的条锈病越冬潜力接近于零(预测成功越冬的概率<0.25)。迄今为止,基于条锈病秋苗发生面积和气象因子的甘肃省小麦条锈病发生面积的预测研究尚未见报道。本研究综合分析甘肃省小麦条锈病秋苗发生面积、气象条件等因素,构建甘肃省小麦条锈病发生面积预测模型,以期为小麦条锈病的准确预测提供依据。
收集整理了甘肃省2001-2021年调查的秋苗期小麦条锈病发生面积(x1)(表1),以及 2001-2021年7月至翌年4月的月平均气温(Ta2~Ta11)、月最高气温(Tmax12~Tmax21)、月最低气温(Tmin22~Tmin31)、月平均相对湿度(RHa32~RHa41)、月最低相对湿度(RHmin42~RHmin51)、月平均降雨量(Ra52~Ra61)和月平均日照时数 (Sa62~Sa71),气象数据来自中国气象数据网(http://data.cma.cn/)。
基于2001-2019年甘肃省小麦条锈病发生面积和气象数据,采用SPSS中的Pearson分析筛选关键因子。利用全子集回归和BP神经网络算法建立甘肃省小麦条锈病发生面积的预测模型。其中全子集回归采用RStudio version 4.0.5软件中leaps包运算,BP神经网络算法运用Matlab编程语言编写,选用3层BP神经网络,即输入层、隐藏层和输出层,采用Pearson相关法对2001年-2019年历史数据进行主导因素分析,利用决定系数R2、赤池信息量准则(Akaike information criterion,AIC)和均方根误差(Root Mean Squared Error,RMSE)作为全子集回归分析的评价指标(Atkinson和Jeganathan,2012)。决定系数R2越高,预测模型拟合程度越好。AIC以熵概念为基础,考虑了模型的统计拟合度和拟合的变量数目,AIC值越小,表明该模型能够以最少参数预测因变量,有助于降低过拟合现象[16]。RMSE通过实际值与预测值的偏差来判断预测模型的准确性,计算公式为:
表1 2001-2021年甘肃省小麦条锈病发生面积Table 1 Area of occurrence of wheat stripe rust in Gansu province from 2001 to 2021
对2001-2019年调查的秋苗发病面积数据与翌年条锈病最终发生面积进行Pearson相关性分析,结果表明,甘肃省小麦条锈病最终发生面积(y)与上年甘肃秋苗条锈病发生面积(x1)相关系数为0.792,呈极显著正相关关系(P=0.0001)(表2);与上年9月平均相对湿度(RHa34)、1月平均相对湿度(RHa38)、3月平均相对湿度(RHa40)、4月平均相对湿度(RHa41)、3月最低相对湿度(RHmin50)、4月最低相对湿度(RHmin51)和上年9月平均降雨量(Ra54)呈正相关关系,其中与3月平均相对湿度(RHa40)和3月最低相对湿度(RHmin50)的相关系数分别为0.537和0.504,呈显著正相关关系(P<0.05);与上年8月最低气温(Tmin23)、上年9月平均日照时数(Sa64)、上年12月平均日照时数(Sa67)和3月平均日照时数(Sa70)呈负相关关系,其中与上年8月最低气温(Tmin23)呈显著负相关(P=0.011),相关系数为0.585(表2)。
表2 各因子与当年最终发生面积的相关系数及P值Table 2 Correlation coefficient and P value between each factor and final area of occurrence
2.2.1 全子集回归分析 基于2001-2019年甘肃省小麦条锈病发生面积和相关气象数据,通过Pearson相关性分析并结合生物学特性,选取上年秋苗发病面积(x1)、8月最低空气温度(Tmin23)、9月平均相对湿度(RHa34)、1月平均相对湿度(RHa38)、3月平均相对湿度(RHa40)和3月平均日照时数(Sa70)作为自变量因子构建预测模型。当预测模型分别选用因子集1(x1、Tmin23、Sa70)和因子集2(x1、Tmin23、RHa38、Sa70)时,调整R2值均大于70%(图1)。构建的预测模型1和预测模型2分别为:
y1=1.482x1-4.593Tmin23-9.535Sa70+131.514
y2=1.5290x1-4.7881Tmin23-0.1591RHa38-9.523 7Sa70+141.632 4
式中,x1为4.99~39 hm2;Tmin23为11.69~16.22 ℃;RHa38取值范围为32.10~71.23%;Sa70为5.48~7.94 h。
图1 全子集回归分析结果Fig.1 Results of full subsets regression analysis
模型1和模型2的AIC值分别为140.737 8和142.487 2,RMSE分别为9.140 1和9.076 7(表3)。
表3 全子集回归预测模型评价指标计算结果Table 3 Calculation results of evaluation index of full subsets regression prediction models
利用2001-2019年历史数据对全子集回归预测模型进行回测(图2),结果表明模型1和模型2的拟合符合率分别为88.65%和88.19%。利用2020-2021年的田间调查数据对预测模型预测结果进行检验,结果表明模型1预测2020年和2021年甘肃省小麦条锈病发生面积与实际发生面积的偏差为0.18万hm2和0.86万hm2,模型2预测2020年和2021年甘肃省小麦条锈病发生面积与实际发生面积的偏差为1.17 万hm2和0 hm2(表4),模型1和模型2的RMSE分别为9.1401和9.0767(表3)。模型1和模型2的平均预测准确度分别为94.63%和88.81%。因此,选择AIC最低、预测准确度较高的模型1作为甘肃省小麦条锈病发生面积的预测模型。
图2 全子集回归分析预测模型2002-2019年甘肃省小麦条锈病发生面积实际值与预测值拟合图Fig.2 Actualarea of occurrence of wheat stripe rust and prediction value by full subsets regression analysis in Gansu from 2002 to 2019
2.2.2 BP神经网络算法预测 利用全子集回归模型1(x1、Tmin23、Sa70)和全子集回归模型2(x1、Tmin23、RHa38、Sa70)中的自变量因子分别作为神经网络算法的输入层,当年条锈病最终发生面积作为输出层。以2002-2019年的数据作为训练集,以2020-2021年的数据作为测试集,计算预测模型的预测准确度。设置BP神经网络算法的学习率为0.05,迭代次数为150次时,预测值和实际值之间的误差最小。通过不断训练选择合适的权重与偏差,模型1最终训练集输出2002-2019年甘肃省小麦条锈病发生面积依次为71.40、 59.32、57.28、65.72、51.56、54.48、26.25、53.72、45.15、21.87、46.58、15.84、35.63、38.90、26.64、22.52、25.66和7.22万hm2,模型2最终训练集输出2002-2019年甘肃省小麦条锈病发生面积依次为57.81、59.36、53.20、57.26、46.23、 53.48、28.36、54.07、50.88、25.72、53.71、12.29、 38.03、45.80、29.25、24.47、29.16和4.28万hm2(图3),模型1和模型2训练集预测拟合符合率分别为88.65%和86.81。模型1输出的2020年和2021年甘肃省小麦条锈病发生面积分别为21.37和29.91万hm2,预测准确度为98.25%;模型2输出的2020年和2021年甘肃省小麦条锈病发生面积分别为23.36和34.01万hm2,预测准确度为94.03%。
表4 甘肃省小麦条锈病发生面积实际值与预测值关系的模型分析Table 4 Analysis of relationship models between actual and predicted values in area of occurrence of wheat stripe rust in Gansu
利用全子集回归和BP神经网络算法对甘肃小麦条锈病发生面积进行预测,结果表明全子集回归模型1和2对2020-2021年的平均预测准确度分别为94.63%和88.81%,BP神经网络模型1和模型2对2020-2021年的平均预测准确度分别为98.25%和94.03%。由以上结果可知,BP神经网络模型1为最佳预测模型,预测2022年甘肃省小麦条锈病发生面积为10.03万hm2。
图3 BP神经网络算法预测2002-2019年甘肃省小麦条锈病发生面积实际值与预测值拟合图Fig.3 Final area of occurrence of wheat stripe rustl and prediction value from 2002 to 2019 by BP neural network in Gansu
中国西北地区尤其是甘肃陇南和陇东是小麦条锈菌重要越夏区之一,是陕西关中、华北平原冬麦区菌源主要来源[4,19-20]。准确预测小麦条锈病发生面积对条锈病的防控至关重要。本研究以甘肃省小麦条锈病为研究对象,以甘肃省2001-2021年小麦条锈病最终发生面积、小麦条锈病秋苗发生面积和关键气象因子数据为基础,使用全子集回归和BP神经网络2种方法,建立甘肃省小麦条锈病发生面积预测模型。BP神经网络算法模型1和模型2的预测准确度分别为 98.25%和94.63%。由于多元线性回归模型自身具有一定的局限性,小麦条锈病的发生和流行受多种因素影响,呈现的并非是线性关系,而传统的线性回归计算过于简单又需要大量数据,无法真实反映各因素间潜在的关系,预测的精度低;人工神经网络因其强大的映射能力和自学习能力等优势,可以对大量复杂性强、非结构及非精确性的规律进行自适应,同时具有非线性逼近能力等优点使其在预测方面的优势极为显著,近年来在数据预测领域得到广泛应用[21],这可能是两种模型对2022年甘肃省发病面积预测结果差距较大的原因。除此之外,小麦条锈病的流行程度与寄主感病性、菌源数量和气象条件等因素均密切相关。本研究仅分析了秋季菌源量和气象条件对小麦条锈病发生面积的影响,并未将感病品种面积纳入模型。未来的研究中,会全面分析感病品种面积、菌源、气象条件、小麦播种时期及拌种等因素对小麦条锈病发生面积的影响,进一步提高预测模型的稳定性和准确率。
目前,基于全子集回归和BP神经网络的预测模型应用较为广泛且预测准确度较高。谭丞轩等[22]利用全子集筛选和机器学习相结合的方法提高了土壤含水率的反演精度,为准确监测农田土壤墒情、实施精准灌溉提供了一种新的途径。韩佳[23]建立基于全子集筛选的分位数回归模型、支持向量机模型和人工神经网络模型,最终发现全子集筛选的分位数回归模型对土壤含盐量预测的效果优于其他两种模型。Lankin Vega等[24]开发了基于人工神经网络的新西兰Lincoln地区秋季捕蚜虫量预测模型,从而预测大麦黄萎病的发生程度。王园媛等[25]建立了基于BP神经网络的云南省勐海县和石屏县的水稻白叶枯病预测模型,预测准确度达到80%以上。本研究建立了基于全子集回归和BP神经网络的甘肃省小麦条锈病发生面积的预测模型,结果表明,全子集回归模型和BP神经网络模型的预测准确度均在85%以上,其中BP神经网络模型的预测准确度高于全子集回归模型。
作物病害的精准预测是实现科学精准防控的关键技术之一,对于减少农药使用量、降低环境污染等都具有重要的意义。然而,目前多数病害的预测模型是基于田间数据的回归模型,缺乏基于病害流行学的预测模型,加之基层植保技术人员少且队伍不稳定,专业化水平不高,采集的田间数据存在不及时、不准确、不完善、不系统等问题,导致使用这些数据建立的预测模型对于作物病害预测的准确度偏低且不稳定[26]。在未来预测模型的研究中,应该形成稳定的、系统的作物病虫害监测站点,加强病害流行学研究队伍建设、监测预警研究经费的投入、基层植保技术队伍建设和培训等,不断提高对作物病虫害监测预警的准确度,为保证国家粮食生产安全奠定基础。