苏畅 户雪敏 胡洋山 马丽杰 商文静 冯小军 胡小平
摘要 为提高陕西省小麦条锈病发生面积的预测准确度,以2010年-2018年陕西省小麦条锈菌冬繁区和越冬区的发生县区数、发生面积、温度和降雨量为数据集,通过Pearson相关性分析筛选病害流行的主要影响因子,利用全子集回归筛选病害流行的因子集。以筛选得到的影响病害流行的5个因子,即累计发生县区数、冬繁区条锈病发生面积、1月平均温度、1月平均降雨量和3月平均降雨量为自变量,采用全子集回归和BP神经网络算法开展小麦条锈病发生面积的預测研究。结果表明,全子集回归和BP神经网络算法对2019年-2020年的小麦条锈病发生面积预测准确度均达90%以上,预测2021年陕西省小麦条锈病发生面积分别为46.11万hm2和52.85万hm2。
关键词 小麦条锈病;发生面积;全子集回归;BP神经网络算法
中图分类号: S435.121;S431
文献标识码: A
DOI: 10.16688/j.zwbh.2021218
Abstract In order to improve the prediction accuracy of the occurrence area of wheat stripe rust in Shaanxi province, the number of counties, the occurrence area, temperature, and rainfall in the winter propagation and overwintering regions of wheat stripe rust from 2010 to 2018 were used as the data set to construct prediction model. Relevant factors were screened through Pearson correlation analysis, and factor sets were screened by full subsets regression. Taking the five screened factors, including the total number of counties with stripe rust, the occurrence area of stripe rust in winter propagation, the monthly mean temperature and mean rainfall in January, and the mean rainfall in March as independent variables, the predicted occurrence area of wheat stripe rust was carried out using full subsets regression and BP neural network. The results showed that the prediction accuracy of full subsets regression and BP neural network on the wheat stripe rust occurrence area in 2019-2020 were both over 90%, and the predicted occurrence area of wheat stripe rust in Shaanxi province in 2021 were 461 100 and 528 500 hm2, respectively.
Key words wheat stripe rust;occurrence area;full subsets regression;BP neural network
由条形柄锈菌Puccinia striiformis f.sp. tritici引起的小麦条锈病是世界上重要的流行性真菌病害[1-4],属于我国一类农作物病害[5],严重影响小麦的产量和品质[6]。我国是世界上条锈病流行面积最大的国家[7-8],1950年、1964年、1990年、2002年和2017年我国先后发生5次小麦条锈病大流行,发病面积333万~667万hm2,共造成小麦减产138亿kg[9-13]。
陕西省陕南地区汉中、安康和商洛以及关中地区宝鸡、咸阳、西安和渭南等均为小麦条锈病的常发流行区,其中陕南地区是小麦条锈病菌冬繁区[13],关中是小麦条锈菌越冬区[14-16]。建立准确率高的小麦条锈病预测模型对保障陕西小麦的丰产稳产至关重要。胡小平等[17-18]基于春季菌量、秋季菌量、感病品种面积比例、4月降雨量和4月平均温度建立了汉中地区影响小麦条锈病流行程度的回归模型,预测准确度为75%。张吉昌等[19]利用小麦感病品种种植比例、秋苗病田率、秋苗单位面积平均病叶数等影响因子建立了汉中小麦条锈病发病程度预测模型,预测拟合符合率为92.31%。但迄今为止尚未见到基于越冬及冬繁菌源量为因子的预测模型。
全子集回归分析是通过筛选可能的变量组合,依据校正R2(Adj.R2)为评价指标进而选择合适的因子作为预测模型的自变量[20]。BP神经网络算法(back propagation neural network)是通过整个神经网络算法中的迭代误差进而调整权重,使神经网络算法输出与目标输出之间的误差最小化。BP神经网络算法由输入层、隐藏层、输出层构成[21]。前人研究表明,三层神经网络算法能够以任意精度逼近给定的非线性连续函数,可以识别复杂的区域[22]。
本研究采用全子集回归和BP神经网络算法以陕西省冬繁区条锈病发生面积、累计发生县区数、1月月平均气温、1月和3月月平均降雨量为自变量,对陕西省小麦条锈病发生面积进行预测,以期为小麦条锈病准确预测和及时防控提供技术支撑。B6F7B9F2-67DC-406B-B422-45868C92D1B5
1 材料与方法
1.1 数据收集
本研究收集整理了陕西省2010年-2020年调查的小麦条锈病冬繁区发生县区数(x1)、越冬区发生县区数(x2)、累计发生县区数(x3)、冬繁区发生面积(x4)、越冬区发生面积(x5)和累计发生面积(x6)(表1),以及2009年-2020年11月至翌年4月的月平均气温(x7~x12)和月平均降雨量(x13~x18),数据来自中国气象数据网(http:∥data.cma.cn/)(表2)。
1.2 预测模型的建立和验证
采用全子集回归和BP神经网络算法建立陕西省小麦条锈病发生面积的预测模型。全子集回归采用RStudio version 4.0.5软件中leaps包运算,BP神经网络算法运用Python编程语言第三方数据库Numpy、Pandas、Matplotlib和Scikit-learn,选用输入层、隐藏层和输出层三层BP神经网络,激活函数选用Sigmoid函数,即:
采用Pearson相关法对2010年-2018年历史数据进行主导因素分析,利用决定系数R2、赤池信息量准则(akaike information criterion,AIC)和均方根误差(root mean squared error,RMSE)作为全子集回归分析的评价指标[23]。决定系数R2越高,预测模型拟合程度越好。AIC以熵概念为基础,考虑了模型的统计拟合度和拟合的变量数目,AIC值越小,表明该模型能够以最少参数预测因变量,有助于降低过拟合现象[24]。RMSE通过实际值与预测值的偏差来判断预测模型的准确性,计算公式为:
其中,n为样本数,yi为实际值,y′i为预测值。
采用构建预测模型因子集所对应y′i计算预测区间。预测区间上限为L1=y′i-1.96S,预测区间下限为L2=y′i+1.96S。其中,S为残差标准差[25]。利用2010年-2018年调查数据对预测模型进行回测检验,并采用肖悦岩最大误差参照法[26]计算拟合符合率。利用2019年-2020年历史数据对预测模型进行验证,计算预测准确度。
2 结果与分析
2.1 主要流行因子分析
筛选与小麦条锈病发生面积呈正相关且自变量间无显著相关性的因子。将2010年-2018年调查数据与当年条锈病最终发生面积进行Pearson相关性分析。结果表明,冬繁区发生县区数(x1)、累计发生县区数(x3)、冬繁区发生面积(x4)、12月月平均温度(x8)、1月月平均温度(x9)、2月月平均温度(x10)、1月月平均降雨量(x15)、3月月平均降雨量(x17)和4月月平均降雨量(x18)与条锈病发生面积(y)呈正相关。其中,冬繁区发生县区数(x1)和3月月平均降雨量(x17)与条锈病发生面积(y)呈显著正相关(P < 0.05)(表3),与3月月平均降雨量(x17)相关性最高,为0.889 3。計算自变量之间的相关系数,结果表明,累计发生县区数(x3)与冬繁区发生县区数(x1)、越冬区发生县区数(x2)和12月月平均温度(x8)均有较强的相关性(P < 0.05)(图1)。
2.2 预测模型的建立与验证
2.2.1 全子集回归分析
基于2009年-2018年调查数据,最终选用累计发生县区数(x3)、冬繁区发生面积(x4)、1月月平均温度(x9)、2月月平均温度(x10)、1月月平均降雨量(x15)和3月月平均降雨量(x17)作为自变量构建预测模型。当预测模型分别选用因子集1(x3、x9、x15、x17)和因子集2(x3、x4、x9、x15、x17)时,校正R2值均大于90%(图2)。构建的2个预测模型分别为y1=0.94x3+4.11x9+1.13x15+0.61x17-8.23和y2=0.74x3+19.94x4+3.84x9+1.06x15+0.65x17-8.43。2个模型R2均大于0.96,模型1的AIC值最小,模型2的RMSE最低(表4)。
利用2010年-2018年历史数据对2个预测模型进行回测,并计算预测拟合符合率(图3)。模型1和模型2预测拟合符合率分别为94.20%和93.99%。利用2019年-2020年的调查数据对预测模型进行检验,模型1和模型2的预测准确度分别为90.35%和93.46%。模型1预测2019年和2020年陕西省小麦条锈病发生面积与实际发生面积的偏差分别为0.00万hm2和0.45万hm2;模型2两年预测的偏差均为0(表5)。因此,选择RMSE最低、预测准确度较高的模型2作为陕西省小麦条锈病发生面积的预测模型。
2.2.2 BP神经网络算法预测
基于全子集回归模型2中的自变量因子即累计发生县区数(x3)、冬繁区发生面积(x4)、1月月平均温度(x9)、1月月平均降雨量(x15)和3月月平均降雨量(x17)作为神经网络算法的输入层,隐藏层数设为9,当年条锈病最终发生面积作为输出层。以2010年-2018年的调查数据作为训练集,以2019年-2020年的调查数据作为测试集,计算预测模型的准确度。在训练之前利用Scikit-learn库中StandardScaler对数据进行标准化处理,通过不断调整神经网络算法参数,设置参数学习率为0.01,选用Sigmoid函数作为神经元激活函数,采用梯度下降法,使网格训练后预测值和实际值之间的均方误差最小,以均方误差(mean squared error,MSE)作为损失函数,设置迭代次数700。通过训练,达到最大迭代次数或训练目标之后停止学习。通过不断训练选择合适的权重与偏差,最终测试集输出2019年和2020年陕西省小麦条锈病发生面积分别为11.73万hm2和58.94万hm2,测试集预测准确度为91.55%,B6F7B9F2-67DC-406B-B422-45868C92D1B5
训练集输出2010年-2018年陕西省小麦条锈病发生面积依次为39.92、7.40、17.24、4.91、23.41、40.31、22.45、54.83、40.90万hm2(图4)。训练集预测拟合符合率达到92.29%。
2.3 条锈病发生面积预测
依据2021年陕西省7市37个县调查资料(表1,图5),利用全子集回归模型2预测出2021年陕西省小麦条锈病发生面积为(46.11±10.61)万hm2,当环境条件适宜发病时,发生面积可达56.72万hm2;当环境条件不适宜发病时,发生面积为35.50万hm2。利用BP神经网络算法对2021年陕西省小
麦条锈病发生面积进行预测,结果显示,2021年陕西省小麦条锈病发生面积为52.85万hm2。
3 结论与讨论
冬季温度和湿度条件等是影响条锈菌越冬的主要因素[27],春季3月-5月降雨量偏多,有利于小麦条锈病春季流行[28]。本研究结果表明,1月月平均温度和3月月平均降雨量是陕西省小麦条锈病发生流行的主要影响因子。建立全子集回归预测模型2的预测准确度为93.46%,BP神经网络算法的预测准确度为91.55%,具有很好的应用前景。
基于全子集回归筛选法建立的预测模型已得到了广泛的应用。李长春等[29]利用全子集回归进行大豆育种材料叶面积指数(leaf area index,LAI)的估测,估测精度优于逐步回归;陈鹏等[30]基于全子集分析能够准确估算马铃薯叶绿素含量;谭丞轩等[31]利用全子集筛选法与机器学习相结合能够提高预测土壤含水率的反演精度。神经网络算法具有较强的解决复杂非线性问题的功能,在病害预测方面已有一些研究。胡小平等[18]利用BP神经网络算法预测陕西汉中小麦条锈病的流行程度;莫丽红等[32]利用BP神经网络算法预测甘肃平凉小麦条锈病的流行程度,预测准确度均达到了100%,测试样本预测输出与实际输出间的均方差为0.1~0.4级。但迄今为止,在小麦条锈病发生流行预测中主要考虑了菌源、温度和降雨量等因素,很少考虑病原菌的致病性等因素在条锈病发生流行中的作用,在以后的研究中应该加强这些方面基础数据的收集等工作。
参考文献
[1] CHEN Xianming. Epidemiology and control of stripe rust [Puccinia striiformis f.sp. tritici]on wheat [J]. Canadian Journal of Plant Pathology, 2005, 27(3): 314-337.
[2] 胡小平, 王保通, 康振生. 中国小麦条锈菌毒性变异研究进展[J]. 麦类作物学报, 2014, 34(5): 709-716.
[3] 李振岐, 商鸿生. 小麦锈病及其防治[J]. 上海: 上海科学技术出版社, 1989.
[4] 刘万才, 刘振东, 黄冲, 等. 近10年农作物主要病虫害发生危害情况的统计和分析[J]. 植物保护, 2016, 42(5): 1-9.
[5] 刘杰, 王福祥, 曾娟, 等. 贯彻《农作物病虫害防治条例》走好依法植保道路[J]. 中国植保导刊, 2020, 40(7): 5-9.
[6] WELLINGS C R. Global status of stripe rust: a review of historical and current threats [J]. Euphytica, 2011, 179(1): 129-141.
[7] 王江蓉, 彭红, 吕国强, 等. 小麦条锈病防治策略的提出与推广应用[J]. 中国植保导刊, 2018, 38(10): 94-96.
[8] 陈万权, 徐世昌, 吴立人. 中国小麦条锈病流行体系与持续治理研究回顾与展望[J]. 中国农业科学, 2007, 40(S1): 3107-3113.
[9] WAN Anmin, ZHAO Zhonghua, CHEN Xianming, et al. Wheat stripe rust epidemic and virulence of Puccinia striiformis f.sp. tritici in China in 2002 [J]. Plant Disease, 2004, 88(8): 896-904.
[10]黄冲, 姜玉英, 李佩玲, 等. 2017年我国小麦条锈病流行特点及重发原因分析[J]. 植物保护, 2018, 44(2): 162-166.
[11]黄冲, 姜玉英, 李春广. 1987年-2018年我国小麦主要病虫害发生危害及演变分析[J]. 植物保护, 2020, 46(6): 186-193.
[12]万安民, 赵中华, 吴立人. 2002年我国小麦条锈病发生回顾[J]. 植物保护, 2003, 29(2): 5-8.
[13]马占鸿. 中国小麦条锈病研究与防控[J]. 植物保護学报, 2018, 45(1): 1-6.
[14]李恩才, 李素玉, 武剑州, 等. 关中西部小麦条锈病发生规律及病菌越冬、越夏问题研究[J]. 陕西农业科学, 2008(1): 103-104.
[15]SHANER G, POWELSON R L. The oversummering and dispersal of inoculum of Puccinia striiformis in Oregon [J]. Phytopathology, 1973, 63: 13-17.
[16]马丽杰. 小麦条锈菌潜育越冬的分子流行学[D]. 杨凌: 西北农林科技大学, 2015.B6F7B9F2-67DC-406B-B422-45868C92D1B5
[17]胡小平, 杨之为, 李振岐, 等. 汉中地区小麦条锈病流行程度预测研究[J]. 西北农业大学学报, 2000(2): 18-21.
[18]胡小平, 杨之为, 李振岐, 等. 汉中地区小麦条锈病的BP神经网络预测[J]. 西北农业学报, 2000(3): 28-31.
[19]张吉昌, 王清文, 黎钊, 等. 汉中市小麦条锈病流行的影响因子及预测模型[J]. 麦类作物学报, 2017, 37(12): 1640-1644.
[20]陈鹏. 基于无人机多源遥感的马铃薯叶绿素含量反演机理及模型构建[D]. 焦作: 河南理工大学, 2019.
[21]张迦南. 基于不同预处理方法的冬小麦冠层高光谱遥感长势监测研究[D]. 郑州: 河南农业大学, 2018.
[22]JIANG Xinhua, XUE Heru, ZHANG Lina, et al. Nondestructive detection of chilled mutton freshness based on multi-label information fusion and adaptive BP neural network [J]. Computers and Electronics in Agriculture, 2018, 155: 371-377.
[23]ATKINSON P M, JEGANATHAN C. Inter-comparison of four models for smoothing satellite sensor time-series data to estimate vegetation phenology [J]. Remote Sensing of Environment, 2012, 123: 400-417.
[24]HANGSHING L, DABRAL P P. Multivariate frequency analysis of meteorological drought using copula [J]. Water Resources Management, 2018, 32(5): 1741-1758.
[25]HYNDMAN R J, ATHANASOPOULOS G. Forecasting: principles and practice [M]. Melbourne, Australia: OTexts, 2018: 59-63.
[26]肖悦岩. 预测预报准确度评估方法的研究[J]. 植保技术与推广, 1997(4): 3-6.
[27]邹一萍, 马丽杰, 胡小平. 條锈病菌源基地小麦返青期条锈病发病程度预测[J]. 西北农业学报, 2016, 25(2): 306-310.
[28]谢飞舟. 陕西省小麦条锈病流行规律进一步研究[D]. 杨凌: 西北农林科技大学, 2011.
[29]李长春, 牛庆林, 杨贵军, 等. 基于无人机数码影像的大豆育
种材料叶面积指数估测[J]. 农业机械学报, 2017, 48(8): 147-158.
[30]陈鹏, 冯海宽, 李长春, 等. 无人机影像光谱和纹理融合信息估算马铃薯叶片叶绿素含量[J]. 农业工程学报, 2019, 35(11): 63-74.
[31]谭丞轩, 张智韬, 许崇豪, 等. 无人机多光谱遥感反演各生育期玉米根域土壤含水率[J]. 农业工程学报, 2020, 36(10): 63-74.
[32]莫丽红, 陈杰新, 倪伟, 等. 基于改进BP网络的小麦条锈病预测模型研究[J]. 中国植保导刊, 2011, 31(9): 38-43.
(责任编辑:杨明丽)B6F7B9F2-67DC-406B-B422-45868C92D1B5