基于贝叶斯网络的小麦条锈病预测研究

2014-04-29 20:13聂臣巍
安徽农业科学 2014年16期
关键词:贝叶斯网络气象因子预测模型

聂臣巍

摘要 [目的]在地理信息系统GIS的平台上,将不确定性推理方法——贝叶斯网络引入病害预测,基于关键气象因子(温度、降水、湿度、日照)构建一个用于预测小麦条锈病发生概率的贝叶斯网络模型。[方法]采用预测日前7 d的气象数据预测自预测日起7 d内的条锈病发病概率,并对我国小麦条锈病重要流行区域——甘肃省东南部地区2010~2012年病害发生情况进行预测。[结果]模型在返青期至乳熟期输出的病害发生概率与实际调查结果吻合度分别为62.92%、63.18%、79.48%、94.75%,能够较客观地反映病害发生的时间规律和空间分布特点。[结论]该研究表明将贝叶斯网络和GIS分析结合在较大的空间范围内利用关键气象因子进行小麦条锈病短期预测是一种可行的途径。

关键词 小麦条锈病;气象因子;贝叶斯网络;预测模型

中图分类号 S126 文献标识码 A 文章编号 0517-6611(2014)16-05027-04

小麦条锈病由Puccnia striiformis Westend f.sp.tritici Eriks引起,是小麦生产中一种重要的流行性病害。该病可在全球范围内造成小麦大幅减产[1-2]。在我国,2002年小麦条锈病的全国性大流行造成超过670万hm2农田感染,直接导致约10亿kg的产量损失[3]。由于该病能够在早期通过喷药等措施控制,因此,如何在早期对小麦条锈病的发生进行有效预测,一直以来受到农业植保部门的高度重视。目前,国内外学者基于气象、农学数据开展了一系列关于小麦条锈病预测方法的研究。陈刚等利用判别分析方法对四川马尔康和甘肃天水两地的小麦条锈病进行预测,回带准确率和交叉验证准确率均在78%以上[2];胡小平等用BP神经网络对汉中地区小麦条锈病进行预测,结果与病害实际发生情况高度吻合[4];刘荣英等以甘肃天水地区小麦条锈病历史数据为基础,进行基于GM(1,1)组合模型的小麦条锈病预测方法研究,正确率达到94.5%[5];袁磊等琴提出了一种基于小波变换和神经网络相结合的小麦条锈病预测模型,并以汉中地区1974年到1994年小麦条锈病发生流行数据作为训练数据,预测1995~1997年小麦条锈病发生情况,结果与实际流行程度高度吻合[6];许彦平等采用统计原理,结合甘肃省天水地区的小麦条锈病相关数据和气象数据,进行冬小麦条锈病发生发展规律的研究,建立冬小麦条锈病预测数学模型[7]等。上述研究构建的小麦条锈病预测模型在局地条件下均可取得较高的精度,能够为特定区域内的病害预警提供重要信息。但注意到上述模型均是针对某一地区的整个小麦生长季发病程度进行预测,且研究区域为条锈病菌源地,模型的标定往往根据局地气象和菌量数据,具有较强的区域专一性,缺乏对较大时空范围的病害预测能力。考虑到该病的发生和流行涉及地域范围较广,且为多循环病害[8-9],亟需构建针对大区域、连续时相的病害预测模型,而目前关于这方面的研究罕有报道。

小麦条锈病的发生从环境条件上看,主要受温度、湿度、降水、日照等一些气象因素的影响和决定[2]。如何在具有一定空间广度和时间幅度的区域中,建立上述因子与病害发生概率间的关系,是构建小麦条锈病预测模型的关键性问题。贝叶斯网络是建立在概率统计理论基础上的一种概率图论模型,具有严密的推理过程、清晰的语义表达和数据学习能力等特点,可以通过一些变量的信息来获取其他变量的概率信息,是不确定性推理和数据分析的一种有效工具[10],自20世纪80年代以来已在专家系统、数据挖掘、模式识别、图像处理、人工智能等众多领域得到了广泛的应用[11]。为此,笔者尝试将贝叶斯网络方法引入到小麦条锈病的预测建模,选择我国小麦条锈病的重要病源地——甘肃省东南部地区为研究区,通过分析2010~2012年连续3年的小麦条锈病测报数据及同期气象数据,构建基于气象参数的条锈病发生概率预测模型,使用预测日前7 d的气象参数预测自预测日起7 d内条锈病发生概率。

1 数据获取及处理

1.1 气象数据 选用与小麦条锈病的发生关联较强,且较易获得的平均温度、平均相对湿度、降水量和日照时数等气象因子作为病害预测建模的输入变量。从中国气象局获取甘肃省研究区及其周边的57个气象站点(图1)2010~2012年小麦返青期至乳熟期的逐日数据,数据跨度从发病前2周至小麦成熟。数据处理包括异常值去除,周平均值计算和空间插值。对去除异常值的气象数据,以周为单位计算各参数平均值。将气象站点数据以30 m×30 m分辨率进行插值处理。考虑到某些气象参数和海拔间存在较强关系,可通过对海拔拟合残差插值的方法提高插值精度[12-13]。为此,该研究对于与海拔间决定系数(R2)高于0.6的气象因子采用上述方法进行修正。插值方法方面,采用Kolmogorov-Smirnov方法对气象站点数据进行正态性检验,对于P-value>0.05即符合高斯分布的样本采用kriging插值,对于不符合高斯分布的数据采用反距离权重(Inverse Distance Weighted)插值。

1.2 小麦条锈病测报数据 该研究中小麦条锈病测报数据由甘肃省植保总站提供,数据年份从2010年至2012年共3年数据,测报点数量分别为:45、18、47,空间分布如图1所示(以2010年为例)。测报时间范围为2010年3月1日~2010年7月4日,2011年3月7日~2011年7月3日,2012年3月19日~2012年7月1日。各点测报时间间隔为7 d,测报内容包括测报点经纬度、条锈病始见期等。该研究将各测报点病害发生数据按时序进行整理,其中,将每年份各生育数据随机分为训练数据(60%)和验证数据(40%)。

2 貝叶斯网络方法

贝叶斯网络是一个有向无环图,是一种建立在概率统计理论基础上的概率图论模型,具有严密的推理过程、清晰的语义表达和数据学习能力等特点,可以通过一些变量的信息来获取其他变量的概率信息,是不确定性推理和数据分析的一种有效工具。

该研究构建小麦条锈病预测贝叶斯网络参考Cooke(2006)的研究结论[8],选择与小麦条锈病发生和流行关系较大的温度(Temperature,T)、湿度(Humidity, H)、降水(Precipitation,P)和日照时数(Sunshine Duration,S)等气象因子作为节点变量。此外,考虑到小麦条锈病发展与生育进程间存在较密切的关系,将小麦生育期(G)也作为一个变量。在网络结构上,贝叶斯网络通过在不同节点(因子/预测概率)间连边的方式描述不同因子间的相互联系以及因子和预测概率间的关系[14]。该研究中,考虑到T、H、P、S、G因素对小麦条锈病发生存在直接联系,因而在5个因素与小麦条锈病发生概率(W)间建立关联(即在网络中连边)。此外,考虑到降水事件对湿度和日照时数的间接影响,在P和H、S因素间建立关联。最终形成的用于预测小麦条锈病发生概率的贝叶斯网络结构如图2所示。其中,w表示小麦感染条锈病的状况,分为感染(w1)与未感染(w0)2种情况,生育期(G)根据甘肃省研究区域内的小麦物候分为返青(g1)、拔节(g2)、抽穗(g3)、乳熟(g4)4个时期。H、P、S、T的分级如表2所示。de Vallavieille-Pope等的研究表明,当温度在5~25 ℃范围内时,小麦条锈病的感染效率等于或高于23%,当温度超过30 ℃时不发生感染[15],Newton等的研究表明温度低于0 ℃时病菌不能产生孢子[16]。因此,笔者将0~25 ℃范围内的温度等间隔分成5级,小于0 ℃的为一级。降水、日照、相对湿度按照数据分布及病害作用规律分为6级,具体各参量值域范围如表1所示。

为获得某因子对应的先验概率值,首先根据2010~2012年训练数据建立各参数的概率表。参考测报数据以7 d为步长进行病害预测,根据第i时相的气象条件和生育期对应的发病先验概率计算第i+1时相的小麦条锈病发生的后验概率。在计算中为避免零频率出现时导致的极端值,采用Laplace估计计算各节点的概率分布[17],计算公式如下:

其中,n为训练实例个数,nw为类的取值个数,nj为第j个属性的取值个数,wi为第i个训练实例的类别标记,aj为影响因子的第j个属性值,aij为i训练实例的第j个属性值δ(wi,w)是一个二值函数,当wi=w时为1,否则为0。

3 结果与分析

在空间上,通过观察2010~2012年研究区小麦条锈病的扩散过程,发现该地区病害的发生和传播具有较强的规律性,每年返青期始见于甘肃南部地区,随后向北扩散。此外,在甘肃省东北地区稍晚亦出现自发性的条锈病感染区域,并向西传播。由于研究区菌源充足,通常经过一段时间的扩散,在6月初条锈病会侵染研究区的大部分地区。这种空间传播过程由于强烈受到气象条件的影响,因此能够被该研究中提出的模型较好地预测(图3,以2010年为例)。通过反复试验和经验判断确定0.4为概率阈值,判定概率低于0.4的样本不发生条锈病,反之则判定发生病害。结果表明(表2),预测准確率在返青期、拔节期、抽穗期、乳熟期分别为:62.92%、63.18%、79.48%、94.75%,随生育期的推进预测准确率逐渐升高。

猜你喜欢
贝叶斯网络气象因子预测模型
随机森林在棉蚜虫害等级预测中的应用
橡胶产量与气象因子的灰色关联性及逐步回归分析研究
无人机数据链测试与评估研究
基于贝叶斯网络的流域内水文事件丰枯遭遇研究
基于神经网络的北京市房价预测研究
中国石化J分公司油气开发投资分析与预测模型研究
基于兴趣预测和热点分析的联合推荐算法研究 
基于IOWHA法的物流需求组合改善与预测模型构建
基于预测模型加扰动控制的最大功率点跟踪研究
杨树叶纹斑病与气象因子的关系