福建农林大学东方学院 胡世录
中国水稻纹枯病发生率预测研究——基于时间序列预测模型
福建农林大学东方学院 胡世录
该文以1960年~2007年中国水稻纹枯病发生率年度数据为样本,通过分析病害流行动态与周期特征,运用时间序列Logistic模型、自回归移动平均(ARIMA)模型和自回归AR模型进行预测,在此基础构建组合预测模型预测2014年水稻纹枯病发生率,预测结果与模型构建过程可以为相关研究提供借鉴参考。
纹枯病 发生率时间序列 周期趋势 组合预测
水稻纹枯病流行预测是对水稻纹枯病病害发展趋势或未来状况的推测和判断,通过分析病害流行趋势,构建数学统计预测模型对病害流行状况进行预测预报。病害发生流行受气候条件、抗病性、田间管理等多种因素影响,且难以量化,相关数据难以获取,可量化指标间存在多重共线性等。时间序列分析是一种有效的数据挖掘方法,在工程、经济学等领域的运用已经相当普遍,在疾病发病率的预测研究中应用也越来越多,本文通过运用时间序列预测模型来预测2014年水稻纹枯病发生率,旨在为农作物病害流行防治管理提供决策参考。
纹枯病是我国危害较重的水稻病害之一,随着农业生产力的发展,纹枯病危害也日益严重。据相关资料分析发现,从上世纪60年代至今,其发生面积与实际损失日趋严重,60年代的发生面积和实际损失分别为13742.2千公顷和78.3997万吨,70年代分别为51588.88千公顷和321.7875万吨,80年代分别增至120219.6千公顷和729.4478万吨,到90年代仍保持较高水平的增长,其发生面积和实际损失分别为161237.7千公顷和1135.2077万吨,比80年代分别增长34.12%和55.62%。其中1997年病害最严重,发生面积高达17084.71千公顷,造成稻谷实际损失131.5615万吨,分别占水稻三种主要病害发生面积和实际损失的77.2%和61.69%。进入21世纪后,病害持续流行,2000年~2007年平均发生面积和实际损失分别为15234.59千公顷和92.9489万吨。
下面运用时间序列进行周期趋势分析,通过序列的历史轨迹可以感性地认知该序列的长期发展趋势和短期波动特征。如图1,全国水稻纹枯病发生率总体上呈现较明显波动上涨趋势,并且波动的幅度越来越大,1960年到1995年期间出现大幅震荡,逐年上升。发生率从1.03%上涨到51.82%。这期间持续上涨之后,纹枯病发生率一直保持一个相对高位流行发生,2007年发生率高达59.40%,并且呈现继续上涨的态势。
(WKB表示纹枯病发生率)
利用H-P滤波分解趋势周期成分可以得到发生率的趋势成分和周期成分。在进行周期分析时,将周期成分中位于0轴以上的部分定义为波峰,将水平0轴以下的定义为波谷,从波谷到波谷为一个周期,按此方法对病害发生率序列的波动周期进行划分。时间序列周期波动长度和波峰、波谷持续时间见表1。观察病害发生率的波动周期表以及时间序列分解图,可以得到一些结论:样本期间纹枯病发生率都包含了4个完整的波动周期,包含周期的时间范围和波动持续时间。在纹枯病的4个完整周期长度中,最长的周期比最短的周期要长13年,平均周期长度为8年;从波动图形看,纹枯病发生率的波动频率比较频繁,而且纹枯病趋势分析曲线均呈上升趋势。
表1 水稻纹枯病发生率周期特征
组合预测法主要是指把不同预测方法或者预测模型组合起来,形成一种新的预测方法,可以有效利用各种模型的信息,能够较大限度地利用各种预测样本信息,更有效地减少单个预测模型受随机因素的影响,从而提高预测的精度和稳定性。
组合预测方法的主要思路是对不同单项预测方法得到的结果赋予不同的权重系数,常用的方法主要有:算术平均法即等权平均法,对各种模型赋予相同的权重系数组合;方差倒数法,把单个模型的方差倒数与所有模型方差倒数和的比例作为其权重系数;均方倒数法,把单个模型的方差倒数的均方与所有模型的方差倒数的均方和的比例作为其权重系数;平均绝对百分(MAPE)误差倒数法,即把单个模型的平均绝对百分误差倒数与所有模型平均绝对百分误差倒数和的比例作为权重系数。本文运用均方误差倒数法和平均绝对百分误差倒数法求权重系数,表达式如下:
(2)平均绝对百分误差倒数法
下面以1960年~2007年中国水稻纹枯病发生率年度数据为样本,分别运用Logistic模型,ARIMA模型,自回归AR模型对水稻纹枯病的发生率进行预测,并将各模型预测参数值中的均方误差、平均绝对百分误差带入上述组合预测模型表达式,2014年水稻纹枯病预测值最终取组合预测两种方法预测值的平均值,结果为60.7621%,其中MAPE=3.26%,表明拟合精度较高,可以用来预测。预测结果如表3所示。本文实证研究主要依赖二手数据,数据来源于2000年以来的《全国植保专业统计资料》(中国农业技术推广服务中心)以及《中国植物保护五十年》(陈生斗和胡伯海,2003),所获数据不够完整(2008年~2013年的样本数据),这一定程度上影响了模型的精度。
表2 水稻纹枯病发生率及各模型预测值(单位:%)
从表2可见, 2008年至2014年的病害发生率年增长率均比2007年低,2008年至2014年的年平均增长率为0.3%,由此可以看出病害发生率年增长率有所下降,上升幅度在减小,这说明有效利用预测信息,及时做好防控措施有助于降低病害流行风险。
本文以1960年~2007年中国水稻纹枯病发生率年度数据为样本,建立时间序列逻辑斯蒂曲线模型、自回归移动平均(ARIMA)模型和自回归AR模型,在此基础构建组合预测模型,并预测2014年水稻纹枯病发生率。研究结果表明:病害发生率年增长率有下降趋势,上升幅度在减小。科学准确地预测病害发生率,可以为病害预防和病害监测提供科学信息,为病害流行防控体系完善提供科学依据,同时建立病害防治长效机制,增强防治意识、科学管理农作物可以很大程度地控制病害流行。
[1] 朱宗元,于青. ARIMA模型在我国病毒性肝炎发病率预测中的应用[J]. 中国卫生统计,2011(1):65-67.
[2] 易丹辉.数据分析与Eviews应用[M].北京:中国人民大学出版社,2008.
[3] 陈生斗,胡伯海.中国植物保护五十年[M].北京:中国农业出版社,2003.
[4] 高铁梅.计量经济分析方法和建模:Eviews应用及实例[M].北京:清华大学出版社,2007.
[5] 全国农业技术推广服务中心病虫害测报处.2011年全国水稻重大病虫害发生趋势预报[J].种业导刊,2011(3):13.