田万银,徐华潮
(浙江农林大学林业与生物技术学院,浙江 临安 311300)
基于相空间重构及GRNN的海防林害虫预测及效果检验
(浙江农林大学林业与生物技术学院,浙江 临安 311300)
考虑到海防林环境气候、动植物组成的特殊性及林业害虫发生的非线性、复杂性、无规律性,通过重构非线性时间序列的相空间并将输出向量作为广义回归神经网络(GRNN, Generalized Regression Neural Network)的输入向量对海防林害虫的发生进行预测;并使用仙居县1983-2011年的马尾松毛虫(Dendrolimus punctatus)实测数据对该预测方法进行仿真检验:1983-2007年虫害数据用于重构相空间及训练神经网络,而2008-2011年的数据用于虫害发生的预测检验。结果表明,在将仙居县马尾松毛虫的危害程度划分为四个等级的前提下,预测方法预测精度较高,除了对 2008年马尾松毛虫危害程度的预测出现一个数量级的偏差外,其余的预测准确率均为100%。
海防林;相空间重构;混沌时间序列;GRNN;仿真
1989年,林业部为了保障沿海地区的生态安全和经济社会发展而启动了沿海防护林体系工程。该工程对改善生态环境,维护生态平衡,保护沿海人民生存和发展起着决定性作用[1]。然而,相比于内陆,沿海防护林树种单一,多以人工纯林为主,加上台风的辅助作用,使得病虫害较易大范围发生。因此,及时有效地对沿海防护林害虫的发生进行监测和防治十分必要。林业病虫害预测预报工作是在病虫害尚未对林业造成重大损失之前对病虫害的发生状况和增长趋势进行预测,从而为病虫害防治工作提供一定参考依据的一系列技术手段。长期以来,森林病虫害的预测方法并不少见,如逐步回归分析[2]、判别分析[3]、模糊聚类分析[4]、马尔可夫链分析[5]、区划分析[6]、灰色系统分析[7]以及神经网络[8]等,董振辉等人甚至还开发出了病虫害有虫面积测报的专用软件[9]。然而,沿海防护林作为一个特殊的林业体系,无论是其环境气候还是其动植物组成都有别于普通的内陆森林,因而传统的森林病虫害预测方法对沿海防护林并不适用。
基于以上问题并充分考虑到林业害虫发生的非线性、无规律性等特征,本文融合当前热门的两种非线性时间序列预测方法,即相空间重构[10-11]及广义回归神经网络(GRNN, Generalized Regression Neural Network)[12-15]对沿海防护林害虫的发生进行预测预报。相关研究表明,具有混沌特性的非线性时间序列短期是可预测的,本文通过重构混沌时间序列的相空间,使用输出向量作为GRNN的输入向量对害虫的发生进行预测并使用沿海城市仙居县的马尾松毛虫(Dendrolimus punctatus)有虫面积对该测报方法进行效果检验。基于相空间重构及GRNN的害虫预测方法是林业特别是海防林害虫监测方面的崭新尝试,本研究旨在为该领域的更深入研究提供一定的理论基础及技术支撑。
1.1 相空间重构
时间序列的相空间重构即由低维时间序列重构出一个多维的确定性相空间,利用混沌相空间重构理论可以还原害虫发生时间序列的非线性动力特性,然后使用一定的预测方法可以进行短期害虫预测。
Takens定理[16~17]认为系统中任一分量的演化都是由与之相互作用着的其他分量所决定的。这些相关分量的信息隐含在任一分量的发展过程中,重构系统相空间只需考察一个分量,然后通过某些固定时延点上的观测值找到m维向量后就可以重构出一个等价的相空间。所以,选择适当的嵌入维数m和时间延迟τ是相空间重构的关键。目前计算时间延迟的方法较多,如自相关系数法[18~19]、互信息法[20~21]、C-C法[22]等。计算嵌入维数的方法也有不少,如饱和关联维数(Grassberg-Procaccia,G-P)法[23]、伪最近邻域法、真实矢量场法和Cao方法等。这些方法各有千秋,本文采用自相关系数法计算相空间的时间延迟,采用Cao方法计算嵌入维数。
实际应用中的数据常受噪声污染,降噪的目的是使数据变得“干净”以利于对数据进行分析检测。在重构相空间之前,本文使用小波变换对数据进行降噪处理[24-25]。
1.2 混沌检测
混沌时间序列判别的基本方法有:功率谱法、Hurst指数法、Lyapunov指数法、关联维数法以及Kolmogorov熵等。本文选用最为常用的Lyapunov指数法检测非线性时间序列的混沌特性。Lyapunov指数是相空间中相近轨道的平均收敛性或平均发散性的一种度量,是研究混沌的一个重要参数。若系统最大的Lyapunov指数λ1>0,则系统一定是混沌状态。计算Lyapunov指数的方法有Jacobian法、Wolf法、小数据量法等,其中以Wolf方法和小数据量法应用最为广泛,也最为普遍。由于小数据量法编程及操作简单、计算量小,且对小数据组计算可靠,本文使用小数据量法计算Lyapunov指数。
GRNN是美国学者Donald F. Spect在1991年提出的,它是径向基神经网络的一种,GRNN在能力和学习速度上较RBF网络有更强的优势,网络最后收敛于样本量积聚较多的优化回归面,并且在样本数据较少时,预测效果也较好。此外,GRNN网络还可以处理不稳定的数据。因此,GRNN在信号过程、教育产业、能源、控制决策系统、金融领域、生物工程等各个领域均得到了广泛的应用[26-27]。本文使用相空间的输出向量作为GRNN的输入向量对海防林害虫进行预测。
本研究使用浙江省仙居县森防站提供的 1983-2011年马尾松毛虫有虫面积实测数据进行预测仿真(见表 1)。仙居县地处浙江省东南部,靠近东海,位于台州市的西部,东连临海、黄岩,南邻永嘉县,西接缙云县,北靠东阳市、磐安县和天台县。仙居县属于典型的沿海城市,该县海防林众多,其中松科植物占据总量的60%以上,该县的马尾松毛虫发生较早,记录也较完整。本文使用1983-2007年的有虫面积数据重构相空间,使用2008-2011年的有虫面积数据作预测检验。
表1 马尾松毛虫历年有虫面积hm2
3.1 小波降噪
在重构相空间之前,首先使用小波变换对仙居县 1983-2007年马尾松毛虫有虫面积数据进行降噪处理,输出结果如图1。
由图1可看出,经小波降噪处理后的数据明显好于原始数据。
3.2 时间延迟及嵌入维数计算
3.2.1 计算时间延迟 自相关系数法计算时间延迟的基本思路是当时间序列的自相关函数下降到初始值的1-1/e时为所确定的时间延迟τ。通过MatlabR2012a编程得到结果如图2。
图2中,横轴表示最大时间延迟,纵轴表示自相关函数。当自相关函数下降到初始值的1-1/e倍时所对应的时间延迟为4,即τ = 4。
图1 小波降噪
图2 时间延迟
3.2.2 计算嵌入维数 通过Cao方法判定最小嵌入维数的方法是,当m逐渐增加到E1停止变化或变化波动较小时,m即为最小嵌入维数。通过MatlabR2012a编程后,结果如图3所示。
由图3可确定时间序列的最小嵌入维数m为5。
图3 嵌入维数
3.3 Lyapun ov指数计算
为了判断仙居县1983-2007年马尾松毛虫有虫面积是否具有混沌特性,使用小数据量算法计算时间序列Lyapunov指数(表示为λ1),若λ1>0,则该时间序列为混沌时间序列。通过Matlab编程并将τ及m代入计算得λ1=16.13>0,说明有虫面积时间序列的演变具有混沌特性。
3.4 相空间重构
设1983-2007年共25 a马尾松毛虫有虫面积一维时间序列为X(t0),X(t1),…,X(ti),…,X(tn),首先使用MatlabR2012a编程对时间序列进行相空间重构,相空间重构的输出结果由式(1)得出。
由于已知τ=4,m=5。因此,原始混沌时间序列经相空间重构后输入向量结果如表2。
表2 有虫面积相空间重构结果hm2
3.5 GRNN 预测
由相空间重构结果可确定广义回归神经网络的输入向量(表2),输出向量可由式(2)求得:
将τ = 4,m = 5代入(2)式得:
Y1= X21= 1 048,Y2= X22= 746,Y3= X23= 404,Y4= X24= 257,Y5= X25= 436,Y6= X26,Y7= X27,Y8= X28, Y9= X29。使用前5组输入及输出向量作为广义回归神经网络的训练数据,后4组数据作为预测数据。依据马尾松毛虫有虫面积与对林业危害程度的关系,将马尾松毛虫的危害程度划分为三级,即有虫面积小于 500 hm2时,危害程度为极轻微,划为一级;虫口密度为500 ~ 1 000 hm2时,危害程度为轻微,划为二级;有虫面积大于1 000 hm2时为严重,划为三级。使用MatlabR2012a编程后,最终广义回归神经网络的预测输出结果见图4、表3。
图4 预测值与实际值拟合情况
表3 危害程度拟合情况
由GRNN的预测结果可看出,除了2008年对马尾松毛虫危害程度的预测出现一个数量级的偏差外,其余基于相空间重构与GRNN的仙居县马尾松毛虫的预测均较准确。经分析,一方面,仙居县属于浙江沿海城市,自然灾害频繁,刚好2008年该县就遭遇了较为严重的台风袭击,或许因此而导致预测结果出现了一定的偏差。另一方面,可能本文使用的仿真数据量较少而影响了相空间重构,进一步影响了GRNN的训练,最终导致GRNN的预测偏差。
相空间重构及广义回归神经网络均是研究非线性问题的热门方法,本文将二者结合起来对海防林害虫的发生进行预测更是较为崭新的尝试。与传统方法相比,重构相空间能够估计出一维时间序列的演化信息并把一维时间序列拓展为包含着各态信息的多维序列,从而使预测结果跟实际值更加吻合;另外,使用相空间重构的输出向量作为神经网络的输入值避免了选取神经网络输入参数时的随意性;除此之外,最重要的是,沿海防护林作为一个特殊的林业体系,其环境气候、动植物组成都有别与内陆森林,因而本文有针对性地对沿海防护林害虫的发生进行预测预报很有意义。
本文中的预测方法在用于对仙居县马尾松毛虫的预测检验过程中,由于各方面的原因而导致预测值与实际值出现了较为轻微的偏差,但这并不影响整套预测方法的展示过程。该套预测方法在实际使用过程中,还应根据实际情况选取合适的方法计算各参数值。总之,沿海防护林病虫害的预测预报是一项长期而艰巨的任务,作为一个特殊的林业体系,其病虫害的预测技术也不应拘泥于传统的病虫害预测方法,应具体问题具体分析。
参考文献:
[1] 谷建才, 陆贵巧, 么凤居. 论林业生态环境建设的主体地位[J]. 林业科学, 2000, 36(5): 127-132.
[2] 薛贤清. 在马尾松毛虫测报中应用逐步回归电算方法的研究[J]. 林业科学, 1984, 20(1): 42-49.
[3] 薛贤清, 冯晋臣, 张石新, 等. 马尾松毛虫定量测报的判别分析模型[J]. 南京林产工业学院学报, 1982(1): 134-153.
[4] 薛贤清, 杨幺明, 史顺平, 等. 模糊聚类分析在林业害虫测报中应用的研究[J]. 广东林业科技, 1986(5): 1-6.
[5] 江土玲, 金崇华. 微电脑在马尾松毛虫预测预报中的应用[J]. 森林病虫通讯, 1986(3): 23-24.
[6] 魏初奖, 庄晨辉, 谢大洋, 等. 福建省马尾松毛虫灾区区划及其应用[J]. 南京林业大学学报: 自然科学版, 2002, 26(3): 35-39.
[7] 陈绘画, 崔相富, 朱寿燕, 等. 马尾松毛虫发生量灰色系统模型的建立及其预报[J]. 东北林业大学学报, 2004, 32 (4): 19-21.
[8] 陈绘画, 朱寿燕, 崔相富. 基于人工神经网络的马尾松毛虫发生量预测模型的研究[J]. 林业科学研究, 2003, 16(2): 159-165.
[9] 董振辉, 赵铁良, 阎峻, 等. 森林病虫害监测预报软件的开发及应用[J]. 中国森林病虫, 2002, 21(2): 6-9.
[10] Ham F M, Kostanic I. Principles of Neurocomputing for Science& Engineering[M]. Mc Graw-Hil, 2003.
[11] 吕金虎, 陆君安, 陈士华. 混沌时间序列分析及其应用[M]. 武汉: 武汉大学出版社, 2002.
[12] Specht D F. A general regression neural network[J]. IEEE Transact Neural Networks, 1991, 2(6): 568-576.
[13] Tomandl D, Schober A. A modified general regression neural network (MGRNN) with new, efficient training algorithms as a robust‘black box’-tool for data analysis[J]. Neural Networks, 2001, 14(4): 1 023-1 034.
[14] Chtioui Y, Panigrahi S, Francl L. A generalized regression neural network and its application for leaf wentness prediction to forecast plant disease[J]. Chemomet Intellig Lab Syst. 1999, 48(1): 47-58.
[15] Leung M T, Chen A S, Daouk H. Forecasting exchange rates using general regression neural networks[J]. Comput Operat Res, 2000, 27(4): 1 093-1 110.
[16] Specht D F, Romsdahl H. Experience with adaptive probabilistic neural networks and adaptive general regression neural networks[J]. Proc IEEE World Congr on Comput Intellig, 1994, 2: 1203-1208.
[17] Farzaneh Maleki, Babak Beheshti, Amirhossein Hajihosseini, et al. The Bogdanov Takens bifurcation analysis on a three dimensional recurrent neural network[J]. Neurocomputing, 2010, 73(16-18) : 3066-3078.
[18] Isar Nejadgholi, Mohammad Hasan Moradi, Fatemeh Abdolali. Using phase space reconstruction for patient independent heartbeat classification in comparison with some benchmark methods[J]. Comput Biol Med, 2011, 41(6): 411-419.
[19] Abarbanel H D I, Brown R, Sidorowich J J, et al . The analysis of observed data in physical systems[J]. Rev Mod Phy,1993 ,65 (4) :1331-1392.
[20] Theiler J . Estimating fractal dimension[J]. J Opt Soc Am A , 1990 ,7 (6) :1055-1073.
[21] Fraser A M, Swinney H L. Independent coordinates for strange attractors from mutual in formation[J]. Phys Rev A , 1986 ,33 :1134-1140.
[22] Rosenstein M T, Collins J J, Deluca C J. Reconstruction expansion as a geometry-based framework for choosing proper delay times[J]. Phys D, 1994(73): 82-98.
[23] Kim H S, Eykholt R, Salas J D. Nonlinear dynamics, delay times, and embedding windows [J]. Physica D. 1999, 127(1): 48-60.
[24] Grassberger P, Procaccia I. Measuring the strangeness of strange attractors[J]. Physica D, 1983, 9: 189-208.
[25] Anooshiravan Ansari, Asadollah Noorzad, Hamid Zafarani, et al. Correction of highly noisy strong motion records using a modified wavelet denoising method[J]. Soil Dynam Earthquak Engin, 2010, 30(11): 1168-1181.
[26] Chanerley A A, Alexander N A. Correcting data from an unknown accelerometer using recursive least squares and wavelet denoising[J]. Comput Struct, 2007, 85(21~22): 1679-1692.
[27] 张德丰. MATLAB神经网络应用设计[M]. 北京: 机械工业出版社, 2009.
[28] 史峰, 王小川, 郁磊, 等. MATLAB神经网络30个案例分析[M]. 北京: 北京航空航天大学出版社, 2010.
Coastal Protection Forest Pest Forecasting and Verification Based on Phase Space Reconstruction and GRNN
TIAN Wan-yin,XU Hua-chao
(School of Forestry and Biotechnology, Zhejiang A & F University, Lin’an 311300, China)
In this paper, reconstructed the phase space of the nonlinear time series and used the output vector as the input vector of Generalized Regression Neural Network (GRNN) to predict the occurrence of coastal protection forest pests. The specific method was using wavelet transform, noise reduction processing of the raw data, then calculate the time delay, embedding dimension and Lyapunov exponent, reused calculated data reconstruction phase space. Finally, using the GRNN to predict the test. Simulation test data was from the Xianju County from 1983 to 2011. Specific ideas: pest data of 1983-2007 for the reconstruction phase space and train the neural network, data of 2008-2011 for pest prediction test. The result showed that the prediction has higher prediction accuracy, 2008 (forecast deviation is only an order of magnitude),the rest of the forecast accuracies are all 100%. In short, the phase space reconstruction and Generalized Regression Neural Networks are all popular method to research nonlinear problems, this paper combined them as a new attempt to predict the occurrence of coastal protection forest pests.
coastal protection forest; phase space reconstruction; chaotic time series; GRNN; simulation
S727.2
A
1001-3776(2014)01-0065-05
2013-09-26;
2014-01-17
浙江省科技厅重大科技专项重点项目(2010C12029)
田万银(1985-),男,贵州毕节人,硕士,从事森林昆虫学研究:通讯作者。