赵 健
(中国电子科技集团公司电子科学研究院,北京100041)
近些年,社会经济的快速发展给环境造成了不可忽视的负面影响,使得环境日益恶化,也给农业生产带来了一些严重问题。农业方面比较突出的问题就是病虫害,所以根据农作物的生长环境、气候的变化规律、病虫害发生的条件等方面的相关资料[1],对病虫害的产生进行全面的研究,做出相应的虫害预测并对农户作出指引,有很重要的社会意义[2-3]。虫害与地震、海啸一类的天灾不同,对于农作物虫害的研究和预测是以先期获得的数据资料为基础进行的,具有一定的可预测性。高准确地预测出虫害的发生,能为综合治理工作打下坚实的基础。
由于虫情问题对社会生产生活的重要影响力,对虫情预测的研究由来已久。先期提出的虫情预测方法有:观察法、统计法、数学生态模型法。这些方法在具体应用情况下有极大的局限性,包括:训练过程的收敛速度较慢,降低实时信息的获取效率;对于测试虫情样本的预测正确率不高等。专家系统的使用具有一定的局限性,适用性不佳。现有的虫情预测研究并不能满足农业经济生产工作的实际需要。对虫情预测需要进行更深入的探讨,来提高虫情预测的科学性、准确性,更好地为农业经济的发展提供保障。虫情预测的样本具有不确定性,在使用预测方法对其虫害级别作出评估时,结果容易陷入局部最小而发生不收敛,最终得出的结果精度相对较低;相比之下,极端学习机(Extreme Learning Machine,ELM)算法没有前者的局限性,可以从本质上解决虫情预测准确率低的问题。本研究即引入极端学习机算法进行虫情预测研究工作。
如图1所示即为ELM算法的结构原理图。图中包括了三个层次:输入层、输出层、隐含层[4]。
图1 ELM算法的结构
假设激活函数g无限可微,则可得到ELM训练设定的隐层数远小于样本的观测数,即L≤N,以此为基础,可得到以下两个与ELM算法密切相关的定理:
(1)定理1
对这一定理的证明过程如下:
式中,g(l)为函数g对bi的l阶导。但是,在N-1个自由系数r1,...,rn-1的情况下,其线性方程却多余N-1个,他们之间有矛盾冲突了。所以可得c不属于维度比N小的子空间。
因此,在(a,b)有一定概率能够随机选N个隐含节点对应的N个偏置值b1,...,bn-1,满足其对应的c(b1),c(b2),...,c(bn)能够跨度表明对于所有的可以按照所有连续概率从的所有区间进行选择,满足H是满秩的列向量。
其中,激活函数有:Sigmoid、径向基函数、正弦函数、余弦函数、指数函数还有别的非正则函数[6]。
普通的单层神经网络的相关参数需要进行调整,相比之下定理1有所不同,它证明了从经验上来说是不需要经过调整的,通过刚开始的参数设定后,ELM的系数矩阵H在算法运行过程中是保持不变的。所以说,对于一定的,根据式(2)可知,单隐层神经网络算法的求解过程,都可转化为的求解过程:
式中H+为H的MP伪逆。
(2)定理2
如果有矩阵G满足:Gy为线性方程Ax=y的一个最小二乘解。则有G=A+。A+即A的MP伪逆[7-10]。
根据定理2,可以将极端学习机算法的重要属性归纳如下:
(a)特别地,x0=A+y与Ax=y的最小二乘解为:
(b)接下来,x0=A+y在Ax=y的所有最小二乘解里具有最小的模:
(c)Ax=y的具有仅有的最小模最小二乘解 x=A+y。
基于以上的定理,可归纳出ELM的学习规则如下:
(b)隐层输出矩阵H的获得;
其中H+为H的MP伪逆,
农村生态建设工作是我国现代化建设的重要内容之一。农村生态建设工作的目的,在于提高农村居民生活环境,推动农村地域经济发展,助力我国经济的可持续发展。不过就实际而言,目前我国村镇规划与建设工作尚有许多问题未能有效解决。
计算H的MP伪逆的方法有很多,包括:正交投影法,正交法,迭代法,奇异值分解法(SVD)等。为了在极端学习机算法中减少搜索与迭代的次数。正交投影方法在HTH是非奇异时使用但是,HTH不可能一定已知非奇异,某些情况下是奇异的,所以正交投影方法没有获得理想的效果。SVD是用来获取H的MP伪逆的一种常用方法。
对采用极端学习算法实现虫情的预测,具体可分为以下几步:
(1)获取虫情数据,预处理
虫害的发生与自然因素有一定的相关性,会受到气温、日照、降雨等因素的影响。在研究过程中主要应考虑这样的因素变量。本研究训练样本使用的数据为某林区从1996年到2013年的总计18年间的虫情样本数据。为了使得预测算法对于虫情样本有更好的拟合度,对训练样本加入高斯白噪声后产生测试样本数据,对18年时间里的总共108组数据进行测试。
(2)极端学习机预测模型构建
由于虫情预测样本的数量是一定的,所以测试样本只能通过加入高斯白噪声获得,试用语句
其中的TestData即为测试数据。
其中“radbas”为激活函数,1表示使用ELM算法进行分类(包括二分类和多分类)。仿真结果如图2。
图2 隐层数=5时的虫情样本预测情况
(3)虫情预测算法效果对比
作为对比,在极端学习机算法之外,再采用常用的BP神经网络、SVM支持向量机、决策树算法来执行同一项虫情预测。这四者的对比结果如表1所示。
表1 虫情预测算法的结果对比
从表中的结果对比来看,基于ELM的虫情预测算法实现了对四类虫情级别精准与快速预测,其效果明显优于经典的分类算法神经网络、SVM和决策树算法;分类正确率均匀分布,每类虫情级别都获得了较高的正确率,预测能力较强。
从对比的结果中可以归纳出以下结论:
(1)极端学习机算法对虫情样本的预测效果最好,其次是SVM支持向量机和决策树,BP神经网络的效果最差。极端学习算法在虫情样本预测的有效性方面较为优越。
(2)基于极端学习的虫情预测模型有较强的适用性,虫情样本具有复杂性与不确定性,如上构建的模型也适用于其他农作物虫害等级的预测。
本文详细分析极端学习机算法的原理机制,这些都是研究虫情预测技术的基础理论。之后介绍了农作物虫害相关因素,主要包括:温度、日照、降雨,对这几个因素进行综合考虑构建虫情样本特征矩阵后,使用极端学习机算法、高斯混合模型算法进行虫害等级的预测,通过实验仿真结果,对比了与常用算法的实验效果,验证了这种算法对于虫情样本的预测具有可行性,预测的正确率较高,对农作物所遭受的虫害程度做出了高精度的判定,能够为虫害的防治工作提供依据,减少虫害,该方法优于传统的虫情预测研究方法,具有很高的实用价值。
[1]QIN J L,YANG X H,YANG Z W,et al.New technology of using meteorological information in forest insect pest forecast and warning systems[J].Pest Management Science,2017.
[2]QIN J,FU H,YANG X,et al.Innovative design and its application on the meteorology serving system for pest forecast and warning[J].Journal of Meteorological Research&Application,2017.
[3]LIU W.Research progress on modern tools for crop pests forecasting in China[J].China Plant Protection,2017.
[4]张博洋,李素梅.应用深度极限学习机的立体图像质量评价方法[J].小型微型计算机系统,2017,38(11):2586-2590.ZHANG Boyang,LI Sumei.Stereoscopic image quality assessment method using deep extreme learning machine[J].Journal of Chinese Computer Systems,2017,38(11):2586-2590.
[5]高鑫,欧阳宁,袁华.基于快速去噪和深度信念网络的高光谱图像分类方法[J].桂林电子科技大学学报,2016,36(6):469-476.GAO Xin,OUYANG Ning,YUAN Hua.A hyperspectral image classification method based on fast denoising and deep belief network[J].Journal of Guilin University of Electronic Technology,2016,36(6):469-476.
[6]臧维明,华骅,赖炳宇,等.一种跨平台敏捷式动态可重构系统架构研究[J].中国电子科学研究院学报,2017,12(3):225-231.ZANG Weiming,HUA Hua,LAI Bingyu,et al.Research on c oss-platform agile dynamic reconfigurable system architecture[J].Journal of China Academy of Electronics and Information Technology,2017,12(3):225-231.
[7]BARNICH O,DROOGENBROECK M V.ViBe:A universal back-ground subtraction algorithm for video sequences[J].IEEE Transactions on Image Processing,2011,20(6):1709-1724.
[8]DANG U J,Punzo A,McNicholas P D,et al.Multivariate response and Parsimony for Gaussian Cluster-weighted models[J].Journal of Classification,2017,34(1):1-31.
[9]BRIF C,MANN A.A hybrid intelligent approach for the prediction of electricity consumption[J].International Journal of Electrical Power&Energy Systems,2012,43(1):99-108.
[10]DING S,ZHAO H,ZHANG Y,et al.Extreme learning machine:algorithm,theory and applications[J].Artificia Intelligence Review,2015,44(1):103-115.
[11]任露,黄颖为.基于牛顿迭代法的分形图像研究[J].西安理工大学学报,2016,32(2):247-252.REN Lu,HUANG Yingwei.Fractal image research based on Newton iteration[J].Journal of Xi'an University of Technology,2016,32(2):247-252.
[12]明艳.基于3D相邻区域宏块相关性的多视点视频快速编码算法[J].重庆邮电大学学报(自然科学版),2016,28(6):783-788.MING Yan.Fast multi-viewpoint video coding algorithm based on 3D adjacent area macroblock correlation[J].Journal of Chongqing University of Posts and Telecommunications(NaturalScience),2016,28(6):783-788.