张飞云
摘要:针对不同小麦病害有不同的形状特征,利用多重分形分析提取小麦病害图像的8个多重分形谱值作为小麦病害的形状特征参数,并利用这8个特征参数来索引图像数据库作为学习向量量化(LVQ)神经网络的输入,进行样本训练、分类识别。试验结果表明,该算法对小麦病害的识别率可达90.0%以上。
关键词:小麦病害; 多重分形谱; 智能识别; LVQ神经网络
中图分类号:TP391.41;S435.12 文献标识码:A 文章编号:0439-8114(2013)07-1669-03
小麦是我国仅次于水稻的第二大粮食作物,在满足人们的生活需求和保证粮食安全方面具有非常重要的作用。而小麦病害每年都有大面积发生,严重影响了小麦的产量和质量。传统小麦病害主要依靠农业生产者或科研人员的视觉判断识别病害的种类、严重程度及受害区域,这种识别方法主观性强,诊断结果容易出现偏差。因此,研究小麦病害的智能识别具有重要的社会和经济意义。
目前,国内外很多学者对农作物病害图像的识别方法进行了研究,Pydipati等[1,2]使用颜色共生矩阵获取纹理特征,并分别用神经网络分类器和广义二乘矩判别式分类器进行柑橘病害的判别分析,达到了很好的识别效果; 田有文等[3-5]将支持向量机方法应用于黄瓜、葡萄、玉米、番茄等病害的识别中;陈兵旗等[6]提取小麦的颜色特征进行小麦病害识别,提高了病害识别的准确率。现有的研究当中大多数是基于纹理特征和颜色特征在可见光范围内进行病害识别研究,这些方法算法比较复杂,运行时间较长,并且达不到理想的识别效果。试验引入多重分形理论,提取小麦病害图像的8个多重分形谱值作为小麦病害的形状特征,然后采用学习向量量化(Learning Vector Quantization,LVQ)神经网络对小麦病害进行识别,算法简单,速度快,并且可以达到很高的识别率。
1 小麦病害图像的获取
试验图像主要来自数码相机拍摄的静态图片、小麦病虫害及防治原色图册[7]上的图片以及网络图片库等。共收集小麦不同病害部位、不同生长阶段的200多张病害图片,每种病害样本70个。主要研究的小麦病害是条锈病、叶锈病和白粉病。
所采集到的小麦叶部病害图片都是彩色图像,其计算量大,影响图像处理的速度,为了提高图像处理的速度,需要将彩色图像转换为灰度图像。根据人眼对R、G、B三色的敏感程度,可以使用加权平均值法将彩色图像灰度化,转换公式为:
Gray=0.30×R+0.59×G+0.11×B (1)
然后,将灰度图像转换为二值图像,便于计算机做进一步的处理。小麦条锈病病害原图及转换后的灰度图像如图1。
2 基于多重分形理论的小麦病害图像局部边缘分割和多重分形特征谱的提取
2.1 多重分形
分形理论作为非线性科学的一个分支,它研究的对象是由非线性系统产生的不可微和不光滑的复杂几何形体。仅用一个分形维数不能完整刻画自然界中复杂的几何形体,必须同时使用多个维数才能刻画其全面的特征。多重分形就是用多个维数从全局和局部两个方面来描述自然界中复杂几何形体的整体特征。而分形维数不仅可以度量图像表面的复杂程度和不规则程度,它还具有小波变换的多尺度、多分辨率的变换不变性。由于对多重分形理论研究的角度不同,处理不同问题时的描述不同,导致多重分形理论在数学上没有严格的定义。
根据图像特征及图像处理的需要来调整多重分形参数是多重分形分析的重点,可以用基于测度理论的α~f(α)语言来描述多重分形,其中α称为Holder指数,因为概率密度的奇异性由它控制,分形体小区域的局部分形维数也是由它反映出来的,所以通称α为奇异性指数。f(α)称为多重分形的奇异谱,一般称为多重分形谱,它反映复杂分形体图像的全局信息。不同信息的奇异性不同,则(α~ f(α))的分布规律不同[8]。
2.2 基于多重分形理论的图像局部边缘分割
图像分割的目的是把小麦叶部病害图像与背景分开,便于提取小麦叶部病害的轮廓特征。基于多重分形理论图像分割的实现步骤如下。
1)计算图像的奇异性指数α。奇异性指数α代表图像的局部信息,定义V(i)为i×i的一个方形区域,定义I(x,y)为V(i)的中心点,则该点的奇异性指数α(x,y)=■(其中i=2n+1,n取0和正整数)。i的取值反映图像的奇异性范围;经过试验证实,i的取值越小越能反映图像的局部奇异性,i的取值越大则更能反映图像广泛的奇异性。选取i≤2,并且经过试验选用效果比较好的Min测度修改方法计算奇异性指数α。
2)计算图像的多重分形谱f(α)。f(α)代表图像的全局信息,根据上一步计算出的奇异性指数计算α的最大值和最小值,即αmax=max(α(i,j))和αmin=min(α(i,j))。然后将[αmin,αmax]划分为N个区域,得到每个区域的中心点奇异值,用该值代替区域中其他点的值,然后采用豪斯道夫维数求出f(α)。
3)根据前两步得到的结果,选取合适的最大值和最小值以及相应的capacity,利用多重分形理论进行小麦病害图像局部边缘分割。分割后的图像如图2。
2.3 小麦病害图像多重分形特征谱的提取
根据多重分形谱的算法,通过Matlab编程完成多重分形谱的计算[9],绘出关于α~f(α)的多重分形谱曲线,并且计算曲线上多重分形谱的一些重要特征值,即奇异性指数α的最大值αmax和最小值αmin以及相对应的f(αmax)和f(αmin);谱宽Δα=αmax-αmin;谱差Δf=f(αmax)-f(αmin);αd:使f(α)取极大值时的α值;m:拟合曲线的一次幂系数,在αd处用最小二乘法进行曲线拟合,拟合的二次函数为f′(α)=l(α-αd)2+m(α-αd)+n。参数B表示谱线f(α)的不对称性。
图3为部分小麦叶部病害图像对应的多重分形谱曲线。表1给出了数据库中6幅小麦叶部病害图像样本的8个多重分形谱特征值。
通过以上试验可知,小麦不同病害图像的形状特征值具有很大差异性,同类小麦病害图像的形状特征值具有一定的规律性。
3 学习向量量化神经网络
3.1 学习向量量化神经网络原理及算法
小麦叶部病害识别问题是一个模式分类的问题,在模式分类中首选的神经网络是自组织神经网络、竞争型神经网络和学习向量量化(LVQ)神经网络,这些类型的神经网络通过检测输入样本的规律性,然后根据输入样本信息自适应地调整网络,使网络的响应越来越适应输入样本。然而自组织和竞争型神经网络训练样本数据的方式采用的是无监督学习方式,输入向量之间的距离决定了分类原则的类型,因此对于两个非常接近的输入向量不能严格地区分它们的类别。LVQ神经网络采用监督状态下的竞争学习方法,在学习的过程中通过期望的输出值规定输入样本的分配类别,从而克服了无监督学习算法的弱点[10]。因此在对小麦的叶部病害进行识别时采用LVQ神经网络。
LVQ神经网络的结构由3层组成,第1层为输入层,第2层为竞争层,第3层为输出层,网络结构图如图4。
LVQ神经网络的学习算法如下:
1)初始化权值向量(聚类中心),W={w1,w2,…,wn},可随机给权值向量赋初值,初始化学习速率β(0),确定训练次数tn。
2)输入第p个训练模式的样本向量xp。
3)通过公式(2)寻找聚类中心k,即获胜节点神经元。
||wk-xp||<||wj-xp|| j=1,2,…,n (2)
4)根据分类正确与否,修正获胜神经元的权值。
5)调整学习速率β,β作为迭代函数逐渐减小。
6)检查训练终止条件,如果t 3.2 分类试验 随机为每种病害选择30个样本作为训练样本,每个样本由8个特征值组成,所以网络有8个输入神经元,设有16个竞争层神经元,根据需要识别的小麦病害种类,需要3个输出层神经元,输出层神经元可表示为:条锈病[1 0 0],叶锈病[0 1 0],白粉病[0 0 1]。根据要求对网络进行训练,确定权值。另外每种病害选择40个样本,提取特征值送入LVQ神经网络进行测试,试验结果如表2。将提取的多重分形谱值送入量子神经网络分类器进行识别,识别率低于LVQ神经网络分类器。 4 小结 利用多重分形分析提取小麦病害的8个多重分形谱值,将提取的小麦病害图像的形状特征值送入LVQ神经网络进行识别,识别率可达90.0%以上,证明LVQ神经网络能根据小麦病害的的形状特征有效识别小麦条锈病、叶锈病和白粉病。 参考文献: [1] PYDIPATI R, BURKS T F, LEE W S. Statistical and neural network classifiers for citrus disease detection using machine vision[J]. Transactions of the ASAE,2005,48(5):2007-2014. [2] PYDIPATI R, BURKS T F, LEE W S. Identification of citrus disease using color texture features and discriminant analysis[J]. Computers and Electronics in Agriculture,2006,52(1-2):49-59. [3] 田有文,张长水,李成华. 支持向量机在植物病斑形状识别中的应用研究[J]. 农业工程学报,2004,20(3):134-136. [4] 田有文,李天来,李成华,等. 基于支持向量机的葡萄病害图像识别方法[J]. 农业工程学报,2007,23(6):175-180. [5] 田有文,牛 妍. 支持向量机在黄瓜病害识别中的应用研究[J]. 农机化研究,2009(3):36-39. [6] 陈兵旗,郭学梅,李晓华.基于图像处理的小麦病害诊断算法[J].农业机械学报,2009,40(12):190-195. [7] 商鸿生,王风葵,李修炼,等.小麦病虫害及防治原色图册[M]. 北京:金盾出版社,2007. [8] 蒲小勤. 基于多重分形的图像识别研究[D].西安:西北大学,2009. [9] 傅荟璇. MATLAB神经网络应用设计[M].北京:机械工业出版社,2010. [10] 杜攀峰,廖立坚,杨新安.铁路路基病害的智能识别[J].铁道学报,2010,32(3):142-146.