基于贝叶斯分类器的水稻病害识别处理的研究

2012-10-16 08:52:54杨昕薇谭峰
黑龙江八一农垦大学学报 2012年3期
关键词:贝叶斯病斑分类器

杨昕薇,谭峰

(黑龙江八一农垦大学信息技术学院,大庆163319)

随着计算机的出现,人们的生活变得更依赖它的发展,随着计算机的发展,它的智能化为人们的日常生活带来了很多方便,人工智能成了计算机的主要发展方向。它是诞生于20世纪的模式识别技术[1],在60年代初期得到了重视并迅速发展的一门学科。它是多个学科领域中都应用到的重要技术,这样进一步扩大了人工智能的发展,同时推动了计算机的发展和应用领域,图像识别技术在模式识别中占重要地位,是图像处理与模式技术的综合产物,各自取长补短,扩大应用领域。目前,用于医学、工业和生物认证的多个领域,已成功实现了其价值,随着中国农业迈向精准化的发展趋势,人工智能在农业生产上得到了充分的应用,利用图像识别技术对作物病虫草害的应用研究日益增多,将作物的反观特征,如:颜色、皱纹和形态与病斑对比进行区分,用于病害的研究方法很多,可以利用统计的线性分类器,人工神经网络、贝叶斯理论[2]、模糊识别技术和支持向量机等模式识别技术,对病虫害进行分类识别,减轻了人工劳作,更有效的利用了时间且错误率低,推进了向精准农业迈进的步伐。

1 识别处理技术路线

由于是针对寒地水稻的户外检测系统,所以,在图像采集时使用的是满足户外需求的田间作业设备。设备不仅保证便携性还保证要采集图像的清晰度。在采集图像时用两种方式进行,最终确定使用工业摄像头所采集的图片,因为要保持采集图像的真实性,所以选择在早上(在早晨的病害症状最为明显)自然光的条件下,不采取任何人工照明措施下,进行采集工作,同时在不同的天气情况如阴天和多云的光照区别明显的条件下进行寒地水稻病害图像的采集。研究中所采集的图像来自中国建三江垦区胜利农场的种植园区试验田进行试验。在试验田共采集4种水稻病害,其中一种是使用农药对水稻叶片造成损伤所形成的斑点图像,共954幅图像,采用于JPG格式存放,最终选择病斑明显且代表性强的108幅图像作为研究样本。研究中的识别部分是整个处理系统的核心,前期采集是为了识别做准备,其分类器的选择和构造对整个识别过程起重要作用[3]。

图1 识别处理技术路线Fig.1 Identify treatment technology route

2 贝叶斯分类器介绍

统计决策理论是模式识别问题中最基础的理论,对模式的分析各分类器设计都有实际的指导意义。在使用贝叶斯分类器时要满足两个最基本的条件:①要求各种分类占总体概率的具体分布情况;②决策分类的分类数量关系是固定的。贝叶斯分类器是按已知对象的先验概率,再利用其计算出后验概率,来判断已知对象是属于某一类别的概率,再选择最大的后验概率作为该已知对象的所属分类。

贝叶斯分类器有很多种,研究中使用的是贝叶斯决策中的最小错误率,它能够有效地减少错误的分类,降低错误率。它的基本原理中:将代表模式的特征向量x分到c个类别(w1,w2,…,wc)中某一类的基础的方法。是计算x的条件下,此分类模式属于各类的概率,用符号p(w1/x);p(w2/x);…p(wc/x)进行表示。比较各分类的概率,最大数值对应的类别是wi,那么它就是该模式所属的分类。例如表示某个待查分类的特征向量x,它属于正常分类的概率是0.2,属于不正常分类概率是0.8,就把它归类为不正常的概率分类。上述定义的条件概率称为后验概率。在特征向量为一维的情况时,一般都具有图2中的变化关系。当x=x*时,p(w1/c)=p(w2/c)对用于x>x*的区域,由于因此x属w2类,对用于x<x*的区域,由于x属w1类p(w2/x)>p(w1/x),x*就相当于区域的分界点。图2中的阴影面积就演示了这种方法错误分类概率,对于以任何其他的x值作为区域分界点的分类方法都对应了一个更大的阴影面积,因此贝叶斯分类器是一种错误概率最小的分类器[4]。

图2 错误分类概率示意图Fig.2 Misclassification probability schematic diagram

后验概率是要通过贝叶斯公式

进行计算。x是在p(x/wi)为模式属于wi类的条件下出现的概率密度,称为x的分类条件的概率密度;p(wi)是在所研究的识别问题中出现的wi类的概率,又称先验概率;x特征向量p(x)的概率密度。分类器在比较后验概率时,对于确定的输入x,p(x)为常数,在实际应用中,通常不是直接用后验概率作为分类器的判决函数gi(x)采用下面两种形式:对所有的c个类计算gi(x)(i=1,2,…,c)。与gi(x)中最大值相对应的类别就是x的所属类别。

研究中,定义水稻的三种病害类分别为Ω={ω1,ω2,ω3},识别样本向量分别为x=[x1,x2,…,xd]T。每次一种病害类别的判别函数分别定义成gi(x)=p(x/ωi)P(ωi),i=1,2,3;其中p(x/ωi)条件概率密度函数,P(ωi)为先验概率。如果对任意j≠i都有g(xi)>gj(x),则将x归类为ωi类,此时满足贝叶斯差别准则。贝叶斯分类器设计如图3所示[5]。

图3 贝叶斯分类器Fig.2 The Bayes Classifier

3 实验结果分析

研究中将216个病斑进行提取特征值并优化,优化后的病斑分为两组:一组用于训练使用;一组用于检验。

使用DPS中的逐步判别分析方法,分析训练样本,设定临界值Fa,对4个不用参数值使用逐步判别分析法,得出结果中发现,对于纹理特征值D3和所有特征集合中被剔除了大量冗余的参数。

表1 利用逐步判别分析对4个参数集进行筛选情况Table1 Results of selecting paramaters for four parameter sets by stepwise discriminantanalysis

D3(纹理参数)中所保留下来的是饱和度和色度纹理参数,分别占了42.1%和36.8%,在D4中色度和亮度纹理保留下来了19.2%,而饱和度占43.2%。因此,可以看出饱和度在分类相关性中占了更大的比例,色度第二,而亮度占的比例最少。D1在分析后,只在最后的综合参数中被剔除了2个参数,由此可见,形态参数比较稳定,可颜色参数在单独使用时,识别相关性得到了很好的保持,但在综合参数时仅剩了1个参数,识别相关性降低的最为明显。

分类器在制造方法中分很多种,但每一种分类器都必须包含输入和输出。因为待需要识别的种类为3种病斑,所以设计的分类器输出的参数包括了3个分类值,根据表1中总结的识别参数的特点,建立分类器,利用训练的样本进行学习试验,使用检验样本考察分类器的识别效果,结果如表2。

表2 利用Bayes判别法识别样本的分类结果Table2 The classification results of using Bayes discriminant method to identify the sample

4 讨论

以水稻常见的3种病害为识别目标,使用逐步判别分析法进行判别分析,对所采集参数进行删减,精化数据的存储和运行。在使用逐步判别分析法时,发现了识别准确率与病斑的饱和度纹理参数的识别相关性较大,颜色参数则相对较低,在剔除相关性较小的参数后和平均识别的准确率都得到了提高。之后利用贝叶斯判别法进行分类识别,识别效果最好的是3种参数的集合,平均的识别准确率达到97.5%,其他3种集合在单独使用时,都不同程度地反映了识别参数的相应问题,由于稻瘟病和纹枯病的病斑形态和颜色上的差异较小,所以在区分时产生误差的大,对综合使用后能准确的识别。

研究可以实现稻瘟病,纹枯病和白叶枯病的计算机自动识别,但对于水稻的整个生长周期来说,还需要增加病害和受害种类进行研究,另外,要研究提取更快更准确的识别分类特征参数,优化分类器,达到多种水稻病害高效率高准确率的识别。

[1]谭峰,马晓丹.基于神经网络的植物图像分割算法的研究[J].黑龙江八一农垦大学学报,2009,21(1):63-65.

[2]管泽鑫,唐健,杨保军,等.基于图像的水稻病害识别方法研究[J].中国水稻科学,2010,24(5):497-502.

[3]管泽鑫,姚青,杨保军,等.数字图像处理技术在农作物病虫害识别中的应用[J].中国农业科学,2009,42(7):2349-2358.

[4]崔艳丽,程鹏飞,董晓志,等.温室植物病害的图像处理及特征值提取方法的研究—基于色度的特征值提取研究[J].农业工程学报,2005,21(增):32-35.

[5]边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.

猜你喜欢
贝叶斯病斑分类器
改进自适应分水岭方法分割棉花叶部粘连病斑
一种桑轮纹病病叶发病程度的评价指数
中国蚕业(2018年4期)2018-12-05 05:45:12
9种药剂防治山核桃干腐病试验研究
BP-GA光照分类器在车道线识别中的应用
电子测试(2018年1期)2018-04-18 11:52:35
贝叶斯公式及其应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于贝叶斯估计的轨道占用识别方法
一种基于贝叶斯压缩感知的说话人识别方法
电子器件(2015年5期)2015-12-29 08:43:15
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别