王利伟+徐晓辉+苏彦莽+宋涛+邓一凡+方正
摘要:利用数字图像处理和支持向量机技术实现对植物叶部常见病害的自动识别,以葡萄叶部常见的白粉病、黑腐病、霜霉病为研究对象,对采集的图像进行预处理后,提取病斑区域形状、颜色和纹理的共15个特征,利用支持向量机分类器对葡萄叶部常见病害进行分类识别。结果表明,与其他核函数相比,径向基核函数对葡萄叶部病害测试样本的识别率最高,正确率达95.00%,说明利用计算机视觉技术实现对葡萄叶部常见病害的自动识别是可行的;通过多次试验可以得出,利用多特征组合进行识别可以有效地提高葡萄叶部常见病害的识别准确率。
关键词:葡萄病害;形状特征;颜色矩;灰度共生矩阵;支持向量机
中图分类号: TP391.41文献标志码: A文章编号:1002-1302(2017)23-0222-03
随着机器视觉技术的不断发展,植物病害的自动识别与诊断作为农业现代化发展的重要一环已经成为国内外专家学者的研究热点,应用前景十分广阔[1]。国内外的专家学者已经利用机器视觉技术在黄瓜、大麦、棉花等作物上进行了相关病虫害识别的研究,Yao等利用描述颜色特征的直方图和描述纹理特征的色调、饱和度、数值(hue saturation value,HSV)、颜色空间的共生矩阵实现对病害特征的提取,然后对多特征进行了筛选[2];杨倩等采用颜色矩提取病斑颜色特征,应用改进的局部二值化模式(local binary patterns,LBP)提取病斑纹理特征,通过支持向量机(support vector machine,SVM)实现对大麦病害的识别[3];刘涛等采用改进的均值漂移(mean shift)图像分割对水稻病斑进行准确分割,通过支持向量机对水稻15种病斑进行准确分类[4];李冠林等利用K-means硬聚类实现病斑分割,采用SVM实现对小麦锈病的识别[5]。
本研究旨在利用数字图像处理相关技术对葡萄叶部白粉病、黑腐病、霜霉病图像进行预处理以及特征提取,并采用多特征组合的方式通过SVM对病斑进行分类识别测试。本研究是在OpenCV开发环境下,利用C++语言编程来实现上述数字图像处理及分类识别等算法的开发,为后期将图像移植到嵌入式平台奠定基础。
1图像预处理及识别流程
1.1图像预处理
采集葡萄的白粉病、霜霉病和黑腐病3种病害及正常图像(对照)共200幅,训练样本、测试样本各占用其中120、80幅。经过处理后图像格式为JPEG,分辨率为400×400。
在进行图像病斑特征采集之前,须要对图像进行滤波去噪、灰度化、二值化和图像病斑分割等预处理[6]。考虑到图像采集过程中灰尘、水雾等因素可能会对采集到的图像产生噪声,影响对病斑的识别效果,本研究采用3×3中值滤波对图像进行去噪处理。经过多次试验得出,提取原病害图像红(R)、绿(G)、蓝(B)3个通道的B通道图像,最大类间方差(Otsu)阈值分割法[7]对原图像植物病斑的分割效果最好,符合后期处理的要求。葡萄白粉病、霜霉病和黑腐病灰度化图像以及病斑分割后二值化图像的结果如图1所示。
1.2识别流程
将采集到的图像进行预处理后,可以得到葡萄叶片的灰度图像、RGB 3个通道的分量图像及病斑二值化图像。然后分别对灰度图像求灰度共生矩阵,直接计算RGB 3个通道的颜色矩,通过病斑二值化图像计算葡萄叶部病害的纹理、颜色和形状特征。具体识别流程如图2所示。
2叶部病斑特征提取
2.1形状特征提取
一般对形状特征的提取是指对旋转、位移和尺度变换不敏感的高层次视觉特征的提取,它主要体现被提取对象的几何形状[8]。常见的形状特征包括病斑数量(C),主要是对病害叶片的病斑数量进行计算;面积(A),主要通过计算病斑区域内的像素总和来描述;周长(L),主要通过病斑部位边界线上像素之间的距离之和来描述;长轴(W)短轴(H)比,主要通过病斑区域的最小外接矩的长轴、短轴的比值来描述[9]。
由于上述特征不完全具有旋转、平移和尺度不变性,这样就不能较好地表达病斑的形状特征,因此,可以根据上述特征
得出5个可以较好地描述形状特征的参数[10]。矩形度R1=A/(H×W),为目标面积与其最小外接矩的面积之比,反映了目标对其最小外接矩的充斥程度;圆形度R2=4πA/L2,可以用来描述目标区域的粗糙程度;形状复杂度R3=L2/A,可以用来描述区域的离散程度;内接圆半径R4=2A/L,为目标区域面积与周长比的2倍;伸长度R5=H/W,可以用來描述目标区域的紧凑性。这5个形状特征具有旋转、平移和尺度不变性,可以准确地表达病斑的形态、粗糙程度、紧凑度等信息,这样就可以得到5个形状特征的参数。
2.2颜色特征提取
颜色矩是描述颜色特征的主要方法之一,用颜色矩描述颜色特征具有简单且有效的优点,其主要思想是图像中任何颜色分布均可以用它的矩来表示[11]。由于低阶矩就可以描述图像颜色的主要信息分布,本研究提取葡萄病害图像的一阶矩和二阶矩作为颜色特征,可分别表示所选区域图像的平均颜色和标准方差[3],其公式分别为
μ=1M×N∑Mx=1∑Ny=1[I(x,y)];(1)
σ=[1M×N∑Mx=1∑Ny=1|I(x,y)-μ|2]1/2。(2)
式中:μ、σ分别为一阶矩、二阶矩;M×N为图像的尺寸;I(x,y) 为(x,y)处的像素值。
1幅图像包含R、G、B 3个通道,本研究将每个通道均提取一阶、二阶颜色矩,这样就可以获得6个颜色特征参数。
2.3纹理特征提取
纹理特征作为图像识别经常须要提取的重要特征之一,是图像中普遍存在但又难以描述的重要视觉特征。目前对纹理特征的描述主要有4种方法,分别为统计法、结构法、信号处理法、模型法。在统计方法中,利用灰度共生矩阵(grey level co-occurrence matrix,GLCM)提取图像的纹理特征已经比较成熟[12]。灰度共生矩阵是由Haralick等于1973年提出的一种可以精确地反映出纹理灰度空间相关性的理论[13]。灰度共生矩阵P(i,j︱d,θ)(i、j = 0,1,2,…,L-1)用于表示具有空间位置关系,且灰度值分别为i、j的2个像素出现的次数或概率(归一化),其中L为灰度级,θ为灰度共生矩阵的生成方向,d=(Dx,Dy),如图3所示。endprint
利用灰度共生矩阵P(i,j︱d,θ)可以对纹理特征用以下4个参数来描述[10]。
(1)能量(ASM),能量是灰度共生矩阵所有元素值的平方和,它可以反映图像灰度分布的均匀程度和纹理的粗细程度,其计算公式为
ASM=∑L-1i=0∑L-1j=0P(i,j︱d,θ)2。(3)
(2)熵(ENT),对图像中纹理的非均匀程度或者复杂程度可以用熵来表示,其计算公式为
ENT=-∑L-1i=0∑L-1j=0P(i,j︱d,θ)log2P(i,j︱d,θ)。(4)
(3)对比度(CON),对比度主要可以体现出图像的清晰程度和纹理沟纹的深浅程度,其计算公式为
CON=∑L-1i=0∑L-1j=0(i-j)2P(i,j︱d,θ)。(5)
(4)相关性(COR),相关性可以反映出图像局部的相关程度,其计算公式为
COR=[∑L-1i=0∑L-1j=0(ij)P(i,j︱d,θ)-μxμy]/σxσy。(6)
式中:μx、σx分别为行方向上纹理参数的平均值、方差;μy、σy分别为列方向上纹理参数的平均值、方差。
因为灰度共生矩阵具有方向性,所以取不同的常见方向(0°、45°、90°、135°)的灰度共生矩阵,然后根据上述参数公式分别计算4个方向的纹理参数,最后通过计算各个参数的均值作为纹理特征向量的各个分量。为了减少灰度共生矩阵的计算量,以提高运算速度,须要提前把普通的灰度图像由256级压缩为所需的级数[14]。本研究将原图像变为灰度图像,然后将变换后的灰度图像的灰度级压缩为64级进行特征提取,这样可得到4个纹理特征参数。
3分类识别
SVM以结构化风险最小化为原则,可以实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下也能获得良好的分类结果的目的[4]。SVM中常用的核函数包括多项式核函数、径向基核函数(radial basis function,RBF)、线性核函数和Sigmoid核函数。考虑到RBF可以实现非线性映射,须要确定的参数少且一般情况下不会出现太大的偏差,因此一般选取RBF作为核函数。SVM分类器决策函数及RBF的表达式分别如公式(7)、公式(8)所示[3,14]。
h(x)=sgn[∑ni=1ai*yiK(xi,yi)+b*];(7)
K(x,y)=exp(-γx-y2)。(8)
式中:SV表示支持向量(support vector)的集合;sgn(.)为符号函数;支持向量的ai*取值不为0,非支持向量的ai*取值为0;b*是分类阈值;γ为RBF中K(x,y)的参数。
将采集到的200幅葡萄图像中的120幅(正常及3种病害图像各30幅)作为训练样本进行训练,剩余80幅(正常及3种病害图像各20幅)作为测试样本进行测试识别。经多次试验验证,当选择RBF作为核函数,令惩罚参数C为64、RBF参数γ=1时,分类效果最好,对测试样本的识别正确率可达95%及以上(表1)。
4结论与讨论
本研究通过对葡萄叶部病害图像进行预处理及对病斑形状、颜色和纹理特征进行提取,提出多特征组合的方式利用SVM分类器进行病害识别,最佳识别正确率可达95.00%,整个研究过程及结果可以得出以下结论。
为提高图像的识别准确率可以通过增加有效特征的方式来实现,病斑的形状、颜色、纹理特征相结合的方式比单一特征或两两特征组合进行病害识别的正确率高。因此,本研究可以有效地对葡萄叶部白粉病、霜霉病、黑腐病进行识别。
通过多次试验可以确定选择RBF进行SVM分类的效果最好,同时也验证了在OpenCV平台进行图像识别算法开发的可行性。
该研究目前只能对植物叶片某个固定时期的单一病害进行特征提取和识别,存在局限性。对植物叶部不同时期、混合病害或植物其他部位病害的特征提取及识别还有待进一步深入研究。
参考文献:
[1]曹乐平. 基于机器视觉的植物病虫害实时识别方法[J]. 中国农学通报,2015,31(20):244-249.
[2]Yao Q,Guan Z X,Zhou Y F,et al. Application of support vector machine for detecting rice diseases using shape and color texture features[C]//2009 International Conference on Engineering Computation,IEEE Computer Society,2009:79-83.
[3]杨倩,高晓阳,武季玲,等. 基于颜色和纹理特征的大麦主要病害识别研究[J]. 中国农业大学学报,2013,18(5):129-135.
[4]刘涛,仲晓春,孙成明,等. 基于计算机视觉的水稻叶部病害识别研究[J]. 中国农业科学,2014,47(4):664-674.
[5]李冠林,马占鸿,王海光. 基于支持向量机的小麦条锈病和叶锈病图像识别[J]. 中国农业大学学报,2012,17(2):72-79.
[6]胡敏,陈红波,徐良凤,等. 基于颜色和纹理特征的黄瓜病害识
别算法[J]. 电子测量与仪器学报,2015,29(7):970-977.
[7]何志勇,孙立宁,陈立国. Otsu准则下分割阈值的快速计算[J]. 电子学报,2013,41(2):267-272.
[8]胡秋萍. 基于叶片形状特征的植物识别技术研究[D]. 西安:西安电子科技大学,2014.
[9]毋媛媛,刁智华,王会丹,等. 作物病害图像形状特征提取研究[J]. 农机化研究,2015(1):64-67.
[10]余秀丽,徐超,王丹丹,等. 基于SVM的小麦叶部病害识别方法研究[J]. 农机化研究,2014(11):151-155.
[11]曾传华,陈红,丁幼春,等. 基于颜色和纹理特征的竹材分类方法研究[J]. 林业机械与木工设备,2010,38(3):37-39.
[12]陈强,田杰,黄海宁,等. 基于统计和纹理特征的SAS图像SVM分割研究[J]. 仪器仪表学报,2013,34(6):1413-1420.
[13]Haralick R M,Shanmugam K,Dinstein I. Texture features for image classification[J]. IEEE Transactons on Systems Man and Cybernetics,1973,SMC-3(6):610-621.
[14]張铮,徐超,任淑霞,等. 数字图像处理与机器视觉[M]. 北京:人民邮电出版社,2010.江苏农业科学2017年第45卷第23期刘伟,张永辉,牛祺君,等. 基于NFC技术的热带农产品可追溯系统的设计[J]. 江苏农业科学,2017,45(23):225-230.endprint