基于K-means和特征提取的植物叶部病害检测与实现

2021-08-25 03:08李亚文陈月星
陕西农业科学 2021年6期
关键词:病斑聚类病害

李亚文 ,张 军, 陈月星

(商洛学院 电子信息工程与电气工程学院, 陕西 商洛 726000)

0 引言

计算机图像分析技术应用于植物病虫害识别研究始于20世纪80年代中期[1]。穗波信雄(1989,1992)对缺素的茨菇叶片进行了室外图像获取,从病态叶部图像中除去背景,针对正常叶部和病态叶部部分的色度直方图展开了论述[2]。Rocha 等[3]从特征融合的思维来开展果蔬识别检测研究,对比和差直方图、颜色聚合向量、颜色直方图等纹理、颜色特征在不同分类下的检测效果,结果显示使用这三类特征结合取得了很好的识别检测结果。从20世纪90年代初开始,国内一些农业院校和科研所陆续将计算机图像处理应用于农业研究中,崔艳丽等[4-5]2005年运用图像处理对两种黄瓜病进行了研究,胡春华等[6]2004年在RGB颜色空间以G/B,G/R统计特征为缺素黄瓜叶片的颜色特征,谭峰等[7]运用数字图像处理技术与BP神经网络技术;王守志等[8]以玉米病叶片病斑图像的特殊点,对叶部病斑分割,然后提取病害图像的纹理特征与颜色特征进行识别检测,识别精度为82.5%。笔者以提高植物病害检测准确率为目标,针对植物叶部病害和植物叶部正常图片展开相关研究。以苹果叶枯病的植物病害和苹果正常叶部图片为例对其图像分割、特征提取、病害识别等关键技术进行研究。重点利用K-means算法对原始图像进行病斑分割技术、基于颜色特征提取的植物叶部病害的检测与实现,以提高检测率。

1 核K--means均值聚类算法

设数据集{X(1),X(2),X(3),…,X(M),其中X(i)∈RN,i=1,2,…,M。Mercer核函数K:RN×RN→R,根据Mercer定理存在映射N:RN→RF使得[9]:

K(X(i),(X(i))=N(X(i))TN(X(i))

(公式1)

(公式2)

(公式3)

式中:K——聚类数目;Nk——第K类的样本数目;xj,xp——第K类Ck的第j个和第i个样本

由(公式2)可以得到k-means聚类的目标函数J在高维核空间表示为:

(公式4)

核K-means聚类算法实质[10]是在高维空间中,对误差平方和准则找寻样本的最优聚类区分,使聚类目标函数J最小。由此可以知道核K-means聚类算法步骤为:

(1)确定聚类类别数目K(2≤ K≤ l))以及允许误差Emax;

(2)在核空间中,确定开始的聚类中心(m1,m2,…,mk);

(3)利用(公式2)计算所有样本N(xi)与聚类中心的间隔,依据最近原则将样本分配到对应类中;

(4)重新计算聚类中心和J值:利用(公式3)重新计算聚类中心,并依据(公式4)计算JI+1值;

(5)计算误差e=|JI-JI+1|;

(6)如果e≤ Emax,则结束;否则进行步骤(3)。

2 颜色特征

颜色特征描述图像或图像区域相对应的场景表面特征的全局特征,而且它也是被用于图像检索中最为研究者所接受的视觉特征,主要原因是颜色通常与图像所含对象或背景密切相关;比较其他视觉特征,图像本身的尺寸,方向,角度对颜色特征影响较小,所以拥有很高的鲁棒性。

(1)HSV颜色空间。HSV是一种将RGB颜色空间中的点表示为一个倒圆锥体中的方法[11],如图1所示是HSV颜色模型。HSV即色调(Hue)、饱和度(Saturation)、值(Value)。色相(H)是颜色的基本属性,就是颜色的名称,如红色、黄色等。饱和度(S)是指颜色的纯度,纯度越高颜色越低,纯度越低则越辨越变色,数值取0到100%。值(V),取0到max(计算机中HSV取值范围和存储长度有关联)。HSV颜色空间可以用圆锥型来描述。圆锥顶部,V=0,H和S没有定义,是黑色。圆锥的顶面中心处V=max,S=0,H无定义,是白色。

(2)颜色矩。颜色低阶矩是一种有效的颜色特征[12],该方法使用线性代数中矩的概念,用矩来表达图像中的颜色分布。表示颜色分布的颜色一阶矩(平均值)、颜色二阶矩(方差)和颜色三阶矩(斜度)。与颜色直方图不同的是,使用颜色矩描述图像颜色分布不需要量化图像的特征[13]。因为每个像素都有三个颜色通道来表示颜色空间,因此图像的颜色矩有9个分量来描述。颜色矩的前三阶矩公式[14]:

(公式5)

(公式6)

(公式7)

其中,Pi,j表示彩色图像第j个像素的第i个颜色分量,N表示图像中的像素个数。

通过MATLAB2016a进行仿真,可以分别得到10张苹果正常叶部图像的颜色特征即颜色的低阶矩阵如表1所示,就HSV三通道分别对应的颜色矩进行归类整理,可得到苹果正常叶部图像的HSV颜色空间颜色矩值域范围。

3 基于K-means植物叶部病害检测过程

3.1 算法原理

基于K-means聚类植物叶部病害检测与实现的原理如图2所示。首先需获取植物叶部正常图像和病害图像,对其进行图中无关信息预处理,再运用K-means聚类分割算法对处理后的植物叶部病害图像进行病斑分割,得到只含有病斑的图像信息,转换颜色空间分别提取植物叶部正常图像和分割后的植物叶部病害图像的颜色特征的颜色矩低阶矩阵,最后,对获取的大量病害图片进行训练,以得到病害的检测效率。由于受植物图像数据库的影响,在本研究中决定将叶部病害图像的低阶矩各参数和正常叶部图像的低阶矩阵各参数值域进行对比,从而实现检测的目的。

笔者以苹果叶部为研究对象,主要检测识别了苹果叶部的的叶枯病,利用图像分割、颜色特征提取等方法实现了对也不病变是提高植物的病害识别准确率和效率,具体实现步骤:

(1)获取苹果叶枯病和苹果正常的叶部图像;

(2)对病害图像的算法分割,利用K-means聚类算法分割病斑技术,得到分割后的病斑图像;

(3)分别提取病斑图像和正常叶片的颜色矩,如:一阶矩(平均值Average)、二阶矩(方差Variance)、三阶矩(斜度Skewness);

(4)通过植物叶部病斑图像特征参数与植物叶部正常图像特征参数对比,实现病害诊断检测。

3.2 图像分割

该文采用苹果叶部作为研究对象,如图3所示为选取的10张苹果正常的叶片图像,和图4所示的10张苹果叶枯病叶片图像作为病害研究对象。

通过使用k-means算法对原始图像进行图像分割,利用MATLAB2016a仿真分割结果,得到如图5苹果叶枯病K-means算法分割后的图像。

3.3 颜色特征提取

通过MATLAB2016a进行仿真,可以分别得到苹果10张正常叶部图像的颜色特征即颜色的低阶矩阵如表1所示,就HSV三通道分别对应的颜色矩进行归类整理,可得到苹果正常叶部图像的HSV颜色空间颜色矩值域范围。如表2所示,苹果10张正常叶部图像HSV颜色空间颜色矩的各分类参数值域通过10张图像数据的总结得出。

表1 苹果10张正常叶部图像的颜色矩

表2 苹果正常叶部图像的颜色矩值域

4 检测结果

通过MATLAB2016a进行仿真,可以分别得到苹果10张叶部病害图像的颜色特征即颜色的低阶矩阵如表3所示,就HSV三通道分别对应的颜色矩与苹果正常叶部的颜色矩各参数作对比。

通过苹果叶枯病叶部病害的颜色矩与苹果正常叶部颜色矩的参数对比表1和表3,10张病害图像的对比结果为8张图像的参数不相同,2张病害图像部分参数不相同,由此可以计算出植物病害的检测率为93.3%。

表3 苹果病害叶部图像的颜色矩

表4 苹果病害检测

通过上述实验结果表明,8张植物病害图像的颜色矩参数与植物正常图像的颜色矩参数均不同,2张病害图像部分颜色矩参数属于正常苹果图像颜色矩参数范围内,这与了2张图像的获取和分割影响有关,检测准确率较高。

5 结束语

主要研究了基于K-means的颜色特征提取的植物叶部病害检测与实现,在Matlab中进行了仿真实现,实验结果表明,有2张病害图像部分颜色矩参数属于正常苹果图像颜色矩参数范围内,检测精度能达到93.3%,有个别颜色矩参数的检测错误与与获取的图像有关,光照、角度、相机像素等影响相关颜色矩的特征提取参数,但总体实现了检测的目标,且有较高的的检测率。研究可以帮助果农提前检测植物叶部病害,以便尽快做出相应的治疗措施,保障植物的正常生长,增加经济收入。

猜你喜欢
病斑聚类病害
一种傅里叶域海量数据高速谱聚类方法
早春养羊需防六大病害
小麦常见三种病害咋防治
春季番茄常见病害防治技术
葡萄病害周年防治历
一种改进K-means聚类的近邻传播最大最小距离算法
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法
基于OTSU算法的苹果果实病斑图像分割方法
套袋对柠檬果实外观品质的影响
基于Spark平台的K-means聚类算法改进及并行化实现