吕金娜
(河南科技学院,河南新乡453003)
基于LAB空间和自适应聚类的害虫图像分割方法
吕金娜
(河南科技学院,河南新乡453003)
为了提高多种棉花害虫图像分割的效率与准确度,提出一种基于LAB颜色空间的棉花害虫普适K聚类害虫图像分割方案.利用LAB颜色空间特性将棉花害虫图像的亮度信息和色彩信息分开分析,并将目标区域图像a分量进行归一化,自适应选取K值.算法核心思想是将K值转换成只与色彩、光照差异有关的阈值C,再利用K-means聚类算法根据提取的害虫图像特征进行分割.实验结果证明,该方案能有效地对典型棉花害虫的图像进行分割.
LAB空间;K均值聚类;图像分割;棉花;害虫特征
棉花是中国最主要的经济作物之一,具有分布广、用途多等特点,有效快速的害虫分割与识别是提高棉花产量的重要途径之一,因此对棉花害虫图像进行分割或识别也成为精细农业研究的热点.常用的图像分割方法有基于阈值的分割方法[1-2],基于边缘的分割方法和均值漂移算法[3-4],这些分割方法利用不同颜色植被把绿色植物或病害从土壤背景中分割出来,对害虫的分割研究也大多集中在仓储害虫识别上,如文献[5]比较几种边缘检测算法在粮样害虫中的分割,文献[6]主要是提取害虫的单一特征,在特定的光源和设定的背景下针对害虫进行识别研究,推广到田间的棉花等作物多种害虫的识别效果不是很好. K均值聚类算法在图像分割中得到广泛应用[7-8],基于K均值聚类法进行图像分割时通过找到特征空间中像素值的空间聚类,并把每一个像素划分到不同的聚类中来实现图像的分割.
但上述研究主要还停留在简单背景(先用人为的方式将需要研究的目标直接从背景中提取出来,再将目标放在单色背景下进行拍照,最后对单色背景中的目标进行算法处理)条件下的病虫害识别阶段,或者对田间图像进行病害检测[9],棉花害虫图像分割方面的研究较少.而且常用的图像阈值分割方法一般直接利用图像中存在灰度差异的目标和背景进行分割,在农田棉花害虫图片上,害虫在整幅图像上所占的篇幅很小,不能有效地利用像素灰度值来统计平均取值的分割阈值方法来展示棉花害虫的像素灰度值.周围光照强度不同,噪声等因素对棉花害虫图像有很大的干扰[10].因此,直接采用像素灰度值分割图像算法不能有效地对棉花害虫图像进行图像分割[11].本文提出一种基于LAB颜色空间的K聚类分割算法,利用棉花害虫的形态特征解决复杂背景下目标和背景粘连问题.
传统的图像分割技术受到硬件速度的制约,通常是基于灰度图像进行处理的.彩色图像较灰色图像含有更丰富的信息,基于彩色图像的图像分割的性能更高.
RGB颜色空间模型是最常用的颜色空间模型,适用于图像的颜色显示,但RGB模型的3个分量具有高度相关性,同时对光照很敏感,在自然光条件下很难保证光照强度的一致性.利用阈值对像素灰度化的棉花害虫图像进行图像分割,同时对于周围环境而言,棉花害虫虫体目标较小,光照强度存在差异等因素,使得图像分割效果不明显.基于以上考虑,本文通过对比棉花害虫的颜色与周围环境颜色的差异,尝试采用基于LAB颜色模型的图像分割技术,以实现害虫目标图像的有效分割.
色彩管理系统采用LAB空间作为颜色坐标,使图像颜色从一种颜色空间表示映射到另一种颜色空间表示.在信息系统中,LAB空间作为一种颜色坐标转换另一种颜色坐标的内部颜色模式.LAB空间能够在不同的系统之间、不同的平台之间进行无差错的切换,是与具体系统平台不相关的颜色空间.不管使用计算机、打印机或者扫描仪等任何系统设备创建图像、输出图像,LAB颜色模式输出的颜色都是一样的.LAB颜色空间支持任何图像相关设备,来保证图像输出设备转换后的图像颜色具有一致性,与任何系统硬件的性能和特性无关.相比于RGB等颜色模式依赖于设备色彩特性,LAB颜色模式弥补了这一不足[12].
LAB颜色空间将图像的亮度信息和色彩信息分开保存,如图1所示.取值范围是[0,100],表示从纯黑到纯白;a的正数部分代表红色,负数部分代表绿色,取值范围为[127,-128];b的正数部分代表黄色,负数部分代表蓝色,取值范围为[127,-128].LAB颜色空间弥补了RGB色彩模型色彩分布不均的问题.
图1 LAB颜色空间分量图Fig.1 Color component of LAB space
为了实现从RGB空间到LAB空间的转换,必须把图像从RGB空间转换到XYZ空间,然后再转换到LAB空间.式1为RGB到XYZ空间的转换公式
CIE1976均匀颜色空间LAB的计算公式如下
式(1)、式(2)中X、Y、Z是物体的三刺激值;X0、Y0、Z0为CIE标准照明体的三刺激值.
对害虫图像进行RGB颜色空间向LAB颜色空间转换后,提取出a、b分量值,可以看出a分量图像可以突出显示害虫目标.而且,由于棉花害虫识别图像的背景一般都是绿色的叶子,所以当LAB颜色空间中a的值为负的时候表示为背景图像.因此根据a的值可以初步根据阈值分割出害虫目标区域的非绿色区域和背景区域,将a分量信息数值小于阈值T的像素点认为是背景区域,并进行a分量值减弱,大于阈值T的点认为是目标区域,并进行区域a分量值增强.最后对a分量图像进行归一化
2.1 K-means聚类算法实现棉花害虫识别
K-means算法是一种使用非常普遍的图像聚类算法,该算法基本思想是将n个对象划分到K个集合,其中K是指该算法中所指定集合的个数.确定K个集合的基本原则是像素点之间的相似度.优点在于算法简单、快速,对大数据集有较高的效率并且是可伸缩性的,时间复杂度近于线性,而且适合挖掘大规模数据集.本文方案中使用相似度准则就是误差平方和(sum of the squared error,SSE)最小化准则. K-means算法是最优划分像素数据的动态聚类算法.K-means算法使所有聚类域中像素点到聚类中心的距离的平方达到最小[13].K-means动态聚类算法采用的最小化误差平方和准则SSE定义
式(4)中Ci表示第i个集合,x表示集合Ci中的任何一点,ci表示第i个集合的平均值.
文献[7]研究了不同的距离测度(欧氏距离、曼哈顿距离和马氏距离)对分割结果的影响,结果表明马氏距离能得出比较符合人类视觉的分割的效果,对局部细节的分割较好.马氏距离是由印度统计学家马哈拉诺比斯(Mahalanobis P C)提出的,表示数据的协方差距离.与欧式距离不同的是它考虑到各种特性之间的联系,并且是尺度无关的,即独立于测量尺度.对于一个均值为μ=(μ1,μ2,…,μp),协方差矩阵为Σ的多变量向量x=(x1,x2,…,xp),其马氏距离为
本文使用K均值聚类算法,在此算法中,聚类数目K的选择对K均值算法影响很大.若K取小了就会有的区域不能分割出来,若K取大了就会出现过分割.所以在分割图像前,K的值一般都由先验知识判断得出.我们提出一种自适应选取K值的方法,其核心思想是将K值转换成只与色彩、光照差异有关的阈值C,通过调控阈值C的大小自适应选择聚类数K,从而改善分割结果.具体算法步骤如下:
Step1.使用K均值聚类算法对归一化的LAB图像进行彩色图像分割,获得初步目标图像.对光照均匀与不均匀图像分别作不同处理,光照均匀图像初始聚类数K=2,即初步目标图像和背景图像;光照不均匀图像初始聚类数为K=3.
Step2.计算每个数据点到这K个中心的距离,采用马氏距离进行计算,按照最小距离原则分配到最邻近聚类.
Step3.使用每个聚类中的样本均值作为新的聚类中心.
Step4.重复步骤2、3,直到聚类中心不再变化.将聚类中心接近的两个聚类合并得到初步目标图像,剩余一个聚类则为背景图像.
2.2 利用形态特征对害虫分割图像进行后续处理
分割后的图像含有一些噪声,有的是分布在背景上的点状噪声,有的是分布在害虫区域上的孔状噪声.本文利用害虫形态特征,对分割后的图像进行后续处理.
数学形态学是一门建立在数学理论基础上的学科,是由一组形态学的代数运算子组成,它包括以下几种基本的形态学运算子:腐蚀(Erosion)、膨胀(Dilation)、开(Opening)和闭(Closing).本算法利用区域填充算法,以集合的膨胀、求补和交集为基础.所有非边界点标记为0,则以1赋给p点开始.下列过程将整个区域用1填充
式(6)中X0=P,B代表害虫体颜色的像素点.如果Xk=Xk-1,则算法在迭代的第k步结束.
为了验证本文方案对棉花害虫分割的有效性和通用性,对棉花害虫的3种典型害虫棉铃虫成虫、棉盲椿、红蜘蛛的图片进行RGB到LAB颜色空间的a、b分量提取,可以看出a分量可以突出显示害虫虫体.
图2 颜色分量提取与分割结果Fig.2 Color component extraction and segmentation result
实验验证,该方案能够对多种害虫虫体进行有效图像特征提取,进行有效的害虫虫体图像分割.从实验结果上看,害虫虫体的大部分得到有效分割,该方案具有有效性.选取多种害虫虫体进行分割,具有通用性.
为了验证本方案的有效性和通用性,对16幅有棉花害虫的彩色图片进行害虫分割实验,统计的错误分割如表1所示.
表1 16幅害虫图像的误提取率Tab.1 False extraction rate of sixteen images
为了验证本方案的正确检出率,选取3组的样本点进行实验,与其他算法相比,本文提出的方案具有较好的检出率和较小的误检率.实验结果如表2所示.
表2 样本点的检测率与误检率Tab.2 Detection rate and false detection rate of samples%
本文提出一种基于LAB颜色空间的棉花害虫普适K聚类害虫图像分割方案.旨在提高多种棉花害虫图像分割的效率与准确度,在LAB颜色空间采用自适应K聚类图像分割算法.利用LAB颜色空间将棉花害虫图像的亮度信息和色彩信息分开.并将目标区域图像a分量进行归一化,自适应选取K值.利用K-means均值聚类算法根据提取的害虫图像特征,进行害虫图像分割.本方案实现了在自然光条件下,棉花害虫图像的正确分割,相较于简单背景的研究而言,该算法更具有实用性.在未来工作中,通过改进方案,使该方案能够对多种害虫图像进行有效分割.
[1]Xavier P B A,Angela R,MariaG,et al.Real-time image processing for crop/weeddiscrimination in maize fields[J].Computers andElectronics in Agriculture,2011,75(2):337-346.
[2]胡波,毛罕平,张艳诚.基于二维直方图的杂草图像分割算法[J].农业机械学报,2007,38(4):199-202.
[3]ZHENG LY,ZHANG J T,WANG Q Y.Mean-shiftbasedcolor segmentation of images containing green vegetation[J].Computers and Electronics in Agriculture,2009,65(1):93-98.
[4]吴艳莲,赵力,姜海燕,等.基于改进均值漂移算法的绿色作物图像分割方法[J].农业工程学报,2014,30(24):161-165.
[5]周龙,牟怿,尤新革.模拟退火算法在粮虫图像分割中的应用[J].华中科技大学学报:自然科学版,2010,5(38):72-74.
[6]刘琼,史诺.基于Lab和YUV颜色空间的农田图像分割方法[J].国外电子测量技术,2015,34(4):39-59.
[7]偱王易,赵勋杰.基于K均值聚类分割彩色图像算法的改进[J].计算机应用与软件,2010(27):127-130.
[8]李光等.基于K均值聚类与区域合并的彩色图像分割算法[J].计算机应用,2010,32(2):354-358.
[9]耿楠,于伟,宁纪锋.基于水平集和先验信息的农业图像分割方法[J].农业机械学报,2011,42(9):167-172.
[10]韩瑞珍.基于机器视觉的农田害虫快速检测与识别研究[D].杭州:浙江大学,2014.
[11]王晏,孙怡.自适应Mean Shift算法的彩色图像平滑与分割算法[J].自动化学报,2010,36(12):1637-1644.
[12]陈昌涛,仇国庆,杨平,等.Lab空间色彩分割在快速车牌定位中的应用[J].计算机应用研究,2010,27(8):3191-3193.
[13]许晓丽.基于聚类分析的图像分割算法研究[D].哈尔滨:哈尔滨工程大学,2012.
(责任编辑:卢奇)
Image segmentation based on LAB color space adaptive clustering algorithm for pest image segmentation
LYU Jinna
(Henan Institute of Science and Technology,Xinxiang 453003,China)
To In order to improve the efficiency and accuracy of the image segmentation,a new image segmentation algorithm based on LAB color space adaptive clustering algorithm for pest image segmentation was proposed.By using the characteristics of the LAB color space,the brightness and color information of the cotton pest image were analyzed separately,then,the a component of the target area was normalized,and the K value was selected adaptively.The core idea is to convert the K value into threshold C,which is only relate to the color and illumination differences.K-means clustering algorithm is used to segment the pest image.Experimental results showed that the proposed algorithm could effectively segment the image of the typical cotton pests.
LAB spaces;K-means clustering;image segmentation;cotton;pest characteristics
TP311.13
A
1008-7516(2016)01-0057-05
10.3969/j.issn.1008-7516.2016.01.013
2015-12-17
吕金娜(1981―),女,河南新乡人,硕士,讲师.主要从事图像多媒体研究.