张春艳
(沈阳理工大学信息科学与工程学院,辽宁 沈阳 110159)
通过对番茄叶片图像进行颜色特征的提取,将提取到的数据输入SVM算法,通过训练求得可以对产生病害的番茄叶片图像进行识别的模型。
直方图作为一种特征描述,具有简单有效的特点,用其来统计特性非常方便,因此,其被广泛应用于计算机视觉。在图像处理领域,对于图像直方图的特征提取十分方便,其对图像无任何要求;关于图像的多模态的体现,直方图也有非常良好的表现,并且对于图像的任意指定区域的统计特征也能很好的表示;直方图还对旋转不敏感,具有旋转不变性。因此衍生出各种各样的直方图,如颜色直方图、亮度直方图、局部二值模式直方图、HOG等。对于图像处理领域,颜色直方图应用最为广泛,但是传统的颜色直方图容易受光照变化影响,并且对于图像内部的具体像素点的分布情况不敏感,对于像素位置不敏感。
求图像的颜色矩特征是通过对线性代数的中矩的理解,同样将图像中的颜色分布抽象提取,用其矩表示出来。分为平均值Average、方差Variance和偏斜度Skewness,并将其分别起名为颜色一阶矩、二阶矩以及颜色三阶矩,通过这些其矩来对图像的空间信息进行表示。使用颜色矩的概念来表示图像与颜色直方图是有差异的,颜色直方图需要颜色量化的操作,而颜色矩不需要颜色量化。关于图像的像素点,通常可以分为3个颜色通道进行表述,而对于颜色矩每个通道可以抽象出3个分量来进行描述,因此一共可以得到9个分量的信息。因为颜色矩得到的特征维数相对少一些,所以使用颜色矩时一般还需要提取一些图像其他的特征,帮助更好地对图像进行分析处理。3个低阶矩的数学模型计算公式进行如下:
(1)
(2)
(3)
其中,pij在以上公式中的下标j代表的是第j个像素点,i代表的是像素点的第i个分量,N代表的是总的像素数是N。
图像的颜色变化可以通过取其抽象出的颜色矩进行表示,如上所述,可以得到一个9维的颜色直方图量化后的向量,以下公式是将颜色分量分别用Y,U,V来表示:
Fcolor=[μY,σY,sY,μU,σU,sU,μV,σV,sV]
(4)
颜色特征与局部特征对应,可以很好地将图像的整体特征描述出来。而颜色特征的本质其实是图像本身像素点所表现出来的特征,但其只是一种整体上的或者说是一种表面上的特征,而对于空间以及更加细致具体的特征无法显示,因此对于图像的局部特征并不能以这个来体现。鉴于此,当只将颜色信息作为一种查询图像的标准时,当数据量小时,可能得到所期望的结果,但是对于数据量很大的时候,常会将许多不需要的图像也检索出来。总的来说,利用颜色直方图的原理简单并且容易理解分析,因此应用很多,虽然其不能很好地表示出图像的空间信息以及图像的局部特性,但对于图像本身的变化如平移和旋转等不敏感,抗这些因素的干扰性较强。
SVM[4,5]的原理是通过核函数将特征空间找到,找到之后将特征空间进行分析得到软间隔分离超平面,再用正则化因子对其进行优化得到样本的二分类操作。使用核函数来将点积运算表示出来并且得到最优的分类面:
(5)
式中,ai代表Lagrange乘子,ai≥0;xi,yi代表两类中的支持向量SV;b*代表根据训练样本确定的阈值;K(x,xi)代表核函数。
将图像在边界方向上的形状特征进行提取出来,在此基础上再进行颜色直方图的分提取和分析。该方法简单有效,在增加了准确性的基础上保留了对图像自身的旋转平移不敏感的特点,另外其对于图像的缩放也不敏感。为了将图像检索的准确性进行提高,还将反馈机制结合起来,可以动态地调整权值系数,并将相应的算法进行抽象出来,通过训练可以将不同数据库的最佳权值系数求出来进行图像分析与识别研究。通过实验发现,此方法具有很好的识别效果,准确性也很高。通过将其与边缘检测结合分析,将边缘的信息进行提取抽象,将小领域内的信息抽象并唯一地确定位置,再将求得的各个小领域内的信息点联合起来,进行总体的抽象与分析,将各个点进行连线,取得连线中点的信息,求得一个能体现图像特征的边缘信息的特征模型,这个过程通常称为拟合过程。在这个过程中,连线之间会产生一定的角度,从而引发一些多余的噪声,因此分析时需要注意排除噪声的干扰,提高准确性。
边缘方向直方图是对图像轮廓特征的一种描述方法,通过Canny边缘检测算子对病变番茄图像的轮廓特征进行提取,并计算出每个边缘像素点的方向,对每个方向上的边缘点数目进行统计进而形成边缘方向直方图。
图1 边界方向直方图
目前基于图像分类使用较为广泛的模式识别算法包括欧式距离法、BP神经网络、支持向量机。针对本实验样本数量有限的特点,最终选择SVM对病害番茄图像进行识别。
SVM(Support Vector Machine)是通过某种事先选择的映射(核函数)将输入向量映射到一个高维特征空间,然后在这个空间中寻找最优分类超平面。
根据SVM软件包提取符合条件的向量集;对数据进行筛选;考虑选用适当的核函数,主要包括上述的4种核函数;应用交叉验证方法获取最优参数C和g,并使用这2个参数处理全部训练集来得到SVM模型;用模型对样本图像进行测试,完成识别。
本实验针对样本颜色特征、边缘方向特征、混合特征进行识别。将颜色特征与边界方向直方图参数特征合成为一个向量。每种特征的识别准确率如表1。
表1 识别准确率汇总
本研究对病害番茄图像的颜色特征和边缘特征进行提取,通过SVM对特征进行分类完成对病害番茄图像的识别,在单一颜色特征识别的基础上对颜色特征与边界方向特征进行混合识别,并且识别的准确率好于基于单一特征的识别。