基于特征加权和支持向量机的图像分类研究

2013-04-01 05:26孙君顶
激光与红外 2013年3期
关键词:直方图纹理灰度

杜 娟,孙君顶,2

(1.河南理工大学计算机科学与技术学院,河南焦作454000;2.“图像处理与图像通信”江苏省重点实验室,江苏南京210003)

1 引言

随着多媒体技术和信息技术的快速发展,越来越多的信息以图像的形式呈现出来并成为当今互联网的一种重要的信息载体,而且图像已广泛应用于社会的多个领域。为了更好组织、管理和利用这些海量的图片信息,建立有效的分类方式已成为迫切需要解决的问题。目前用于图像分类的方法很多,如有贝叶斯分类法[1],神经网络算法[2],K - NN 算法[3],支持向量机算法[4]等。其中,支持向量机从结构风险最小化的原则出发设计,是小样本学习中十分有效的一种学习方法。与传统的学习方法相比支持向量机具有小样本、推广性能好、全局最优等优点。本文在研究图像底层特征每一维向量的相对重要程度的基础上,利用特征加权的方法[5],并基于支持向量机,实现了图像的有效分类。

2 图像特征提取

图像特征提取和对其进行有效的描述是理解视觉内容的关键,本文主要采用的是颜色和纹理特征作为分类依据。

2.1 颜色特征

颜色是图像最基本和最直观的特征,且对图像大小、方向、旋转都不敏感。常用的颜色描述方法有颜色直方图,颜色矩,颜色分布熵等。王陈飞[6]等利用颜色直方图实现了对图像的分类,但全局颜色直方图无法捕捉颜色组成的空间关系,本文采用符合人眼视觉特性的HSV颜色模型,并分别提取图像的颜色直方图和颜色低阶矩特征。首先将图像由RGB颜色空间转换成HSV颜色空间;然后,颜色低阶矩采用HSV三个分量的均值、方差和三阶矩表示,得到9维的颜色矩特征。在提取颜色直方图特征时,采取符合人类视觉特性的非均匀的量化模式将图像的颜色量化为36个等级,具体量化方法如下式所示:

2.2 纹理特征

纹理反映了像素邻域灰度空间分布规律,常用的描述方法如灰度直方图的矩、灰度共生矩阵等[7]。本文采用的是灰度共生矩阵和方向纹理普描述符[8]。为了减少计算量本文将灰度级量化成16 级,计算 0°,45°,90°,135°四个方向的共生矩阵,并采用共生矩阵的能量、熵、惯性矩、相关性4个纹理参数的均值和标准差作为灰度共生矩阵纹理特征。方向纹理普描述符D-LBP(direction local binary pattern,D-LBP)描述符,描述如下:

3 特征加权计算和基于支持向量机的分类

通常我们提取图像的某种特征之后,每一维的权重都默认为1,同等对待。但实际上并不是每一维的特征都与分类强相关,有一些弱相关的特征影响着我们的分类结果,为此我们采用特征加权来提高分类的准确性。

3.1 特征加权

为了实现特征加权,确定特征权重是关键。本文利用特征数据的稳定性来判定特征的重要程度,通过计算训练数据每一类每一维的标准差,标准差越小说明特征越稳定,这一维特征对分类的贡献就越大。假定一个训练集D,有M个类,每类有R个样本,每个样本有N维特征,其表示如下:

假设第p类第q维的特征标准差为Spq:

从而相对应的权重系数定义如下:

从而可得到权重矩阵Wpq,如下所示:

3.2 基于SVM的分类

支持向量机的基本思想是通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求最优线性分类面,这种非线性变换是通过定义适当的内积函数实现的[9]。在自然界中大多数分类问题是非线性可分的。在这种情况下,我们可以在线性分类约束函数上增加一个松弛项,这样得到的最优分类面称为广义最优分类面。相应的判别函数为:

在支持向量机中,采用不同的内积函数将导致不同的支持向量机算法,因此内积函数的选择对支持向量机的构建有重要作用,本文采用高斯核函数,从而得到径向基函数分类器:

基于SVM图像分类的具体过程如下:

(1)训练数据准备

将训练集D中每一类的每一维特征加权,从而得到新的训练集D'={xij'},其中xij'表示如下:

(2)测试数据的准备

将矩阵W的任意一行元素分别乘到对应维的特征上可得到一个新的集合,M行元素即可得到M个集合,其中第p个集合表示为Dp={xij'},其中xij'表示如下:

(3)选择适当的惩罚系数C,通过训练数据对支持向量机进行训练得到分类模型,用于测试这M个测试数据集合,得到M个分类结果。

(4)统计测试的结果,根据投票规则,某个样本落入哪一类的概率最大,我们就把它归到哪一类。最后统计出准确率。

4 实验结果与分析

实验中,我们从COREL图像库中选取10个类别共1000幅图像组成图像数据库,它们包括人物、马匹、花朵、恐龙、大象、雪山风景、建筑物、海边风景、公共汽车、食品等各100幅。随机选取每一类的30幅作为训练数据,剩下的70幅作为测试数据。实验比较在四种图像特征下以及特征综合及特征加权通过支持向量机的分类结果,实验结果如表1所示,其中Histogram代表36维颜色直方图,D-LBP代表16维纹理谱描述符,ColorMoment代表9维颜色矩,GLCM代表8维灰度共生矩阵纹理特征,Histogram&D-LBP代表融合颜色直方图与D-LBP,ColorMoment&GLCM代表融合颜色矩与灰度共生矩阵纹理特征。

表1 图像分类结果

从表1可以看出,由于特征的每一维对分类的重要程度不同,通过加权计算后的分类结果有了明显的提高。同时还可看出,采用不同的底层特征分类结果不同,准确率的高低主要取决于底层特征能不能很好的描述图像的本质特征;另外低层特征的维数也在一定程度上影响着分类结果,但考虑到计算的复杂性问题,所以选取适当的维数是关键;在多种特征综合下比在某一种特征下的分类结果正确率高。

为了进一步验证本文分类算法的性能,我们将其应用到遗迹化石图像的分类中。图像库选择10类遗迹化石图像,每类16幅,共160幅图像,其中部分图像如图1所示。实验中融合颜色直方图与DLBP通过特征加权的方法,对遗迹化石图像进行分类,实验取得了较好的分类结果,分类正确率达到71%。

图1 遗迹化石示例图像

5 结论

本文基于特征加权及支持向量机实现了图像分类,通过比较特征加权和不加权分类的结果,可以看出,采用特征加权地方法有效地提高了图像分类效果。另外,如何有效提取图像特征、如何增加加权效果以及考虑样本对分类的重要程度,通过对样本加权提高分类效果,将是本文进一步研究的内容。

[1] D ong Liyan,Yuan Sensen,Liu Guangyuan,et al.Image classification based on bayesian classifier[J].Journal of Jilin University:Science Edition,2007,45(2):249 -253.(in Chinese)董立岩,苑森森,刘光远,等.基于贝叶斯分类器的图像分类[J].吉林大学学报:理学版,2007,45(2):249-253.

[2] X ie Wenlan,Shi Yuexiang,Xiao Ping.Classification of natural image based on BP neural network[J].Computer Engineering and Applications,2010,46(2):63 -166.(in Chinese)谢文兰,石跃祥,肖平.应用BP神经网络对自然图像分类[J].计算机工程与应用,2010,46(2):63 -166.

[3] Y u Xiaosheng,Zhou Ning,Zhang Fangfang.A KNN based model for automatic image categorization.[J].Zhongguo Tushuguanxuebao,2007,33(167):74 -76.(in Chinese)余肖生,周宁,张芳芳.基于KNN的图像自动分类模型研究[J].中国图书馆学报,2007,33(167):74 -76.

[4] Gao Yonggang,Zhou Mingquan,Geng Guohua,et al.Image classification based on feature selection and SVMs[J].Computer Engineering and Appfications,2010,46(5):169 -172.(in Chinese)高永岗,周明全,耿国华,等.基于特征选择和SVMs的图像分类[J].计算机工程与应用,2010,46(5):169-172.

[5] Wang Keping.Research on key techniques of automatic image annotation[D].Beijing:Beijing University of Posts and Telecommunications,2010.(in Chinese)王科平.自动图像标注的关键技术研究[D].北京:北京邮电大学,2010.

[6] Wang Chenfei,Xiao Shibin.Study of image classification based on SVM[J].Computer and Digital Engineering,2006,34(8):74 -77.(in Chinese)王陈飞,肖诗斌.基于SVM的图像分类研究[J].计算机与数字工程,2006,34(8):74 -77.

[7] S un Junding,Ma Yuanyuan.Summary of texture feature research[J].Computer Systems & Appfications,2010,19(6):245 -250.(in Chinese)孙君顶,马媛媛.纹理特征研究综述[J].计算机系统应用,2010,19(6):245 -250.

[8] W u Xiaosheng.Image retrieval based on texture spectrum[D].Jiaozuo:Henan Polytechnic University,2010.(in Chinese)毋小省.基于纹理谱特征的图像检索技术研究[D].焦作:河南理工大学,2010.

[9] V apnik V.The nature of the statistical theory[M].Zhang Xuegong,Translation.Beijing:Tsinghua University Press,2000.(in Chinese)Vapnik V.统计学理论的本质[M].张学工,译.北京:清华大学出版社,2000.

猜你喜欢
直方图纹理灰度
符合差分隐私的流数据统计直方图发布
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
基于BM3D的复杂纹理区域图像去噪
用直方图控制画面影调
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
基于最大加权投影求解的彩色图像灰度化对比度保留算法
中考频数分布直方图题型展示
基于灰度线性建模的亚像素图像抖动量计算