Lib SVM在彩色图像分类中的应用

2018-09-03 02:30耿艳萍张建英
无线互联科技 2018年16期
关键词:彩色图像纹理灰度

耿艳萍,张建英

(山西大学 软件学院,山西 太原 030013)

图像分类是图像处理的基础,是通过计算机技术定量地分析图像像素和区域,把图像划分为某一类别的技术[1],是计算机视觉领域的核心问题。现实中,有很多不同的实际应用,如人脸识别、视频监控分析、医疗影像分析等。支持向量机(Support Vector Machine,SVM)是机器学习常用方法,其理论基础是统计学习,SVM原理是用分离超平面作为分离训练数据的线性函数,解决非线性分类问题[2]。在图像分类时有很好的效果,尤其是样本数量有限,分类泛化能力更佳[3]。图像分类时,在特征提取方面,单一特征不能获取图像的完整信息,故分类效果比较差。多特征融合,可以获取互补的图像信息,分类效果更佳[4]。在本文中,主要提取彩色图像的颜色特征和纹理特征,在此基础上,采用Lib SVM方法对图像进行分类,不同特征的组合(进行特征融合)及类别数目对分类结果有一定影响,Lib SVM参数的设置对分类结果也有很大影响,本文经过多次实验,获取了最有效的特征组合,和最优参数设置,对分类准确率有了很大的提高。

1 颜色特征

任意获取一幅彩色图像,颜色特征在视觉上是很直观的,是图像的重要性质[5]。本文采用简单有效的方法:颜色矩来描述图像的颜色特征。颜色信息主要集中在低阶矩中,图像中任何一种颜色分量都可用它的一阶矩(均值)、二阶矩(方差)、三阶矩(倾斜度)来描述颜色分布特征。在本文的实验中,图像的颜色特征用9个分量来表示(3个颜色分量RGB,每个分量上3个低阶矩)。如:有N个像素的一幅彩色图像,pi,j表示第i个颜色通道中,灰度为j的像素出现的概论。

公式(1)为一阶颜色矩的计算方法,描述图像颜色明暗度。

公式(2)二阶颜色矩的计算方法,描述图像颜色分布范围。

公式(3)三阶颜色矩的计算方法,描述图像颜色分布的对称性。

2 纹理特征

2.1 Tamura纹理特征

从视觉心理学的角度,Tamura等人提出了6个纹理特征[6]:coarseness(粗糙度),刻画纹理基元(组成纹理的基本单位)的大小和重复次数;contrast(对比度),统计图像的灰度分布情况;directory(方向度),衡量纹理的方向性;rgularity(规则度),刻画纹理的规律性;linkness(线性度);roughness(粗略度),对比度和粗糙度的和。这些纹理特在图像识别、图像合成方面都有很好的应用。

2.2 统计特征

图像的统计特征是对图像的像素分布情况进行统计,从而描述图像的全局信息,常用的统计特征有:熵值、均值、方差等。具体计算方法如下:

公式(4)计算熵值,其中pi为图像中k种灰度值出现的概率。

对于一幅M×N的图像,某一点(i,j)的灰度值用f(i,j)表示,用公式(5)计算图像的灰度算术均值。

公式(6)为灰度方差的计算方法,反映了整幅图像的灰度均值与图像中每一像素灰度值的离散程度。

本实验提取了图像的上述3个统计特征。

2.3 特征融合

本实验所选corel图像库中的图像都是彩色图像,颜色是图像的关键特征,辨识度较高。Tamura特征和统计特征刻画图像其他某方面的特征。本实验中提取了3类图像特征,这些特征对不同类别的图像在分类时所起的作用不同,所以融合不同的特征能提高图像分类的准确度,实验中融合了颜色特征9个,Tamura特征6个和统计特征3个,形成一个能从多方面,多角度描述图像特征的18维综合特征向量T=(C1,C2,C3,C4,C5,C6,C7,C8,C9,T1,T2,T3,T4,T5,T6,P1,P2,P3),对次实验证明多特征融合比单一特征对图像分类更有效。

3 图像分类算法

本实验分类算法的流程如图1所示。

图1 实验分类算法流程

SVM,从样本的特征入手分析对象,预测对象的属性类别。通过支持向量(Support Vector)能够使经验误差最小,几何边缘最大的分类过程[7],其特点在于在某种程度上解决了样本容量小、非线性等分类中遇到的困难,一定程度上解决了分类模型局部最小的问题,提高了分类的精度。

实验中对支持向量机的具体实现采用台湾大学林智仁 教授设计开发的工具包—Lib SVM(Library for Support Vector Machines)—进行图像分类。Lib SVM主要由以下几个函数组成。

(1)svm_scale,对训练数据和测试数据做归一化处理,一般情况,把数据缩放到[-1,1]或[0,1];(2)svm_train,对样本分类建模,提供优化参数;(3)svm_predict,利用上一步已建模型,对测试数据进行分类。

4 实验结果分析

4.1 实验设置

实验从corel图像库中选择花、食物、建筑、大象、车5类图像各80张,并归一化成512×512的图像;其中每一类随机选取40张作为训练集,另外的40张作为测试集。在Win7系统下采用了MATLAB R2016a,Lib SVM-mat-3.0-1,MinGW-64编译器等软件进行实验。

4.2 实验结果

如表1所示,分类正确率=正确分的该类的数目/测试集中该类的总数。

Lib SVM可以实现多分类,图像分类的种类越多时,系统进行分类的难度就越大,分类的准确率就越低。实验中只选两种样本种类(动物类,食物类)时,分类准确率可达100%,当选3种样本种类(建筑类、动物类、食物类)时,识别准确率可达95%,而再加入花和车后,分类准确率明显下降。在corel图像库中,花和食物色彩多样鲜艳,颜色特征对花和食物的分类很有效;建筑类和车类,棱角清晰,线性感较强,Tamura纹理特征对建筑对这两种分类更有效。

表1 分类实验结果

由于训练集数量有限,从训练集提取的特征不能包含后面测试集图像的所有特征,故由训练集得到的分类模型鲁棒性不够强,在实验中当把每类图像的训练集增到60,测试集减少到20时,分类准确率有很大提高。

分类模型参数的设置对分类准确率也有一定影响,经过多次实验,结合参数优化算法,当惩罚系数C=1,核参数g=0.07时,分类效果最佳。

5 结语

多种特征的融合比单一特征,更有助于提高分类准确率,但是也并非特征越多越好,首先,大量增加特征向量的维度,会降低算法的运行效率,准确率却没有明显提高。故在下一步的研究工作中,采用主成分分析的方法降维,去掉特征向量中的冗余信息,采用贡献率高的分类特征[8]。

猜你喜欢
彩色图像纹理灰度
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
基于FPGA的实时彩色图像边缘检测
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
消除凹凸纹理有妙招!
基于颜色恒常性的彩色图像分割方法
基于Arnold变换和Lorenz混沌系统的彩色图像加密算法