基于支持向量机的相关反馈图像检索算法研究

2015-05-30 10:48雷雯魏星
智能计算机与应用 2015年6期
关键词:反馈支持向量机主动学习

雷雯 魏星

摘 要:相关反馈技术和主动学习的提出,缩小了图像低层特征与高层特征的语义鸿沟,进一步提高了检索准确性。支持向量机应用在图像检索中,以所需图像特征作为训练样本数据,通过选取合适的核函数以及相关参数设置构建分类器,对测试样本进行分类,从而检索出相似度更接近的图像。本文融合了图像颜色与纹理综合特征,通过支持向量机学习机制构造分类器,并引入主动学习,实现图像检索。实验表明,引入主动学习可提高检索准确性。

关键词: 图像检索;反馈;支持向量机;主动学习;分类器

中图分类号:TP391.9 文献标识码:A 文章编号:2095-2163(2015)06-

Abstract: Relevance feedback technology and active learning proposed reduce the image low-level features and high-level features of the semantic gap, further improve the retrieval accuracy. Support vector machine in image retrieval, image feature desired as training data, by selecting the appropriate kernel and related parameters set to build a classifier, to classify the test samples,thereby to retrieve an image closer similarity. This article combines the image color and texture synthesis features, classifier is constructed using support vector machine learning mechanism, and by the introduction of active learning, realize image retrieval. Experimental results show that the introduction of active learning can improve the retrieval accuracy.

Key words: Image Retrieval; Feedback; SVM; Active Learning ;Classifier

0 引 言

支持向量机在解决小样本分类问题中存在一定技术优势,因而被应用在图像检索中。为了缩小高层特征与低层特征的语义鸿沟,有关反馈的算法即已应用在图像检索中。涉及的研究有:郭士会提出基于FSVM的相关反馈检索算法[1],采用语义相关矩阵提高查询准确度;欧阳军林等提出用先验知识的Boosting方法与SVM相结合[2],有效解决了SVM存在样本数量少、反馈准确率低的问题;郭金旭等提出基于多类SVM相关反馈算法,检索准确性优于传统SVM算法[3];针对标注样本不足,鲁珂提出近邻保留回归算法[4],解决了过适应问题;符保龙提出基于改进布谷鸟搜索算法的相关算法,较遗传算法、粒子群算法有较高的准确度[5]。

本实验融合了图像的颜色与纹理综合特征,根据检索结果,选择不同数量的正负例图像作为训练样本,以支持向量机学习算法构造分类器,并引入主动学习进行再反馈。实验表明,主动学习可提高检索准确性,能够满足用户的不同需求。

1 特征提取

1.1颜色特征

顏色矩[6]于1995年由Stricker和Orengo首次提出,是一种简单且有效的图像颜色特征描述方法。图像的颜色分布信息主要集中在低阶矩中,因此,图像的颜色特征可采用颜色直方图的一阶矩、二阶中心矩和三阶中心矩来表示。相对于颜色直方图,该提取方法的优点是不需对颜色空间进行量化,且颜色特征维数降低。式(1)就是颜色矩的三个低阶矩:

1.2 纹理特征

图像的纹理可理解为多个奇异点的连接组成的边界,而小波变换能够有效检测图像的边界和奇异点[7]。因此,可用于提取图像的纹理特征。小波变换是指将信号分解为一系列的子函数,表达为一种子函数累加的形式。小波变换需要有二维小波函数和尺度函数才能应用在图像处理中,二维小波变换往往通过可分离变量的方法由一维小波函数和尺度函数构造。尺度函数和小波函数也可以理解为一个伸缩和平移的基函数,该基函数沿着图像的水平方向和垂直方向滤波和采样,得到一个含带四子图的系数矩阵,对其中的逼近子图不断进行滤波与采样,可构成多尺度的小波分解。采用小波变换表示图像纹理特征是由每个小波分解层上能量的分布信息予以实施和呈现,即均值与标准方差。使用均值与标准方差的分量构成纹理特征向量实现纹理特征的检索。目前,Haar小波变换,Daubechies小波变换方法等易受到图像尺寸的限制,Dwong等人[8]提出的一种进行多分辨率分析的W变换克服了尺寸限制,可进行整幅图像的检索,实验表明该方法精确、有效。为了获得更好的检索效果,往往采用小波变换结合其他技术的方法。为了实现简捷品质,本实验采用MATLAB软件中自带了小波函数。

2 相关算法

2.1 SVM

支持向量机是建立在统计学习理论上的分类算法,较神经网络分类器算法,其在求解最优值时不易陷入局部最优解。通过选择合适的惩罚系数和核函数,可获得更优分类面。因此,在解决小样本问题中存在独有优势。在训练小样本情况下, 不需要特定问题的先验知识,就可以切实良好地控制学习机器的推广能力,因此在图像检索中可以有效提高检索准确性[9]。SVM在解决分类问题上往往都是低维空间不可分,因此,需要引入核函数在高维空间实现可分。核函数在一定程度上影响检索准确性[10-11]。工作中多采用LIBSVM工具[12],常用的核函数有线性核、多项式核和RBF核,一般选择RBF核即径向基核函数。

2.2 SVM训练步骤

SVM训练步骤详细如下:

(1)采用多特征融合的低层特征对待检索图像进行相似度测量;

(2)对检索结果进行正例图像和负例图像的标记,得到相关图像集和不相关图像集;

(3)构造样本训练集 ,其中, 代表样本图像的特性向量,如式(3)所示; (3)

(4)对训练样本进行学习并构造分类器如式(4)所示:

(5)对于正类样本的图像,分别计算每幅图像的子图到分类面的距离,取其中最大的距离作为该图像到分类面的距离。正类图像的特征向量 到分类面的距离可表示为 ,即如式(5)所示:

(6)计算待检索图像与剩余图像的距离,按照距离大小排序,最终返回检索结果。

2.3 主动学习

主动学习的思想就是学习机在已知的测试样本集中自动选择学习样本,具体就是在反馈过程中由算法自动选择供用户标记的样本,通过用户的检索结果判断用户的检索意图,为用户提供一些歧义性较大的反馈样本[13]。在这些样本中,标记出感兴趣与不感兴趣的样本,经过如此反复操作,歧义性大的图像就排在后面,在反馈给用户的结果中与待检索图像的相关图像就越多,更加符合了用户的查询需求。相似度测量方法较多,常用的有欧式距离等,文献[14-15]采用了EMD距离,文献[16]在此基础上提出了相应的改进,使检索率有了一定的提高。实验中采用EMD-CkNN距离测量方法。

3 实验分析

本实验采用微软的Corel图像库,包含20类的2 000张图片,每类100张。实验分别选取标记正负例样本图像数量为5、10、20、30、40、50、60、70。为了测试方便,正负例图像数量完全一样。同时为了测试主动学习对检索结果的影响,采取了同样的测试方法。抽取同一幅待检索图像,随机测试8组实验,对比效果如表1所示。

通过表1可知,选择反馈图像的数量越多,检索准确率并不一定随之增加。为了获得更为科学的对比结果,这里采用测试100组求均值的方法,对比结果如图1所示。

从图1结果可以看出,在相关反馈中加入主动学习可以提高检索准确性。通过引入主动学习,在每次检索结果中显示歧义较大的图像范围内,选择感兴趣与不感兴趣的图像作为反馈的样本图像集,如此即使得样本图像集在进行支持向量机学习中,会获得最优分类面,从而将不同类图像尽可能最大程度地实现分离。研究将获得更加符合用户意愿的检索结果,因此解决了在大量图像数据库中快速准确地检索到用户所需图像重点内容难题,满足用户的不同需求。研究可知,在实际的应用中,可通过加入主动学习来提高检索准确性。

4 结束语

支持向量机作为一種相关反馈算法,将分类问题转换为在线性条件下的凸二次优化问题,找到的极值点都是全局最优点[18]。主动学习的引入,运用人机协同工作缩小了语义鸿沟,检索结果更加符合用户的检索意图,同时提高了检索准确性。

参考文献:

[1] 郭士会,杨明,王晓芳等.基于FSRM的相关反馈图像检索算法[J].计算机科学,2012,39(6A):540-542.

[2] 欧阳林军,刘建勋,曹步清.基于LBSVM机器学习的相关反馈图像检索[J].计算机工程与应用,2009,45(2):112-115.

[3] 郭金旭,王昱.基于多类SVM相关反馈技术的研究[J].华中师范大学学报(自然科学版),2008,42(2):354-357.

[4] 鲁珂,赵继东,丁正明等.一种基于近邻保留的相关反馈图像检索算法[J].计算机科学,2012,39(1):281-284.

[5] 符保龙,张爱科.基于改进布谷鸟搜索算法的相关反馈图像检索[J].电视技术,2014,38(3):39-42.

[6] 肖秦琨,刘米娜,高嵩.基于颜色和纹理特征的遥感图像检索[J].计算机技术与发展,2013,23(4):107.

[7] ALEXANDROV A D. Adaptive filtering and indexing for image databases[J].SPIE,1995,2420:12-23.

[8] DWONG M K.W-transform method for feature-oriented multiresolution image retrieval[J]. SPIE,1999,2941:1086-1095.

[9] Vapnik V.The Nature of Statistical Learning Theory[M].New York: Springer Verlag,1995,11-14.

[10] 奉国和.SVM分类核函数及参数选择比较[J].计算机工程与应用,2011,47(3):126-127.

[11] 汪延华,陈峻婷.核函数的选择研究综述[J].计算机工程与设计,2012,33(3):1181-1185.

[12] 王慧勤,雷刚.基于LIBSVM 的风速预测方法研究[J].科学技术与工程,2011,11(22):5440.

[13] 彭晏飞,尚永刚,王德建.一种新的基于SVM和主动学习的图像检索方法[J].计算机工程与科学,2014,36(7):1372-1376.

[14] 李展,彭进业. 温超.基于EMD距离的多示例聚类[J].计算机科学,2011,38(7):235-238.

[15] 王宇凡,梁工谦,张淑娟.基于相似度量的模糊支持向量机算法研究[J].微电子学与计算机,2014,31(4):112-115.

[16] 李大湘,彭进业,贺静芳.基于EMD-CkNN多示例学习算法的图像分类[J].光电子激光,2010,21(2):301-305.

[17] 冯伟兴,梁洪,王臣业.Visual C++数字图像模式识别典型案例详解[M].北京:机械工业出版社,2012:97.

猜你喜欢
反馈支持向量机主动学习
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
对“未来教室”的初步探索
高中生物教学中学生主动学习策略研究
数字电路课程的翻转课堂教学及调研
试论高中生物教学中学生主动学习的措施
《个人理财》教学中,发挥学生主体地位的路径研究
媒介融合背景下的分众传播与受众反馈
基于支持向量机的金融数据分析研究