汪辉进
(池州职业技术学院 信息技术系,安徽 池州 247000)
基于敏感部位图像特征的提取方法研究
汪辉进
(池州职业技术学院 信息技术系,安徽 池州 247000)
随着互联网高速发展,一些敏感图像信息也在网络上广泛传播,如何对这些敏感图像进行有效自动识别,净化网络环境已成为计算机领域的重点研究课题.通过对常用图像分割算法k-means算法、k-means++算法探讨,提出敏感图像敏感部位的特殊构造形态,构建彩色变柱宽多分辨率直方图矩特征,有效的表示了敏感部位的颜色和纹理信息.采用敏感部位特征视觉词汇和聚类算法计算的视觉词汇形成混合视觉词汇表,并使用词袋模型建模,在图像识别阶段使用基于RBF核的SVM分类器.实验结果显示该方法有效地提高了敏感图像的识别效果.
敏感图像;聚类算法;词袋模型;图像识别
截至2016年12月,我国共查处180.1万件色情信息.由此可见互联网+时代,色情图像与视频、即时通讯软件、社交软件、网络直播平台等,这些敏感部位的图像越来越引起人们的关注.为此,如何让互联网环境变成绿色的、健康的信息通道,是我们信息领域科研人员所要研究的重点课题.经过大量调查研究,发现如何对网络敏感图像进行匹配和识别是学者们共同研究的重要内容,研究人员主要是通过图像分割技术来对人脸和皮肤等区域进行有效识别[1].Liao等[2]人使用小波多尺度进行分析局部图像信号特征,来提高图像精密结构,提高了图矩特征对图像的要求.由于受图像清晰度影响性较大,图像一旦受到外界干扰,其识别率会下降,鲁棒性也差.
本文通过研究局部图像的特征方法来进行探讨k-means算法,进一步对敏感部位patch特征值进行提取,建立混合词汇表的词袋模型,通过实验比对来进行分析:
局部图像特征的提取主要应用在图像的匹配和检索中,一般随着物体灯光、噪声的干扰,会引起局部图像的灰度明暗变化,所以运用角点来进行提取也是不错的方法.文献[3]利用Harris算法进行角点特征提取,其利用局部图像与邻近像素点灰度之间的差值,检测角点上各个特征点的一阶导数矩阵.广泛用于物体目标跟踪、目标匹配、重建3D等领域.图像分割从字面简单理解就是将一张图像分割成小的,互不相交的区域的集合.通过这些小的区域的像素的聚类过程,可以通过常用的边缘方法和区域方法解决,这里主要探讨基于区域的图像分割方法--k-means算法.
通常,人们根据样本间的距离或者相似性来定义聚类,即把相似的(或距离近的)样本聚为同一类,而把不相似的(或距离远的)样本归在其他类.算法主要思想:
(1)聚类的中心点由每个聚类子集中的数据均值来表示;
(2)通过迭代过程把数据集划分为不同类别;
(3)使得评价聚类性能的准则函数达到最优,从而使生存的每个聚类内紧凑,类间独立.
图1 松散不同聚类效果图
如图1所示,三个不同的聚类效果不同,根据欧式定理,一般样本距离越小,相似性度越高,差异性也越小;样本距离越大,相似度越差,差异性也越大.因此,可采用局部区域进行划分.
k-means算法作为计算机图形图像领域最常见迭代算法之一,由于它的普遍性,它通常被称为k-均值算法,它也被称为Lloyd算法.给定一个初始集的K均值M1(1),…,MK(1),该算法通过两个步骤迭代进行:
步骤一:每个聚类就是最小聚类组内距离的平方和.
其中每个xp被分配到一个确定的S(t),即它可能被分配到两个或两个以上.
步骤二:计算在新簇中心的方法为:
由于算术平均采用的是最小二乘法来进行计算,因此最大限度地减少了聚类内的平方和.
该算法收敛时,分配不再改变.通过两步来优化聚类内的平方和,针对有限数量的这种分割情况下,该算法一定能收敛而达到局部最优.但该算法不能保证全局也是最优的.因此对该算法加以改进,用最近距离的聚类子集来分配方案,就是利用“最小平方和”,也等同于分配最小欧氏距离算法.
给定一组数据值(x1,x2,…,xn),其中每个都是一个 d维实向量聚类,k-均值算法旨在划分K(≤n),S={S1,S2,…,Sk},用以减少聚类内的平方和(即方差).可得:
其中ui是Si簇点的平均值.这相当于在同一簇点中最小化误差平方和:
因为总方差为常数,这也相当于在不同的聚类之间计算机最大误差的平方积.
k-means算法聚类过程如图2所示:
图2 k-means算法聚类示意图
(1)K初始值(以K=3为例)随机生成的数据区域(分别用红、绿、蓝色表示)即初始聚类中心.
(2)k样本集按最小距离来创建关联的每一个最近聚类,可用Voronoi图所产生的方法来表示.
(3)每个k聚类中样本均值将成为新的均值,即为新的聚类中心.
(4)重复步骤(2)和(3),直到聚类中心达到收敛为止.
由于它是一个启发式算法,不能保证它会收敛到全局最优,其结果可能会依赖于初始聚类.通过相关研究可知,初始聚类选不好,结果有可能不理想.因此,众多学者对算法加以改进,比如k-means++算法,其初始化就将K个聚类中心间距离设置最大化,其新聚类中心点的选择,一般选取距离最近聚类中心点较大的点作为新的聚类中心.一般k-means算法需要手工进行初始值的配置,很多时候难以确定初始值的大小情况下,就选择用k-means++算法来解决,进行设置不同的聚类中心点,来达到满意的效果.因此,k-means算法与k-means++算法是常用来进行聚类研究的重要算法.
本文提出一种基于敏感部位颜色纹理特征和视觉词袋(Bag of Visual Words,BOW)模型的敏感图像识别方法,是将敏感图像的敏感部位特征信息和词袋模型结合起来,对图像直接进行规则网格划分,采用手工标记敏感图像敏感部位,以提取彩色变柱宽多分辨率直方图矩特征(Color Variable Binwidth Multiresolution Histogram Moments,CVB-MHM),形成敏感部位视觉词汇表.然后利用聚类方法获取视觉词汇表组合,建立混合视觉词汇表并使用视觉词袋模型来表示,再运用SVM分类器对敏感图像进行识别.其优点CVB-MHM特征能有效地表示图像局部块的颜色和纹理特征,并且计算迅速,特征维度小,能稳定高效地识别敏感图像信息.
人体敏感部位的识别对于敏感图像识别有着关键作用,采用边缘检测[4]等方法进行敏感图像敏感部位提取已经取得了一定的效果.考虑到使用特定算法进行敏感部位提取会产生误差,针对词袋模型的特点,直接采用手工标记人体敏感部位:在训练图像中随机抽取一定数量的敏感图像进行密集patch提取,根据图像内容,用矩形区域标记敏感部位所包含的所有patch,并提取每个patch的颜色和纹理特征(采用2.2节提出的CVB-MHM特征).则该敏感部位的特征F为所有patch特征{fi}ni=1的加权平均值:
特征权值计算如下:
其中(x0,y0)为敏感区域中心坐标,(xi,yi)为对应的patch中心坐标.对于固定边长的矩形区域,其对应的权值是确定的.敏感部位的特征提取如图3所示:
图3 敏感部位patch特征提取
词袋模型已经广泛应用到图像检索中,大部分词袋模型的图像检索、识别方法都采用固定视觉词汇表大小的聚类方法,本方法针对敏感图像识别的特点,提出基于混合词汇表的词袋模型,并使用两种提取词汇表的方式:
一是提取敏感部位patch特征值,形成视觉词汇表Ts.在训练图库中,随机抽取若干幅敏感图像,采用3.1节的方法确定每幅图像的敏感部位patch特征.每一个敏感部位的patch特征对应一个视觉词汇,将所有随机抽取的敏感图像的敏感部位特征值组合成视觉词汇表Ts.
二是采用聚类方法确定视觉词汇表Tc.抽取一定数量的训练图像组成验证集合SVLD和视觉词汇表提取集合SVW,在验证集合SVLD上对视觉词汇表大小V进行最优验证,使用取得最佳识别效果的视觉词汇表大小V为聚类算法的中心数目,提取SVW中的所有密集patch的特征,采用K-Means算法进行V个类别的聚类,将计算出的V个中心作为视觉词汇表Tc.
图4 混合词汇表的词袋模型敏感图像识别
将Ts和Tc组合成混合词汇表TH=Ts∪Tc,用于最终的词袋模型.基于混合词汇表的词袋模型敏感图像识别如图4所示.
对于CVB特征,下面可以通过实验数据来验证该算法改进的有效性,在互联网上,图库1随机下载4000张正常图像和2000张敏感图像进行特征值提取.图库2随机价值2000张正常人像和抽取2800张Corel图库来增加图像识别难度.如图5所示,两组图库,通过两组实验均提取100个敏感部位视觉词汇组成Ts.
实验一:通过互联网随机下载图像进行比对固定柱宽直方图矩特征和变柱宽多分辨率直方图矩特征在两个图库上的识别效果,实验采用的混合视觉词汇表词袋模型,Tc的视觉词汇个数固定为200.实验一特别较多的选择人物图像,主要比较CVB-MHM特征较MHM特征在敏感图像识别上性能的提升能力.
实验二:通过互联网进一步比对,针对实验二的实验数据较多地加入其他非人图像来增加识别难度,判断敏感图像是否还能进行有效地识别,从而分析其敏感部分图像的识别能力.
图5 图库1和图库2图像示例
在两组试验中,均采用图像的多分辨率分解级数为3,并使用两种不同的CVB-MHM特征,第一种CVB-MHM特征的柱宽设置为={1,4,16},第二种CVB-MHM特征的柱宽设置为={2,8,32},采用的分类器为基于RBF核的SVM分类器.实验时,在训练图像中随机抽取100幅敏感图像和100幅正常图像作为验证集合.实验结果的采用查准率、查全率进行比较分别如图表1、图表2所示.
图表2 图库2比较
实验一的结果如图表1所示.采用了较多人物图像来进行敏感部位的识别,CVB-MHM特征的图像识别结果要明显好于固定柱宽的MHM特征,在图库1上,={2,8,32}的CVB-MHM特征可以达到94.25%的查全率,b→={1,4,16}的CVB-MHM特征也能达到87.15%的查全率,相比CMHM固定柱宽直方图矩82.15%,有了较大提升.其查准率b→={2,8,32}={1,4,16}分别为 94.82%和 97.92%,也高于 CMHM固定柱宽直方图矩91.79%.
实验二的结果如图表2所示.加入较多其他图像进行识别,采用了CVB-MHM特征的图像识别结果也明显好于固定柱宽的MHM特征,结果也达到了较为满意地实验效果,在图库2上,b→={2,8,32}的CVB-MHM特征的查全率可以达到77.7%略高于也高于CMHM图矩77.15%,={1,4,16}的CVB-MHM特征可以达到81.30%的查全率,相比CMHM,提高比较明显.在查准率方面={2,8,32}={1,4,16}分别为83.37%和82.04%,相比CMHM固定柱宽直方图矩78.21%有了较大提升.
通过上述两组实验,大家不难发现,基于CVB-MHM特征混合词汇表词袋模型的敏感图像识别方法无论在查准率和查全率上都有了不错的改进.另外,由于CVB-MHM特征,不需要计算图像的梯度,因此计算量比较小,更有利于敏感图像的实时识别,因此,这种简单而快速的识别方法,将能够得到很好的应用.
本项研究的敏感图像敏感部位特征提取与彩色变柱宽多分辨率直方图矩特征图像识别方法,针对敏感图像敏感部位的特殊构造形态,构建彩色变柱宽多分辨率直方图矩特征,进行图像的颜色及结构信息的表示.通过对敏感部位patch特征提取,并采用混合词汇表词袋方法对敏感图像建模,对于网络中敏感图像的识别效果优于原始多分辨率直方图矩.其中针对词袋模型可不需要分割图像、不需要复杂的数学统计算模型的特征,因此总体计算量小,应用于图像识别的效果好,利用上述方法还可用于相关计算机图像分割和处理方面,如卫星遥感图像、电子地图、人脸识别等方面,并且还可结合其他模型如空间金字塔匹配对图像进行建模,也是有效地可选用的方法,所以应用前景广阔,具有较大推广价值.
〔1〕A N Ganar,C S Gode,S M Jambhulkar.Enhancement ofImage Retrievalby Using Colour,Texture and Shape Features[C]//International Conference on Electronic Systems,Signal Processing and Computing Technologies,2014:251-255.
〔2〕Liao L,Zhang Y,Maybank S J,et al.Image recognition via two-dimensional random projection and nearest constrained subspace[J].Journal of Visual Communication&Image Representation,2014,25(5):1187-1198.
〔3〕Chris Harris,Mike Stephens,A Combined Corner and Edge Detector,4th AlveyVision Conference,1988:147-151.
〔4〕吴翔,于微波,马艳辉,刘克平.一种新的改进 Canny图像边缘检测算法[J].影像科学与光化学,2016,34(1):116-121.
TP391.4
A
1673-260X(2017)11-0011-03
2017-07-09
安徽省高校优秀青年人才支持计划重点项目(gxyqZD2016530);2016年安徽省高等学校省级质量工程项目精品资源共享课程(2016gxk099);安徽省高等学校省级重点教学研究项目(2012jyxm695,2012jyxm697,2015jyxm528);2016年池州职业技术学院质量工程项目(2016jyxm07)