杨婧譞
摘 要:为解决传统图像拼接检测算法对图像内容、光照变化等鲁棒性不强问题,提出一種基于多种纹理特征融合的图像拼接检测方法。对二维灰度图像执行非下采样轮廓波变换(NSCT),以获得包含图像纹理特征的一系列子带图像。对在水平和垂直方向进行差分处理的低频子带图像以及4个高频图像,获取韦伯局部描述符(WLD)纹理和局部三值模式(LTP)纹理。将WLD纹理与灰度共生矩阵结合,得到像素点强度、梯度与灰度之间的关系;再将LTP纹理与灰度共生矩阵结合,得到无噪声和光照影响的像素点灰度间关系;最后分别提取WLD值共生矩阵和LTP值共生矩阵的对比度、相关性、相异度、熵、能量等5个特征,并融合成特征向量,使用RBF神经网络分类。该方法在哥伦比亚彩色图像库上检测准确率达到了95.7%。
关键词:复合纹理特征;非下采样轮廓波变换;韦伯局部描述符(WLD);局部三值模式(LTP);灰度共生矩阵;图像检测
DOI:10. 11907/rjdk. 182731
中图分类号:TP317.4文献标识码:A文章编号:1672-7800(2019)001-0178-05
Abstract: Aiming at the problem that traditional image splicing detection algorithm is not robust to image content and illumination change, an image splicing detection method based on multi-texture feature fusion is proposed. In this method, non-subsampling contour wave transform (NSCT) is performed on two-dimensional gray images to obtain a series of sub-band images with image texture features. Then the low frequency sub-band images were processed in the horizontal and vertical directions, and the four high frequency images were used to obtain the Weber local descriptor (WLD) texture and local three-valued model (LTP) texture. Then WLD texture and gray level co-occurrence matrix are combined to obtain the relationship among pixel intensity, gradient and grayscale; LTP texture and grayscale co-occurrence matrix are combined to obtain the relationship among the noiseless pixels affected by light. Finally the five features including WLD value symbiosis matrix, LTP co-occurrence matrix phase contrast ratio, correlation, entropy and energy are extracted and integrated into feature vectors. RBF neural network is employed for classification.
0 引言
随着计算机产业蓬勃发展以及智能手机广泛普及,图像处理的软硬件变得容易获得和使用,如Photoshop、美图秀秀等。修图成为人们的一种日常休闲娱乐,而轻而易举篡改图片也给图谋不轨的人创造了机会。近年来确实频频出现篡改或伪造图像被应用于新闻媒体、科学发现、摄影比赛和法庭物证等案例,无疑极大影响了社会稳定性。因此,在人们无法通过肉眼识别图像真实性的情况下,检测图像真实性的技术变得尤为重要。
目前,数字图像篡改检测主要分为主动取证和盲取证两类[1]。前者主要通过检测事先在图像中添加的数字签名、数字水印鉴别图像真实性[2]。后者主要通过检测图像内容以检测图像本身的真实性。相比之下,被动取证(盲取证)并不需要提前对图像进行任何处理,因此它更具有应用价值。
在被动取证研究中,图像拼接检测是目前研究热点之一,它将同一图像或不同图像上的某一区域剪切并粘贴到另一图像的某一区域,而不进行任何修饰。图像纹理特征提取方法作为识别拼接篡改图像的关键步骤,也是众多学者不断研究的重点。
针对该问题,近年来,相关学者纷纷对较具代表性的局部相位量化(LPQ)、韦伯局部特征(WLD)、局部二值模式(LBP)和基于二阶概率密度统计的灰度共生矩阵(GLCM)等4种局部纹理特征提取方法进行了改进[3]。其中,Saleh 等[4]用多尺度 WLD 对图像拼接进行检测,在3个不相似邻域内计算梯度定向和激励信息,合并该邻域直方图从而得到多尺度的WLB直方图,最后依据该直方图特征用相应分类器实现对拼接图像的检测。Verma等[5]证明了局部三值模式(LTP)能很好地描述图像统计特征和结构模式。Hashmi等[6]通过融合DCT、LBP和Gabor等3种纹理特征,实现对拼接图像的识别。而李燕等[7]通过局部二值模式(LBP)与共生矩阵相结合方式,将描述每个像素之间的关系拓展到描述整个灰度空间的相关特性,但基于LBP本身依旧存在局限性,仅描述了图像细节特征与每个像素点及周围8个像素点之间的相关性,而忽略了噪声干扰以及像素点的强度特征、梯度特征、灰度—梯度空间特征等。
因此,本文提出基于局部三值模式(LTP)、WLD与灰度共生矩阵相结合的复合特征对拼接图像进行检测,实验表明该方法对拼接图像的检测准确率有较大提升,并且对光照、噪声、旋转有很好的鲁棒性。
1 基本原理
1.1 局部二值模式(LBP)与局部三值模式(LTP)
LBP 是描述灰度图像纹理特征的算子,主要在提取图像局部区域的对比度特征方面起到辅助作用[8]。LBP 算子仅比较像素值的大小而忽略了像素间的对比度值,无法描述该类非线性变化前后的差异,最终可能会丢失一些重要纹理特征。
LTP 算子扩展了 LBP 算子并采用三值编码,它对光照变化和噪声等方面更加鲁棒,并增强了局部纹理特征的分类性能[9]。在LTP运算器量化级中,添加-1值模式及用户定义的阈值t,并且将映射在[-t,t]区间中的像素差值量化为 0 值,大于该间隔的差值被量化为1,小于该间隔的差值被量化为-1,S([gi-gc])变换为三值编码形式,具体定义如下[10]:
正LBP编码:将不为1的编码值均修改为0。负LBP编码:将为-1的编码值修改为1,其余变为0。
以图1为例,中心像素点的正LBP编码为00010001,正LBP编码值为25-1+1=17。负LBP编码为10100010,负LBP编码值为28-1+26-1+22-1=162。
LTP 通过对 LBP扩展以表示图像的局部形状、微量特征和纹理,并且通过用户定义的阈值t增加一个编码模式, 极大增强了对噪声的敏感度,且在一定程度上均衡了剧烈光照变化下的像素值。综上所述, LTP 改进和完善了 LBP,并通过增强对图像噪声的鲁棒性及对剧烈光照变化的均衡能力,有效提高了 LTP 特征的分类性能。
1.2 韦伯局部描述符(WLD)与共生矩阵
韦伯局部描述符是一种计算简便、高效且健壮的局部描述符[11]。它包含两个部分:差别阈限、方向。对于输入图像中的每个像素点,计算特征的两个组成部分,通过统计所有像素点的值,可以得到一个用以描述输入图像的特征直方图。
式(5)中,[?I]表示增量阈值(可引起注意的差异值),I表示初始刺激强度,[k]表示即使I變化,等式左侧的比率也将保持恒定。该比值被称为韦伯分数。事实上,韦伯定律表明刚好可被注意到的差异值在原始刺激强度值中占有一个恒定比例。
WLD则使用邻域强度差和当前像素强度比作为图像局部特征,WLD描述符由两部分组成:[ξ]是韦伯公式的比值,用于描述周围像素变化与当前像素的比值,如式(6)所示;θ是当前像素的梯度方向,用来描述垂直方向与水平方向像素变化的比值,如式(7)所示。
差励反映了当前像素与相邻像素之间的差异,能够获取图像局部区域的变化情况。对于图像中任意一个像素点,即可计算出该点的差励值(见图2)。
2 改进复合特征模型
2.1 算法整体流程
基于复合纹理特征的图像拼接检测算法整体流程如图4所示。
2.2 拼接检测框架
3 实验结果与分析
下文对试验数据集进行介绍,并使用提出的复合特征方式进行拼接检测测试,使用不同参数进行测试,以获取最佳参数值,并与基于残差图的LBP与灰度共生矩阵融合的拼接检测算法进行对比。实验环境为Matlab2014b,实验机器为Intel(R) Core(TM)i7-3630QM CPU2.4GHz。
3.1 数据集选择与训练
本文选择哥伦比亚彩色拼接检测数据集进行测试[16]。该测试集中图像大小范围从757*568到1 152*768,格式为未压缩的TIFF或BMP。拼接图像的创建使用真实图像并且没有任何后期处理,真实图像中包含完整的EXIF信息。首先选择180张篡改图片和92张真实图片,以7∶3分为训练集和测试集。
实验中主要使用查全率、查准率以及准确率3个参数衡量算法性能。查全率(Recall) 计算公式为R=TP/TP+FN,查准率(Precision)计算公式为P=TP/TP+FP,准确率(Accuracy,ACC)计算公式为ACC=(TP+TN)/(TP+FN+FP+TN)。其中,TP 表示被正确识别的真实图像数量,TN表示正确识别的篡改图像数量,FP 表示被误判为真实图像的数量,FN表示被误判为篡改图像的数量[17]。
3.2 实验结果分析
3.3 鲁棒性测试
为了验证本文算法对光照、噪声、旋转的鲁棒性,选取哥伦比亚图库中部分图片,对图像进行质量压缩、亮度增强、减弱、加噪、旋转等操作后,使用本文算法进行检测。将图片压缩到不同程度并进行20次测试,结果如表2所示。可以看出,当压缩质量为90%时,降低了非下采样轮廓波高频分量的影响,进而使复合纹理特征更为突出,准确率最高达到97.7%。同时对图像不同亮度变化进行测试,实验结果如表3所示,光照在一定范围内时,算法识别效果稳定,但是光度过强或者过暗时,影响图像特征提取,识别率下降。对于噪声测试,本文对原图像进行不同程度加噪,结果如表4所示,在加噪10%~30%的情况下,算法准确率相对稳定,加噪达到50%时,准确率明显下降。最后对图像进行多角度旋转测试,结果如表5所示,算法体现出很好的稳定性。
4 结语
本文通过改进已有算法并且使用多纹理特征融合的方式对拼接图像进行检测,在哥伦比亚拼接图库上准确率达到了95.7%。此外,在鲁棒性测试中本文方法可以很好地抵抗噪声、光照等因素干扰。但是,算法对于不同图库的鲁棒性不高,其原因可能是在提取纹理特征时,为降低算法复杂度,仅对通过NSCT变换得到的低频子带图像进行差分处理,而放弃了本身携带纹理信息较少的高频子带图像,从而带来一定误差,使得图像内容的影响不能被完全消除,进而造成对于不同图库鲁棒性不强的问题。未来将在消除图像内容影响、提取拼接痕迹方面作更进一步研究,从而提高算法准确性和在不同图库中的鲁棒性。
参考文献:
[1] 张震,边玉琨,康吉全,等. 一种新的拼接图像检测方法[J]. 计算机应用研究,2009, 26 (3):1127-1130.
[2] 陈园园,于在河. 数字图像被动取证技术综述[J]. 吉林大学学报:信息科学版,2014,32(6):689-698.
[3] 石泽男. 基于局部纹理特征的数字图像拼接盲鉴别算法研究[D]. 长春:吉林大学,2017.
[4]MUHAMMAD H,SAHAR Q,GEORGE B,et al. Evaluation of image forgery detection using multi-scale Weber local descriptors[J]. Artificial Intelligence Tools,2015,24(4):416-417.
[5] VERMA M, RAMAN B. Local tri-directional patterns: a new texture feature descriptor for image retrieval[J]. Digital Signal Processing,2016,51:62-72.
[6] HASHMI M F,KESKAR A G. Image forgery authentication and classification using hybridization of HMM and SVM classifier[J]. International Journal of Security & Its Applications,2015,9(4):125-140.
[7] 李燕,钟磊,李健. 基于LBP和共生矩阵的图像拼接篡改检测[J]. 武汉大学学报:理学版, 2015, 61 (6):517-524.
[8] JIN H,LIU Q,LU H,et al. Face detection using improved LBP under Bayesian framework[C]. IEEE First Symposium on Multi-Agent Security and Survivability,2004:306-309.
[9] TAN X,XU T,TAN X,et al. Enhanced local texture feature sets for face recognition under difficult lighting conditions[J]. IEEE Transactions on Image Processing,2010,19:1635-1650.
[10] JALA T,PETIKAINEN M,MAENPAA T. Multiresolution gray scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(7):971-987.
[11] CHEN J,SHAN S G,HE C,et al. WLD:a robust local image descriptor[J]. IEEE TPAMI,2010,32(9):1705-1719.
[12] JAIN A K. Fundamentals of digital signal processing[M]. New Jersy:Prentice-Hall,1986.
[13] 朱正禮,赵春霞,侯迎坤,等. 基于多特征的旋转不变纹理图像检索[J]. 南京理工大学学报,2012,36(3):375-380.
[14] 雷升锴,刘红阳,何嘉,等. 动态K-均值聚类算法在RBF神经网络中心选取中的应用[J]. 信息系统工程,2011(6):83-85.
[15] 王奇平,王祯璋. 基于径向基神经网络的变压器故障诊断方法研究[J]. 电力与能源,2017,38(5):546-548.
[16] COLUMBIA DVMM RESEARCH LAB. Columbia image splicing detection evaluation dataset[EB/OL]. http://www.ee.columbia.edu/ln/dvmm/downloads/authsplcuncmp/.
[17] 王任华,霍宏涛,蒋敏. RANSAC算法在同图复制鉴定中的应用研究[J]. 计算机应用研究,2014,31(7): 2209-2211.
(责任编辑:何 丽)