尚文韬
(河南省实验中学,河南 郑州 450002)
一种鉴别数字图像真伪的方法
尚文韬
(河南省实验中学,河南 郑州 450002)
复制图像部分区域粘贴在同幅图像的另外一个地方是图像伪造的常用形式,针对这种伪造目前常用检测方法是块匹配方法。这类方法存在检测速度慢、鲁棒性低等缺陷。为此本文提出了一种新方法,不对图像进行分块,直接从图像中提取SIFT特征,然后通过特征匹配来检测、定位伪造区域。特征数量少,检测效率高,而且鲁棒性强,不仅可以对付噪声、压缩等图像处理,而且可以对付旋转、缩放等几何形变,最后通过实验验证了该方法的有效性。
图像伪造;尺度不变特征变换(SIFT);特征匹配
数字图像篡改伪造的一个常用操作方法就是复制一幅图中的一个区域粘贴在另外一个区域以掩盖被粘贴区域中的人或物体。由于在同一幅图中进行复制粘贴操作不会引起图像在亮度、色彩等方面比较明显的变化,不会引起人们视觉上的怀疑,所以是目前应用较为广泛的篡改方法。
目前对复制粘贴伪造图像甄别检测的依据是检测图像中存在两个或多个相同的区域,因为在自然图像中存在大面积相似区域的概率很小。检测方法主要有块匹配法,此类方法首先对图像以像素为单位进行滑窗分块,用一些图像特征来描述图像块,然后在图像块集合中通过特征匹配搜索相似块,进而检测与定位篡改区域[1]。基于这种块匹配方法框架,目前研究者研究较多的是如何选取图像块的特征,Fridrich等[1]首先利用8×8图像块的64个离散余弦变换(Discrete Cosine Transform,DCT)量化系数作为特征向量,由于向量维度高,检测速度慢,Popescu等[2]对Fridrich等人的算法进行了改进,利用主成分分析方法(PCA)把特征向量降到32维。随后很多学者围绕如何选取维度低的特征对检测算法进行研究,刘美红等[3]利用图像块的分形维数和3个统计量构成4维不变特征,欧佳佳等[4]从灰度共生矩阵中选取8个统计特征作为特征向量。
除了特征维度,分块数量是影响检测速度的关键因素。分块数量对应寻找相似块的搜索空间,搜索空间大,算法时间复杂度高,对此一些学者采用下采样方法缩小图像尺寸来减少分块数量。Li等[5]对待检测图像进行一级离散小波变换(DWT)后,对仅有原图像的小波低频分量进行分块,然后利用奇异值分解(SVD)系数作为图像块的特征。但是这样做使检测精度降低。
当前块匹配方法面临的主要问题是:①每个像素对应一个图像块,每个图像块提取一个特征向量,造成特征向量数量多,搜索空间大,特征匹配效率低;②图像特征鲁棒性不强,目前常用特征如DCT系数,PCA降维系数等,这些特征对压缩和噪声等一般的图像处理具有一定的鲁棒性,但是对于几何变换稳定性较差,如果图像或复制区域发生了偏移或旋转,很难再匹配。
本文利用尺度不变特征变换(Scale Invariant Feature Transform,简称SIFT)从图像中提取SIFT特征,通过特征匹配检测图像中是否有复制粘贴区域[6]。SIFT特征鲁棒性强,可以抵抗一般的图像处理和几何变换,而且不需要对图像进行分块,避免分块引起的问题。直接从图像中提取SIFT特征进行匹配,特征向量数量少,可以有效提高匹配效率。
1.1 SIFT特征及其特性
SIFT算法是一种基于高斯尺度空间理论提取图像局部特征点的算法,在尺度空间寻找局部极值点,提取尺度和方向不变的局部特征。SIFT提取图像局部特征的过程是:①尺度空间局部极值检测;②特征点选择;③指定方向;④局部特征描述[6]。
SIFT特征包括特征点和特征向量两部分,特征点用(x,y,σ,θ)表示,其中(x,y)是在特点图像平面的位置,σ是高斯尺度空间的尺度维,θ指的是主方向。每个特征点对应一个特征向量,特征向量的维数是128。SIFT特征点和特征向量对噪声和压缩等信号处理和几何变换具有稳定性。除此之外SIFT特征还具有一些其他特性:
1.1.1 SIFT特征的鉴别性高
特征的鉴别性是指即使纹理特征非常相像,但是不相同的内容,提取的特征也是不一样的。在自然图像中树和草地具有相像的纹理特征,但是从不同区域提取的SIFT特征是不一样的。
图1是SIFT特征鉴别性测试实例,图1中树的纹理特征非常相像,特别是图像块A和B、C和D的纹理特征和结构更是相像。为了测试,从图1(a)的A、B、C、D四个区域分别提取SIFT特征,然后对A和B、C和D区域的特征分别进行匹配,没有得到一个匹配点对,如图1(b)所示。由此可以看出SIFT特征的鉴别性强,在检测复制和粘贴区域时,不会因相似的纹理结构而产生误判。
1.1.2 SIFT特征的鲁棒性强
图像即使经过平滑、加噪、旋转和尺度缩放,SIFT特征匹配得依然很好,图2是一个测试例子。在图2(a)中左上角的图像是从右图中截取的一部分,但是这部分图像被旋转了10°并缩小了10%。从这两个图中提取SIFT特征并进行匹配,左图中提取了319个特征,右图中提取了3818个特征点,匹配的特征点是185个点对,匹配率达60%,匹配结果如图2(b)所示。从实验可以看出,即使经过几何变形,SIFT特征也可以很好匹配,可以有效对付几何变换,鲁棒性强。
1.2 基于SIFT的复制-粘贴伪造鉴别方法
1.2.1 方法步骤
基于SIFT特征匹配的复制-粘贴伪造鉴别方法的主要步骤包括:①从待检测图像中提取SIFT特征;②对这些特征进行相互匹配;③根据匹配结果确定复制-粘贴区域。如果两个SIFT特征匹配,则在对应的两个特征点之间进行连线,同时在特征点周围3×3区域进行标注。
特征匹配就是针对某一特征搜索它的最近邻和次近邻,因此高效的搜索算法是非常必要的。搜索算法有穷举搜索、kd-tree搜索和BBF(Best-Bin-First)搜索。穷举搜索是一种最简单的搜索方法,但是搜索效率低,其计算量和特征点的个数为指数关系。kd-tree能够高效搜索最近邻的一般规则是:如果特征向量的维数是d,特征点个数是N,只有满足条件N>>2d才能达到高效的搜索。而SIFT特征是128维,一幅图像提取的特征点的数量一般是几千到几万,无法满足这个条件。针对高维数据BBF算法[6]对kd-tree搜索算法进行了改进,主要改进了树结构的遍历策略,确保优先检索包含最近邻点可能性较高的空间,因此其搜索效率高,本文选用BBF算法作为搜索算法。
1.2.2 与同类方法比较
基于特征匹配的伪造鉴别算法,在设计算法时不仅考虑检测精度,而且要考虑检测速度。特征提取和匹配占用整个算法过程的大部分时间。本文提出的方法和经典的算法在512×512大小的图像上进行了比较,比较内容包括选用特征、特征向量的个数和维数以及检测精度,具体内容见表1。
从表1可以看出本方法的特征向量数量远远小于其他算法,这将大大减少算法的运行时间,而且检测精度较其他算法高。
为了验证本方法的有效性,对一些图像进行复制-粘贴修改,然后用本文方法进行检测,检查结果如图3和图4所示。图3中分别是原始图像、修改图像、匹配结果和检测结果。修改图像是对原始图像进行了两处复制-粘贴,匹配结果图是复制粘贴区域特征的匹配情况,对于匹配的两个特征其特征点之间用线连接,检测结果图是在匹配的特征点周围3×3区域进行标注。从实验结果看本文方法可以对多处伪造修改进行准确定位。
图4的修改图像对原始图像中人物不仅进行了复制-粘贴,而且在粘贴之前对复制内容进行了旋转和缩小。从实验结果看,本文方法可以对这些带有几何变换的修改进行有效检测和定位。
因为SIFT特征具有很好的鲁棒性和鉴别性,本文利用SIFT特征和基于BBF方法的特征匹配方法,搜索和定位同幅图像中复制-粘贴区域,得到了良好的真伪检测结果,不仅能检测到复制-粘贴区域,而且在复制区域被信号处理甚至几何变化都能有效检测到。但是如果复制区域是平滑区域,本方法检测效果不好,因为从平滑区域无法提取足够数量的SIFT特征,所幸平滑区域的隐藏能力很弱,一般人不会复制平滑区域去覆盖另外一个区域的图像内容。
[1] J.Fridrich,D.Soukal,J.Lukas.Detection of copy–move forgery in digital images[C].In Proceedings of Digital Forensic Research Workshop,Cleveland,OH,USA,August 2003:55-61.
[2] A.Popescu,H.Farid.Exposing digital forgeries by de⁃tecting duplicated image regions[R].Technical Report TR 2004-515,Department of Computer Science,Dartmouth Col⁃lege,2004.
[3] 刘美红,徐蔚鸿.基于分形和统计的复制—粘贴篡改图像的检测[J].计算机应用,2011,31(8):2236-2239.
[4] 欧佳佳,蔡碧野,熊兵,等.基于灰度共生矩的图像区域复制篡改检测[J].计算机应用,2011,31(6):1628-1630.
[5]Li G H,Wu Q,Tu D.et al.A sorted neighborhood approach for detecting duplicated regions in image forgeries based on DWT and SVD[C].In Proceedings of 2007 IEEE International Conference on Multimedia and Expo.Beijing,China:IEEE,2007:1750-1753.
[6] D.G.Lowe.Distinctive image features from scaleinvariant keypoints[J].International Journal of Computer Vision,2004,60(2):91-110.
A M ethod for the Identification of the Authenticity of Digital Images
ShangWentao
(Henan ExperimentalMiddle School,Zhengzhou Henan 450002)
It is a common form of image forgery to copy imageand then paste it on the other part.In thisway,the commonly used detection methodis a block matchingmethod.Thismethod has the defects of low detection speed and low robustness.This paper presents a new method,which does not block the image,but extracts the SIFT features directly from the image,and then detects and locates the forged region by featurematching.The features are small,the detection efficiency is high,and the robustness is strong,which can not only can deal with the noise,compression and other image processing,but also can deal with the rotation,scaling and other geometric deformation.Finally,the effectiveness of thismethod is verified by experiments.
image forgery;scale invariant feature transform(SIFT);featurematching
TP391
A
1003-5168(2015)06-0001-4
2015-5-20
尚文韬(1997-),男,河南省实验中学高三学生,研究方向:数字图像处理。