徐 亮,史金昌
(黄淮学院 信息工程学院,河南 驻马店 463000)
数字化时代,人们获取、处理数字图像变得越发容易,借助各种图像处理软件可以得到预期效果的各种图像,从而愉悦人们的精神,陶冶人们的艺术情操。先进的技术往往是把“双刃剑”。给人们日常生活或科技研究带来方便的同时也带来许多负面的影响。各种篡改伪造的数字图像将给社会的公正和稳定带来威胁,给政治、经济、文化、新闻和科学的真实性带来极其严重的负面影响。面对网络中大量的篡改伪造图片,目睹数字图像篡改造假事件的不断出现,人们迫切需要权威可信的能够鉴别数字图像真伪的技术。因此,本文研究建立图像真实与否的分类算法,提取能区别正常图像和篡改伪造图像的特征,对图像进行检测。
为了寻求高效、准确、实用的篡改检测技术,研究人员从篡改者的角度研究其篡改的种类、思路和方法。全面、系统、深入的了解对篡改图像的各种方法。分清数字图像伪造篡改的各种手段和具体方法,对构造篡改与取证的博弈模型以及篡改检测算法的提高意义深远。实际应用中,比较常用的篡改过程如图1所示。
图1 图像篡改过程Fig.1 Process of image forgery
关于数字图像的篡改伪造手段,Dartmouth大学的HanyFarid[1]教授将伪造手段分为合成、变种、润饰、增强、计算机生成和绘画6类。周琳娜博士根据自己的研究成果在HanyFarid教授分类的基础上又增加了数字图像版权篡改、二次获取图像和图像携密篡改共九种类型,并将其归类为图像真实性篡改、完整性篡改、原始性篡改和版权篡改4个部分[2]。数字图像都具有图像内容本身、图像的来源、图像的版权3个方面的属性。数字图像的篡改伪造技术也是从这3个方面进行的,一是对图像来源的混淆伪造;二是对数字图像内容的篡改;三是对数字图像版权的篡改。其中,对数字图像内容的篡改伪造是目前最流行、使用最广泛的篡改伪造方法,也是数字图像被动盲取证研究的重点。对数字图像内容的篡改可以归为内容的真实性篡改和内容的完整性篡改两类,如图2所示。
图2 篡改分类模型Fig.2 Tamper classification model
数字图像内容真实性就是图像内容真假的问题。图像篡改者通过相应的企图伪造与原始图像所表达或呈现出不同甚至截然相反的意义。篡改技术包括:图像拼接(复制粘贴、缩放、旋转)、图像润饰(非线性伽马校正、模糊、羽化、锐化、边缘平滑、压缩)、图像增强(色彩、灰度级、亮度、对比度的调整)、变形等。
1)图像拼接是将两幅图像对应且具有一定标志性特征点找出,利用相应的技术将一幅图像中的对象渐变为另具有另一张图像中对象特征的图像。找出两幅图像中的对应特征点是这种篡改手段的关键,然后对两幅图像以不同的权重在对应的特征点上叠加,这样得到的伪造图像就兼有两幅图像的特征。图像拼接技术是图像篡改操作最常见的手段。篡改者选取两幅或两幅以上图像中感兴趣的部分区域,将它们合成一幅图像,以达到篡改者预期的目的和效果。在篡改者实施图像拼合伪造操作的过程中复制粘贴(copy-move)是其必然要用到的方法。然而,不同图像中篡改方感兴趣的区域其大小和角度可能需要调整,这就会涉及到图像的缩放和旋转。无论是复制粘贴、缩放、旋转,在图像拼合的篡改伪造过程中都必然引入原始图像所没有的篡改痕迹和各种统计特征,或者破坏原始图像中固有的自然统计特征。通过对这些特定操作带来的不同痕迹和特征进行提取、比较、分析,可以检测图像内容的真实性甚至定位篡改伪造区域。这在数字图像的被动盲取证领域是普遍采用的方法。
2)图像润饰是一种将图像拼接篡改后,遗留在篡改区域且能直接看出的篡改痕迹消除的技术。这种技术的主要手段是对篡改区域进行模糊、羽化、锐化、柔化、缩放、修补、非线性伽马校正、边缘平滑、压缩等清除因为拼接所带来的伪造痕迹,使图像更具欺骗性。
3)图像增强是一种突出图像中的特殊对象的技术。这种技术的特点是不显著改变图像中的内容,其主要对图像特定对象的对比度、颜色、背景等进行改变,对图像中目标区域或人、物进行突出或者淡化。
4)图像的变形是一种比较特殊的数字图像修改和渐变方法,它是将一个人或者一个物体逐渐演变成另一个人或物的过程,或者形成一个兼有两者形态特征的一个综合体。这类图像修改多见于动画和影视制作中,当然也属于对图像内容的篡改之列。
数字图像内容完整性是指在原始图像上删减或者增加额外的信息或图像区域,有选择有目的的将篡改后的图像内容呈现给图像的接收者。它包括分别对可见信息和不可见信息的篡改。对可见信息的删减和增加,它会让呈现在人们视野下的图像包含或者不包含某种信息。在原始图像中隐藏秘密信息,通过利用原始图像的传播和通信来达到传递隐秘信息的目的,这类操作属于对图像不可见信息的篡改。目前这方面的篡改主要体现在信息隐藏即隐写术领域。这是另一个目前关注度很高并正得到系统研究的学科领域。
从篡改分类的角度可将图像拼接取证包括复制粘贴和旋转缩放,如图3所示。
图3 图像拼接取证技术模型Fig.3 Forensics model of image joining
图像拼接必然要经过复制粘贴,绝大多数为了获得合适大小和角度的感兴趣区域还要经过旋转和缩放。复制粘贴又分为同副图像内的复制粘贴和不同图像间的复制粘贴,同副图像内的复制粘贴必然导致图像数值出现完全相同或相似区域;不同图像间的复制粘贴必然导致不同区域具有不同的来源特征或不同的图像统计特征;而旋转缩放必然导致重采样。所以从这些角度着手可以对拼接篡改进行有效检测。
同副图像内进行复制粘贴,因为图像篡改块来自同一图像,所以在该图像内,一定存在与该篡改块完全相同或者相似的图像区域,研究者目前主要将图像分成不同的区域块,采用匹配搜索的方法对这种类型的篡改进行检测。
不同图像的复制-粘贴篡改是指两张或者多张图像中的不同部分拼接到一张图像上,以达到伪造成是同一个整体图像的效果。这种方式的篡改较copy-move使用的更为广泛,造成的风波会更为人所关注。相比copy-move篡改,由于多幅图像的亮度、光线、色彩等区别较大,因此往往遗留的拼接痕迹会比较明显。篡改者往往会进一步使用边缘模糊等润饰操作,以期消除这样的痕迹。因此,成功的不同图像的拼接篡改都是多种篡改方式合作后的结果。图4为不同图像中的复制-粘帖篡改的一个实例。
检测不同图像间的复制粘贴篡改的方法有:基于光源方向不一致性的方法、基于双相干特征和边缘百分比特征检测的方法和基于图像获取设备不一致的方法。
2.2.1 基于光源方向不一致性的方法
图4 不同图间的篡改图Fig.4 Splicing in the different image
取自两幅或两幅以上图像的区域,其原始光照方向很难具有一致性,因此,估计图像中某一区域或某一物体的光照方向,如果区域或不同物体具有不同的光照方向,可以认为不同区域或物体来源不同,进而鉴定篡改。如MahajanD提出基于球面频率不变量的检测图像的光照一致性方法[3]。但缺点是需要人工提取图像边界且在没有直接光源,比如阴天的条件下是不适用的,另外,其只能估计光源的二维方向,而不是实际中的三维方向[4]。
2.2.2 基于双相干特征和边缘百分比特征检测方法
Ng首先使用双相干幅度和相位特征进行拼接图像检测[5]。将双相干特征直接应用于探测图像拼接效果并不理想,检测精度仅为62%(随机判断的精度为50%)。为了进一步加强检测效率,Ng又提出了两个基本的方法,即刻画对双相干敏感的图像特征和估计拼接不变量[6],并由此导出了3个新的特征:双相干幅度和相位变化的预测残差特征,以及边缘百分比特征。双相干特征结合边缘百分比特征可以显著提高图像拼接的检测准确率,由62%提升至72%。但是该算法中使用的图像数据是128×128的块,而不是一幅完整的、有意义的图像,而且要求拼接图像没有进行后处理操作。
2.2.3 基于图像获取设备不一致方法(不同数码相机)
基于图像获取设备不一致的方法又分为:基于CFA插值一致性的检测方法、基于模式噪声一致性的检测方法、基于相机响应函数一致性的检测方法和基于色差一致性检测方法。
1)基于CFA插值一致性的检测方法 基本思想是使用了某一像素领域内若干像素的真实值通过一定的规则,进行线性或者非线性组合、优化得到插值后的像素值。这种插值使得真实的自然图像每个色彩通道内的像素值之间存在固有的相关性。而篡改拼接图像会破坏这种相关性。基于CFA插值检测的方法具有不错的认证效果,缺点是需要大量训练样本进行训练,但对于高明的伪造者,可以模拟插值来再现这种相关性使上述认证方法失效。
2)模式噪声一致性检测 图像中的噪声分为环境噪声和数码相机的模式噪声(Pattern Noise),环境噪声不容易区别。但不同型号的数码相机具有不同的模式噪声,如果图像中的某一区域的模式噪声不同于其他区域,那么可以认为该区域是被篡改的。这类方法的缺点是检测时需要有照片获取设备或者一些由该设备拍摄的照片。另外,由于硬件的固有特征会受到相机变焦或者曝光程度等影响而难以准确提取。
3)相机响应函数一致性检测
数码相机的数字图像形成过程要采用色彩校正、白平衡、伽马校正等操作,由于不同的相机有不同的响应功能,利用单幅图中不同色彩间的边缘像素反推估计不同区域的响应函数,若结果不一致则可认为图像经过篡改。这类方法的缺点同样是需要有照片获取设备或者一些由该设备拍摄的照片,另外,如果拼接图像是由同一相机甚至同一型号相机拍摄的不同图像拼接而成的,此法失效。
4)色差一致性检测
由于真实场景的光照连续性和数字图像获取设备其光学成像系统的缺陷,图像局部色彩、灰度等会具有一致性的色彩失真。而篡改图像会破坏整幅图像的色差一致性。Johnson提出了一种利用横向色差不一致性的篡改检测方法。如果篡改区域较小,该方法检测效果比较理想,但如果篡改区域较大或者是全局篡改,该方法不理想。
2.2.4 基于统计特征分类的盲检测算法
为了使图像相素没有突变,使照片看起来更加自然,产生数字图像的设备一般都含有光学低通装置,也即相当于对产生的图像进行低通滤波,使之产生的数字图像的相邻像素具有连续性。图像经过简单的复制-粘贴而不经过任何后继的润饰操作,篡改区域的像素边界会产生不连续的变化,因此提取出对边界突变较为敏感的特征来建立检测算法将是一个可行的思路。
Tan-Tsong Ng和Shi-Fu Chang在文献[7]中具体使用了3类5个特征进行训练分类,这3类5个特征分别为:
1)图像双谱的幅值和相角
图像的归一化的双谱的表达式如下:
其中x*表示x的伴随矩阵。相角的熵:
图像经过复制—粘贴操作后,其复制区域边界的不连续会导致该位置图像块双谱幅值的变大,并且该位置的相角会以0和90的整数倍增加。
2)估计原图与检测图的双谱幅值差以及相角差
在盲取证的过程中,往往需要提取多维特征,其中的一些特征对图像篡改前后的变化不敏感,而另一些会有很明显的感应。因此寻找并得到对图像篡改前后较为敏感的特征是检测算法中最重要的一步。经过验证,图像的双谱幅值和相角是很好的可建立检测算法的特征,它们在图像经过篡改操作前后都会有明显的差异。
算法是基于这样的理论依据:假设每一幅待检测图像A都存在一个原图B,A与B大体一致,只是B是数码相机拍摄的原始图像,这样就可以通过比较图像A和图像B的双谱幅值和相角,判断A是否为经过篡改操作的图像。这种方法的很关键的一步是能不能精确估计出原始图,因为在任何的取证过程中,都不可能提供原始图给取证者进行比较。因此,比较实用的方法是将待检测图像分为纹理部分和细节部分,用纹理部分来近似的估计原始图像。则待检测图和原始图的双谱幅值差和相角差的表示为:Δfm=fm′-af m;Δfp=fp-af p,式中的a和b是用fisher线性判决训练得到的,其选择原则是使篡改图和原始图之间的双谱幅值和相角有最大的差值。
3)图像的纹理复杂度
图像背景越复杂,图像的双谱幅值和相角就越大,所以在引入了以上4个特征后,进一步以图像的纹理复杂度作为特征来进行相似重叠块的匹配。这里纹理复杂度主要以图像的边缘相素占总体相素的百分比来表示。图像的边缘是用canny算子进行提取的。
这样,提取出5个对图像复制—粘贴篡改较为有效的特征量,然后用支持向量机对这5个特征量进行训练分类。这种方法可达到72%的正确检测率。
在数字图像篡改检测中,通过对图像特征的提取及分类建立算法,识别出篡改图像和自然图像。此类算法通常采用两种方法对算法分类性能做评价:一种是常用的评价参数TP、TN、Accuracy。其中TP、TN分别表示真实、篡改图像的分类正确率,Accuracy则是算法中最为关注的总体检测正确率。而另一种是用ACU表示ROC(the Receiver Operation Characteristics Curve)曲线下的面积来衡量分类效果。AUC越大,则分类效果越好。针对拼接篡改的检测算法,其检测效果基本能令人满意,复制区域的定位及其检测率能够达到理想的检测结果,甚至复制区域经过边缘模糊、旋转、缩放等后继处理,也能达到很好的检测效果。
虽然目前在数字图像篡改检测上的研究一时成为热点,且已出的成果也很多。就总结目前的检测算法可以看出,虽然研究很多、所得算法也很丰富,但许多现有检测算法的特征组成依赖于图像内容的本身,而图像的来源以及图像本身内容的复杂性,都给取证算法的建立增加了不小的难度,现有综合检测正确率都很难突破90%,这是目前检测算法中一个很难突破的瓶颈。
[1]Farid H.Creating and Detecting Doctoredand Virtual Image:Implications to the Child Pornography Prevention Act[EB/OL].(2012)http://www.ists.Dart-mouth.edu/library/tr-2004-518.pdf
[2]周琳娜.数字图像盲取证技术研究[D].北京:北京邮电大学,2007.
[3]Mahajan D,Ramamoorthi R,Curless B.A theory of frequency domain in variants:spherical harmonic identities for BRDF/lighting transferandimage consistency[J].IEEE Transactionson Pattern Analysisand Machine Intelligence,2008,30(2):197-213.
[4]Lukas J,Fridrich J,Goljan M.Detecting digital image for geriesusingsensorpatternnoise[C]//California,USA:Proceedings of the SPIE:Security,Steganography,and Watermarking of Multimedia Contents.SanJose,2006:362-372.
[5]Ng T T,Chang S F,Sun Q B.Blinddetection of photomontage using higher order statistics[C]//Canada:IEEE International Symposium on Circuits and Systems,2004:688-691.
[6]Ng T T,ChangS F.Blind detection of digital photomontage using higher order statistics[C]//ADVENT Technical Report,Columbia University,2004.
[7]Tian T N,Shih F C.A model for image splicing[C]//Singapore:In IEEE International Conference on Image Processing,2004:1169-1172.