赵 洁,郭继昌
(1.天津大学电子信息工程学院,天津300072;2.天津城建大学计算机与信息工程学院,天津300384)
基于JPEG系数变化率的图像复制粘贴篡改检测
赵 洁1,2,郭继昌1
(1.天津大学电子信息工程学院,天津300072;2.天津城建大学计算机与信息工程学院,天津300384)
针对JPEG图像的复制粘贴篡改方式,提出单一流程的被动检测方法,实现了同幅图像复制粘贴篡改和异幅图像合成篡改的检测定位.该算法判断篡改图像是否为JPEG格式.对于JPEG图像,读取图像文件中存储的量化表和JPEG系数;对于非JPEG图像,进行特定质量因子的JPEG压缩转化为JPEG格式篡改图像.将JPEG格式篡改图像进行特定质量因子的JPEG压缩,计算每一个图像子块两次压缩间的JPEG系数变化率,得到JPEG系数变化率图像JCCR.对JCCR图像进行归一化处理,实现篡改区域的检测定位.实验结果表明,采用该算法可以有效地检测JPEG图像复制粘贴篡改的多种情形,与最近的同类方法相比,具有较高的鲁棒性和检测召回率.
复制粘贴;篡改检测;JPEG图像;被动取证
在过去的近10年中,数字取证作为一个新兴的研究领域正在逐步发展起来,帮助公众重建对数字媒体的信任.以数字水印为代表的主动取证技术由于需要预先在图像中嵌入标识信息的缺陷而限制了其广泛应用.图像被动取证技术由于不需要事先在图像中嵌入认证信息的独特优势成为国内外数字取证领域的研究热点,发表在IEEE和Elsevier会议和杂志上的相关论文数量逐年上升,2012年达到了近百篇之多[1].
复制粘贴操作是一种最常见的图像篡改方式,通常指复制一幅图像中的某个区域,然后粘贴到同一幅图像不相交的特定区域中,从而实现伪造场景或掩盖目标的目的.对于两幅图像形成的合成篡改方式,本质上是复制粘贴操作,本文将上述2种篡改方式统一称为广义的复制粘贴篡改方式,提出一种非监督的图像篡改检测定位方法.目标是在未知任何关于待检图像篡改类型先验知识的前提下,采用单一检测流程实现广义的复制粘贴篡改图像的检测.
JPEG是目前主流的图像压缩标准,针对JPEG图像的被动取证研究具有更强的现实应用价值[2].JPEG压缩采用图像分块离散余弦变换(discrete cosine transform,DCT),在量化后各个子块边缘大量的高频分量会丢失,造成解码图像中块的边界处出现不连续的块效应现象.块效应现象可以看作JPEG图像中一种特殊的不可见水印,并且可以通过检测这种特殊水印的完整性和连续性实现篡改检测[3].Luo等[4]提出块效应特征矩阵(blocking artifact characteristics matrix,BACM)对于原始JPEG图像会呈现出对称形状,可以通过检测BACM对称性的变化实现篡改检测,然而该方法仅仅适用于原始JPEG图像经历裁剪和再次JPEG压缩的情况.一幅完整的原始JPEG图像一般采用统一的量化表进行编码,因此图像中DCT系数不一致的区域可以认为是拼接区域,Hamdy等[5]通过估计JPEG图像中的量化表实现上述检测思想.该方法仅对于2幅具有不同质量因子的JPEG图像合成为一幅BMP格式图像的情况有效,无法处理双重JPEG压缩的情况.Barni等[6]提出2种基于双重JPEG压缩和图像分割的复制粘贴篡改检测方法,然而这2种方法不仅检测效率低,而且由于部分篡改图像中的篡改区域很难被有效分割,严重影响了该算法的检测性能.Ye等[7]利用DCT系数直方图的功率谱来估计JPEG图像的原始量化表,根据可疑图像不同区域块效应测度值的不同定位篡改区域.该算法只能手动选择用于估计量化矩阵的区域,无法实现自动定位篡改区域.Li等[8]提出块效应网格的提取算法,通过检测背景区域与篡改区域块效应网格的错配现象实现JPEG篡改图像的检测定位,然而该方法主要存在2个问题:1)检测结果受图像内容本身纹理边缘分布的影响很大,尤其是强边缘以及周期性线边缘使篡改区域的定位效果较差;2)算法只适用于JPEG质量因子较低的高压缩图像,对于轻度压缩的高质量图像无效.近年来,Amerini等[9-14]提出很多图像复制粘贴篡改的检测方法,虽然这些方法在一定程度上增强了对复制区域几何变换攻击的鲁棒性,然而它们仅仅对同幅图像复制粘贴篡改方式有效,并且检测结果只能标识出篡改图像中成对的相似区域,不能有效地定位篡改区域.Liu等[15]在文献[8]方法的基础上,结合分割图像的局部噪声差异特性,实现了广义的复制粘贴篡改图像的检测定位,然而该方法仅对JPEG格式的篡改图像有效.Li 等[3]通过计算待检图像与不同质量因子下再次JPEG压缩图像分块绝对差分的平均和,提出JPEG图像之间复制粘贴篡改的检测方法,然而该方法对于复制源图像和背景图像质量因子相等的情况无效,并且需要遍历不同的质量因子对待检图像进行多次JPEG压缩,影响了检测效率.王浩明等[16]通过分析二次压缩DCT系数直方图的特点,将JPEG篡改图像的检测转化为对图像子块一次压缩与双压缩的判别,从而实现对篡改区域的检测定位.当两次压缩的质量因子差值<5时,该算法的检测率很低.
本文在详细分析JPEG图像复制粘贴篡改模型的基础上,利用JPEG系数的变化规律,提出非监督的单一流程被动检测方法,实现了同幅图像复制粘贴篡改和异幅图像合成篡改的自动检测定位.
考虑复制粘贴篡改过程中采用的JPEG格式图像以及篡改方式的差异性,JPEG图像复制粘贴篡改过程一般可以分为8种情形,如表1所示.
1)载入一幅JPEG图像作为背景图像(质量因子为Qb),从另一幅JPEG图像(质量因子为Qf)中复制部分区域,粘贴到解压缩后的背景图像中的特定区域,并将篡改图像保存为JPEG格式图像(质量因子为Qs)——情形1,或者将篡改图像保存为非压缩格式图像——情形2.
2)载入一幅JPEG图像作为背景图像(质量因子为Qb),从其他非压缩格式图像中复制部分区域,粘贴到解压缩后的背景图像中的特定区域,并将篡改图像保存为JPEG压缩格式图像(质量因子为Qs)——情形3,或者将篡改图像保存为非压缩格式图像——情形4.
3)载入一幅非压缩格式图像作为背景图像,从另一幅JPEG图像(质量因子为Qf)中复制部分区域,粘贴到背景图像中的特定区域,并将篡改图像保存为JPEG格式图像(质量因子为Qs)——情形5,或者将篡改图像保存为非压缩格式图像——情形6.
表1 JPEG图像复制粘贴篡改模型Tab.1 Forgery model of copy-paste forgery with JPEG images
4)载入一幅JPEG图像(质量因子为Q),解压缩后复制部分区域并粘贴到同一幅图像中不相交的特定区域,并将篡改图像保存为JPEG格式图像(质量因子为Qs)——情形7,或者将篡改图像保存为非压缩格式图像——情形8.
2.1算法检测原理
假设JPEG图像记作Jn(n=1,2,…),其中n为图像被JPEG压缩的次数.比如,J1表示图像是一幅单次压缩的JPEG图像,J2表示图像经历了两次JPEG压缩过程.Sn为Jn中非零JPEG系数的个数(这里JPEG系数是指JPEG图像文件中存储的量化DCT系数),Dn(n=1,2,…)为Jn与Jn+1之间相异JPEG系数的个数,Cn为Jn与Jn+1之间的JPEG系数变化率,且Cn=Dn/Sn(n=1,2,…).
对于篡改情形1,背景区域和篡改区域都经历了双重JPEG压缩过程.一般来说,背景区域两次压缩的块效应网格是对齐的,即经历了对齐的双重JPEG压缩过程,而篡改区域经历了非对齐的双重JPEG压缩过程.这是由于为了使篡改图像更加逼真,篡改者会更加注重篡改区域与相邻背景区域图像内容上的统一,而无暇顾及两者DCT块网格位置上的对应关系.当然,篡改区域有可能与背景区域的块效应网格完全对应,但这种情况的发生概率仅为1/64,实际检测中的影响可以忽略不计.
为了分析方便,采用一幅512×512的非压缩彩色Lena.tif图像作为案例素材,来详细说明本文算法的检测原理.如上所述,情形1中的背景区域经历了对齐的双重JPEG压缩过程,而篡改区域经历了非对齐的双重JPEG压缩过程.下面对篡改后的JPEG图像再进行一次JPEG压缩操作,分析JPEG系数变化率C2的变化规律.
将彩色Lena.tiff图像进行第1次压缩(质量因子为Q1)后形成背景区域Rb1或篡改区域Rf1.首先考虑Rb1作为背景区域时经历对齐双重JPEG压缩的情况,将Rb1直接进行第2次压缩(质量因子为Q2)后形成篡改图像中的背景区域Rb2.然后考虑Rf1作为篡改区域时经历非对齐双重JPEG压缩的情况,将Rf1剪切x行y列(x=0,1,…,7;y=0,1,…,7,且x与y不同时为0)后再进行第2次压缩(质量因子为Q2)后形成篡改图像中的篡改区域Rf2.然后对Rb2和Rf2分别进行一次JPEG压缩(质量因子为Q3),分别取Q1=75,Q2=90,考察Q3为50~100时以步长为2进行变化时C2的变化趋势,如图1(a)所示.对于篡改区域,记录的数据为63种非对齐双重JPEG压缩下C2的平均值.从图1(a)可以看出,当Q3=90时C2达到接近于零的最小值,这说明当Q3=Q2时JPEG系数几乎没有变化.当Q3<Q2时背景区域的C2很快收敛到1(当Q3=86 时,C2=0.8952;当Q3=84时,C2=0.937 9;当Q3=82时,C2=0.999 3),而篡改区域的C2变化相对比较缓慢(当Q3=86时,C2=0.3061;当Q3=84 时,C2=0.510 3;当Q3=82时,C2=0.5480,A∈{30×30,50×50,100×100}),即当Q3=86、84、82时背景区域和篡改区域的C2具有明显的可区分性.基于以上实验观察可知,当背景图像与复制源图像的JPEG质量因子相等,甚至是同幅图像的复制粘贴篡改时,可以通过将Q3遍历可能的取值后计算图像分块的C2,进而比较各图像块归一化的C2来实现篡改区域的定位.
对于异幅图像的合成篡改,背景图像与复制源图像的质量因子一般不相等.重复上述实验过程,得到背景区域Rb2(Q1=75,Q2=90),而对于篡改区域,则取Q1=85,Q2=90,得到篡改图像中的篡改区域Rf2,此时得到C2的变化趋势,如图1(b)所示.图1(b)中C2的变化趋势与图1(a)几乎相同.由此可知,情形1中背景区域Qb和篡改区域Qf的差异与算法的检测性能无关,对于异幅图像的合成篡改,可以利用Q3<Q2时C2收敛速率的不一致性来实现背景区域和篡改区域的区分.
对于篡改情形3,背景区域经历了对齐的双重JPEG压缩过程,而篡改区域只经历了1次JPEG压缩过程.将彩色Lena.tiff图像进行第1次压缩(质量因子为Q1)后形成背景区域Rb1,第2次压缩(质量因子为Q2)后形成篡改图像中的背景区域Rb2.将彩色Lena.tiff图像进行1次压缩(质量因子为Q2)后形成篡改区域Rf1.然后对Rb2和Rf1分别进行一次JPEG压缩(质量因子为Q3),这里取Q1=75,Q2=90,得到背景区域的JPEG系数变化率C2和篡改区域的JPEG系数变化率C1的变化趋势,如图2所示.由于情形3中复制源图像为非压缩格式,即篡改区域只经历了1次JPEG压缩过程,因此此时只能得到C1.从图2可以看出,背景区域和篡改区域的C的变化趋势类似于图1,可以利用Q3<Q2时C收敛速率的不一致性来实现背景区域和篡改区域的区分.
图1 情形1中背景区域与篡改区域C2值的变化规律Fig.1 Change rule of value C2in background region and forgery region of scenario1
图2 情形3中背景区域与篡改区域C值的变化规律Fig.2 Change rule of value C in background region and forgery region of scenario 3
对于篡改情形5,背景区域只经历了1次JPEG压缩过程,而篡改区域经历了非对齐的双重JPEG压缩过程.将彩色Lena.tiff图像进行1次压缩(质量因子为Q2)后形成篡改图像中的背景区域Rb1.将彩色Lena.tiff图像进行第1次压缩(质量因子为Q1)后形成篡改区域Rf1,考虑Rf1作为篡改区域时经历非对齐的双重JPEG压缩的情况,将Rf1剪切x 行y列(x=0,1,…,7;y=0,1,…,7且x与y不同时为0)后再进行第2次压缩(质量因子为Q2)后形成篡改图像中的篡改区域Rf2.然后对Rb1和Rf2分别进行一次JPEG压缩(质量因子为Q3),这里取Q1=85,Q2=90,得到的背景区域的JPEG系数变化率C1和篡改区域的JPEG系数变化率C2的变化趋势如图3所示,这里记录的数据为63种非对齐双压缩下C2的平均值.从图3可以看出,此时背景区域和篡改区域的C值变化趋势几乎重合在一起,不具有区分性.对于第5与第6种篡改情形,采用本文算法无法进行检测.
下面对第2和第4种篡改情形进行分析.情形2中待检测图像是非压缩格式,其他完全类似第1种篡改情形.情形4中待检测图像是非压缩格式,其他完全类似第3种篡改情形.首先将非压缩格式的待检测图像进行质量因子为Q*的JPEG压缩,得到JPEG格式的篡改图像,然后如上述情形1与情形3中的分析进行后续检测.由于Q*较小时会破坏JPEG系数变化率的差异性,通过反复实验,对于第2种与第4种篡改情形,若Q*为Q*∈[90,95]的整数值,则采用本文算法均可以实现上述相同的检测性能.
图3 情形5中背景区域与篡改区域C值的变化规律Fig.3 Change rule of value C in background region and forgery region of scenario 5
第7和第8种篡改情形属于同幅图像的复制粘贴篡改方式,它们分别类似于第1和第2种篡改情形中当Qb=Qf时的情况,此时篡改区域与背景区域的块效应网格一般会发生非对齐的错配现象.如图1所示的算法可以利用Q3<Q2时C2收敛速率的不一致性来实现背景区域和篡改区域的区分.
通过上述实验分析可以得出结论:篡改区域经历的非对齐的双重JPEG压缩在效果上等同于一次JPEG压缩,而背景区域经历了对齐的双重JPEG压缩过程.两者对于再次压缩操作的JPEG系数变化率表现出不同的响应特性,可以利用上述变化规律定位篡改图像中的篡改区域.
2.2 算法检测流程
1)判断待检测图像是否为JPEG格式.对于JPEG图像(记为Js),则读取Rdiff图像文件获得量化DCT系数矩阵qdcts和JPEG压缩的量化表,进而计算得到质量因子Qs;对于非压缩格式图像,则首先以质量因子Q*进行JPEG压缩,得到JPEG图像Js,然后读取量化DCT系数矩阵qdcts.
2)将JPEG图像Js再次进行质量因子为Qrs的JPEG压缩,得到JPEG图像Jrs,尺寸为M×N,读取Jrs的量化DCT系数矩阵qdctrs.根据反复实验可知,Qrs取[Qs-8,Qs-4]中的整数.
3)用一个尺寸为b×b的滑动窗口从图像Jrs的左上角到右下角每次滑动一个像素点进行扫描,从而把Jrs分为(M-b+1)×(N-b+1)个重叠的图像块Bij,其中(i,j)为Bij左上角的像素坐标值.
4)对于Jrs中的每个图像块Bij,计算Js与Jrs两次压缩的JPEG系数变化率C:C=D/S,从而生成一幅C值图像,尺寸为(M-b+1)×(N-b+1).其中,D表示Bij对应的qdcts与qdctrs之间相异JPEG系数的个数,S表示Bij对应的qdcts中非零JPEG系数的个数.
5)将C值图像进行归一化处理,生成JPEG系数变化率图像JCCR.观察得到的JCCR图像,确定待检测图像是否经历篡改操作,并定位篡改区域.归一化处理有助于肉眼更加清晰地观察到步骤4得到的C值图像中是否存在篡改区域.若JCCR图像中存在某个闭合区域Rdiff的亮度明显小于同幅JCCR图像中的其他大部分区域,则可以认为JCCR图像中区域Rdiff对应的原始图像区域为篡改区域.
实验中选取的非压缩图像均来自于McGill Calibrated彩色图像数据库[17]和Kodak彩色图像组[18],尺寸分别为768×576像素和768×512像素.利用Matlab将非压缩格式图像另存为不同质量因子的JPEG图像,然后采用Photoshop软件进行复制粘贴篡改操作,篡改图像存储为TIF格式;同时,利用Matlab将TIF格式图像压缩另存为不同质量因子的JPEG格式篡改图像.实验运行环境为Windows 7操作系统,Intel酷睿i3-3240T2.9 GHz CPU,4 GB内存,Matlab R2013a平台.通过反复实验发现,滑动窗口越大,检测到的篡改区域边缘越模糊,而滑动窗口越小,则易受噪声影响并降低了检测效率.为了平衡这两方面的影响,实验中选取滑动窗口大小为b=12.
3.1 性能评价指标
在实际应用中,要评价一种篡改图像检测算法的性能优劣,最重要的是考察算法对篡改图像和真实图像的辨识能力.采用Christlein等[19]定义的图像层面上2个评价指标来评估本文算法的检测性能.实验中需要记录一些重要的观测量,包括:正确检测的篡改图像数目TP、真实图像被错误检测为篡改图像的数目FP以及错误漏检的篡改图像数目FN.根据上述观测量,可以得到2个检测性能评价指标:准确率p和召回率r,分别定义为
p表示算法检测为篡改的一幅图像是篡改图像的概率,r表示一幅篡改图像被算法检测到的概率.准确率和召回率越同时接近于1,表明算法的检测性能越好.
3.2 各种篡改情形的检测实例
下面给出第1种与第2种篡改情形的检测实例.图4(a)显示了一幅原始JPEG图像A,质量因子为65.如图4(b)所示为一幅篡改图像,它是将另一幅质量因子为80的JPEG图像中的鳄鱼对象与另一幅质量因子为85的JPEG图像中的海鸥对象分别复制粘贴到A中特定区域生成的,并且分别将篡改图像另存为质量因子为95的JPEG格式和TIF格式.如图4(c)所示为取Qrs=90时JPEG格式篡改图像的JCCR检测结果图像,如图4(d)所示为取Q*=90,Qrs=84时TIF格式篡改图像的JCCR检测结果图像.可以看出,JCCR检测结果图像中的2个闭合暗区为篡改区域.
下面给出第3种与第4种篡改情形的检测实例.图5(a)显示了一幅原始JPEG图像B,质量因子为80.将另一幅TIF格式的非压缩图像中的垃圾桶对象复制粘贴到B中的草坪上,分别将篡改图像另存为质量因子为95的JPEG格式和TIF格式,如图5(b)所示.如图5(c)所示为取Qrs=90时JPEG格式篡改图像的JCCR检测结果图像,如图5(d)所示为取Q*=90,Qrs=84时的TIF格式篡改图像的JCCR检测结果图像.可以看出,本文算法对于篡改情形3和情形4具有较好的检测效果.
图4 篡改情形1和情形2的检测实例Fig.4 Detection example of forgery scenario1 and scenario2
图5 篡改情形3和情形4的检测实例Fig.5 Detection example of forgery scenario 3 and scenario 4
给出同幅图像复制粘贴篡改的检测实例.图6(a)显示了一幅原始JPEG图像C,质量因子为75.将C中右侧的房屋复制,按照高度1.3倍、宽度1.4倍进行放大,并且施加水平镜像操作后粘贴到最右侧的岩石上,同时将C中灯塔的眺望台复制,按照高度0.8倍、宽度0.9倍缩小且经过30°旋转后粘贴到左侧房屋的屋顶上,分别另存为质量因子为95的JPEG格式和TIF格式的篡改图像,如图6(b)所示.如图6(c)所示为取Qrs=90时JPEG格式篡改图像的JCCR检测结果图像,如图6(d)所示为取Q*=90,Qrs=84时TIF格式篡改图像的JCCR检测结果图像.从图7(c)、(d)可以看出,JCCR图像中存在亮度明显小于周围区域的2个闭合区域,即为检测到的篡改区域.从检测结果来看,采用本文算法可以有效地检测同幅图像复制粘贴的篡改方式,并且可以抵抗多区域篡改、小尺寸篡改以及复制区域的复合几何变换攻击.图7的篡改图像中存在较大面积的平坦区域,如天空、海洋以及中间位置的白塔等,因此JCCR检测结果图像中的相应位置会出现一些虚警块,然而它们属于零散的、非闭合的噪声区域,可以通过后续的滤波算法进行滤除,不影响本文算法对篡改区域的检测定位.
3.3 算法检测性能评
为了进一步评估算法的有效性,设计以下2组实验.第1组实验的目标是评估算法对于第1~4种篡改情形的有效性,第2组实验是评估算法对于同幅图像中复制粘贴篡改方式的有效性.
图6 同幅图像复制粘贴篡改检测实例Fig.6 Detection example of copy-paste forgery in one image
1)第1组实验.从McGill Calibrated彩色图像数据库[17]随机选取120幅TIF格式的图像,大小均为768×576像素.将120幅非压缩图像平均分成6 组,分别采用不同的质量因子Q∈{55,65,75,85,95,100}进行JPEG压缩,从而得到6组JPEG图像.对于每组20幅JPEG图像,通过在每一幅图像中的随机位置选取50×50像素大小的正方形区域进行复制并粘贴到每组JPEG图像中任意10幅图像中的随机位置生成篡改图像,总计得到20×10× 6×6=7200幅篡改图像,并分别保存为质量因子为Qs的JPEG格式(情形1)和TIF/BMP等非压缩格式(情形2).2组特定质量因子的复制源图像与背景图像(Qf-Qb)形成的合成篡改图像共有200幅,加上120幅未篡改的JPEG图像,一起组成Qf-Qb合成篡改图像的测试集.对于篡改情形1,当JPEG质量因子Qs=95时,Qrs可取[87,91]中的整数,实验中取Qrs=90,检测的准确率和召回率如表2和3所示.对于篡改情形2,只需取Q*=Qs=95转化为篡改情形1.篡改情形3实质上是表2和3中复制源图像的质量因子Qf=100且背景图像的质量因子Qb≠100时的情况.对于篡改情形4,只需取Q*= Qs=95转化为篡改情形3.
图7 同幅图像不同复制粘贴篡改方式的检测召回率Fig.7 Detection recall rate of different copy-paste forgeries in one image
对照表2和3可以看出,当Qb<Qs=95时,检测准确率和召回率均较高,都在84%以上.尤其当Qb≤75时,检测性能达到最优,并且随着Qb的增大,准确率和召回率均降低,当Qb≥95时检测性能出现陡然降低.这说明算法最适合背景区域的质量因子与合成图像的质量因子相差较大的情况.当Qf=100且Qb≠100时,对应于篡改情形3和情形4,可以看出,当Qb≤85时,准确率和召回率几乎都在88%以上.另外,可以观察到,当Qb≤85时,随着Qf的增大,准确率和召回率均略有增高的趋势,但检测性能相差较小.当Qs<Qb即合成图像的质量因子小于背景图像的质量因子时,由于背景区域本身的JPEG系数特征被掩盖,导致检测性能大大降低.
2)第2组实验.下面通过第2组实验,评估本文算法对于同幅图像复制粘贴篡改方式的有效性.将Kodak彩色图像组[18]中的24幅PNG格式的真彩色图像分别采用不同的质量因子Q∈{50,60,70,80,85}进行JPEG压缩,总计生成24×5=120幅JPEG图像.将每幅JPEG图像分别施加以下5种复制粘贴操作,并分别保存为TIF格式和JPEG格式(随机质量因子Qs∈{85,90,95})的篡改图像.a)简单复制粘贴(包括多区域复制粘贴):在随机位置复制尺寸A∈{30×30,50×50,100×100}的正方形区域并粘贴到不相交的随机位置处,未进行任何后处理操作;b)复制区域旋转:旋转随机角度φ∈{3°,5°,10°,15°,30°,60°,90°,180°};c)复制区域缩放:水平缩放因子w∈{0.6,0.7,0.8,0.9,1.1,1.2,1.3,1.4},垂直缩放因子h∈{0.6,0.7,0.8,0.9,1.1,1.2,1.3,1.4};d)复制区域镜像:随机水平/垂直镜像变换;e)复制区域复合变换:进行上述随机参数的旋转、镜像和缩放的复合变换.采用本文算法对得到的篡改图像测试集进行检测,得到的检测召回率如图7所示.
表2 合成篡改图像的检测准确率(Qs=95,Qrs=90)Tab.2 Detection precision rate of composite forgery images(Qs=95,Qrs=90)
表3 合成篡改图像的检测召回率(Qs=95,Qrs=90)Tab.3 Detection recall rate of composite forgery images(Qs=95,Qrs=90)
从图7可以看出,本文算法对于同幅图像的上述5种复制粘贴篡改方式都具有较高的检测召回率(均大于90%),没有显著的统计学差异,并且对TIF格式篡改图像的检测性能略优于JPEG格式篡改图像.原因如下.1)本文算法是根据背景区域与篡改区域两次压缩的JPEG系数变化率收敛速率的不一致性来实现篡改区域的检测定位,与文献[9~14]不同,本文算法的检测原理与不同的复制粘贴篡改方式无关,因此实验结果中各种篡改方式的检测性能大体相近.2)在实验中发现,当篡改图像存储为质量因子为85的JPEG格式时,算法的检测召回率较低,从而导致JPEG格式篡改图像的检测召回率比相应的TIF格式略低.通过分析实验中的漏检图像发现,本文算法没有检测出的篡改图像大多都是质量因子为85的JPEG图像生成的篡改图像,与第1组实验中表2的结果类似,检测召回率随着原始JPEG图像质量因子的增大而降低.
3.4 检测性能比较与分析
下面通过比较实验定量评估本文算法与文献[3]和文献[16]算法的检测性能.针对JPEG图像复制粘贴篡改模型中的前4种篡改情形以及同幅图像复制粘贴的篡改方式,分别构建篡改图像测试集.首先,从第1组实验的篡改图像测试集中随机选择属于前4种篡改情形的篡改图像,每一种情形选择300幅篡改图像.然后,从第2组实验的篡改图像测试集中随机选择300幅篡改图像构成同幅图像复制粘贴篡改方式的测试集.如图8所示为在相同的实验环境下,本文算法与文献[3]和文献[16]算法的检测召回率的性能比较.
从图8可以看出,本文算法的检测召回率比文献[3]和文献[16]有了一定程度的提高,尤其是对于同幅图像复制粘贴的篡改方式具有明显的性能优势.文献[3]算法对于复制源图像和背景图像质量因子相等的情况无效[3],并且由于需要遍历不同的质量因子对待检图像进行多次JPEG压缩,影响了检测效率.文献[16]算法将JPEG篡改图像的检测转化为对图像子块的一次压缩与二次压缩的判别,因此仅适合于情形1和情形3,对于篡改图像为非压缩格式的情况无效.当两次压缩的质量因子差值小于5时,二次压缩相当于一次压缩,导致二次压缩前、后的直方图差别很小,检测召回率很低[16],因此对于同幅图像复制粘贴的篡改方式,检测效果较差.
图8 不同篡改情形下检测召回率的性能比较Fig.8 Performance comparison of detection recall rate in different forgery scenarios
本文提出针对JPEG图像复制粘贴篡改方式的被动检测方法,通过一系列实验证明了该算法的有效性.本文算法具有以下优势:1)算法采用单一检测流程实现了同幅图像复制粘贴篡改和异幅图像合成篡改的检测定位,可以有效地检测JPEG图像复制粘贴篡改的多种情形,对于多区域篡改和小尺寸篡改同样有效;2)算法可以有效地检测同幅图像的复制粘贴篡改方式,对于复制区域的旋转、翻转、缩放以及复合几何变换,都具有强鲁棒性;3)在算法执行过程中不需要人为设定的参数阈值,可以实现非监督的自动检测,避免了大多数算法中特征匹配阶段由于参数阈值设定不准确对检测结果的干扰;4)算法的执行过程中不需要估计原始图像的量化表,而是直接从JPEG格式篡改图像文件中读取量化DCT系数矩阵和量化表进行后续检测;5)算法计算简单,具有较高的检测效率.
本文算法具有局限性.当Qs<Qb时,算法将失效.这是由于当以一个更低的质量因子压缩篡改图像时,篡改区域原来的压缩痕迹将被破坏,以致检测失效.下一步研究工作的重点是对于篡改图像以一个更低的质量因子再次压缩保存的情况,如何综合JPEG图像的多种特征提高被动取证算法的有效性和准确性.
(
):
[1]BIRAJDAR G,MANKAR V.Digital image forgery detection using passive techniques:a survey[J].Digital Investigation,2013(10):226-245.
[2]赵洁,郭继昌,张艳.利用块效应特征的JPEG图像盲取证研究进展[J].中国图象图形学报,2013,18(6):613-620.
ZHAO Jie,GUO Ji-chang,ZHANG Yan.Survey:blind forensic of JPEG forgeries based on blocking artifacts[J].Journal of Image and Graphics,2013,18(6):613-620.
[3]LI X,ZHAO Y,LIAO M,et al.Passive detection of copy-paste forgery between JPEG images[J].Journal of Central South University,2012,19(10):2839-2851.
[4]LUO W,QU Z,HUANG J,et al.A novel method for detecting cropped and recompressed image block[C]∥Proceedings of IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP).Honolulu,HI:IEEE,2007:217-220.
[5]HAMDY S,EL-MESSIRY H,ROUSHDY M,et al.Quantization table estimation in JPEG images[J].International Journal of Advanced Computer Science and Applications,2010,1(6):17-23.
[6]BARNI M,COSTANZO A,SABATINI L.Identification of cut&paste tampering by means of double-JPEG detection and image segmentation[C]∥Proceedings of IEEE international Symposium on Circuits and Systems.Paris:IEEE,2010:1687-1690.
[7]YE S,SUN Q,CHANG E.Detecting digital image forgeries by measuring inconsistencies of blocking artifact [C]∥Proceedings of IEEE International Conference on Multimedia and Expo.Beijing:IEEE,2007:12-15.
[8]LI W,YUAN Y,YU N.Passive detection of doctored JPEG image via block artifact grid extraction[J].IEEE Transactions on Signal Processing,2009,89(9):1821-1829.
[9]AMERINI I,BALLAN L,CALDELLI R,et al.Copymove forgery detection and localization by means of robust clustering with J-Linkage[J].Signal Processing:Image Communication,2013,28(6):659-669.
[10]LI L,LI S,ZHU H,et al.Detecting copy-move forgery under affine transforms for image forensics[J].Computers and Electrical Engineering,2014,40(6):1951-1962.
[11]ZHAO J,ZHAO W.Passive forensics for region duplication image forgery based on Harris feature points and local binary patterns[J].Mathematical Problems in Engineering,2013,24(4):657-675.
[12]DAVARZANI R,YAGHMAIE K,MOZAFFARI S,et al.Copy-move forgery detection using multi-resolution local binary patterns[J].Forensic Science International,2013,231(1/2/3):61-72.
[13]GUO J,LIU Y,WU Z.Duplication forgery detection using improved DAISY descriptor[J].Expert Systems with Applications,2013,40(2):707-714.
[14]JABERI M,BEBIS G,HUSSAIN M,et al.Accurate and robust localization of duplication region in copymove image forgery[J].Machine vision and Applications,2014,25(2):451-475.
[15]LIU B,PUN C,YUAN X.Digital image forgery detection using JPEG features and local noise discrepancies[J].The Scientific World Journal,2014,2014(1):95-104.
[16]王浩明,杨晓元.一种基于DCT系数直方图差异的JPEG图像篡改检测[J].四川大学学报:工程科学版,2014,46(1):41-46.WANG Hao-ming,YANG Xiao-yuan.Detection method for JPEG image based on the difference of DCT coefficient histograms[J].Journal of Sichuan University:Engineering Science Edition,2014,46(1):41-46.
[17]McGill Calibrated Color Image Database.[2014-08-17].http:∥tabby.vision.mcgill.ca/.
[18]Kodak Lossless True Color Image Suite.[2014-08-17].http:∥r0k.us/graphics/kodak/.
[19]CHRISTLEIN V,RIESS C,JORDAN J,et al.An evaluation of popular copy-move forgery detection approaches[J].IEEE Transactions on Information Forensics and Security,2012,7(6):1841-1854.
Image copy-paste forgery detection based on JPEG coefficients change rate
ZHAO Jie1,2,GUO Ji-chang1
(1.School of Electronic Information Engineering,Tianjin University,Tianjin 300072,China;2.School of Computer and Information Engineering,Tianjin Chengjian University,Tianjin 300384,China)
A passive detection method with the single process was proposed in order to realize the detection and localization of copy-paste forgery in one image and composite forgery between two images aiming at copy-paste forgery with JPEG images.A counterfeit image was made the judgement whether it was stored in JPEG format.For a JPEG image,quantization table and JPEG coefficients were read from the image file;while for a non JPEG image,it was compressed into a JPEG image with a specific quality factor.The tampered image of JPEG format was compressed with another specific quality factor.The rate of JPEG coefficients change was calculated between the two JPEG compressions in every image sub-block in order to obtain the JCCR image of JPEG coefficients change rate.Normalization processing was conducted in the JCCR image in order to locate the forgery regions.Experimental results demonstrate that the proposed approach can effectively detect a variety of situations in copy-paste forgery with JPEG images,and achieve higher robustness and detection recall rate compared with recent similar methods.
copy-paste;forgery detection;JPEG image;passive forensics
TP 391
A
1008-973X(2015)10-1893-09
2014-08-21.浙江大学学报(工学版)网址:www.journals.zju.edu.cn/eng
天津市自然科学基金资助项目(15JCYBJC15500);天津市高等学校科技发展基金计划资助项目(20120712).
赵洁(1984—),男,讲师,博士生,从事数字取证、多媒体信息处理的研究.ORCID:0000-0001-6340-5580.
E-mail:zhaoj@tju.edu.cn
郭继昌,男,教授,博导.ORCID:0000-0003-3130-1685.E-mail:jcguo@tju.edu.cn