赵俊红
(华南理工大学自动化科学与工程学院,广东广州510640)
随着数字图像处理技术的飞速发展,人们可以利用各种图像处理工具(如Photoshop等)对图像进行篡改而不留下人眼可以观察到的痕迹.这些篡改有些只是为了娱乐大众,但也有很大部分会给社会带来危害(如华南虎事件),因而图像的真伪鉴别变得非常重要.
依据是否事先往图像中添加信息,目前的图像真伪鉴别技术可以分两大类:主动取证技术和被动取证技术.主动取证技术是往图像中加入数字水印信息或数字签名信息,通过判断数字水印信息和数字签名信息是否完整来判断图像是否被篡改[1].主动取证技术的研究较为成熟,但由于需要事先向原始图像中加入水印或签名信息,而实际上需要真伪鉴定的图像往往只有它本身,很难得到或无法得到原始图像,因而限制了主动取证技术的使用.数字图像被动取证不需要水印或签名信息,直接利用图像本身信息来判断图像的真伪,应用范围十分广泛,是数字图像研究中的新兴前沿领域.
篡改图像的操作方式很多,文献[2]中将图像的篡改手段分成6大类:合成、变形、修整、增强、计算机生成、绘制.在这些篡改方法中不可避免地会用到缩放、旋转、模糊等图像篡改操作,而且为了掩饰篡改中留下的痕迹,往往会使用模糊操作来润饰图像边缘,如果能够找出图像中人工模糊操作的证据,则可以将其作为图像被篡改的证据,达到图像被动取证的目的.国内外学者对图像的模糊操作有了一定的研究.针对高斯模糊,孙堡垒等[3]提出了一种基于Benford定律的高斯模糊取证方法,该方法利用经过高斯低通滤波后的自然图像红绿蓝(RGB)三通道趋向一致的性质,在大量实验的基础上总结出模糊图像的离散余弦变换(DCT)域交流系数在Benford域的两个性质,从而构造特征,根据篡改前后差异的显著性水平来设定阈值,对待检对象的真实性作出判决.针对人工模糊和离焦模糊,周琳娜[4]利用同态滤波缩小离散模糊边缘的动态范围,同时增强人工模糊的拼接边缘,弱化自然正常边缘,再通过腐蚀运算排除自然边缘,提取定位出图像拼接边缘;基于在图像聚焦的区域找到模糊区域,Hsiao等[5]将图像经DCT变换后的每个DCT块的能量谱与整个图像的能量谱进行比较,分别得到模糊区域和锐化区域,如果能在锐化区域找到模糊区域,则认为图像被篡改过;Sutcu等[6]根据图像小波变换的规律来估计图像边缘的清晰度和模糊度,进而检测定位图像篡改区域;王波等[7]认为模糊操作破坏了图像的局部相关性和局部一致性,提出了一种利用局部异常色调率来对模糊操作进行检测和定位的方法;陈英等[8]引入“不和谐点”概念,若在待检测图像的边缘找到大量消失的“不和谐点”,则将其作为图像被篡改的证据.正常聚焦的真实图像中物体的边缘一般来说是清晰的,篡改后的图像为了掩饰新添加的物体痕迹,往往会在新添加的物体边缘处进行人工模糊操作,使得过渡自然不易被发现.很多图像处理软件都提供模糊操作,如Photoshop中提供的各种模糊滤镜.经过人工模糊操作后的边缘比正常聚焦图像边缘要模糊一些;同时由于模糊后的边缘在视觉上仍然是肉眼可以明显区分出来的,因此人工模糊操作后的边缘比散焦模糊边缘及平坦区域要清晰一些.
针对篡改图像的边缘模糊,文中首先采用图像模糊增强技术得到人工模糊操作边缘被增强而其它部分被弱化的图像;然后对原篡改图像进行分块,利用粗糙集对子图像块进行分类,排除平坦区域和自然清晰强边缘后得到另外一个图像,最后将这两个图像融合得到仅保留人工模糊边缘的结果图像,从而达到被动取证的目的.
由前面分析可知,人工模糊操作边缘是介于正常清晰边缘、散焦模糊边缘及平坦区域之间的,人工模糊操作边缘、正常清晰边缘、散焦模糊边缘与平坦区域之间的差异不是泾渭分明的,而是具有不确定性和不精确性,在过渡中出现“亦此亦彼”的现象.要想将人工模糊操作边缘与正常清晰边缘、散焦模糊边缘及平坦区域区分开来,需要有一种可以增强人工模糊操作边缘而弱化正常清晰边缘和散焦模糊边缘与平坦区域的方法.模糊数学善于处理“亦此亦彼”的不确定性问题和不精确性问题,因此文中引入模糊数学,对待检测的图像进行图像模糊增强.
1965年,Zadeh[9]提出了模糊数学的概念.20世纪80年代起,模糊数学开始被广泛应用于数字图像处理领域,并取得了大量的研究成果,其中之一就是数字图像的模糊增强[10].
自然界中大量的事件不是简单的“是”或“不是”就能够刻画的,而是具有“亦此亦彼”的模糊现象和模糊概念.普通集合只能够刻画某一个元素x绝对属于(特征函数为1)或不属于(特征函数为0)集合A.为此,Zadeh[9]提出了模糊集合的概念,将模糊集合记为,并将取值在[0,1]闭区间上的隶属函数μ~A(x)作为刻画模糊集合中元素x隶属于的程度的特征量.
一个M×N的二维图像I中,设像素点(i,j)隶属于某一个模糊集合~A的程度为μ(i,j),则矩阵
为图像I的模糊特征平面.
为了能够检测出人工模糊操作边缘,需要增强人工模糊操作边缘,则模糊集合~A=“人工模糊操作边缘”.边缘的人工模糊操作实质上是一种低通滤波,如Photoshop中的高斯模糊其实就是高斯低通滤波,均值模糊是均值滤波.与真实清晰边缘相比,人工模糊操作边缘的像素在灰度上与其周围的像素点灰度值更趋于一致;但与散焦区域和平坦区域相比,由于人工模糊操作后的边缘在视觉上仍然是一条较为清晰的边缘,因此像素点灰度值与周围像素点的一致性比平坦区域和散焦区域弱.因此设计出一个能准确反映出这三者区别的隶属函数至关重要,即设计出的隶属函数能使散焦区域、平坦区域以及真实清晰边缘的隶属函数变小,而使人工模糊操作边缘的隶属函数变大.因此文中选用中间对称的隶属函数,即梯形分布型隶属函数:式中:μ(i,j)为图像I中像素点(i,j)对于模糊集合~A的隶属度;Y(i,j)为图像I中点(i,j)的灰度值I(i,j)与周围像素灰度值均值之差的绝对值,即分别为依据具体图像设定的阈值.从式(1)可知:
(1)如果Y(i,j)≤a-a2,那么μ(i,j)=0,即确定平坦区域和散焦区域的隶属度为最小;
(2)如果a-a1≤Y(i,j)<a+a1,那么μ(i,j)=1,即确定人工模糊操作边缘的隶属度为最大;
(3)如果a-a2<Y(i,j)≤a-a1,那么μ(i,j)=,即确定平坦区域、散焦区域与人工操作模糊边缘之间过渡像素点的隶属度,让二者线性过渡,体现模糊数学的“亦此亦彼”特点;
(4)如果a+a2<Y(i,j),那么μ(i,j)=0,即确定真实清晰边缘的隶属度为最小;
(5)如果a+a1≤Y(i,j)<a+a2,那么μ(i,j)=,即确定真实清晰边缘与人工操作模糊边缘之间过渡像素点的隶属度,让二者线性过渡,体现模糊数学的“亦此亦彼”特点.
根据隶属函数(1)得到的模糊特征平面X能够将人工模糊边缘和自然边缘、平坦区域、散焦区域的隶属度明显地区别开来,前者的隶属度明显大于后三者的隶属度.
经过式(1)的变换,可以得到一个大小为M×N的二维图像I隶属于某一个模糊集合~A的模糊特征平面X.此模糊特征平面的特点是:人工模糊操作边缘像素点处的隶属度较大,而其它像素点的隶属度小.选用合适的隶属度变换函数T(·)对模糊特征平面X中的每个隶属度进行变换,使得人工模糊操作边缘处的隶属度更大,而自然边缘、散焦区域、平坦区域等隶属度更小,从而进一步增大它们之间的差别,达到图像增强的目的.设计函数T(·)时应遵循如下准则:(1)在0≤μ≤1内,有0≤T(μ)≤1,即变换后的新隶属度仍然在[0,1]内;(2)T(·)应该是单调递增函数,即变换后新的隶属度之间的大小次序不变.重复进行隶属度变换,最终得到一个二值图像.
文中采用如下的隶属度变换函数对模糊特征平面X的每一隶属度μ进行迭代:
式中,μ(i,j)n-1和μ(i,j)n分别是隶属度μ(i,j)的第n-1次、第n次迭代值.
图1(a)所示原图像是一个典型的拷贝-移动型篡改,将别处的犀牛“移花接木”到树叶上.采用式(1)针对性地对人工模糊操作边缘进行图像模糊增强后,所得结果如图1(b)所示.由图1(b)中可知,图1(a)中因散焦而模糊的背景区域、平坦区域(如大片树叶的中间部分)和大部分自然边缘(较清晰的树叶边缘)被减弱甚至消失,而人工模糊边缘和区域得到凸显,取得了比较好的增强效果;但图像中更清晰的部分(如右下方大树叶边缘、犀牛身体上)却未被减弱,说明这种方法对人工模糊边缘、散焦区域和平坦区域的区分效果比对人工模糊边缘和自然清晰强边缘的效果要好,因为人工模糊边缘像素点的灰度值与周围平坦区域或散焦区域像素点灰度平均值的差值较其与自然边缘像素点的灰度平均值的差值大.此外,这种方法在设计隶属函数μ(i,j)时,阈值a、a1、a2的选取与具体图像有关.
图1 基于模糊增强的图像取证Fig.1 Image forensics based on fuzzy enhancement
粗糙集是一种处理不完整性和不确定性问题的软计算方法,在20世纪80年代由Pawlak[11]提出后已经在机器学习、知识获取、模式识别等领域得到了广泛的应用.知识简约是粗糙集理论的核心内容之一.文献[12]中运用粗糙集的属性约简得到子图像块的低高频能量比B、频域熵H、均值和方差D并作为条件属性,再用规则约简获得判断图像块是平滑区域还是剧变区域的规则.这些粗糙集理论在数字压缩领域获得的约简属性和约简规则具有普适性,所以文中将其运用到数字图像取证中.基于粗糙集的被动图像取证算法的具体步骤如下:
1)计算4个条件属性.将图像划分成大小为k×k的不重叠分块,获得每个图像块的DCT系数,然后计算每个图像块的低高频能量比B、频域熵H、空域属性均值和方差D,其中
式中:βm为第m个图像块经DCT后的系数;r为远小于k2的正整数,代表包括直流分量在内的前几个低频变换系数的数目;B越大说明图像块的灰度分布越平滑,B越小说明包含的细节和边缘等高频成分越多;H越大,说明图像块中包含的细节和边缘成分越多.
2)根据粗糙集的约简、合并规则,得到规则1-5.
规则1若(B很大)or(H很小)or(很小)and(D较小),则该图像块为平坦区.
规则2若(H很大)and(和D很小)and(B很小),则该图像块为强边缘区.
规则3若(H很大)and(很大),则该图像块为强边缘区.
规则4若(H较大)or(D很大)or(较大),则该图像块为强边缘区.
规则5若(B较小)and(H较大),则该图像块为强边缘区.
按照人的思维习惯,将5条规则中的模糊量“很小”、“较小”、“较大”、“很大”分别定义为:如果x≤Δ×10%,则x∈{很小};如果Δ×10%<x≤Δ×30%,则x∈{较小};如果Δ×70%≤x≤Δ×80%,则x∈{较大};如果x≥Δ×85%,则x∈{很大}.其中Δ=xmax-xmin,xmax和xmin分别为x的最大值和最小值.这样就可以克服模糊增强中隶属函数阈值a、a1、a2的选取与具体图像有关的缺点.
3)根据规则1去除图像中灰度变化不大的平坦区域,根据规则2-5去掉图像中清晰的自然边缘.
利用粗糙集理论对图1(a)所示篡改图像进行取证,结果如图2(a)所示.图2(a)中显示了篡改图像中犀牛的边缘和自然清晰强边缘(如图1(a)右下方大树叶边缘和犀牛所处的树叶边缘),但图2(a)下方有很多误检测的区域,这些误检区域对应于图1(a)中比较暗的平坦区域.通过对大量自然图像的计算可知,对于不同的自然图像,其频域熵H、均值和方差D都是在一个大致相似的数量级范围内,而低高频能量比B的范围则对于不同的图像差别较大.所以使用规则1来检测平坦区域时,因B的数量级差别很大,规则“如果x≥Δ×85%,则x∈{很大}”中的判断阈值85%应随不同的图像而变化.
图2 基于粗糙集的图像取证及其融合结果Fig.2 Image forensics based on rough sets and its fusion result
从前面分析可知:经过模糊增强后的图像能较好地区分人工模糊边缘与散焦区域、平坦区域,但对人工模糊边缘与自然清晰边缘的区分效果略差;经过粗糙集处理后的图像能较好地辨识出图像的自然清晰强边缘.为此,文中将这两种图像融合,得到既能区分散焦区域和平坦区域又能区分人工模糊边缘与自然清晰强边缘的图像.3幅篡改图像经模糊增强、粗糙集处理和融合后的结果如图3所示.从图3可知:(1)图像1的原图像是将指环王的男精灵的脸换到了一个女性的身体上,可以看到模糊增强后的图像在平坦区域(如皮肤、衣服、树木之间的光亮)得到了弱化;高频细节即身后的树枝和头发弱化的程度差一些,仍然保留;当粗糙集处理后,可以看到高频细节受到抑制,而低频细节(如衣服)弱化的程度差一些,融合后的图像就只保留了脸部轮廓即人工模糊的边缘.(2)图像2中原图像是将奇异果的果肉替换到橙子上,模糊增强后的图像中真实边缘(如栅栏轮廓、椅子靠背、背景树叶)和平坦区域(如橙子皮、碟面)得到弱化,但是一些高频细节(如奇异果肉放射状的轮廓、橙皮与碟面接触部分)弱化的程度差一些,仍然保留;粗糙集处理后高频细节受到抑制,而一些低频细节(如奇异果肉黑色部分)弱化的程度差一些,融合后的图像则凸显出了左面和前面两个橙子被篡改的奇异果果肉轮廓.(3)图像3中原图像是将狮子的头替换到海豹身上,模糊增强后的图像在平坦区域(如背景海水)和散焦区域(海豹尾巴)得到了弱化,但高频细节(如海豹后背曲线)弱化的程度差一些,仍然保留;粗糙集处理后高频细节受到抑制,但低频细节(散焦的海豹尾巴)弱化的程度差一些,融合后的图像则凸显了狮子的头.
图3 3幅篡改图像的取证结果Fig.3 Forensics results of three tampered images
文中针对图像篡改中的模糊润饰进行被动取证,提出了一种新的取证算法.首先采用图像模糊增强技术对待检测图像进行增强,得到人工模糊边缘被增强而平坦区域被减弱的图像;再利用粗糙集在数字图像压缩应用中得到的约简属性和约简规则,对待检测图像子块进行分类,排除平坦区域和强边缘而剩下保留有人工模糊边缘的图像;最终对两幅图像融合得到只有人工模糊操作区域的结果图像.实验结果显示文中算法能较准确地找到篡改图像中经过人工模糊操作的边缘.人工模糊润饰是图像篡改中的常用手段,所以文中算法可以应用在数字图像的被动取证中.今后可以对模糊增强中的隶属函数作进一步研究,采用铃形隶属函数来刻画图像的模糊性;同时选用左右不对称的隶属函数来扩大人工模糊边缘和自然边缘、平坦区域、散焦区域之间的差别.
[1]Fridrich J.Imagewatermarking for tamper detection[C]∥Proceedings of International Conference on Image Processing.Chicago:IEEE,1998:404-408.
[2]Farid Hany.Creating and detecting doctored and virtual image:implications to the child pornography prevention act[R].Hanover:Department of Computer Science and Center for Cognitive Neuroscience,Dartmouth College,2004.
[3]孙堡垒,周琳娜,张茹.基于Benford定律的高斯模糊篡改取证[J].计算机研究与发展,2009,46(增刊):211-216.Sun Bao-lei,Zhou Lin-na,Zhang Ru.Forensics of Gaussian blur tempering based on Benford's law[J].Journal of Computer Research and Development,2009,46(Suppl):211-216.
[4]周琳娜.数字图像取证技术[M].北京:北京邮电大学出版社,2008:103-107.
[5]Hsiao Dun-yu,Pei Soo-chang.Detecting digital tampering by blur estimation[C]∥Proceedings of the First InternationalWorkshop on Systematic Approaches to Digital Forensic Engineering.Taipei:IEEE,2005:264-278.
[6]Sutcu Y,Coskun B,Sencar H T,el al.Tamper detection based on regularity ofwavelet transform coefficients[C]∥Proceedings of IEEE International Conference on Image Processing.San Antonio:IEEE,2007:397-400.
[7]王波,孙璐璐,孔祥维,等.图像伪造中模糊操作的异常色调率取证技术[J].电子学报,2006,34(12A):2451-2454.Wang Bo,Sun Lu-lu,Kong Xiang-wei,et al.Image forensics technology using abnormity of local hue for blur detection[J].Acta Electronica Sinica,2006,34(12A):2451-2454.
[8]陈英,赵鹏,王瑀屏.基于边界平滑检测的虚假图像盲识别算法[J].软件学报,2008,19(增刊):59-68.Chen Ying,Zhao Peng,Wang Yu-ping.Exposing digital forgeries by detecting traces of smoothing[J].Journal of Software,2008,19(Suppl):59-68.
[9]Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[10]郭桂蓉.模糊模式识别[M].长沙:国防科技大学出版社,1992:134-159.
[11]Pawlak Z.Rough sets[J].International Journal of Computer and Information Sciences,1982,11(5):341-356.
[12]徐立中.数字图像的智能信息处理[M].2版.长沙:国防工业出版社,2007:42-63.