邢 楠,朱 虹,王 栋,侯浩录
西安理工大学 自动化与信息工程学院,西安 710048
基于多分类器融合的图像真伪鉴别方法
邢 楠,朱 虹,王 栋,侯浩录
西安理工大学 自动化与信息工程学院,西安 710048
照片始自于1826年,新闻报道、个人证件、甚至呈堂证供中都少不了它的身影。为篡改事实或者增强视觉效果,被篡改的照片和图片始终都与人们相伴。当前,由于各种功能强大的图像处理软件的广泛使用,使得制作一张逼真的伪造图像变得非常简单,这甚至不需要造假者具有专业的知识。随着互联网时代的到来,伪造的照片会被迅速传播到世界的各个角落,产生广泛的影响。图1就是两张著名的涉嫌伪造的照片,而一些被篡改的照片甚至会引发诸多民事纠纷或法律问题。
针对数字图像真伪鉴别问题,国内外已经做了一些相应的研究,其中根据图像中不同景物光照方向是否存在不一致,来检测图像的真伪[1];以及利用双一致性对拼接的图像进行检测[2];还有根据单幅图像中不同色彩之间的边缘像素反推响应函数,对所得到响应函数的特殊状态进行分析,从而判断图像是否经过合成处理[3]。
为提高图像真伪鉴别的准确率和适应性,本文通过使用滤波器,将数码相机中广泛存在的一类噪声检测出来,使其作为相机的特征信息,通过分类器对其加以区分,并融合多个分类器的结果,最终对图像的真伪作出判断。
根据Lukáš J,Fridrich J等人的研究[4-5],在数码相机的内部普遍存在着一种反映相机本身物理特性的噪声,被称为模式噪声(Pattern Noise),它由固有模式噪声(Fixed Pattern Noise,FPN)和光响应非均匀性噪声(Photo Response Non-Uniformity noise,PRNU)两部分构成,其中,PRNU是指图像传感器中基本单元对光照的不同敏感度,对于不同的图像传感器它又存在差异,因此,可以将其看作是图像传感器的固有属性。
图1 有伪造嫌疑的数码照片
对于PRNU这种传感器采集图像时引入的微量噪声,需要性能良好的滤波器才可以获得。得益于小波变换本身所具有的低熵性、多分辨率、去相关性等特点,小波滤波器能够在保持原始图像特征的基础上,更加精确地获得细微的图像噪声。因此,本文采用基于小波系数随机模型[6]构建的小波滤波器。
受噪声干扰的小波系数模型如图2所示。其中,n(k)是均值为0,方差为σn2的高斯白噪声;X(k)是无噪声干扰图像的小波系数,每个小波系数都被认为是独立的,来自一个均值为0,方差为σ2(k)的高斯源;Y(k)表示观测到的受噪声干扰的图像小波系数。
图2 受噪声干扰的小波系数模型
在上述模型中,小波系数满足局部的独立同分布,而且其方差所在区域是光滑的,为了获得“干净”的小波系数 X(k),采用最佳线性预测器进行估计,其表达式如下:
通过对样本图像进行五层小波分解,采用db8小波进行小波变换,可以得到各个小波子带中的HH、HL、LH区域的小波系数,采用最大似然估计(ML)的方法,根据受噪声干扰的小波系数周围的邻近区域,对每一个小波系数的方差进行估计,并通过最小均方误差估计(MMSE)获得最优解,最终,将它代入公式(2),得到图像各点小波系数X(k)的估计值Xˉ(k),滤掉了样本图像的噪声。图3所示为小波去噪算法的示意图。
图3 小波去噪算法的示意图
如图4所示,以标准测试图LADY为例,将小波滤波器与中值滤波器、空间维纳滤波器[7]进行对比测试,可以发现,只有小波滤波器对正常拍摄的图像进行处理后得到的残差图与原始图像内容不相关,即:通过滤波器所获得的噪声,仅仅反映相机内部固有噪声特性。
图4 三种滤波器去噪效果的对比
同时,为了更加客观地比较各个滤波器的性能,引入一系列图像参数指标对其进行评判,这些参数包括:峰值信噪比PSNR,信噪比SNR,均方误差MSE,相似度FNC等。表1列出了上述三种滤波器各项参数指标的的对比情况。其中,小波滤波器的各项参数指标均优于其他两类滤波器。
在获得图像固有噪声之后,通过分类器对噪声信息进行划分,以便为鉴别图像真伪提供依据。在进行真伪鉴别时,虽然图像所包含的信息量非常大,但是往往关注的只是一些局部的区域,将这些可疑区域标记出来,对其进行鉴别,可以大大减少运算量。如图5所示,图像中包含房屋、绿地、文字等多种信息,而在进行图像真伪鉴别时,只有两个人物头部特征相同的区域是最需要关注的,因此选择该区域为可疑区域,对其真实性进行判别。
表1 各项参数指标的对比情况
图5 在待测图像中选取可疑区域
3.1 BP神经网络分类器
本文采用三层结构的BP神经网络构建分类器[8],其拓扑结构包括输入层、隐层和输出层。其输入层为选定的可疑区域的噪声图像,其像素点作为BP神经网络的输入节点;输出层节点数是2个,由输出节点状态可以判断图像的真和假;而隐层节点可以由公式(3)确定:
其中,mid表示隐层节点数,in表示输入节点数,out表示输出节点数,a取整数1。
对BP神经网络进行训练时,采用不同相机型号来源的样本图像共计1 000张,其中真实图像和伪造图像所占各半。对所有样本图像中与可疑区域位置相同的部分进行滤波处理,获得该区域的噪声图像,将其输入网络进行训练并使网络收敛,从而可以进行图像真伪的判别。
实验测试表明,BP神经网络对于真实图像的识别效果很好,而对伪造图像识别率则偏低。经过分析发现,这是因为伪造区域所占可疑区域的面积比例较小而导致的。如图6(a)所示,伪造的海鸥只占可疑区域面积较小的一部分。为了提高伪造图像的检出率,本文采用交互的方式,如图6(b)所示,将待测图像中可疑区域的核心目标物框定,将框定范围内的区域作为BP神经网络的输入节点,通过网络进行判别。即:通过提高可疑目标所占区域的面积比,来提高BP神经网络的识别准确率。
图6 在可疑区域中框定核心目标物
3.2 广义高斯特征分类器
其中,R为所选择的可疑区域,PC(R)为某相机在R区域的噪声图像,它是相机大量样本图像在对应可疑区域噪声的平均值,n(R)为待测图像在R区域的噪声图像,(R)和ˉ(R)分别为PC(R)和n(R)的均值,ρ(n(R),PC(R))为相关系数,表示两者的相关程度,‖·‖则表示二范数。
实验测试表明,通过给相关系数设定一个阈值,对待测图像加以判断,其检出率并不高。由于待测图像噪声和某相机图像噪声并不满足完全独立同分布的高斯模型,它们之间存在一定相关性,因此,引入广义高斯分布[9]对噪声之间的相关系数进行判断。广义高斯分布的概率密度函数表达式如下所示:
待测图像在可疑区域的固有噪声与该相机在对应区域固有噪声的统计规律的一致性判别,可以通过相关系数来实现,以相关系数的大小来判断待测图像是否系伪造。其计算公式如下:
进而得到判断真伪的条件,也就是得到随机变量 ρ(即:相关系数)在已建立的模型中的概率值P,即P= G(ρ),通过概率值的大小,可以对待测图像的真伪作出判断[11]。该方法相较于对相关系数给定阈值,检测伪造图像和真实图像的准确率均有所提升。
由于BP神经网络分类器以及广义高斯特征分类器具有各自不同的特点,并且,它们对于真实图像和伪造图像的检测效果也各有侧重。因此,本文将这两个分类器进行融合,对对分类结果加以综合判断。
其中,参数 μ,σ2,β,α分别对应广义高斯分布的均值,方差,形状参数以及尺度参数。对于一组样本,其主要参数α和 β可以利用牛顿迭代法获得其最优解[10]。根据估计的分布参数,就可以得到相应的广义高斯分布的概率密度函数。在已知概率密度函数 f(x,α,β,μ)的情况下,对其积分可以求得分布函数:
3.3 分类器综合
使用多个分类器对事件进行分类时,为了实现不同分类器的优势互补,通常是将不同分类器的分类结果进行融合,以提高分类识别效果以及鲁棒性。进行分类器融合时,经常会采用“一致通过”准则、“大多数同意通过”准则等投票组合规则[12-13]。本文针对两种分类器的结果进行融合时,采用了部分投票组合的规则。
两个分类器对待测图像的真伪进行判断时,如果BP神经网络分类器和广义高斯特征分类器的判断结果是一致的,则按照“一致通过”准则,接受两者的判断结果。如果BP神经网络分类器和广义高斯特征分类器的判断结果是相互矛盾的,即:广义高斯特征分类器判断待测图像是假图,而BP神经网络分类器判断是真图,接受广义高斯特征分类器的判断结果,反之,则接受BP神经网络分类器的判断结果。
在BP神经网络分类器的实验中,选取五种不同型号相机:佳能A80,佳能IXUS75,柯达LS420,美能达Z6,尼康E2000拍摄的照片作为样本进行测试。其中,真实图像500张(来自佳能A80型相机)和伪造图像500张(其他四种型号相机),合计1 000张样本图像。使用上述样本图训练BP神经网络并使其收敛。随后,对200张待测图像进行鉴别,其中,伪造图像100张,真实图像100张。实验结果显示,BP神经网络分类器对于真实图像具有较高的检出率,而通过交互方式进行处理后,伪造图像的检出率得到大幅提升。
在广义高斯特征分类器的实验中,选取10种不同型号的相机:佳能A80,尼康L1,索尼T3,佳能A570,柯达LS420,美能达Z6,尼康E2000,尼康E950,索尼T3,索尼α200,佳能IXUS75。在上述型号相机拍摄的图像中,共选取1 000张样本图像,计算其关于相关系数 ρ的广义高斯分布情况,并利用概率P进行判断。使用200张待测图像进行鉴别,其中,伪造图像100张,真实图像100张。实验结果显示,采用广义高斯分布对相关系数加以判断,相较于给定阈值的相关系数判断,伪造图像和真实图像的检出率均有所提升,特别是对于伪造图像的提升更加明显。
将两种分类器进行综合后,很好地实现了两种不同分类方法的相互补充。对200张待测图像进行鉴别,其中,100张伪造图像的检出率达到95%,100张真实图像的检出率为93%。具体鉴别结果见表2。
表2 不同方法实验的结果 (%)
本文采用小波滤波器提取数码相机所固有的噪声特征,将BP神经网络和广义高斯特征两种分类器的判断结果进行融合,对待测图像的真伪进行鉴别。实验结果表明,算法对于采用复制、模糊等手段得到的伪造图像均具有较高的检出率。
[1]Johnson M K,Farid H.Exposing digital forgeries by detecting inconsistencies in lighting[C]//Proceedings of the 7th Workshop on Multimedia and Security,2005:1-10.
[2]Ng T T,Chang S F,Sun Q.Blind detection of photomontage using higher order statistics[C]//Proceedings of the 2004 International Symposium on Circuits and Systems,2004,5:688-691.
[3]Lin Z,Wang R,Tang X,et al.Detecting doctored images using camera response normality and consistency[C]// IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2005,1:1087-1092.
[4]Lukáš J,Fridrich J,Goljan M.Detecting digital image forgeries using sensor pattern noise[C]//SPIE,2006:362-372.
[5]Lukas J,Fridrich J,Goljan M.Digital camera identification from sensor pattern noise[J].IEEE Transactions on Information Forensics and Security,2006,1(2):205-214.
[6]Mihcak M K,Kozintsev I,Ramchandran K.Spatially adaptive statistical modeling of wavelet image coefficients and its application to denoising[C]//1999 IEEE International Conference on Acoustics,Speech,and Signal Processing,1999,6:3253-3256.
[7]Wiener N.Extrapolation,interpolation,and smoothing of stationary time series:with engineering applications[M]. [S.l.]:MIT Press,1964.
[8]Rumelhart D E,McClelland J L.Parallel distributed processing:explorations in the microstructure of cognition,volume 1:foundations[M].[S.l.]:MIT Press,1986.
[9]Chang S G,Yu B,Vetterli M.Adaptive wavelet thresholding for image denoising and compression[J].IEEE Transactions on Image Processing,2000,9(9):1532-1546.
[10]Do M N,Vetterli M.Wavelet-based texture retrieval using generalized Gaussian density and Kullback-Leibler distance[J].IEEE Transactions on Image Processing,2002,11(2):146-158.
[11]Birney K A,Fischer T R.On the modeling of DCT and subband image data for compression[J].IEEE Transactions on Image Processing,1995,4(2):186-193.
[12]Kimura F,Shridhar M.Handwritten numerical recognition based on multiple algorithms[J].Pattern Recognition,1991,24(10):969-983.
[13]Xu L,Krzyzak A,Suen C Y.Methods of combining multiple classifiers and their applications to handwriting recognition[J].IEEE Transactions on Systems,Man and Cybernetics,1992,22(3):418-435.
XING Nan,ZHU Hong,WANG Dong,HOU Haolu
College of Automation and Information Engineering,Xi’an University of Technology,Xi’an 710048,China
By applying the filter which is in the wavelet domain,a certain noise is extracted which can reflect the camera physical characteristic and it further serves as the key feature to detect the authenticity of digital image.The noise characteristics of suspicious region in the image are determined and aggregated by the generalized Gaussian classifier and BP neural network classifier,to detect forgeries in digital images.The experimental results show the approach provides a relative high accuracy on detecting digital images that are forged in various ways.
camera noise;wavelet domain filter;generalized Gaussian;Back Propagation(BP)neural network;authenticity of digital image detection
针对数字图像的真伪鉴别问题,通过在小波域上构造的滤波器,提取反映相机本身物理特性的某种特定噪声,将其作为判断图像真伪的关键特征。在待测图像中选取出可疑区域,将其噪声特征通过广义高斯分类器以及BP神经网络分类器进行判断和融合,从而实现图像的真伪鉴别。实验结果表明,该方法对多种不同伪造方式的数字图像均具有较高的识别正确率。
相机噪声;小波域滤波器;广义高斯;反向传播(BP)神经网络;图像真伪鉴别
A
TP391
10.3778/j.issn.1002-8331.1304-0460
XING Nan,ZHU Hong,WANG Dong,et al.Authenticity of digital image detected algorithm based on multiple classifiers aggregation.Computer Engineering and Applications,2014,50(24):164-167.
陕西省教育厅科学研究计划项目(No.11JK1047)。
邢楠(1980—),男,博士研究生,讲师,主要研究领域为数字图像处理;朱虹(1963—),女,博士,教授,博士生导师,主要研究领域为模式识别、数字图像处理;王栋(1979—),男,讲师,主要研究领域为数字图像处理;侯浩录(1973—),男,讲师,主要研究领域为信号处理。E-mail:sportsman_xing@163.com
2013-05-03
2013-07-17
1002-8331(2014)24-0164-04
CNKI网络优先出版:2014-03-07,http∶//www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1304-0460.html