◆张思博
网络犯罪与取证
图像拼接检测的被动取证方法研究综述
◆张思博
(北华航天工业学院计算机学院 河北 065000)
伴随着高分辨率数码设备的推广、图像处理技术的日益成熟以及各种图像处理软件的广泛应用,图像拼接带来的图像篡改问题层出不穷,图像拼接检测的被动取证受到极大关注。本文从图像拼接检测的研究现状展开,分析被动取证方法的优势,归纳了五类流行的被动取证方法,对应分析了每一类方法对应的几种典型算法,并从基本原理、检验效果和应对场合等方面对几种算法作比较。最后进行了总结与思考,分析了图像拼接检测被动取证方法面临的挑战和难题,并讨论了其在未来信息安全领域的研究方向。
图像篡改;图像拼接检测;被动取证;信息安全
随着数字图像处理技术的日渐成熟,高清完美的图像给人们的生活带来很多美好与便利的同时,也伴随着图像篡改问题的产生,其在政治、医学、军事、外交等各方面给社会和人们的生活都造成极大危害,损失更是不可估量。基于此,针对图像拼接和篡改的取证方法的研究受到信息安全领域专家学者的广泛关注。图像的检测可以取得犯罪取证的突破,利于加强个人隐私保护不给犯罪分子可乘之机,在军事情报分析和医学鉴定领域也发挥着积极作用。通过检测尽最大可能从源头上避免虚假图像信息的传播,图像篡改检测技术的迫切需要也使其成为信息安全研究领域中一个重要分支。
图像篡改方法多种多样,使得图像拼接检测算法并不统一,接下来本文对其中比较流行的基于人工模糊、噪声特征不一致性、成像机理不一致性、重采样痕迹不一致性以及JPEG压缩痕迹不一致性等五种检测方法在检测原理、实验难点、算法适用性方面对国内外学者的研究现状进行阐述。
拼接图像的模糊操作是手段之一,为了使拼接边缘更逼真,往往会进行一定程度的模糊操作。若想要全面地考虑图像伪造过程中对图像特性的影响,精确度可以提高同时也伴随着难度的提升。周琳娜等[1]提出一种利用同态滤波和形态学滤波的算法,分析并利用离焦模糊和人工模糊的边缘特性实现对篡改图像伪造的取证从而有效地检测出伪造图像的模糊处理痕迹。王睿和方勇[2]提出另一种检测算法,该算法按照像素级搜索机制,对图像中各像素所在位置计算频域系数的对数相关性,以此表达出该区域的模糊程度,与预设阈值相比较,可实现图像中局部模糊区域的检测。Bahrami等[3]设计出一种基于局部模糊类型不一致性的模糊图像拼接定位框架,利用区域的模糊类型差异来追踪拼接定位的不一致性。该方法能有效地检测分类离焦和运动模糊类型,不过这种方法只适用于模糊图像伪造。
在对拼接篡改图像进行篡改区域定位时,由拼接篡改区域与原始图像噪声水平不同作为检测目标,这一类算法由于易于实现且放宽了某些特定于操作的假设而备受关注,难点在于提高定位精度和算法的鲁棒性。李思纤等[4]提出一种检测方法,对图像块进行局部噪声水平估计,利用估算的噪声水平进行聚类结果定位出被篡改的区域。该方法能够较好地定位拼接篡改区域,精确地保留拼接区域的边缘信息。Zeng等[5]结合最近发展起来的噪声级估计算法,采用基于主成分分析(PCA)的算法对测试图像进行分块噪声水平估计,该方法在图像原始区域和拼接区域之间噪声差较小的情况下表现出良好的性能。张德鹏等[6]等则是通过奇异值分解和改进的拉普拉斯算子计算噪声特点,从而利用模糊聚类求出阈值,拼接区域与原区域的噪声差异较小时,该算法也有效,且对后处理操作也具有较好鲁棒性。
从图像的获取来源出发,每个数字设备有自身参数特性,包括设备品牌、设备类型、设备个体等,可以根据设备的参数确定图像来源,以检测图像是否伪造[7]。王洋和谢权威[8]总结了两种检测方法,其一为gama型相机响应函数,原理是根据六维特征向量利用支持向量机作为分类器进行图像真伪鉴别;另一种则是通过相机响应逆函数进行图像盲检测。Ferrara等介绍了一种能够区分原始图像和伪造区域图像的取证算法,假设图像是用彩色滤光片阵列获得的,加上抑制器可以消除伪造。该算法可以在不需要知道位置的情况下筛选出伪造图像。曹刚等提出一种基于阶跃型边缘颜色滤波阵列内插特征一致性分析的快速检测算法,根据成像过程中内插规律的分析找到异常颜色滤波阵列(CFA)内插特征,然后利用局部边缘直方图辨别图像的真伪并定位拼接位置。该算法能抵抗一定程度的JPEG压缩和模糊等后处理,对高分辨率图像的拼接操作具有准确的快速检测和定位能力。
在图像伪造过程中,常会伴有缩放和旋转等几何变化,检测图像重采样技术也是图像伪造检测的有效途径之一,难点在于一次重采样的检测方法无法区分出篡改区域,且同时检测出缩放和旋转的算法难度也较高,因此普通算法往往有一定的局限性。左菊仙和邓坚提出一种基于重采样痕迹的图像伪造检测算法,将待测图像重叠分块,之后计算每块的特征量并由其不一致性定位篡改区域。该算法能够进行篡改伪造图像的自动判断与篡改区域定位,对再次重采样操作具有一定的鲁棒性。谢鹏程和李峰提出一种基于重采样检测JPEG图像拼接篡改取证算法,JPEG图像局部区域二阶导数进行Radon变换,并求其自协方差进行快速傅里叶变换,从而去除JPEG压缩的影响,从而判断该局部区域是否存在重采样操作。该算法使得JPEG压缩对于检测的影响减小,检测的准确度也得到提高。刘一和刘本永研究出一种基于再采样的图像重采样检测算法,该算法抗JPEG压缩能力强,对于经过不同缩放因子所得到图像进行拼接时的重采样操作有明显的检测效果。
JPEG图像篡改完成后,篡改者往往还以JPEG格式保存,该过程会引入图像经历重压缩时的某些数据特征,此时篡改痕迹已经不明显,很多根据数据特征进行取证的方法因而受限。Bianchi等提出了一种区分JPEG图像中原始区域和伪造区域的基本算法,假设被篡改的图像呈现双重JPEG压缩,即对齐(A-DJPG)或未对齐(NA-DJPG),该算法基于一种改进的单一统计模型,描述出现在对齐或非对齐中的伪影,自动计算一个表示离散余弦变换块概率的似然图双倍压缩。韩洪立等提出一种根据不同分块的压缩痕迹进行检测的方法。该算法对多重JPEG压缩检测范围的扩展有不错的效果。李晟和张新鹏找出一种利用压缩特性进行JPEG合成图像检测的方案,主要根据再压缩在不同区域导致的失真程度变化进行检测。
图像拼接检测的被动取证方法是图像信息安全领域的一个重要分支,鉴于篡改数字图像方法的多样性以及复杂性,图像拼接检测的工作极具挑战性。当前图像被动取证研究还没有达到技术成熟的阶段,基于人工模糊的检测算法复杂度往往较高,且不能有效地进行局部模糊检测;在图像采集和传输中噪声的干扰不可避免,噪声差异检测往往行之有效,但当噪声差异较小时该类算法的表现不能达到令人满意的效果;基于成像机理不一致性的检测算法往往是针对某一种篡改设计的,容易产生较大误差,通用性有待提高;基于重采样痕迹检测的算法大部分针对的是单次重采样,再次经历重采样便很难定位篡改区域;JPEG图像所占空间小且便于存储运输,因而这种保存格式最为常见,基于JPEG压缩痕迹的检测算法也得到了广泛应用,但在定位精确度上还有待进一步提升。
随着信息时代发展,图像拼接技术会日益成熟,而篡改者可能会抓住这个机会将多种篡改技术应用于一幅图像中,给图像拼接检测带来新的难题。在对图像进行检测时,不仅要从拼接后的处理方案原理等方面分析从而对症下药研究出相应的认证算法,接下来还要提高已有算法的精确度和鲁棒性,不断提高检测技术。探索出能够统一检测多种篡改技术的算法,是未来图像信息安全研究的一个重要方向。
[1]周琳娜,王东明,郭云彪,等. 基于数字图像边缘特性的形态学滤波取证技术[J]. 电子学报,2008(06):1047-1051.
[2]王睿,方勇. 一种图像局部模糊检测方法及其在被动图像认证中的应用[J]. 高技术通讯,2009(07):718-723.
[3] Bahrami K,Kot A C,Li L,et al. Blurred Image Splicing Localization by Exposing Blur Type Inconsistency[J]. IEEE Transactions on Information Forensics and Security,2017,10(5):999-1009.
[4]李思纤,魏为民,楚雪玲,等.利用改进的超像素分割和噪声估计的图像拼接篡改定位方法[J].华侨大学学报(自然科学版),2020,41(2):237-243.
[5]Zeng H,Zhan Y,Kang X,et al. Image splicing localization using PCA-based noise level estimation[J]. Multimedia Tools & Applications,2016:1-17.
[6]张德鹏,王晓峰,胡姣姣,等.噪声水平不一致性的图像拼接区域检测方法[J].计算机系统应用,2019,28(2):132-139.
[7]甘艳芬,钟君柳,郑媛裕. 数字图像篡改检测关键技术研究综述[J]. 赤峰学院学报(自然科学版),2017,33(024):17-19.
[8]王洋,谢权威. 基于相机响应函数的图像盲检测技术研究[J]. 重庆工商大学学报(自然科学版),2014,31(3):55-61.