杜 媛
(西安职业技术学院 大数据应用学院, 陕西 西安 710072)
当今人们可通过多种图像采集设备,轻易地获取图像数据。数字图像已被广泛应用于人们生活的方方面面[1]。科学技术的不断发展不仅有助于人们能简单快速地获取数字图像,而且还为人们修改编辑数字图像提供了条件。虽然这种修改编辑数字图像的方法给人们的生活带来许多便利,但若使用不当将会给人们的生活带来困扰[2-3]。因此,对篡改图像进行检测,就显得非常具有实用意义。
为了识别篡改内容,研究者设计了多种多样的篡改图像检测算法。如Rajan 等[4]开发了一种利用特征的神经网络检测阴影或反射中的图像伪造技术,在分割过程中,利用基于映射的分割技术对阴影点和反射点进行识别,然后利用LVP(Learn vector quantization)算子提取阴影点和反射部分的特征点,最后利用前馈神经网络进行伪造检测。由于该方法中直接将提取的特征点用于伪造检测,没有考虑伪特征点的负面影响,易使得检测结果中存在错误检测。陈辉映等[5]采用Hessian 算子从图像中提取特征点,利用K-g2NN 方法实现伪造检测。由于K-g2NN 方法仅考虑了图像特征的距离,而没有考虑图像特征间的互相关性,并且该方法在使用特征点时没有对其进行优化,易引起错误检测和漏检测。如Kim 等[6]采用主动检测的方法,设计了一种用于数字伪造篡改后图像恢复的自嵌入水印算法,以绝对矩块截断编码影像为水印,采用原始封面影像为压缩版本,包含封面影像的内容特征,以实现自我嵌入,对篡改图像进行检测。该方法无须考虑图像特征,但由于其需要将水印嵌入到原始图像中,易造成原始图像被损坏。Mohammed 等[7]将离散余弦变换引入篡改检测过程,计算图像系数,并根据图像系数使用之字形扫描方法求取特征向量,采用欧氏距离对复制块进行定位,完成检测。由于采用欧氏距离定位复制块时,未考虑复制块间的互相关性,而且该过程依赖于阈值的设定,易使得检测结果出错。
对此,本研究采用DoG 算子及其二次Taylor 展开式构造了优化因子,提取图像特征。利用NCC 模型求取特征点间的互相关信息,并利用其与特征点间的欧式距离信息一同完成图像特征匹配,使得匹配结果的正确性得以提高。借助特征点间欧氏距离信息构造比值制约规则,用以归类匹配图像特征,识别篡改内容。利用所设计的篡改检测算法,对伪造图像进行识别,以验证其检测性能。
本研究算法过程如图1所示。由图1可见,待检测图像经过DoG 算子提取图像特征后,再利用DoG 算子的二次Taylor 展开式构成优化因子并计算,获取优化后的图像特征。利用图像的Haar 小波信息获取其特征向量,并通过该特征向量求取特征点间的欧氏距离信息,同时将其与特征点间的互相关信息进行联合,完成图像特征的匹配,以提高图像匹配的准确度。利用基于匹配特征点间欧氏距离信息建立的比值制约规则,对匹配特征进行归类,识别篡改区域,获取检测结果。
图1 本研究篡改检测算法架构图Fig.1 The proposed architecture diagram of tamper detection algorithm
当下众多的图像特征提取算子中,DoG 算子具有优异的检测性能[8]。而且DoG算子的计算过程较为简单,其利用像素点与其邻域点的像素值进行比较快速提取图像特征。对于尺度为β的图像I(x,y),其尺度空间函数L(x,y,β)的计算过程为[9]
这里,G(x,y,β)为高斯核函数,其表达式为
然后,利用尺度空间函数L(x,y,β)求取DoG 算子D(x,y,β),计算过程如下所示:
其中,k为比例因子。
利用DoG 算子提取图像特征的示意图如图2 所示。由图2 可见,在DoG 算子提取图像特征的过程中,需要将像素点P的像数值与其26 个邻点(图2 中圆形区域)的像素值进行比较。若像素点P的像素值为这些邻点中的极值,则判定像素点P为图像特征点[10]。
图2 DoG算子提取图像特征示意图Fig.2 The schematic diagram of image feature extraction using DoG operator
由于受噪声等影响,任何图像特征提取算子时所提取的图像特征都会包含有伪图像特征。为了将伪图像特征去除,本文利用DoG 算子的二次Taylor 展开式构造了优化因子,用于净化图像特征提取结果。
DoG算子的二次Taylor展开式D′为
在式(4)等于0 的情况下,对其进行求导计算,便得到优化因子,即
当优化因子的值太小时,易受到噪声的影响,而成为伪图像特征。对此,设定优化阈值为TP,利用式(7)求取通过DoG 算子提取的图像特征的值。若则认为该特征点为伪特征点。
上述方法提取图像特征的结果示意图如图3 所示。由图3(b)可见,上述方法能够较为准确地获取图3(a)中图像的特征点。
图3 提取图像特征结果示意图Fig.3 The schematic diagram of extracted image features
为了克服旋转等变换的影响,需计算图像特征的基准方向。在本研究算法中,利用特征点的梯度直方图获取其基准方向。首先,计算像素点p(x,y)的梯度模值M(x,y)和梯度方向U(x,y)[11],即
随后,通过M(x,y)和U(x,y)计算[0∘,360∘]的梯度直方图,并以10∘为步长将其分割。将分割后的峰值方向视为基准方向φ。
再以特征点g(x,y)为起点,按照图4所示方法,以基准方向φ为起始方向建立特征点的8邻域区。
图4 建立特征点8邻域区示意图Fig.4 The schematic diagram of establishing feature point 8-neighborhood area
图4中极半径R与极角θ的计算过程为
其中,(xi,yi)为P(x,y)点的邻点坐标。
接着,采用大小为4β(β为特征点的尺度因子)的Haar 小波,计算每个邻域区中x、y方向上的Haar 小波值Hx及Hy,由此可求得每个邻域区中的四维向量W,即
联合特征点的8 邻域区便可得到一个32 维的向量。将其进行归一化运算,便生成了如图5 所示的特征向量。
图5 特征向量示意图Fig.5 The schematic diagram of feature vectors
近邻搜索方法是当下使用较为广泛的图像特征匹配方法。由于其依赖于阈值而且没有考虑特征点间的互相关特征,易出现错误匹配。对此,本研究利用NCC 模型求取图像的互相关信息,将其与特征点的欧氏距离信息相联合,用于匹配图像特征,克服匹配过程中对阈值的依赖以及唯距离为依据的局面,提高匹配正确度。
特征点A(i,j)与S(i,j)间欧氏距离值D(A,S)可表述为[12]
其中,DAi与DSi分别为A(i,j)与S(i,j)的特征向量。
令E与T分别为以特征点A(i,j)与S(i,j)为中心,大小为m×n的区域,则此时A(i,j)与S(i,j)之间互相关值Re(A,S)的计算过程为[13]
其中,与分别为E与T中像素点均值。
利用式(12)与(13)分别计算特征点A与任一特征点S间的D(A,S)值与Re(A,S)值,若特征点A与某一特征点S′既满足其欧氏距离值D(A,S′)为所有D(A,S)值中的最小值,又满足其Re(A,S′)值比所有Re(A,S)值都大,则认为A与S′为匹配点。
利用特征点间欧氏距离信息与互相关信息匹配的图像特征示意图如图6所示。由图6可知,本研究算法匹配的图像特征具有较高的准确度。
图6 匹配的图像特征示意图Fig.6 The schematic diagram of matched image features
尽管匹配的图像特征具有较高的准确度,但难免会存在一些错误匹配[14]。为了对正确匹配的结果进行归类,更准确地识别篡改内容,本研究利用匹配特征点间的欧氏距离信息,建立了比值制约规则,用以归类匹配特征。
令Z={z1,z2,z3,…,zn}为一个含有n个元素的特征点集。V={v1,v2,v3,…,vn}为另一个含有n个元素的特征点集,且该集合中的特征点与Z中的特征点为匹配关系。利用式(12)求取Z中元素zi与其他元素的欧氏距离值,并形成距离集合Z′={z′i1,z′i2,z′i3,…,z′in}。利用同样的方法求取V中元素vi与其他元素的欧氏距离值,并形成距离集合V′={v′i1,v′i2,v′i3,…,v′in}。通过距离集合V′和Z′建立的比值制约规则如下。
首先,v′i1与V′中其他各元素进行比值计算,z′i1与Z′中其他各元素进行比值计算。然后,将v′i1与V′中其他各元素的比值结果,与z′i1与Z′中其他各元素的比值结果进行比较。最后,若比较结果能够满足式(14),则将与归为一类。
图6 中匹配特征经过比值制约规则进行归类后的结果如图7所示。由图7可见,利用比值制约规则对匹配特征进行归类后,识别的篡改内容具有较高的准确度。
图7 识别的篡改内容示意图Fig.7 The schematic diagram of the identified tampered content
以LenovoIntel I3 CPU、500 GB ROM 的PC 机作为实验平台,利用MATLAB 7.10 软件进行实验,实验中优化阈值TP= 0.05。采用文献[15]和文献[16]所提出的算法作为对比对象,并利用文献[15]和文献[16]算法以及本研究算法对伪造图像进行检测,验证本研究算法的有效性。
文献[15]和文献[16]以及本研究算法对复制-粘贴伪造图像的检测效果以及检测准确度数据如图8 与表1所示。由图8可见,文献[15]算法检测效果中具有错误检测现象。文献[16]算法检测效果中具有漏检测现象。本研究算法检测效果中不存在错误检测现象,而且漏检测内容也较少。通过对比表1 数据可见,本研究算法的检测准确度最高。图9 及表2 分别为3 种算法对复制-粘贴+缩放伪造图像的检测效果以及检测准确度数据表。由图9 可见,文献[15]算法的检测效果中有漏检测现象以及2 处错误检测。文献[16]算法的检测效果中也有漏检测现象和错误检测现象。本研究算法检测效果中检测完整度最高,而且错误检测内容最少。表2 数据也反映出本研究算法的检测准确度最高,为92.01%。图10 和表3 分别显示了3 种算法对复制-粘贴+旋转+噪声伪造图像的检测效果以及检测准确度数据。由图10 可见,本研究算法的检测效果最佳,检测伪造内容的完整度最高。对比表3 中数据发现,本研究算法的检测准确度较对比对象最高,文献[15]算法的检测准确度为86.80%,文献[16]算法的检测准确度为87.79%,本研究算法的检测准确度为90.03%。由此说明,本研究算法对伪造图像的检测效果较好,检测完整度以及检测准确度都较高,且鲁棒性较好。因为本研究算法在利用DoG算子提取图像特征后,并没有直接使用提取结果,而是利用DoG算子的二次Taylor 展开式构造优化因子对提取结果进行净化后再使用,使得获取的图像特征正确度较高。同时本研究算法还利用直方图方法计算了特征点的基准方向,并以其为起始方向建立了特征点的极坐标邻域,通过求取邻域Haar 小波值,获取旋转等鲁棒性都较好的特征向量,从而使得算法的检测准确度以及抗干扰性能得以提高。
表1 图8中3种算法检测准确度数据Tab.1 The detection accuracy of three algorithms in Figure 8
表2 图9中3种算法检测准确度数据Tab.2 The detection accuracy of three algorithms in Figure 9
表3 图10中3种算法检测准确度数据Tab.3 The detection accuracy of three algorithms in Figure 10
图8 不同算法对复制-粘贴伪造图像检测效果Fig.8 The detection effect of different algorithms on copypaste forged images
图9 不同算法对复制-粘贴+缩放篡改图像检测效果Fig.9 The detection effect of different algorithms on copypaste-zoom tampered images
图10 不同算法对复制-粘贴+旋转篡改图像检测结果Fig.10 Detection results of different algorithms for copypaste-rotation tampered images
GRIP数据集中包含了80幅伪造图像。采用GRIP数据集的一幅伪造图像进行客观评价,将该伪造图像的篡改内容旋转多个角度,以形成12 幅伪造图像。利用3 种算法对这些伪造图像进行检测,并将检测结果的准确度进行比较,以分析各算法的检测性能。
3种算法检测结果的准确度如图11所示。从图11可以看出,本研究算法的检测结果准确度比文献[15]和文献[16]算法高。在检测旋转70∘的伪造图像时,本研究算法检测结果准确度为93.68%。由此说明,本研究算法的检测性能较好,而且抗干扰能力较强。因为本研究算法将特征点间的互相关信息引入到图像特征的匹配过程,利用其与特征点间欧氏距离信息来完成图像特征匹配,使得算法的抗干扰能力及匹配准确度得以提升。同时本研究算法还以特征点间的欧氏距离信息为基础,建立了比值制约规则,对匹配点进行归类,进一步提升了算法的抗干扰能力及检测准确度,从而使得本研究算法的检测性能较好。文献[15]算法中将图像分割为重叠圆形块,用离散径向谐波傅里叶矩提取重叠圆形块的局部和内部图像特征,通过最近邻方法来搜索块的相似特征向量,进而采用形态学运算去除孤立像素,获取检测结果。文献[15]算法中将离散径向谐波傅里叶矩提取的图像特征直接用于伪造检测,忽略了伪图像特征的影响,而且最近邻方法对阈值依赖性较强,从而使得文献[15]算法的检测性能不佳。文献[16]算法利用尺度不变特征变换提取特征点,生成多尺度特征。在每个尺度上利用自适应匹配算法对图像特征完成匹配,将所有尺度上的匹配特征进行合并,生成伪造区域。但是,文献[16]采用尺度不变特征变换方法所提取的特征点没有经过优化就直接用于伪造检测,降低了算法的检测准确度,且没有对匹配后的图像特征进行聚类就用于合并生成伪造区域,易引起误检。
图11 3种算法检测结果的准确度Fig.11 The detection accuracy of three algorithms
为了在图像伪造检测过程中获取较为纯净的图像特征,本文利用DoG 算子的二次Taylor展开式,构造了优化因子,对利用DoG 算子提取的图像特征进行了净化,提高了图像特征的正确性。通过利用图像Haar 小波值求取特征向量,并求取了特征点间的欧氏距离信息,利用其与通过NCC 模型获取的特征点间互相关信息,共同完成图像特征的匹配,提高了图像特征的匹配正确性及鲁棒性,采用特征点间的欧氏距离信息建立了比值制约规则,对匹配图像特征进行归类,准确识别了伪造内容。实验结果表明,无论本研究算法的检测准确度还是抗干扰性都较为优异,能够在准确检测伪造内容的同时,适应于旋转等多种干扰因素。