基于核主成分分析的图像模糊篡改检测算法*

2015-01-11 07:53杨本娟黎小平
传感器与微系统 2015年11期
关键词:分类器向量特征

杨本娟, 黎小平

(1.贵州师范大学 数学与计算机科学学院,贵州 贵阳 550002;

基于核主成分分析的图像模糊篡改检测算法*

杨本娟1, 黎小平2

(1.贵州师范大学 数学与计算机科学学院,贵州 贵阳 550002;

2.江西财经职业学院 信息工程系,江西 九江 332000)

现有的图像模糊篡改检测算法通常提取模糊操作引入的某单一特征进行判断,为更好地提高算法检测效率,提出基于核主成分分析的模糊篡改检测算法。通过奇异值分解提取第一组特征,计算图像二次模糊相关性作为第二组特征,计算图像质量因子作为第三组特征。运用核主成分分析方法实现多特征融合。采用支持向量机进行判断,从而实现模糊篡改检测。实验表明:该算法能够有效地检测数字篡改图像的模糊操作痕迹,并能对模糊篡改区域进行准确定位。

图像篡改检测; 核主成分分析; 模糊操作

0 引 言

随着图像编辑软件的普及和功能的多样化,数字图像极易被篡改而不留明显痕迹,为公安侦破和司法取证带来了挑战,也因此促进了数字图像盲取证技术研究的发展[1]。

为消除篡改留下的人眼可察觉的伪造痕迹,伪作者通常都会进行人工模糊操作。因此,检测模糊操作痕迹可为图像篡改检测提供有力凭据。王波等人利用模糊操作对异常色调率的影响来实现数字图像取证[2]。周琳娜等人提出基于图像形态学滤波边缘特性的盲取证算法[3]。王伟等人提出一种基于二次模糊相关性的单通道分离方法来检测模糊操作[4]。左菊仙等人利用二次模糊后像素差值的变化实现了模糊篡改的检测和定位[5]。这些传统方法都仅根据图像模糊后的某一特征来实现模糊检测并定位。因此,普遍存在以下两个问题:1)由于利用的特征是单一的,所以,检测效果不可避免地受到特征局限或特征显著性的限制;2)通常采用了基于阈值的检测方法,由于阈值的选择缺乏理论依据,所以,阈值的健壮性严重地制约着算法效果。

针对以上两个问题,杨本娟等人从模式识别的角度来检测篡改图像中的模糊操作,提出了基于特征融合的盲检测算法,一方面可以综合利用多特征,另一方面也可避免阈值的影响[6]。本文提出了基于核主成分分析(kernel principal component analysis,KPCA)的图像模糊检测算法。首先通过奇异值分解提取第一组特征,计算图像二次模糊相关性作为第二组特征,计算图像质量因子作为第三组特征。然后,运用KPCA方法实现多特征融合。最后,采用支持向量机(support vector machine,SVM)进行判断,从而实现基于模糊检测的图像篡改盲取证。实验表明:该方法能够有效地检测数字篡改图像的模糊操作痕迹,并能对模糊操作的图像局部进行准确定位。

1 算法流程与方案

检测图像是否篡改,从模式识别的角度看,本质上就是一个辨识原始图像和篡改图像的二元分类问题。本文算法的思想是:提取大量原始图像和篡改图像的特征,并在特征层进行融合,用融合特征训练分类器,得到一个训练模型,最后利用训练模型对待测图像或待测块进行分类判断。算法流程图如图1所示。

图1 算法流程图

本文提取的特征是篡改操作引入的特征(具体特征如下节所示)。除了特征提取之外,特征融合也是篡改检测的重要环节。本文在特征融合环节采用KPCA方法,具体特征融合方案如图2所示。

图2 特征融合方案的流程图

2 特征提取

2.1 奇异值特征

根据模糊操作对图像奇异值的影响,采用下述三个度量因子CD1,CD2和CD3[6]。首先,令

然后,定义

(1)

(2)

(3)

其中,I为M×N的待测图像或图像块,S为I的奇异值向量,P(k)为奇异值向量的第k个元素的比重。CD1描述了奇异值向量中后半部分的元素在整个向量中所占比重的均值。CD2描述了奇异值向量中小于某个阈值的元素个数与向量1/2长度的比重,这里的阈值取2。CD3定义为奇异值向量中后半部分元素的能量。最后,令T1={CD1,CD2,CD3},称为SVD特征。

2.2 二次模糊相关性特征

利用文献[4]的方法得一个基于二次模糊相关性的度量因子CD4为

CD4=ρcorr(|lnF(I)|,|lnF(I′)|).

(4)

其中,F为傅氏变换,I为M×N的待测图像或图像块,I′为I二次模糊后的图像或图像块。本文二次模糊采用σ为2的高斯模糊,模板大小取5×5,并令T2={CD4},称为二次模糊相关性特征。

2.3 图像质量因子

将文献[7]中的图像质量因子应用于模糊篡改检测,得5个度量因子CD5~CD9,分别是平均绝对误差、均方差、Minkowsky测度、内容结构相关性和归一化互相关

(5)

(6)

CD7=max(|I(i,j)-I′(i,j)|),

(7)

(8)

(9)

其中,I为M×N的待测图像或图像块,I′为I的退化图像或图像块。值得注意的是,计算图像质量度量(IQM)需要获得待测图像的退化图像,通常采用小波变换,但由于目的是检测模糊操作,因此,采用高斯模糊获得退化图像,也可视为二次模糊图像。实验中,高斯模糊参数σ为2,模板大小为5×5。最后,令T3={CD5,CD6,CD7,CD8,CD9},称为IQM特征。

3 KPCA特征融合

KPCA采用核映射Φ将样本数据映射到核空间F后,利用核方法实现核空间F中的主成分分析,经过推导可得KPCA的准则函数如下[8]

J(u)=uTStu.

(10)

其中,St为核空间F中的总体样本协方差矩阵。由于目标u∈F,所以,令

(11)

其中,n为样本总数,xi(i=1,2,…,n)为原始空间中第i个样本,Φ(xi)为核空间中对应的第i个样本,ai为对应的表示系数,Z=[Φ(x1),Φ(x2),...,Φ(xn)],a=[a1,a2,…,an]T。利用式(10)和式(11)可得

(12)

其中,K=ZTZ为核矩阵。进一步可得

(13)

其中,λi(i=1,2,…,r)为第i个特征值,gi为对应的特征向量。从而可得到高维空间中协方差矩阵的前r个大特征向量。

4 实验结果

本文实验中原始图像选择Columbia大学彩色拼接图像数据库中真实图像部分,共183幅。模糊篡改图像则利用Matlab获得。篡改图像的模糊类型为高斯模糊,参数σ为2,模板大小为5×5。实验样本库为183幅原始图像和183幅模糊图像组成。SVM选择LIBSVM软件包实现,核函数采用非线性的径向基函数,并利用3折交叉验证方法确定最佳惩罚因子c和径向基函数的参数γ。KPCA的核函数采用非线性的核函数为非线性的径向基函数,参数σ设置为30。为了验证提出算法的有效性,将实验结果与参考文献[6]的实验结果对比。

1)不同主成分个数下的正确检测概率

设计实验样本集的75 %用于训练分类器,25 %用于测试分类器,统计随机20次的平均正确检测概率,并在不同主成分个数下对平均正确检测概率进行对比,其结果如图3所示。实验结果表明:在不同的主成分个数下,本文算法的检测效果优于文献[6]算法的检测效果。同时可以看出,当主成分个数取4时检测算法的效果均较好,所以,接下来的实验中固定主成分个数为4。

图3 不同主成分个数时的正确检测概率

2)不同训练样本数目下的正确检测概率

为进一步比较不同特征融合方法的效果,设计三种实验:实验样本集的25 %用于训练分类器,75 %用于测试分类器,并统计随机20次的平均正确检测概率;50 %训练,50 %测试;75 %训练,25 %测试。在不同训练样本数目下对平均正确检测概率进行对比,其结果如图4所示。实验结果表明:本文算法的的检测效果优于文献[6]算法的检测效果。

图4 不同训练样本数目时的正确检测概率

5 结束语

本文从模式分类的角度探讨图像模糊篡改检测问题,提出了基于KPCA特征融合的模糊篡改检测算法。在特征提取阶段,提取SVD特征,二次模糊相关性特征和IQM特征;在特征融合阶段,利用KPCA进行特征融合。实验结果显示了算法的有效性,也证明了KPCA特征融合能有效提高检测效果。本文算法对存在其他篡改(如双重JPEG压缩)时的鲁棒性不好,一方面可考虑进一步融合其他篡改引入的特征,另一方面可在决策层进行信息融合。

[1] Farid H.Image forgery detection[J].IEEE Trans on Signal Processing,2009,26(2):16-25.

[2] 王 波,孙璐璐,孔祥维,等.图像伪造中模糊操作的异常色调率取证技术[J].电子学报,2006,34(12):2451-2454.

[3] 周琳娜,王东明.基于数字图像边缘特性的形态学滤波取证技术[J].电子学报,2008,36(6):1047-1051.

[4] 王 伟,方 勇.基于二次模糊相关性的单通道置换图像盲分离[J].应用科学学报,2011,29(2):169-175.

[5] 左菊仙,刘本永.伪造图像典型篡改操作的检测[J].中国图象图形学报,2012,17(11):1367-1375.

[6] Yang B J,Liu B Y.Feature fusion for blurring detection in image forensics[J].IEICE Transactions on Information and Systems,2014,E97—D(6):1690-1693.

[7] 周长辉,胡永健,谭莉玲.典型源相机分类算法性能研究[J].计算机应用,2011,31(4):1133-1137.

[8] Scholkopf B,Smola A,Muller K.Nonlinear component analysis as a kernel eigenvalue problem[J].Neural Computation,1998,10(5):1299-1319.

Blur detection algorithm in image forgery based on kernel principal component analysis*

YANG Ben-juan1, LI Xiao-ping2

(1.School of Mathematics and Computational Science,Guizhou Normal University,Guiyang 550002,China; 2.Department of Information Engineering,Jiangxi Vocational College of Finance and Economics,Jiujiang 332000,China)

Most existing image blurring forgery detection algorithm consider only one single feature introduced by blurring operation,in order to improve algorithm detection efficiency,propose blur forgery detection algorithm based on kernel principal component analysis(KPCA).Through singular value decomposition(SVD),extract the first group of features,calculate the secondlary fuzzy correlation as the second group of features,calculate image quality factor as the third group of feature.Multi-feature fusion are achieved using KPCA.Judgement is carried out using support vector machine,so as to realize blur forgery detection.Experimental results show the proposed algorithm can effectively detect blur operation trace of digital tampering image and can accurately locate blur forgery area.

image forgery detection; kernel principal component analysis(KPCA); blur operation

2015—09—01

贵州省科学技术基金资助项目(黔科合J字(2012)2272); 教育部人文社会科学研究青年项目(13YJC870013)

10.13873/J.1000—9787(2015)11—0137—03

TP 391

A

1000—9787(2015)11—0137—03

杨本娟(1982-),女,贵州贵阳人,博士,主要从事图像处理与模式识别的研究。

猜你喜欢
分类器向量特征
根据方程特征选解法
向量的分解
离散型随机变量的分布列与数字特征
聚焦“向量与三角”创新题
不忠诚的四个特征
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
基于层次化分类器的遥感图像飞机目标检测