一种JPEG图像的DCT域隐写分析方法

2011-05-17 09:08倪晋宇吴福宝谢春辉
网络安全与数据管理 2011年8期
关键词:特征参数差分正确率

倪晋宇,吴福宝,谢春辉

(中国科学技术大学 电子科学与技术系计算机视觉实验室,安徽 合肥230027)

图像信息隐藏是一种将秘密信息嵌入到普通载体图像中传输以期达到不可感知和不易检测目的的技术。隐写分析是在不知道隐藏方法的条件下,检测载体中秘密信息存在性的一种技术 。研究隐写分析技术具有重要的现实意义,它不仅能够促进信息隐写技术的发展,更能对各种非法的隐蔽通信起到很好的检测作用。

JPEG图像是作为隐藏载体应用最广泛的图像格式之一,DCT域隐藏又具有隐蔽性好等优点而常被用来隐藏信息,因此对JPEG图像DCT域的隐写分析意义重大。2002年,TU C等人提出隐写嵌入影响图像DCT系数的平滑性、规律性、连续性、周期性[1]。2007年,XUAN G R等提出了局部的差分扫描规则,并阐述了嵌入数据后对块内水平和竖直两个方向DCT系数差分统计特性带来的改变[2]。2008年,CHEN C H等通过实验证明了JPEG图像在嵌入数据后,提取DCT系数的块间特征来进行隐写分析会大大提高检测正确率[3]。

本文针对基于JPEG图像的几种常用的隐写算法,提出了一种DCT域的隐写分析方法。该方法通过JPEG图像分块DCT域系数水平、竖直及主副对角线4个方向上的差分矩阵,提取具有较强分类能力的特征向量,并用SVM分类器进行分类,检测出载密图像。实验证明,该方法具有较好的效果。

1 检测方法

图1所示为基于DCT域系数差分矩阵统计特征的JPEG图像隐写分析检测方法框图,主要包括分类模型的建立以及图像的隐藏信息检测两个部分。

图1 隐写分析方法框图

框图的上半部分为DCT域隐写分析模型的建模部分,训练样本包括原始图像集合和含有秘密信息的图像集合。经过分块的DCT变换,得到DCT系数的差分矩阵,并从中获取统计特征参数,对参数做方差分析,选择那些能较好反映原始图像和载密图像统计差异的参数作为隐藏信息检测的特征,通过分类器的自学习建立分类模型。

框图的下半部分是图像的隐藏信息检测部分。先对待测图像进行8×8的分块DCT变换,同样获得其系数在选定方向上的差分矩阵,计算预先选择的特征的参数值,进而应用预先训练获得的隐写分析模型,最终获得图像中是否含有隐写信息的检测结果。

2 特征提取

原则上,用于隐写分析的特征必须对秘密信息敏感而对载体图像不敏感。本文研究的是JPEG图像DCT域的隐写分析,因此在隐藏过程中,量化的DCT系数中被隐藏了信息,而这在一定程度上可能导致DCT系数的统计特征发生改变,可以考虑利用这一统计特征的改变来对图像进行分析。基于以上论述,对图像做8×8的分块DCT变换,再求取其差分矩阵,从中提取并筛选特征。

2.1 DCT系数块内4个方向上的差分矩阵

假设待测JPEG图像的尺寸大小为 M×N,对其做8×8的分块 DCT 变换后可被分成 NB=⎿(M+7)/8」×⎿(N+7)/8」个不重叠的DCT系数块,而每一个8×8的DCT系数块如图2所示。(⎿(M+7)/8」表示对(M+7)/8向下取整)。

图2 一个 8×8的 DCT块

为了更好地描述JPEG图像分块DCT系数差分矩阵的统计特征,用Dm,n(i,j)表示JPEG图像中第 m行、第 n列的8×8图像块经DCT变换后位置处的量化DCT系数值,其中 l≤m≤⎿(M+7)/8」,1≤n≤⎿(N+7)/8」,1≤i≤8,l≤j≤8。

这样,就可以方便地得到JPEG图像某分块DCT系数块内4个方向上的差分矩阵:

(1)水平方向:BDhm,n(i,j)=Dm,n(i,j+1)-Dm,n(i,j),1≤i,j≤7;

(2)竖直方向:BDvm,n(i,j)=Dm,n(i+1,j)-Dm,n(i,j),1≤i,j≤7;

(3)主对角线方向:BDpm,n(i,j)=Dm,n(i+1,j+1)-Dm,n(i,j),1≤i,j≤7;

(4)副对角线方向:BDqm,n(i,j)=Dm,n(i-1,j+1)-Dm,n(i,j),1≤i,j≤7。

BDh(i,j)、BDv(i,j)、BDp(i,j)、BDq(i,j)分别表示水平 、竖直、主副对角线4个方向上的差分二维矩阵。通过对以上4个方向上差分矩阵的求取,就可以选取和计算出在这4个方向上的特征和特征向量。

2.2 方差分析提取部分特征

选择合适的特征空间对构建隐写分析的分类器起至关重要的作用。有效的特征必须对嵌入改变敏感而对图像内容相对不敏感。目前比较普遍被采用的特征有DCT系数差分矩阵系数的均值、方差、偏度γ3=E(x-μ)3/σ3、峰度γ4=E(x-μ)4/σ4等。 本文的方法中还加入特殊系数值的分布概率以及系数差分直方图的曲线平滑度、偶数阶中心矩、直方图曲线下特定区域面积和中心区域面积的比重等特征。怎样对上述这些特征进行筛选,选取对隐藏分析和检测最有效的特征,以达到好的分类效果就显得相当重要。本文的方法采用了方差分析[4]技术。

方差分析法常用于两个或两个以上样本均值差异的显著性检验,通过分析研究不同来源的差异对总差异的影响大小,来确定不同来源对结果的影响。若A是包括原始图像和K-1中信息隐藏方法的图像样本集合,共有 M=n×k个图像样本,可表示为 A={A1,A2,…,Ak},其中 A1是包含 n个原始图像样本的子集,Ai(i=2,…,k)是第i种信息隐藏方法得到的图像样本子集。Ai经过分块DCT变换后,组成一个新的子集 Ai′,通过 Ai′中相应元素可计算出第j个图像隐写分析特征参数的子集Xij={Xi1j,Xi2j,…,Ximj},其中 m=1,2,…,n为每种隐藏方法的图像样本个数,j=1,2,…,p为图像特征参数的个数,故A集合中所有图像样本第j个特征参数的集合可表示为Xj={Xi1j,Xi2j,…,Ximj}。

由方差分析法知,对第j个特征参数,可计算相应的Fj值:

其中Xij为子集 Ai第j个特征参数的平均值,Xj为A集合中第j个特征参数的总平均值,n为子集Ai中元素的个数。

MSj1反映了原始图像和用不同隐藏方法嵌入信息的图像经DCT变换后特征参数的差异,MSj2反映的是同一种隐藏方法嵌入信息的图像经DCT变换后特征参数的差异。这样F值大小便反映出各特征参数在图像信息隐藏前后的变化的大小。

若H(d)表示图像DCT系数值d出现的次数,取H(-5)~H(5)共10个值,并进行归一化得到DCT系数的差分分布频率 h(d),如式(1)所示。 选择提取偏度γ3、峰度γ4及 h(1)、h(-1)、h(2)、h(-2)作为部分特征参数。

2.3 DCT系数块内特征

在2.1节中定义了DCT系数块内4个方向上的差分矩阵,且由于每个DCT块左上方区域的系数值较大,在比较多的隐藏方法中被选择作为嵌入信息的区域,基于此本文特别选取每个块中1≤i,j≤4的DCT系数作为特征提取重要的研究对象,这样在相对减小检测精度的前提下,大大减小了计算复杂度。通过引入多向差分差异参数来描述相邻DCT系数受嵌入影响的概率分布情况,其定义如式(2)所示。

实验中按照Zig-Zag扫描的顺序间隔选取M(1,1)、M(2.1)、M(2.2)、M(1,4)、M(3,2)、M(5,1)、M(3,3)、M(1,5), 与2.2节中提出的6个特征一起,即得到14维对信息嵌入更敏感的特征向量,用于检测JPEG图像中是否含有秘密信息。

3 SVM分类

支持向量机SVM(Support Vector Machine)方法建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。

本文算法的实质就是对每幅待测图像进行统计分析,提取含有特征参数的特征向量,将其输入支持向量机分类器进行分类,能否判定是否含有秘密信息是一个二分类的问题。很多模式识别中成熟的方法可被用来进行分类,本文采用LIBSVM[5]分类器对待测图像进行检测,来判定是否含有隐藏信息。

4 实验与结果分析

首先,构建实验所用的测试图像库:从UCID图像库[6]中随机选取500幅格式为JPEG的图像,并统一处理成256×256的大小作为实验测试数据库;其次,每次选取这200幅图像构成实验用的原始图像库,并对这500幅图像分别用 JSteg[7]、F5[8]、OUTGUESS三种嵌入方法嵌入,嵌入容量分别为最大嵌入比特数0.25 bpc的20%、40%、60%、80%和100%(每种情况随机选 100幅图像进行嵌入);最后,对这些图像进行检测分类,计算出每种情况下的检测正确率、误检率和漏检率。其中,

其检测结果的统计数据以及与其他方法的结果比较分别如表1和表2所示。

从表1可以看出,对以上三种嵌入方法,随着嵌入容量的增大,检测正确率也在增大;对于不同嵌入方法,当嵌入容量达到一定值(最大嵌入比特数的40%)时,本文的方法都能有效地检测(检测正确率达到85%以上)。如表2所示,相比于已有的信息隐藏分析方法[9],本文的方法也具有较高的检测正确率,特别是嵌入率较低的情况下也有很好的检测效果。总体来说,该算法能够有效地对JPEG图像进行检测,具有较好的性能。

表1 不同嵌入方法和嵌入率条件下的检测正确率/%

表2 已有分析方法对此3种隐藏方法的检测正确率/%

本文提出了一种基于统计学的信息隐藏分析方法,通过利用差分矩阵相关特征的统计特性在图像信息隐藏前后的改变进行特征评估,并对评估的数据进行方差分析,选择有效的特征组成多维特征向量来建立隐写分析的系统模型,从而实现JPEG图像隐藏信息的盲检测。实验表明,该方法实现较为简便,检测效果较好,具有较强的实用价值。

[1]TU C,TRAN T D.Context-based entropy coding of block transform coefficients for image compression[J].IEEE Transactions on Image Processing,2002,11(11):1271-1283.

[2]XUAN G R,CUI X,SHI Y Q,et al.JPEG steganalysis based on classwise non-principal components analysis and multi-directional markov model[C].IEEE International Conference on Multimedia and Expo(ICME 2007),Beijing,China,July2-5,2007.

[3]CHEN C H,SHI Y Q.JPEG image steganalysis utilizing both intrablock and interblock correlations[C].IEEE International Symposium on Circuits and Systems,2008:3029-3032.

[4]辛益军.方差分析与实验设计[M].北京:中国财政经济出版社,2001.

[5]CHANG C C,LIN C L.LIBSVM:a library for support Vector Machines[CP].http://www.csie.ntu.edu.tw/-cjlinllibsvm.

[6]SCHAEFER G,STICH M.UCID-an uncompressed color image database[R].Technical Report,School of Computing and Mathematics,Nottingham Trent University,UK,2003.

[7]UphamD.JPEG-JSteg-V4[CP/OL].(1993-05-25)[2009-l1-02].http//www.funet.fi/pub/crypfstegan~~graphy/jpeg-jstegv4.dif.gz.

[8]WESTFELD A.F5-a steganography algorithm:high capacity despite better steganalysis[C].Proceedings of 4th Information Hiding International Workshop.Berlin:Springer-Verlag,2001,LNC2137:289-302.

[9]Yu Wenqiong,Li Zhuo,Ping Lingdi.Blind detection for JPEG steganography[C].Networking and Information Technology(ICNIT),2010 International Conference on Digital Object Identifier,2010:128-132.

猜你喜欢
特征参数差分正确率
RLW-KdV方程的紧致有限差分格式
数列与差分
冕洞特征参数与地磁暴强度及发生时间统计
门诊分诊服务态度与正确率对护患关系的影响
基于交通特征参数预测的高速公路新型车检器布设方案研究
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意