图像隐写分析系统性能评价方法研究

2010-03-11 07:27马秀莹
电信科学 2010年2期
关键词:分析方法准确性系数

马秀莹

(上海应用技术学院计算机科学与信息工程学院 上海 201418)

1 引言

隐写(steganography)和隐写分析(steganalysis)是信息隐藏技术的重要分支。信息隐藏技术作为一种新型的计算机取证技术,在信息安全领域起着非常重要的作用。目前,国内有关计算机取证方面的研究和实践还处于起步阶段,计算机取证工具的评价标准尚未建立,亟需进行相关研究。

基于图像的隐写术将隐秘信息嵌入在正常载体 (图像)中进行传送而不引起第三方怀疑,实现隐秘信息的传递。图像隐写分析技术是对隐写术的攻击,目的是为了检测隐秘信息的存在以致破坏隐秘通信。隐写已成为保密通信的有效手段,但隐写也会被敌对势力利用,成为危害国家政治、经济安全的工具,隐写分析是解决非法使用隐写术问题的关键技术。

隐写分析系统性能主要从准确性、适用性、实用性和复杂度4个方面进行评价。准确性指检测的准确程度,是隐写分析算法最重要的一个评价指标;适用性指检测算法对不同的隐写算法的有效性,用检测算法能够有效检测的隐写算法种类来衡量;实用性指检测算法可实际应用的程度,由现实条件、检测结果稳定性、自动化程度和实时性等来衡量;复杂度是针对检测算法本身而言的,由实现检测算法所需要的资源开销、软硬件条件等来衡量。

2 隐写分析算法准确性描述

隐写分析算法准确性通常用虚警率 (FPF)、漏警率(FNF)、检测率(TPF)、全局检测率(AUC)和检测器接收操作特性(receiver operating characteristic,ROC)曲线来进行评价。

ROC曲线是以FPF作为x轴,TPF作为y轴得到的直观性图示分析工具。ROC曲线与横坐标包含区域的面积(area under curve,AUC)可以全面衡量算法性能,称为全局检测率。

上述测试方法均与嵌入容量有关,使得评价方法复杂化。全局检测率AUC也具有一定的局限性,这是由于AUC是在赋予了虚警率和漏警率相同的加权值的前提下计算得到的,因此只适用于一定的应用范围。要解决这些问题,就必须画出全体ROC曲线(即针对每一个嵌入率,都要画出相应的ROC曲线)。面对这样庞大的数据量,几乎不可能形成一个有效的评价准则。

基于此,本文提出一种新的评价方法,利用原始图像分布和掩密图像分布之间的差异,该差异可用KL距离度量。设f和g分别代表分布F和G的密度函数,则KL距离为:

3 准确性评估模型

首先,必须在隐写分析过程中选择适当的阶段计算KL距离。

如图1所示,将隐写分析过程分为 3个阶段:(1)提取特征相量阶段;(2)使用分类器或容量估计将特征相量维数减小为1;(3)设定阈值阶段。如果求得的一维特征相量值大于设定的阈值,则认为是掩密图像,否则为原始图像。

图1中,Ap代表嵌入率为p的掩密图像的分布,Bp是隐写分析算法所使用的特征向量的分布,Cp是将待测图像划分为掩密图像和原始图像之前的单变量特征向量分布,Dp是输出的二进制分布。

DKL(A0,Ap)值通常用来评估隐写算法的安全性;在图1的另一端,DKL(D0,Dp)由于量化掉过多的信息,也不适于评价隐写分析算法的准确性;DKL(B0,Bp)能够较好地反映隐写分析系统的性能,但是当特征向量维数很大时,对于DKL(B0,Bp)的估计非常困难;最后只剩下DKL(C0,Cp)由于跟嵌入容量有关,仍然不是一个简便的评价准则。

因此,考虑用相对性能代替绝对性能评价,即定义隐写分析系统准确性指标为:

4 评估指标计算方法

从式(1)可以看出,要计算KL距离,需要知道原始图像和掩密图像的分布。由于图像的多样性和非平稳性,空域中缺乏有效的分布模型,但是在变换域存在比较成熟的模型来对图像的统计分布进行描述。考虑到JPEG图像使用的普遍性和DCT变换在JPEG压缩标准中的应用,选择在DCT域对KL距离进行度量。

与传统的模型 (高斯分布、Lapalacian分布和柯西分布)相比,SαS模型更适合于描述图像的DCT系数分布[1]。SαS模型有用于控制概率密度函数拖尾的厚度的参数,随机变量的概率密度函数存在且连续。除了高斯分布、柯西分布等很少的例外之外,SαS分布没有封闭形式的显式表达式,很多使用概率密度函数的工作可以通过对特征函数的变换来实现。

SαS分布的特征函数为:

其 δ中为位置参数(-∞<δ<+∞),分散系数 γ(γ>0)是样本相对于均值分散程度的度量,为特征指数或称稳态因子(0<α≤2)。当稳态因子 α=1时是柯西(Cauchy)分布,当α=2时是高斯(Gaussian)分布。显然,α是一个最重要的参数,它决定了SαS分布形状。

对于SαS随机变量X,当x→∞时,其尾部满足:

这里 cα=Γ(α)sin(απ/2)/π。

由式(4)可以看出,特征指数α越小,其分布模型的尾巴就越重;特征指数α越大,其分布模型的尾巴就越细,表现为快速衰落。

对于图像而言,纹理细节越丰富的图像,其特征指数α就越小;具有平滑区域越多的图像,其特征指数α就越大。这是由于图像细节部分的能量聚集在DCT系数的高频部分,图像纹理细节越丰富,其DCT系数概率分布就越平坦,也就具有重尾巴特征;而图像平滑部分的能量经DCT变换后却聚集在DCT直流系数和低频系数部分,图像纹理细节越贫乏,其DCT系数概率分布就尖锐,也就是尾巴越细。

图1 隐写分析过程

采用极大似然估计法[2,3]对DCT交流系数分布的参数α进行估计,从而确定SαS模型。利用式(1)计算得到KL距离 DKL(A0,Ap)和DKL(C0,Cp),代入式(2)即求得隐写分析系统准确性评价指标Q。

5 实验结果与分析

LSB隐写算法由于具有算法简单、嵌入容量大等优点,得到了广泛的应用,因此,相应的隐写分析技术也成为研究热点。因此,本文利用指标Q对常见的针对LSB的隐写分析方法进行分析评价。目前,主要的针对LSB的隐写分析方法有 χ2检测算法[4]、RS 算法[5]、DIH(differential image histogram)算法[6]、SPA(sample pair analysis)算法[7]和 Triples/LSM[8]算法。

(1)实验一

选用华盛顿大学的CBIR图像库[9]和J.H.van Hateren建立的灰度图像库[10],用顺序LSB嵌入法在图像中嵌入不同容量的隐秘信息,生成一系列掩密图像。利用上述5种隐写分析方法对其进行隐写分析,用准确性指标Q进行分析评价的结果见表1。

表1 顺序LSB嵌入的隐写分析算法的准确性

(2)实验二

选用与实验一中相同的图像库,采用随机间隔LSB嵌入法生成一系列掩密图像。用准确性指标Q对5种隐写分析方法进行分析评价的结果见表2。

表2 随机间隔LSB嵌入的隐写分析算法的准确性

从表1和表2可以看出,算法准确性从高到低依次为:Triples/LSM 算法、SPA 算法、DIH 算法、RS 分析方法、χ2检测算法。SPA算法的原理是基于基本集的势,对随机嵌入信息的图像检测的准确率很精确;Triples/LSM算法是对SPA算法的改进算法,沿水平方向(或垂直方向)取3个相邻像素为一组,将基于像素对的方法推广为以3个像素 (样本)为一组,在嵌入率较低时检测准确率高于SPA算法;DIH算法和RS分析方法的检测准确率非常相近,而对于原始无损存储图像,DIH算法的准确率高于RS分析方法,因此,总体上DIH算法优于RS分析方法;χ2检测算法对随机间隔LSB嵌入方法无效,对于顺序嵌入的检测准确率最低。

6 结束语

随着计算机取证技术的发展需求,信息隐藏技术的研究不断深入,建立相应的性能评价标准势在必行。隐写分析算法的目的是揭示隐秘信息的存在,因此如何准确地从大量的载体中检测出掩密载体,从而破坏隐蔽通信非常重要。实验表明,本文提出的隐写分析系统准确性评价指标Q,以掩密图像和原始图像之间的KL距离为基础,能够对不同隐写分析算法的准确性进行公正的评价。如何得出更具全面性、客观性的信息隐藏性能评价标准是下一步的研究内容。

1 Adler R,Feldman R,Taqqu M S.A guide to heavy tails:statistical Techniques and applications.Boston,MA:Birkhauser,1998

2 Nolan JP.Numericalcalculation of stable densities and distribution functions.Commun Statist-Stochastic Models,1997,13(2):759~774

3 Bodenschatz J S,Nikias C L.Maximum-likelihood symmetric α-stable parameter estimation.IEEE Transactions on Signal Processing,1999,47(5):1382~1384

4 Westfeld A,Ptzmann A.Attacks on steganographic systems.In:Proc of the 3rd International Workshop on Information Hiding,Dresden,Germany,1999

5 Fridrich J,Goljan M,Du R.Reliable detection of LSB steganography in grayscale and color images.In:Proc of ACM,SpecialSession on Multimedia Security and Watermarking,Ottawa,Canada,2001

6 Zhang Tao,Ping Xijian.Reliable detection of LSB steganography based on the difference image histogram.In:Proc of IEEE InternationalConference on Acoustics,Speech,and Signal Processing,Hong Kong,China,2003

7 Dumitrescu S,Wu Xiaolin,Wang Zhe.Detection ofLSB steganography via sample pair analysis.In:Proc of the 5th International Workshop on Information Hiding,Springer-Verlag,2002

8 Ker A.A general framework for the structural steganalysis of LSB replacement.In:Proc 7th Information Hiding Workshop,Springer LNCS,2005(3727):296~311

9 University of Washington.CBIR image database.http://www.cs.washington.edu/research/imagedatabase/groundtruth/,1997

10 Hateren J H,Schaaf A.Independent component filters of natural images compared with simple cells in primary visual cortex.Biological Sciences,1998,265(1394):359~366

猜你喜欢
分析方法准确性系数
基于EMD的MEMS陀螺仪随机漂移分析方法
浅谈如何提高建筑安装工程预算的准确性
一种角接触球轴承静特性分析方法
中国设立PSSA的可行性及其分析方法
这些待定系数你能确定吗?
打雪仗
过年啦
两张图弄懂照明中的“系数”
影响紫外在线监测系统准确性因子分析
论股票价格准确性的社会效益