基于CSR-ICA模型的隐写信息盲提取算法

2013-07-20 02:33冯帆王建华张政保王惠萍戚红军张海龙
计算机工程与应用 2013年24期
关键词:峭度子图高斯

冯帆,王建华,张政保,王惠萍,戚红军,张海龙

1.白求恩军医学院基础部,石家庄 050081

2.军械工程学院计算机工程系,石家庄 050003

基于CSR-ICA模型的隐写信息盲提取算法

冯帆1,2,王建华1,张政保2,王惠萍1,戚红军1,张海龙1

1.白求恩军医学院基础部,石家庄 050081

2.军械工程学院计算机工程系,石家庄 050003

1 引言

随着网络技术和多媒体技术的迅速发展,隐写术已成为实现网络隐蔽通信的全新技术手段。隐写分析技术作为隐写术的对抗技术,其目的是揭示出隐秘载体中秘密信息的存在,进而进行提取、篡改或破坏。鉴于隐秘信息提取的困难性,目前关于隐秘信息的提取技术研究较少,并且主要集中于特定算法的研究上[1-4]。ICA是一种统计计算技术,对于通常情况下,以大量样本数据库形式给出的多元观测信号,它定义了一个问题生成模型,模型假设观测数据变量是内在变量的线性组合,且内在变量和混合系统均是未知的,如果内在变量满足统计上相互独立,且至多只有一个非高斯信号,则该变量可通过ICA的方法实现分离提取。ICA作为当今信号处理领域的一个研究热点,主要用于解决信号的分离提取、增强、降噪、分类等问题,近几年来,研究者们开始将ICA模型技术用于水印及主动隐写分析技术的研究[5-9]。

加性隐写模型和乘性模型是数据隐写嵌入研究应用最多的模型,而乘性隐写模型从数学角度上可转化为加性模型。因此,针对加性隐写模型,进行隐秘信息盲提取技术研究更具有通用性。隐写信息盲提取实际上是从混叠信号中分离提取出隐写信息的过程。对于图像载体加性隐写嵌入模型,隐秘信息可以看成载体和秘密信息的线性混叠信号。因绝大多数自然图像,其概率密度函数为非高斯分布,且隐秘信息和载体信息一般为非高斯信号,唯一可能成为高斯信号的只有秘密信息,满足ICA模型的约束条件。但是,对于隐写分析者而言,往往不能够得到满足条件的两个观测信号。所以,隐写信息盲提取属于BSS问题中“欠定”ICA模型问题。研究表明[10]:源信号的非高斯性以及ICA学习算法本身的性能对源信号分离提取精度影响较大。而信号的非高斯性与其稀疏性又有着直接的关系:信号的稀疏性越好,非高斯越强。自然图像基本上没有稀疏性可谈,但是通过相应变换可以实现图像稀疏性表示。轮廓波(Contourlet)是一个空间多分辨率分析工具,能够根据实际应用的具体情况,选择所需要的空间和方向进行分析,其变换较小波变换具有更好的图像稀疏表示,是二维图像稀疏表示最有效的工具,图像通过Contourlet稀疏性表示,能够增强其非高斯性[11]。

鉴于上述分析,为便于解决问题,同时提高隐写信息盲提取的精度,笔者将图像稀疏性表示(CSR)与ICA有机结合,提出一种基于CSR-ICA的隐写信息盲提取算法。算法能够有效实现隐写信息的盲提取,隐写信息的平均提取精度达90%,运行效率高于典型FastICA算法,综合性能优于典型的Chandramouli算法。

2 ICA模型理论及分析

2.1 ICA数学模型

ICA模型分为超“欠定”(Overunderminded)ICA(m>n)、“适定”(derminded)ICA(m=n)和“欠定”(undermined)ICA (m<n)。关于超欠定和适定ICA问题的研究较为成熟,而对于“欠定”ICA问题研究才刚刚起步。因此本算法是在适定ICA模型基础上进行研究。模型约束条件:各个源信号之间统计上相互独立,若随机变量y1,y2,…,yi,…,ym统计上独立,当且仅当它们的联合概率密度是其边缘概率密度之积,见式(2);源信号至多有一个高斯信号,对于模型y=Wz= WVx=WVAs=WA~s,如果y具有较强的非高斯型,则WA~=I,此时的分离信号则等于源信号;源信号混叠矩阵是一个常矩阵,且列满秩。此时的ICA便能实现源信号的分离和提取。

ICA模型实际上是通过对“隐变量”生成过程的描述,在源信号和传输通道参数先验知识未知的情况下,对源信号作一个非常弱的假设,然后根据其分布特性,确定目标函数、选择学习优化算法,估计源信号混叠矩阵,进而实现对源信号的分离提取。假设存在n个独立源信号s= [s1,s2,…,si,…,sn]T和m个观测信号x=[x1,x2,…,xi,…,xm]T,且观测信号x的n个随机变量由信号s的m个随机变量线性组合得到。则随机变量xi表示为:

2.2 盲信号估计方法

常用ICA估计方法有极大化非高斯性估计算法、极小化互信息估计算法等。研究表明源信号非高斯强弱影响ICA分离精度。考虑到算法的研究对象,在此仅对简单而直观的极大化非高斯性的ICA估计方法进行研究分析。在ICA算法估计中,峭度是一种经典的非高斯度量指标,是随机变量的四阶累计量,用于度量源信号偏离高斯性的程度。若随机变量的均值为0,则其峭度:

若峭度kurt(x)=0,则随机变量的分布为高斯分布;若峭度kurt(x)<0,则随机变量为次高斯分布;若峭度kurt(x)>0,则随机变量为超高斯分布,并且超高斯性越强,其峭度绝对值则越大。

3 基于CSR-ICA的隐写信息盲提取算法

3.1 欠定ICA问题的适定化转换

利用隐写分析者仅有的一幅隐秘图像z(k),生成满足适定ICA问题模型约束条件的另一幅观测信号z1(k)。则图像载体加性隐写模型:

由上式可知,z(k)实际上是s(k)和w(k)的加权线性组合,见式(6),式(5)在β=1情况下的特例。

将隐秘载体z(k)作为新的载体,按照加性隐写模型公式,嵌入一独立同分布的随机信号n(k),得一新的含秘载体信号z1(k),原信号的分布特性不受影响,并且z1(k)仍然是连续稳定的非高斯信号,可通过s(k)和w(k)的加权线性组合得到,则:

3.2 源信号CSR前置处理

在混合信号输入ICA前,首先采用CSR进行前置处理得到稀疏性较好,即非高斯性最大的输入信号。自然图像并不是简单的一维分段光滑线段的简单堆积,而是包含着内在的几何结构,其突变信息通常为图像的边缘信息,并且位于光滑的轮廓曲线上。传统的二维可分离小波是由一维小波的张量积构成,在表示一个光滑轮廓时,其不同分辨率下的支撑空间为不同尺寸大小的正方形,对奇异曲线的逼近表现为奇异点的逼近。而轮廓波(Contourlet)是一种多尺度、多方向的图像表示方法,其支撑区间具有随尺度而长、宽比变化的“长条形结构”,类似于线段的基结构来逼近原始图像。因此增强源信号的非高斯性,有利于源信号分离精度的提高。峭度可以作为信号极大化非高斯性的无量纲度量标准。Contourlet变换是图像稀疏性表示的优秀工具,在数字水印、隐写分析等方面得到了成功应用[12-15]。图像CSR表示能够获得非高斯性较小波变换更强的高频子图。表1为不同变换方式所得到的高频子图峭度的大小对比。

表1 两种变换方式的高频子图概率密度函数的峭度

表1中数据显示:图像经Contourlet DBF三层分解所得16个方向高频子图的概率密度函数的峭度最大为67.47,32个方向高频子图的概率密度函数的峭度最大为90.09,而图像经DWT三级小波分解,所得HL、LH和HH三个方向9个高频子图的概率密度函数的峭度最大只有36.66。因此,图像的Contourlet变换能够得到较DWT变换稀疏性更好的高频子图。所以,根据Contourlet变换高频子图的归一化峭度,选择非高斯性较强的高频子图作为ICA模型的输入数据,以提高ICA估计矩阵精度。

3.3 ICA学习方法确定

算法选择简单直观的极大化非高斯性ICA估计方法,通常情况下,选择峭度作为度量非高斯性的无量纲标准,但因峭度对异常值比较敏感,所以,将归一化峭度作为代价函数的自然梯度学习法,实现分离矩阵的估计,以消除异常值的影响。代价函数:

3.4 隐写信息提取

首先对ICA模型所涉及到的观测信号x(含密图像)、白化信号z和源信号s(载体和隐写信息)的估计信号y(提取的秘密信息)分别进行Contourlet变换:

式中,C(.)表示Contourlet变换,A、V和W分别为源信号的混叠矩阵、观测信号的白化矩阵和源信号分离矩阵。

因Contourlet变换是一个线性变换,源信号混叠矩阵在变换前后保持不变。所以,基于CSR-ICA模型得到的估计矩阵与时域矩阵相同,可直接用于隐写信息的分离和提取。此外,因图像稀疏性表示子图与原始图像相比,尺寸要小很多,所以,基于CSR-ICA的源信号分离提取,不仅提高分离矩阵的估计精度,而且还缩短了算法运行的时间。

4 实验结果与分析

为与典型的Chandramouli算法性能进行对比,实验分别采用“三观测信号”和“两观测信号”算法模型实现隐写信息的盲提取。

4.1 仿真实验

实验采用大小为256×256的lena.bmp灰度图像作为原始载体图像c(k),隐秘载体图像z(k)通过扩频隐写,在DCT和DWT高频系数中,选取嵌入长度为L的隐写信息得到最大系数。在此隐写信息w(k)为均值为0、方差为1的随机序列,若随机序列的长度为L,则L分别取10、50、100、500、1 000、3 000、7 000。

(1)“两观测信号”。将待测图像z(k)作为新的载体对象,采用加性隐写嵌入模型嵌入一独立同分布的随机序列,生成另一观测信号x1(k),并分别对x(k)、x1(k)进行j=3的LP分解,lj=2j的多方向DBF分解,优化选择峭度较大的高频子图C(x(k))、C(x1(k))作为CSR-ICA模型观测信号[C(x(k)),C(x1(k))]T,然后采用归一化峭度自然梯度学习法,实现源混叠信号的分离和提取。其中C(·)为Contourlet变换。

(2)“三观测信号”。将(1)中的x1(k)替换Chandramouli算法中原始信号的估计信号xˆ(k),并与已知的非高斯随机序列f(k)进行线性组合,生成另外两个观测信号,按照(1)中相同的方法生成[C(x(k)),C(x1(k)),C(x2(k))]T,实现隐写信息的分离提取。

初始值随机产生,算法运行20次所提取隐写信息长度平均错误率见表2,DCT域隐写嵌入长度分别为50和100的秘密信息的提取见图1。

表2 基于SCR-ICA的信息长度平均估计错误率

图1 秘密信息嵌入长度提取

此外,算法因对观测信号进行Controulet变换,使图像大小缩小了很多,降低了ICA学习算法的计算复杂度,提高了算法学习效率。表3是LP=3,DBF分解方向数为16的高频子图混叠信号与原始图像混叠信号采用典型的固定点学习算法的耗时情况。

表3 算法耗时

4.2 结果分析

表2中的数据显示:算法隐写信息提取的正确率最大为95%、最小为86%,明显高于Chandramouli文献[5]提出的“三观测信号”模型算法的提取正确率(最大70%、最小62%),虽然与Chandramouli文献[6]中的“两观测信号”模型算法的实验结果(最大为100%、最小为92%)相比,低了几个百分点,但因其算法要求两观测信号必须是不同嵌入强度下的相同载体和秘密信息线性组合生成,限制条件过于苛刻,对于隐写分析者来讲,实现起来难度较大,甚至根本无法实现,如果隐写分析者具备Chandramouli算法中观测信号生成条件,可将其引入Chandramouli算法中,进一步提高算法的性能;如果不具备其条件,采用本文提出的算法,效果则会更好。

表3的数据显示,FastICA算法的运行时间为0.361 6,而SCR-FastICA算法的运行时间为0.004 1,因此,采用图像CSR对ICA模型输入数据进行前置处理能够提高算法运行效率。

5 结束语

本文对通用隐写嵌入模型、隐写信息盲提取原理以及ICA模型技术进行了综合分析和研究,给出了隐写信息盲提取“欠定”ICA问题“适定”化解决的思路,在此基础上,将图像Contourlet稀疏性表示与ICA模型技术进行有机的结合,提出了一种基于CSR-ICA模型实现隐写信息盲提取算法。算法仅需一幅隐写图像,即可实现隐写信息的提取,克服了典型Chandramouli算法约束条件的限制,降低了提取信息的错误率,同时提高了算法的运行效率,其综合性能优于典型Chandramouli算法。

[1]Fridrich J,Soukal D,Goljan M.Maximum likelihood estimation of secret message length embedded using±K steganography in spatial domain[C]//Proceedings of the SPIE-Security Steganography and Watermarking of Multimedia Contents VII,San Jose,CA,2005:595-606.

[2]张卫明,李世取,刘九芬.对空域图像LSB隐写术的提取攻击[J].计算机学报,2007,30(9):1625-1630.

[3]Lou Der-Chyuan,Liu Chiang-Lung,Lin Chih-Linn.Message estimation for universal steganalysis using multi-classification support vector machine[J].Computer Standards&Interfaces,2009,31(2):420-427.

[4]Kodovsky J,Fridrich J.Quantitative structural steganalysis of Jsteg[J].IEEE Transactions on Information Forensics and Security,2010,15(4):681-693.

[5]Chandramoouli R.A mathematical framework for active stenanalysis[J].Multimedia Systems,2003,9(3):301-311.

[6]Chandramouli R,Subbalakshmi K P.Active steganalysis of spread spectrum image steganography[C]//2003 IEEE International Symposium on Circuits and Systems(ISCAS 2003):General&Nonlinear Circuits and Systems,2003:830-833.

[7]刘晓芹,王嘉祯,徐波.基于HMT和ICA的主动隐写分析算法[J].武汉大学学报:信息版,2008,33(10):1060-1066.

[8]Malik H.Blind watermark estimation attack for spread spectrum watermarking[J].Informatica,2009,33(1):49-68.

[9]Umaamaheshvari A,Thanushkodi K.Digital image watermarking based on independent component analysis and ridgelet transform[J].International Journal of Computer Science and Network Security,2011,11(4):14-17.

[10]史习智.盲信号处理——理论与实践[M].上海:上海交通大学出版社,2008.

[11]焦李成,侯彪,王爽,等.图像多尺度几何分析理论与应用——后小波分析理论与应用[M].上海:上海交通大学出版社,2008.

[12]楼偶俊,王钲旋.基于特征点模板的Contourlet域抗几何攻击水印算法研究[J].计算机学报,2009,32(2):308-317.

[13]Sajedi H,Jamzad M.Using contourlet transform and cover selection for secure steganography[J].International Journal of Information Security,2010,9(5):337-352.

[14]石慧,林闯,李明楚,等.基于Contourlet变换的抗几何攻击数字水印算法[J].光电子·激光,2011,22(10):1575-1581.

[15]Sajedi H,Jamzad M.CBS:Contourlet-Based Steganalysis method[J].Journal of Signal Processing Systems for Signal,Image,and Video Technology,2010,61(3):367-373.

FENG Fan1,2,WANG Jianhua1,ZHANG Zhengbao2,WANG Huiping1,QI Hongjun1,ZHANG Hailong1

1.Department of Basic Courses,Bethune Military Medical College,Shijiazhuang 050081,China
2.Department of Computer Engineering,Ordnance Engineering College,Shijiazhuang 050003,China

Aiming at steganography adding model,a blind extraction algorithm of embedded messages is proposed based on CSR-ICA.It attains estimated signal of original cover signals using linear combination just one digital image,which consists with constrain of ICA model.Then signals with optimal normalization kurtosis are selected and inputted to ICA model by optimization algorithm.In order to eliminate effect of outlier,normalization kurtosis is taken as objective function of separation algorithm on precision.The algorithm has higher comprehensive performance and conquers the localization of proposed algorithm by Chandramouli.Average extraction correct rate is 90%.The results of simulation experiments prove its validity further.

Contourlet Sparse Representation(CSR);Independent ComponentAnalysis(ICA)model;steganography;blind extraction

针对加性隐写模型,提出一种基于CSR-ICA的隐写信息盲提取算法。算法仅需一幅隐写图像,在满足ICA模型线性约束条件下得到载体信号的估计信号,通过Contourlet稀疏性表示(CSR)对模型输入信号进行前置处理,优化选取归一化峭度性较大的信号作为模型输入信号,将归一化峭度作为分离算法学习的目标函数,避免异常值给分离算法带来的误差。算法具有较好的综合性能,并且克服了Chandramouli算法的局限性,提取正确率平均为90%。仿真实验结果给出了算法的有效性验证。

Contourlet稀疏性表示(CSR);独立成分分析(ICA)模型;隐写;盲提取

A

TP393

10.3778/j.issn.1002-8331.1203-0628

FENG Fan,WANG Jianhua,ZHANG Zhengbao,et al.Blind extraction algorithm of embedded messages based on CSR-ICA. Computer Engineering and Applications,2013,49(24):70-73.

河北省基金项目(No.052135,No.11213527D)。

冯帆(1971—),女,博士,主要研究方向为信息安全;王建华(1977—),女,博士,主要研究方向为图像处理;张政保(1964—),男,博士,主要研究方向为信息安全。E-mail:fengfan_2357@163.com

2012-03-27

2012-06-14

1002-8331(2013)24-0070-04

CNKI出版日期:2012-08-08http://www.cnki.net/kcms/detail/11.2127.TP.20120808.1548.019.html

猜你喜欢
峭度子图高斯
基于MCKD和峭度的液压泵故障特征提取
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
数学王子高斯
天才数学家——高斯
临界完全图Ramsey数
基于峭度分析的声发射故障检测
基于频繁子图挖掘的数据服务Mashup推荐
基于鲁棒性小波包峭度图的滚动轴承故障诊断*
有限域上高斯正规基的一个注记
不含2K1+K2和C4作为导出子图的图的色数