基于多相关HMT模型的DT CWT域数字水印算法

2022-01-13 13:34:32王向阳牛盼盼杨红颖

自动化学报 2021年12期

王向阳牛盼盼杨红颖李丽

作为传统加密方法的有效补充手段,数字水印(Digital watermarking)是一种可以在开放的网络环境下保护版权和认证来源及完整性的新技术,近年来已引起人们的高度重视,并成为国际学术界研究的一个热点[1-3].依据水印信息所附载的数字媒体形式,人们习惯上将数字水印划分为图像水印、音频水印、视频水印、文本水印等.本文重点关注数字音频水印技术.

理论上讲,数字水印技术应同时满足三项基本要求[4],即不可感知性、鲁棒性、水印容量.其中,不可感知性是指嵌入的水印信息不应该影响人对载体的感知效果;鲁棒性则是指在对含水印载体进行常规信号处理或几何攻击后依然能够检测出水印信息的能力;水印容量指的是单位区域或时间内嵌入的水印比特数,显然水印容量越大越好.不可感知性、鲁棒性、水印容量是衡量一个数字水印算法优劣的最重要指标,而这三方面却又存在着固有的相互矛盾关系,三者之间的最佳平衡也成为数字水印算法所共同追求的目标[4].

数字水印技术发展到今天,已有大量不同的数字水印算法.但遗憾的是,现有绝大多数数字水印方案往往着重关注数字水印的某一单项技术要求(不可感知性或鲁棒性或水印容量),并相继提出了不可感知水印、鲁棒水印、大容量水印等方案[5-8],而没有全面充分地考虑不可感知性、鲁棒性、水印容量三者之间的最佳平衡问题,从而严重影响了数字水印的隐藏效果.也就是说,现有绝大多数数字水印技术均无法有效同时满足数字水印所需的三项基本要求.因此,可有效保持不可感知性、鲁棒性、水印容量之间良好平衡的高性能数字水印算法研究仍然是一项富有挑战性的工作.

一般说来,为全面提高数字水印的不可感知性、鲁棒性和水印容量,应该充分结合人类视觉掩蔽特性与载体自身统计特性而进行数字水印信息的嵌入与检测[9].基于统计模型的变换域乘性水印较好地体现了上述思想,为有效解决不可感知性、鲁棒性、水印容量之间良好平衡问题提供了可能的解决方向[9].基于统计模型的变换域乘性水印工作原理为:在水印嵌入环节,利用简单的乘性策略调制原始载体信号,以保证水印嵌入强度与载体信号强度成一定比例变化,让人更不容易察觉,从而最大程度地平衡鲁棒性和不可感知性;在水印检测环节,结合能够充分体现载体自身特性的多尺度变换特性(多分辨率性、能量聚集性等),有效利用变换系数的统计特性而构造数字水印检测器,以检测和提取数字水印信息.

近年来,基于统计模型的高性能数字水印算法研究日益受到关注,并已广泛应用于数字图像领域[10-12],但在数字音频领域内的应用研究却显得相对滞后,且仅有的统计模型音频水印方案检测性能并不理想[13-17].Akhaee 等[14]首先将水印信息直接嵌入到原始载体的音频样本内,然后利用Gaussian 分布和Laplacian 分布对含水印音频样本进行统计建模,同时结合极大似然方法估计统计模型参数并构造数字水印检测器.由于该算法估计模型参数时需要原始载体部分信息,属于半盲方案,故不利于实际应用.Majoul 等[15]结合广义高斯分布(Generalized Gaussian distribution,GGD)与最大后验(Maximum a posteriori,MAP)参数估计理论,提出了一种基于统计模型的空间域音频水印方案.然而,其数字水印检测器的抗攻击能力较弱.唐鑫等[16]利用高斯混合模型(Gaussian mixture model,GMM)刻画数字音频的DCT (Discrete cosine transform)域Mel 频率倒谱系数(Mel-scale frequency cepstral coefficients,MFCC)统计特性,并使用变分贝叶斯方法估计GMM 模型参数,同时结合最大似然检验理论构造了数字水印检测器.Akhaee 等[17]以样本累加统计(Cumulative sums tatistics)理论与中心极限定理为基础,提出了一种与载体音频信号分布近似无关的极大似然数字水印检测算法,但该检测算法的时间复杂度很高.

本文以双树复数小波变换(Dual-tree complex wavelet transform,DT CWT)及隐马尔科夫树(Hidden Markov tree,HMT)理论为基础,提出了一种基于Weibull 向量HMT 模型的DT CWT域数字音频盲水印算法.由于算法结合局部信息熵自适应确定了数字水印嵌入位置、建立了可全面反映DT CWT 系数局部统计特性与多种相关性的Weibull 混合向量HMT 统计模型、设计了适合于非高斯与小样本的局部最优检测器,故可获得较好的工作性能.

本文结构安排如下:第1 节全面分析了DT CWT 系数幅值的统计特性;第2 节给出了基于Weibull 混合分布的向量HMT 模型;第3 节和第4 节叙述了数字水印的嵌入和提取过程;第5 节给出了本算法的实验结果及对比结果;第6 节对全文进行了总结.

1 DT CWT系数幅值统计特性分析

Kingsbury 等[18]首次提出了双树复小波变换(Dual-tree complex wavelet transform,DT CWT)概念,Selesnick 等[19]进一步提出了DT CWT 的分解与重构算法.由于DT CWT 具有近似平移不变、数据冗余有限、可完全重构、计算效率高等优良特性,故本文采用DT CWT 进行数字音频信号分解,并在此基础上利用DT CWT 系数幅值进行数字水印嵌入与水印检测器构造.

1.1 DT CWT系数幅值的边缘分布分析

DT CWT 是在DWT 基础上进行了新的改进,由原来只使用一个滤波树变为两个,对于一维音频信号而言,使用两个滤波树将获得双倍数量的DWT小波系数.由于DT CWT 拥有近似的平移不变特性,当输入信号中存在小幅度偏移时,各个尺度下DT CWT 系数幅值的能量分布几乎保持不变.然而实验结果表明,绝大多数DT CWT 高频系数幅值接近于零,即其体现了明显的高峰拖尾特点.同时,其峰度值远大于高斯分布的峰度值3,表明DT CWT 高频系数幅值具有明显的非高斯分布特性.韦伯(Weibull)分布[20]是上世纪40 年代Wallodi Weibull 提出的一种具有封闭形式的概率密度函数(Probability density function,PDF),其PDF 曲线拖尾厚重,冲激特性明显.对于随机变量,Weibull分布的概率密度函数一般形式为

其中,x为随机变量,且有 0＜x ＜∞;a与b分别表示Weibull 分布中的形状与尺度参数,并且a ＞0,b ＞0.大量研究表明,Weibull 分布非常适合用来建模具有高尖峰、长拖尾分布特征的随机变量,故在包括图像检索、数字水印在内的诸多统计建模中得到了广泛应用.

鉴于DT CWT 高频系数幅值分布具有明显的高峰拖尾特点,而Weibull 分布能够更加准确地描述出这种拖尾性质,因此本文采用Weibull 分布,对DT CWT 高频系数幅值进行建模并构造数字水印检测器.

1.2 DT CWT系数幅值的相关性分析

近年来,研究者普遍关注并利用了变换域系数幅值的高尖峰重拖尾非高斯性,但不同程度忽略了变换系数幅值之间的强依赖性(多种相关性).事实上,DT CWT 系数幅值间存在着子带内、尺度间、分解树间等多种相关性.其中,子带内相关性是指在同一分解子带内,每个DT CWT 系数幅值与其附近邻域内的DT CWT 系数幅值密切相关.尺度间相关性是指某一分解子带内的DT CWT 系数幅值与其上一尺度对应的DT CWT 系数幅值密切相关.分解树间相关性是指不同分解树(即树A和树B)相同位置上的DT CWT 系数幅值间密切相关.为说明DT CWT 系数幅值间所存在的子带内、尺度间、分解树间等多种相关性,以下采用Chi-plot工具[21]分析了DT CWT 域系数幅值间的相互依赖关系.图1 给出了数字音频的DT CWT 域系数幅值子带内、尺度间、分解树间Chi-plot 图.不难看出,图1 所示3 幅Chi-plot 图中的大多数点都比较集中且较大地偏离水平线,其说明DT CWT 域系数幅值之间存在较强的子带内、尺度间、分解树间相关特性.

图1 DT CWT 域系数幅值的子带内、尺度间、分解树间Chi-plot 图Fig.1 Chi-plot to illustrate the different degrees of dependence between intraband,interscale and dual-tree,DT CWT coefficient pairs

2 基于Weibull混合分布的DT CWT域向量HMT模型

Crouse 等[22]所提出的小波域HMT 模型是基于树结构的概率图模型,其优势在于能够利用简单树型结构有效捕获内部尺度之间的从属特点,进而全面描述小波系数在尺度间、尺度内的统计相关性.对于数字音频的DT CWT 而言,不仅其DT CWT系数幅值与它的父节点幅值同样存在树状结构特点,而且其不同分解树相同位置上的DT CWT 系数幅值密切相关.受小波域HMT 思想启发,本文根据DT CWT 系数幅值的分布特性与DT CWT系数幅值的多种相关性,建立了如图2 所示的基于Weibull 混合分布的DT CWT 域向量HMT 模型.

图2 DT CWT 域向量HMT 模型Fig.2 Vector HMT model in DT CWT domain

在图2 所示的DT CWT 域向量HMT 模型中,实心点表示DT CWT 系数幅值,空心点表示DT CWT 系数幅值所处的状态.为叙述方便,作如下约定:在具有M种状态(m=1,2,···,M,本文选取M=2)的HMT 结构中,i表示任一结点,j表示尺度,xij表示该结点的DT CWT 系数幅值,Sij表示该结点系数幅值所对应的隐状态,p(i)表示该结点的父结点,且该结点所在树结构的根结点为Np(i),其系数幅值所对应的隐状态为Sp(i).鉴于在Sij=m条件下,xij满足Weibull PDF,因此有尺度参数和形状参数,则DT CWT 系数幅值的边缘分布可定义成如下形式

上式的含义是,已知父结点ρ(i),且其隐状态变量Sρ(i)的值为m′,与之相对应的子结点i,其隐状态变量Sij的值为m的条件概率.

不难看出,以上DT CWT 域HMT 结构仅仅利用Weibull 混合模型,描述与刻画了DT CWT系数幅值的非高斯性与尺度相关性.

其中,p1为初始状态概率;A2,···,AJ为状态转移概率矩阵;和为Weibull PDF 的尺度参数和形状参数;表示用于刻画DTCWT 域系数幅值分解树间相关性的协方差矩阵.J表示分解尺度数,M表示状态数.对基于Weibull 混合分布的DT CWT 域向量HMT 模型参数,本文拟采用HMT-EM 算法迭代进行最优估计,其具体计算过程如下:

步骤1.初始化模型参数集 Θ=Θ0,并令迭代计数器l=0;

步骤2.E 步骤:对参数集 Θl的隐状态变量S,计算其概率质量函数P(Sij|x,Θl)与P(Sij,Sρ(i)|x,Θl);

步骤3.M 步骤:更新HMT 模型的参数;

步骤4.令l=l+1,如果参数集 Θ 收敛则停止,否则返回步骤 2.

3 数字水印嵌入

本文选取DT CWT 域分解树A的第2 尺度高频子带作为水印嵌入区,并将数字水印信息嵌入到局部信息熵较大的DT CWT 高频系数段内,以期同时提高数字水印的不可感知性和鲁棒性.

假设原始数字音频信号为A={a(i),1≤i ≤L}.其中,L为音频数据的个数,a(i)∈{0,1,2,···,2p-1}是第i个音频数据的幅度值,p为表示每个数据所使用的比特数.假设二值水印图像为W={w(i,j),1≤i ≤I,1≤j ≤J}.其中,w(i,j)∈{0,1}代表二值水印图像的第i行、第j列象素值.则数字水印嵌入过程可描述如下.

3.1 水印预处理

为消除二值水印图像的像素空间相关性,提高数字水印算法的安全性和鲁棒性,以确保含水印音频某一部分受到破坏后仍能全部或部分地恢复出二值水印图像,本文首先采用了Arnold 变换对二值水印图像进行置乱加密.接下来,再对置乱后的二值水印图像进行降维处理,即将置乱后的二值水印图像转换为一维二进制水印序列:W={wk}(k=1,2,···,N),N=I ×J,以便于将二维的水印图像嵌入到一维的数字音频信号中.

3.2 原始音频DT CWT

对原始载体音频做二级DT CWT 分解,以得到分解树A和分解树B.其中,分解树A和分解树B均包含有1 个低频子带和2 个高频子带.为了取得不可感知性和鲁棒性的良好平衡,本文选取分解树A的尺度2 高频子带用于水印嵌入与水印检测.

3.3 重要DT CWT系数段确定

信息熵是系统有序化程度的一个度量,Shannon 将其定义为离散随机事件的出现概率.本质上讲,信息熵是一种特征的统计形式,它反映了信源中所含有信息量的多少.近年来,信息熵理论已广泛应用于物理、数学、统计、计算机等众多领域.在信号处理方面,信息熵可以估测信号所含有的平均信息量,普遍认为信号中熵值越大的区域,需要获取的信息量就越大,这种局部区域通常被认作是显著性局域(即重要区域).

鉴于数字音频样本(值)具有相互独立性,而信息熵能够从显著性角度估计特征位置及其周围信息,进而获得更多的数字音频关键内容,故本文引入局部信息熵描述数字音频的内容特征,并据此确定出适合水印嵌入的重要DT CWT 系数段.具体步骤如下:

步骤1.构造局部DT CWT 系数段.所谓局部DT CWT 系数段,是指以分解树A尺度2 高频子带中的每个DT CWT 高频系数为标识,从尺度2高频子带中分割出的一部分子系数.为了减少计算量,本文以每个DT CWT 高频系数为标识,选取出其前面D/2 个高频系数和后面D/2 个高频系数组成局部DT CWT 系数段.

步骤2.计算每个DT CWT 系数段的局部信息熵.首先计算出局部系数段中DT CWT 系数幅值x(i)(i=1,···,D)在整个局部系数段中所出现的概率,即

然后计算出DT CWT 系数段的局部信息熵,即

由上述定义知,局部信息熵与相应DT CWT系数的邻域系数幅值密切相关,其反映了局部系数段内DT CWT 系数幅值的离散程度.对于局部信息熵较大的DT CWT 系数段,其DT CWT 系数幅值离散小,说明DT CWT 系数幅值分布较均匀.反之,对局部信息熵较小的DT CWT 系数段,其DT CWT 系数幅值散度大,说明DT CWT 系数幅值分布较不均匀.局部信息熵表征了局部音频所含信息量的多少.局部信息熵越大的DT CWT 系数段所含信息量越多,CWT 系数幅值分布无序程度越低.反之,局部信息熵越小的DT CWT 系数段所含信息量越少,相应的DT CWT 系数幅值分布无序程度越高.

步骤3.选取重要局部DT CWT 系数段.选取局部信息熵较大的前N个局部DT CWT 系数段,用以水印嵌入与检测.

3.4 数字水印嵌入

其中,α为水印嵌入强度,xki和yki分别表示原始DT CWT 高频系数幅值和含水印DT CWT 高频系数幅值,i=1,2,···,D,k=1,2,···,I ×J.

重复上述数字水印嵌入步骤,直到分解树A的尺度2 高频子带中所有局部重要DT CWT 系数段处理完毕为止.最后,用含水印局部重要DT CWT系数段替换掉原始的局部重要DT CWT 系数段,并进行逆DT CWT,即可得到含水印数字音频信号.

4 数字水印检测

4.1 水印检测器构造

本文将以局部最大势(Locally most power,LMP)检验理论为基础,结合基于Weibull 混合分布的DT CWT 域向量HMT 模型,首次构造出可有效提取水印信息的多相关局部最优水印检测器(Locally optimum decoder,LOD).数字水印检测可以看作二元假设问题,在此假设下,H1和 H0分别表示DT CWT 系数幅值嵌入“1”及嵌入“0”时的假设,可以表示为

其中,α为水印嵌入强度,wk表示水印信息位,,且为含水印DT CWT 系数段,xki和yki分别表示原始DT CWT 高频系数幅值和含水印DT CWT高频系数幅值.

对于含水印DT CWT 系数段中的系数幅值yki,可根据最大似然统计理论,将水印检测器设计转化为如下决策表达式

其中,fY(·)表示含水印系数幅值在两种假设下的条件概率.

分别对上式两边取自然对数,并经过移项后可得到如下对数似然比,即LOD 检测器势函数

由局部最大势(LMP)检验理论知,LOD 检测器将在水印嵌入强度α=0 时,使其势函数(检测概率)的斜率达到最大[23],于是可得到LOD 检测统计量

其中,g1,g0分别表示嵌入函数y1(x)=x(1+α)和y0(x)=x的反函数.

鉴于数字水印信息属于弱信号,且该弱信号不会改变原始DT CWT 高频系数幅值的统计特性,即可认为含水印DT CWT 高频系数幅值仍符合Weibull 向量HMT 分布.于是,将基于 Weibull混合分布的DT CWT 域向量HMT 的PDF(即式(5))代入LOD 检测统计量(即式(13)),可得到式(14).

其中,Zk见式(16).

4.2 数字水印提取

本文所提出的数字音频水印算法属于盲水印算法,其水印检测过程无需原始载体、原始水印等辅助信息.整个数字水印提取过程如下:

步骤1.对含水印数字音频做二级DT CWT分解,并选取分解树A的尺度2 高频子带用于水印提取.

步骤2.利用分解树A和B的尺度2 和尺度1高频子带的DT CWT 系数幅值,构造基于Weibull混合分布的DT CWT 域向量HMT 模型并利用EM 算法进行模型参数估计,同时采纳第4.1 节中的方法构造局部最优数字水印检测器.

步骤3.采用类似于第3.3 节的工作步骤,在分解树A的尺度2 高频子带中确定重要DT CWT系数段.

步骤4.利用步骤2 所构造的局部最优数字水印检测器,从重要DT CWT 系数段中提取出水印信息位.

步骤5.重复步骤4,即对每个重要DT CWT系数段进行水印提取,可以得到一维水印序列

步骤6.对W*做升维与逆Arnold 变换,即可获得最终的二维水印图像

5 实验结果与分析

为验证本文音频水印算法的有效性,以下给出了算法的工作性能检测、不可感知性检测和鲁棒性检测结果,同时与文献[5,7-8,17]进行了对比.实验中,本文选取了10 段5 种不同风格的数字音频信号进行性能测试,包括Popular、Classical、Speech、Rock、Jazz 等.其中,每段音频信号都是波形格式(Wave format)的单声道音频,采样率为44.1 kHz,量化精度为16 bits,样本长度为20 s.数字水印采用大小为32×32 像素的二值图像.这里,所有测试数据均是在操作系统为64 位Win 7、CPU 为4 核Intel(R)Core (TM)i5-4590、主频为3.30 GHz、内存为16.0 GB 的PC 机HP Pro 680 G1 TW 上获得,且所使用的运算平台为MATLAB 7.12.0.

5.1 实验参数选取

由数字水印嵌入原理知,局部DT CWT 系数段长度(D)将影响整个算法的工作性能.为合理选取局部DT CWT 系数段长度,本文利用10 段5 种不同风格的数字音频信号,给出了实验参数D与算法平均工作性能的关系,即在不同局部DT CWT系数段长度下,整个水印系统的平均峰值信噪比(Peak signal to noise ratio,PSNR)(dB)、平均比特出错概率(Bit error ratio,BER)(%)、平均水印嵌入时间(s)以及平均水印提取时间(s)等工作性能,如表1 所示.

表1 测试结果表明,当局部DT CWT 系数段长度D设定为60 时,可以获得较好的水印算法工作性能.

表1 不同系数段长度下整个水印系统的工作性能 (水印容量为1 024 位)Table 1 Performance of the watermarking system in different coefficient lengths (watermark capacity is 1 024 bits)

5.2 本文算法的工作性能测试

本文首次结合局部最大势检验与DT CWT域Weibull 混合向量HMT 统计建模理论,构造了可有效提取数字水印信息的多相关局部最优水印检测器(Locally optimum decoder,LOD).这里,本文对LOD 水印检测器工作性能进行了评测,并与常用的最大似然(Maximum likelihood,ML)检测器进行了对比.实验中,首先从测试音频内任意选取一个局部重要DT CWT 系数段,并将水印信息位“1”或“0”嵌入到其DT CWT 系数幅值中.然后分别计算每个DT CWT 系数幅值的LOD、ML检测响应值及检测阈值.由数字水印检测原理知,如果该DT CWT 系数段的累积响应值大于累积阈值(即响应曲线与阈值曲线所围成面积大于0),则判断该DT CWT 系数段嵌入了水印信息位“1”;否则(即响应曲线与阈值曲线所围成面积小于0),判断该系数段嵌入了水印信息位“0”.同时,响应曲线与阈值曲线所围成面积(绝对值)越大,则说明检测响应效果越好,即水印检测器工作能力越强.

图3 给出两种假设下,LOD 检测器和ML 检测器的水印提取结果.图3 评测结果表明,本文所提出的LOD 检测器及目前普遍使用的ML 检测器均能准确提取出水印信息,但LOD 检测器的灵敏度明显高于ML 检测器.因为LOD 检测响应曲线与阈值曲线所围成面积(绝对值)远大于ML 检测响应曲线与阈值曲线所围成面积.

图3 两种数字水印检测器(LOD 和ML)的检测响应结果Fig.3 The test results of LOD watermark detector and ML watermark detector under various attacks

表2 利用10 段5 种不同风格的数字音频信号,给出了水印容量与算法平均工作性能的关系,即不同水印容量(包括64 位、256 位、1 024 位及4 096 位)下,整个水印系统的平均PSNR (dB)、平均BER (%)、平均水印嵌入时间(s)以及平均水印提取时间(s)等工作性能.从表2 实验数据可以得出,随着水印容量增大,PSNR 不断下降,BER 与嵌入提取时间持续增加.考虑到原则上应该保证理想不可感知性前提下水印容量越大越好,而在数字水印容量为32×32 时,水印提取效果达到了比较好的平衡,因此本文选取了32×32 像素的二值图像水印.

表2 不同水印容量下整个水印系统的工作性能(局部重要系数段长度为60)Table 2 Performance of the watermarking system in different watermark capacities (coefficient length is 60)

为了更加直观地显示数字水印的感知透明性,图4 给出了原始载体音频、含水印数字音频以及音频差值波形图.同时,本文还采用PSNR 和PEAQ(Perceptual evaluation of audio quality)客观评价了原始数字音频与含水印数字音频信号之间的差别.其中,PEAQ评价模型首先将参考信号和失真信号通过感知声学模型模拟人对音频信号的感知,然后认知模型将感知声学模型输出值在时域和频域进行综合产生一系列模型输出变量,最后通过一个人工神经网络,计算出最终的客观差异等级(Objective difference grade,ODG),其含义如表3 所示.表4 给出了不同风格数字音频信号的感知透明性客观评价结果.

表3 客观听觉测试区分度ODG Table 3 Objective difference grades

表4 感知透明性与鲁棒性客观评价Table 4 Objective evaluation of perceived transparency and robustness

从图4 不难看出,在保证完全正确提取水印的情况下(原始水印与提取的水印完全一致),嵌入水印前后波形图改变较小,基本保持一致.而从图4(e)差值波形中,更可直观地看出宿主音频在嵌入水印后,与原始音频相比变化很小,说明本算法具有较好的不可感知性.

图4 原始音频、含水印音频和差值音频波形图Fig.4 The waveform of original audio,watermarked audio,and difference audio

为验证本文算法的鲁棒性,这里对含水印音频进行了一系列攻击实验,包括重新量化(Requantization)、重新采样(Resampling)、叠加噪声(Additive of Gaussian noise)、添加回声(Echo addition)、低通滤波(Lowpass filtering)、MP3 压缩(MP3 compression)等常规信号处理,及随机剪切(Random cropping)、幅值改变(Amplitude scaling)、抖动(Jittering)等去同步攻击.图5 给出了本文算法的鲁棒性能测试结果,包括所提取出的数字水印、BER(%)等.

图5 本文算法的鲁棒性能测试结果Fig.5 The watermark detection results for various attacks

5.3 不同算法的工作性能对比

为充分客观地评价本文算法的有效性,以下对本文算法与文献[5,7-8,17]的水印检测性能进行了对比.表5～8 给出了10 段5 种不同风格的数字音频信号的平均检测性能.对比实验中,采用了相同大小的数字水印容量(1 024 位).

表5 不同算法的平均检测性能对比(本文算法和文献[8])Table 5 Comparison of average detection performance of different schemes (our scheme and [8])

以上实验结果表明:本文算法不仅具有较好的不可感知性,而且能够抵抗大部分常规信号处理(如重新量化、重新采样、叠加噪声、添加回声、低通滤波、MP3 压缩等)及部分去同步攻击(如随机剪切、幅度缩放、抖动等),较好地解决了不可感知性、鲁棒性、水印容量之间的良好平衡问题.这是因为本文算法:1)引入局部信息熵描述数字音频的内容特征,并据此自适应确定了适合水印嵌入的重要DT CWT 系数段(位置);2)结合DT CWT 系数幅值分布及多种相关特性,建立了预测能力更强的基于Weibull 混合分布的DT CWT 域向量HMT统计模型,并有效估计了统计模型参数;3)以局部最大势能检验理论为基础,首次构造了适合于非高斯与小样本的可有效提取水印信息的多相关局部最优水印检测器.

6 结束语

本文以双树复数小波变换(Dual-tree complex wavelet transform,DT CWT)及隐马尔科夫树(Hidden Markov tree,HMT)理论为基础,结合DT CWT 系数幅值分布及多种相关特性,提出了一种基于Weibull 向量HMT 模型的DT CWT域数字音频盲水印算法.该算法利用局部信息熵刻画数字音频内容并依此自适应确定水印嵌入位置,同时将水印信息乘性嵌入到DT CWT 高频系数幅值内.进行数字水印检测时,首先根据DT CWT 系数幅值的非高斯分布特性及DT CWT 系数的子带内、方向间、尺度间等多种相关特性,建立起基于Weibull 混合分布的DT CWT 域向量HMT 统计模型并估计出其模型参数,然后根据局部最大势能检验理论,利用基于Weibull 混合分布的DT CWT 域向量HMT 统计模型参数,构造出多相关局部最优数字水印检测器并盲提取水印信息.仿真实验结果表明,本文算法不仅具有较好的不可感知性,而且能够抵抗大部分常规信号处理(如重新量化、重新采样、叠加噪声、添加回声、低通滤波、MP3 压缩等)及部分去同步攻击(如随机剪切、幅度缩放、抖动等),较好地解决了不可感知性、鲁棒性、水印容量之间的良好平衡问题,其总体性能优于现有同类方案.

表6 不同算法的平均检测性能对比(本文算法和文献[5])Table 6 Comparison of average detection performance of different schemes (our scheme and [5])

表7 不同算法的平均检测性能对比(本文算法和文献[7])Table 7 Comparison of average detection performance of different schemes (our scheme and [7])

表8 不同算法的平均检测性能对比(本文算法和文献[17])Table 8 Comparison of average detection performance of different schemes (our scheme and [17])