基于SVR的混合域鲁棒音频水印算法

2022-03-14 02:19齐燕博杜庆治邵玉斌
电视技术 2022年2期
关键词:鲁棒性预处理音频

齐燕博,杜庆治,龙 华,邵玉斌

(昆明理工大学 信息工程与自动化学院,云南 昆明 650500)

0 引 言

数字水印就是在数字媒体信息中添加某些数字信息,以保护数字媒体版权,证明产品的真实可靠性,跟踪盗版或者提高产品的附加信息。通常来说,对于一个实用的音频水印方法,最主要的指标就是重建声音信号的质量和水印数据的误码率。按照水印作用域的不同,水印嵌入算法分为时间域算法和变换域算法。后来的研究主要集中在变换域中,主要的方法有傅里叶变换(Discrete Fourier Transform,DFT)、快速傅里叶变换(Fast Fourier Transform,FFT)、离 散 小 波 变 换(Discrete Wavelet Transformation,DWT)、离散余弦变换(Discrete Cosine Transform,DCT)、奇异值分解[1](Singular Value Decomposition,SVD)以及正交三角分解(QR)等。

文献[1]将DWT-SVD与人耳听觉特性结合起来,选择能量大的帧作为水印嵌入帧,并通过局部最大值追踪算法确定最佳的嵌入位置,提高了水印的鲁棒性。文献[2]通过DWT-SVD变换后,将水印嵌入在奇异值矩阵的非对角元素中,同时利用汉明码提高鲁棒性,经过实验该算法的不可感知性较差。文献[3]通过DWT-DCT变换,分段计算奇异值,通过修改奇异值嵌入水印信息,将水印信息集中嵌入在音频的起始位置,经过实验该算法的不可感知性较差。文献[4]通过LWT-DCT-QR,利用了提升小波运算速度快、离散余弦变换抗干扰能力强以及QR分解数值稳定的特点,对信号进行嵌入提取,提升了水印系统的鲁棒性。但本算法的不可感知性较差。为此,本文提出了一种新的基于奇异值比(Singular Value Ratio,SVR)的混合域鲁棒音频水印算法。通过本文的方法,对嵌入水印的音频做常见的仿真攻击,并对水印进行提取,仿真结果证明本文的方法提高了水印的抗噪能力,具有有效性。

1 主要技术及基本原理

1.1 音频特征

音频特征主要有短时能量和短时过零率两个指标。假设第n帧语音信号的短时能量用En表示,则其计算公式为:

式中:xn(m)为第n帧第m个音频数据。

短时过零率表示一帧语音中语音波形穿过横轴(零电平)的次数。定义语音信号xn(m)的短时过零率Zn为:

式中:sgn[·]是符号函数,即:

由于人类听觉系统具有屏蔽效应,较弱的声音会被较强的声音隐藏起来。短时能量反映了声音的强度,能量越大,屏蔽效应越好。短时过零率反映了信号的稳定程度,过零率越小,信号的稳定性 越强。

1.2 离散小波变换

离散小波变换(DWT)实现了对信号不同区域、不同分辨率的分析。信号经过DWT变换后,分为高频子带和低频子带,低频子带进一步分成高频和低频部分。小波分解和小波重构的过程如图1所示。

图1 三级离散小波分解过程

1.3 奇异值分解

奇异值分解有以下特性:稳定性好,遭受各种攻击后,奇异值变化不大;矩阵的第一个奇异值大于其他的奇异值,对音频的影响很大。

2 音频水印算法

2.1 水印预处理

水印预处理的步骤如下。

(1)将原始水印W(M×M)进行Arnold变换,得到置乱水印。

(2)将置乱后的水印降维,得到一维水印信号,长度为M×M,然后利用logistic序列进行加密处理。

整个水印预处理过程如图2所示。

图2 水印预处理过程

2.2 水印嵌入

水印嵌入过程如图3所示。具体步骤如下。

图3 水印嵌入过程

(1)对二值图像W(16×16)进行预处理后,得到待嵌入水印W2。

(2)对原始音频进行分帧(每帧为1 024个数据)。音频信号分帧后,计算各帧的短时能量En和短时过零率Zn。并计算平均值E´和Z´。选择En≤E´且Zn≤Z´的音频帧作为水印嵌入帧。

(3)对待嵌入水印的音频帧先进行3级DWT。将得到的三级低频系数ca3再进行DCT。得到A1。

(4)将A1分成四部分,根据公式:

式中:N为每帧音频的长度,表示向下取整。

(5)提取中频系数,每部分的长度为nn,根据公式:

(6)分别对R1,R2进行奇异值分解,得到S1V1D1和S2V2D2。

(7)计算奇异矩阵V1(1),V2(1)的比值:

(8)按照如下规则嵌入。如果待嵌入水印W2(k)=0,其中1≤k≤length(W2),则:

如果待嵌入水印W2(k)=1,则:

式中:a为嵌入强度,λ1,λ2为R1,R2的奇异值,λ1´,λ2´为修改后的奇异值。

(9)将得到的新的V1和V2与之前的S1,D1和S2,D2进行奇异值分解逆运算。

(10)将R1和R2进行重组,并进行DCT与DWT的逆运算。

(11)重复以上步骤,直到所有的水印信息全部嵌入完成。

2.3 水印提取

水印提取的流程如图4所示,具体实施步骤 如下。

图4 水印提取过程

(1)对原始音频进行分帧(每帧为1 024个数据)。

(2)对待嵌入水印的音频帧先进行3级DWT。将得到的三级低频系数ca3再进行DCT。得到A1。

(3)将A1分成四部分,根据公式:

式中:N为每帧音频的长度,表示向下取整。

(4)提取中频系数R1,R2,分别对R1,R2进行奇异值分解,得到S1V1D1和S2V2D2。

(5)计算奇异矩阵V1(1),V2(1)的比值:

(6)根据以下规则进行提取:

(7)将得到的W(k)进行重组,得到二维矩阵。然后进行图片预处理的逆运算,最终得到水印图像。

2.4 嵌入策略

3 实验结果分析

为了验证本算法的有效性[5-14],本文使用Matlab2020作为实验仿真平台,使用3种不同种类的音乐类型作为原始音频,每种音乐种类包含100首音乐,且每首音乐为单声道,音乐格式为wav格式,分辨率为16,采样频率为44.100 kHz,长度约为30 s,水印为16×16的二值图像,提升小波方案采用haar小波基函数。

3.1 水印的安全性

实验选取的水印信息为二值图像,内容为K,U,S,T四个英文字母。如果用ASCII码来表示这4个字母,每个字母需要一个字节,需要8 bit,4个字母需要32 bit。如果用二进制图像表示,需要256 bit,增加了水印的冗余性,从而提升了鲁棒性。同时,经过置乱将图像的能量分散到整个图片中,降低了像素之间的相关性,再通过加密,提高了水印的安全性。将原始水印通过本文的加密处理,结果如图5所示:

图5 水印加密

3.2 水印的不可感知性

水印的不可感知性是指经过一系列隐藏处理,使目标数据没有产生明显的降质,而隐藏的数据无法人为地感知到。对于水印的不可感知性,评价标准一般有主观评价和客观评价两种。

3.2.1 主观评价

使用本文算法对随机选取的音频加入水印,与原始音频波形在时域上进行对比,发现无明显差异。结果如图7所示,其中横坐标表示点数。纵坐标表示信号幅值。

图6 随机选取的原始音频与含水印音频比较

3.2.2 客观评价

信噪比(Signal-Noise Ratio,SNR)是音频水印常用的一种客观评价标准。国际留声机工业联盟要求嵌入水印后的音频可以提供20 dB或更高的信噪比。信噪比的定义为:

式中:x(i)表示原始音频帧,xw(i)表示嵌入水印之后的音频帧。

在本文的算法下对3种不同种类的音乐嵌入水印,计算3种不同音乐类型的SNR值。Disco、Pop、Rock的信噪比分别为26.265 8,26.397 0,27.107 1。满足国际留声机联盟的要求。

3.3 水印的鲁棒性

鲁棒性是指含水印音频在经过常规信号处理之后仍然可以检测出水印的能力。鲁棒性用来衡量水印算法的抗攻击能力,在实际应用中经常采用误码率(Bit Error Rate,BER)和相关系数(Normalized mutual correlation Coefficient,NC)来衡量水印的抗攻击能力。

误码率反映的是提取出来的水印与原水印的差别性,设嵌入的提取的水印序列长度为N,则BER按照如下公式计算:

式中:W(i)为原始水印信息,W´(i)为提取出来的水印信息。BER值越接近1,则水印系统的鲁棒性越差,BER值越接近0,则水印系统的鲁棒性越好。

相关系数反映的是提取出来的水印与原始水印之间的相关性,设嵌入和提取出的水印图像大小为M1×M2,其定义如下:

NC(w,w´)越接近1,则W(i)与W´(i)的相关程度越高;NC(w,w´)越接近0,则W(i)与W´(i)的相关程度越低。

对嵌入水印的音频信号进行常见的音频处理,以下是常见的仿真音频处理操作。

(1)无攻击,对音频不做任何处理。

(2)噪声叠加,在已嵌入水印的音频上分别叠加20 dB的高斯白噪声。

(3)低通滤波,使用低通滤波器对含水印音频信号进行低通滤波。

(4)重采样,把已嵌入水印的音频的原始采样频率降为一半,再恢复到原始采样频率。

(5)重量化,把已嵌入水印的音频的原始分辨率降为一半,再恢复到原始分辨率。

(6)MP3压缩,将含水印音频信号压缩为原始音频水印的0.7倍。

为了直观感受本算法的鲁棒性,选取一首名称为rock.00001.wav的音频文件,嵌入水印后,分别进行添加噪声、低通滤波、重采样、MP3压缩攻击,提取的水印如图7所示。

图7 本文算法的鲁棒性对比

对于三种类型音乐,每种类型各选取100首进行对比实验,计算所得的平均值如表1所示。

表1 不同算法下水印的鲁棒性对比分析

选取相同的音频,在同样的攻击下,选取一篇较为经典的文献和近期发表的一篇文献进行比较。从表1的比较可以看出,本算法相较于文献[2]算法和文献[6]算法在应对添加高斯噪声、滤波、重量化、重采样、剪切、压缩等常见的攻击方式时表现出了良好的鲁棒性。

4 结 语

本文提出了一种新的水印嵌入算法,将原始音频信号进行分帧预处理后,利用音频特征动态选取水印嵌入位置,将水印嵌入帧先进行DWT再进行DCT,将得到的信号分段,分别对这两段音频信号进行奇异值分解,通过对奇异值的对比,将水印信息嵌入。此外,在Arnold变换的基础上,重新设计了水印预处理的算法,增强水印的安全性与可靠性,同时利用汉明码的纠错能力提高水印的鲁棒性。通过本文算法对嵌入水印的音频进行噪声叠加、低通滤波、压缩等常见的仿真攻击,并对水印进行提取,仿真结果证明本文的方法具有良好的鲁棒性和适用性。

猜你喜欢
鲁棒性预处理音频
求解奇异线性系统的右预处理MINRES 方法
武汉轨道交通重点车站识别及网络鲁棒性研究
污泥预处理及其在硅酸盐制品中的运用
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
基于预处理MUSIC算法的分布式阵列DOA估计
音频分析仪中低失真音频信号的发生方法
一种基于三维小波变换的鲁棒视频水印方案