杨 洋,陈耿彪
YANG Yang,CHEN Geng-biao
(上海工程技术大学 高职学院, 上海 200437)
随着互联网技术与数字音频压缩技术的发展,数字化的信息传播变得极为快速和便捷,非法传播带有版权保护的音乐作品也因此得以盛行,这使得音乐作品的创作者和发行者的利益受到极大损害。数字音频水印技术作为音频作品版权保护的有效手段,已经引起人们的高度重视,并逐步成为多媒体信息处理和信息安全领域的一个研究热点,并陆续提出了一系列数字音频水印嵌入方案。目前的数字水印算法有LSB[1]、回声隐藏算法[2],相位隐藏算法[2]和扩频算法[3]等以及随后的各种变换域水印算法[4,5]。近年来,结合机器学习[6]的水印算法成了水印研究中一个新的热点。
在嵌入算法确定后,嵌入位置的选择对水印性能有很大的影响。然而在以往的研究中,嵌入位置的选择仅考虑了不可感知性的需求,却未综合考虑抗攻击的鲁棒性。本文在基于音频信号DCT域嵌入同步水印方案的基础上,引入遗传算法优化嵌入位置,进一步改善水印算法性能。
为了有效地抗击剪裁攻击,在加入同步信号的基础上,还添加了每个水印值的序号,在检测时通过同步信号确定水印嵌入在音频作品中的位置,在恢复图象时利用水印序号确定每个水印值在图象中的位置,将同步信号,水印序号,水印信号均嵌入DCT域的低频系数中。图1给出了嵌入数据的结构。
图1 嵌入数据的结构
同时由人类听觉系统(HAS)掩蔽特性知:高能量信号前后短时间发生的少量畸变难以被觉察,且滞后掩蔽区持续时间较长。可见能量较高的数字音频区更适合嵌入水印。
另外,为了消除二值水印图像的像素空间相关性,避免音频作品在遭受大面积剪裁后,提取的水印图象会出现整块区域无法恢复的情况,可对待嵌入的水印图像进行置乱加密处理。本文采用Logistic映射,首先产生一个混沌系列,对水印图象与混沌系列进行异或运算,即可生成置乱加密后的安全水印信息。用混沌序列排序的方法对图像进行置乱有很高的保密度,只有确切密钥才能恢复原图像。
对每个水印元素按照同步码,水印序号,水印的顺序组成一个水印的数据组,首先将数字音频信号进行分段处理,根据能量关系选择合适的音频数据段,然后再将该音频数据段分割成L1,L2,L3三部分,分别进行DCT变换,每帧选取频率较低的交流分量嵌入同步码,水印序号和水印信息。本文采用量化调制策略,对所选低频系数进行量化处理,其嵌入规则如下:
遗传算法GA(Genetic Algorithm)由美国Miehigan大学的Holland教授提出的模拟自然界遗传机制和生物进化论而成的一种并行随机搜索最优化方法。它将“优胜劣汰,适者生存”的生物进化原理引入优化参数形成的编码串联群体中,按所选择的适配值函数并通过遗传中的复制、交叉及变异对个体进行筛选,使适配值高的个体被保留下来,组成新的群体,新的群体继承了上一代的信息,又优于上一代。这样周而复始,群体中个体适应度不断提高,直到满足一定的条件。
音频水印希望有更好的不可察觉性和更高的鲁棒性。因此,GA全局搜索要尽量提高不可察觉性和鲁棒性的综合性能。不可感知性选取的量化标准:信噪比SNR。鲁棒性考虑选取对音频进行攻击测试后,提取水印的相关系数:Nc和误码率:Ber。根据上面的嵌入方案,取得Snr和三组不同攻击下的Nc、Ber数据,设定适应度函数时,必须考虑到以下两个条件:
1)以提高以上3个参数的综合值为遗传算法的进化目标。
2)进化过程中,GA不能以牺牲过大的对立数据值来提高整体综合值。也即避免出现很高的音频质量,而抗攻击能力极低或过大地降低音频质量来提高对攻击的鲁棒性等情况。
将Snr,Nc‘,Ber’线性合成适应度函数:
其中Xι表示遗传算法进化过程中的个体,考虑到不可感知性和鲁棒性是一对此消彼长的矛盾对立,必须平衡两方参数的对fitness值的收益。
根据遗传算法的基本思想,具有越高适应度能力的个体有越高的能力把本身的基因遗传到下一代。因此,本文算法以个体适应度能力为标准采用轮盘法确定被选择直接复制到下一代的个体。
完成选择算子后,剩余的个体中,根据轮盘法选定个体参与交叉,交叉配对双方随机确定且每个个体只能参与一次交叉行为。交叉过程采用单点交叉法:随机确定在基因序列中的某个位置,交叉的父代在这个位置以后的基因片段进行对换。
数字水印发展至今,没有一个完善的标准来评价某个音频信号的最佳水印方案。因此,本文遗传算法迭代没有预期最优解,而是尽量提高水印算法的综合性能,因此设定终止条件为进化100代。
利用遗传算法进行水印信息嵌入的步骤如下:
1)随机生成2O个初始染色体S;
2)设置进化代数计数器t=0,最大进化代数T=100,种群规模N=10;
3)采用赌轮盘法从S中选出N个染色体,构成SI即S(t);
4)个体评价,根据公式(5)计算每个个体的适应度值;
5)检验算法收敛终止准则,如果满足则转到(11)
6)按60%的概率将SI的N/2对染色个体进行两点交叉;
7)按2%的概率进行变异得N个新染色体,存入S2,即S(t+1);
8)终止条件判断,若t≤T,则t=t+1;转到3);若t>T,终止计算,转到9);
9)以进化过程中所得到的具有最好适应能力个体对应的数据音频数据段适合同步码和水印信息的嵌入。。
本文采用量化策略将水印数据组嵌入音频信号中,该算法属于盲水印检测,即检测数字水印信号时不需要原始音频载体。数字水印提取过程如下:
1)对嵌入水印后的音频进行嵌入时相同的分帧,根据嵌入时由GA得到的位置信息,对嵌入位置的数据段进行DCT变换。
3)通过同步码对水印元素定位,若受到随机裁剪攻击,必然会丢失部分水印信息,将缺失的水印元素被置0,使提取的水印与原水印有相同的长度,以此来恢复水印图像。
4)将所有的语音数据段处理后,得到一个水印混沌序列V'1,再对V'1与原混沌序列进行异或运算,得到解密后的水印信息V'1,对其进行升维处理,最终可以把图象水印给恢复出来。
为了验证本文数字音频水印算法的高效性,以下分别给出了检测性能测试,抗攻击能力测试的实验结果,并与文献[4]算法进行了对比。实验中,采用8bit量化精度,22.05kHz采样率,长度为68.34秒的数字音频信号,采用L1=12bark码作为同步码,水印图象是32*32的“洋”二值图象,总的水印元素为1024个,由于log2(1024)=10,所以水印序号长度定为L2= 10,仅在每个子段的DCT系数的第2个位置上嵌入水印信息,所以L3=1,每个子段的数据长度取为8,量化步长Δ取值为0.1,K=8。水印的嵌入结果如图2所示,其中图2(a)为原始的音频信号,(b)为嵌入水印后的音频信号。
图2 原始音频信号和嵌入水印的音频信号
仿真试验分别对本文算法和文献[4]算法获得的含水印音频信号进行了一系列的攻击,如加高斯白噪声(均值为0,方差为0.01)、低通滤波(10阶,截至频率是7000Hz的巴特沃斯滤波器)、重采样(8-16-8)、重量化(22050-44100-22050)、MP3压缩(压缩比为4.4:1)及任意剪裁(剪切音频作品中间部分的10%长度)等。图3中的(a)到(g)分别是原始水印、未攻击提取水印和依次经过上述攻击后提取的水印图象。
图3 经历不同攻击后提取的水印图像
表1 不同嵌入水印方案的性能比较
仿真试验结果表明,本文算法不仅具有较好的不可感知性,而且对诸如叠加噪声、重采样,重量化、低通滤波、有损压缩和随机剪切等攻击均有较好的鲁帮性。但是采用遗传算法训练耗时较多,在MATLAB环境下,运行时间较长,还需进一步研究如何进一步改善算法来提高水印的不可见性和鲁帮性。
[1]Neubauer C,Herre J.Advanced Audio watermarking and its Application[C].109th AES Conv,USA,2000,Preprint 5176.
[2]赵朝阳,刘振华,王挺.数字音频信号的回声隐藏技术[J].计算机应用研究,2000,17(2) pp42-44.
[3]Cveji C,Keskinarkaus A,Seppanen T.Audio watermarking using m-sequence and temporal masking[C].Proceedings of the 7th IEEE Workshop on Application of Signal Processing to Audio and Acoustics,New York.NY,2001,227—230.
[4]郑晓势赵彦玲等.基于量化DCT域数字音频水印方法[J].计算机工程与应用, 2006.20:40-43.
[5]王向阳,杨红颖,牛盼盼.性能优越的混合域数字音频盲水印算法[J].通信学报,2007,28:109-114
[6]Wang Chong, Ma Xiao-hong, Cong Xiang-ping, Yin Fuliang.An audio atermarking scheme with neural network[C]. ISNN2005,LNCS3497, 2005:795-800.