一种快速MP3音频水印算法

2013-05-02 10:55金渊智
三门峡职业技术学院学报 2013年1期
关键词:鲁棒性音频比例

金渊智

(三门峡职业技术学院 信息工程系,河南 三门峡 472000)

引言

当前,数字水印技术(Digital Watermarking)[1]是国际信息安全领域研究的重要分支,它的研究目的主要是为了应对当前网络盗版横行的趋势,以此来保障数字作品原作者的版权[2]。

音频水印技术[3]是指通过修改音频信号(如MP3)中的某些信息,从而使其代表一些特定的意义,比如作者的版权,从而实现水印的嵌入。在水印提取时,由于选取的嵌入位置比较特殊,因此即使音频信号经过编辑或恶意的修改,版权所有者也能顺利的从中提取出自己嵌入的信息,以此来保护版权。目前MP3等压缩标准[4]已经在网络或个人电子设备上广泛应用,如何确保版权所有者发布的MP3文件不被恶意的修改和传播就显得尤为重要。

文章通过研究MP3压缩量化过程得知[5],比例因子在MP3文件中具有一定的冗余,并且具有相对的稳定性,因此,比例因子可以用来嵌入水印。同时,为了减少声音失真,本文结合现有的最低有效位(LSB)[6]算法来对比例因子进行修改,这样做既保证了听觉的不可感知性,同时又满足了鲁棒性要求,这在保护MP3音频文件的版权有一定的实用价值。

1 水印算法描述

1.1 水印预处理

水印的预处理是水印嵌入的常见做法,本文先将水印图像由二维变成一维,接着再进行AES加密,以提高水印的安全性,具体的处理过程如下:

①水印信息降维:将二维水印图片转换为一维水印序列W={w1,w2,w3,Λ,wM},M代表水印序列的长度。

②AES数据加密:对上述得到的W使用AES算法进行加密,W′=AES(W,K),其中 K 为密钥。

1.2 水印的嵌入

在MP3文件的帧边信息中比例因子的位数由0-4bit的二进制组成,可以将目前比较流行的LSB图像水印方案移植到音频水印上来,只要选择好水印的载体,那么根据LSB算法的原理,仅仅是对载体数据微弱的改动,不会影响到人类的视觉或听觉感受。在此基础上,结合MP3比例因子的特点,本文使用修改具有4位的比例因子的最低有效位(LSB)来进行水印的嵌入,其优点是不用对比例因子进行比较和整合,简化了嵌入步骤,提高了水印的嵌入速度,更有利于实时操作,水印嵌入流程如下图所示。

图1 水印嵌入流程

设载体音频信号A=!a( i ) ",1≤i≤L。 具体的水印嵌入过程描述如下:

①将原始MP3音频信号A分为互不重叠的N个帧,每帧的长度为Q,即有N=L/Q,各音频帧表示为 B(i),i=1,2,Λ,N。

②从每一帧中读取比例因子,选取比例因子的LSB 作为待嵌入位置,记为 C(i),1≤i≤N′。

③根据经典的LSB算法,将W′嵌入到C(i)中,每个比例因子嵌入一位水印信息的密文,并且N′≥M。

水印信息的嵌入以某个满足条件的音频帧为例,根据奇数加一变偶数/偶数加一变奇数的特点,来对音频帧内的比例因子进行修改以实现水印的嵌入。人为的规定偶数代表水印“0”,奇数代表水印“1”。具体的修改方法见表1。

表1 对比例因子的修改方法

重复步骤③的嵌入操作,直到将所有水印信息嵌入完毕。

1.3 水印的提取

设待测音频信号为A′,则水印的提取过程如下:

图2 水印提取算法的框图

水印提取的过程与水印嵌入过程是互逆的,将待检测的MP3文件进行分帧,然后提取有效的比例因子 C′(i,4),1≤i≤N′,再判断出水印信息。 具体根据公式<1>,也就是根据比例因子的奇偶性来判决:

将所有的比例因子提取完毕后,再对得到密文水印序列进行AES解密,最后再进行一维转二维即可恢复出原始水印序列。

2 软件实现

根据水印嵌入算法,使用VS2008作为开发环境,C#作为开发语言,在windows平台上实现了本文提出的音频水印方案。由于C#语言可以实现跨平台,因此该程序不仅能够在桌面上运行,而且可以很轻松的迁移到WEB上运行。图3是程序运行的界面。

图3 程序运行效果

从图3可以看出,该界面分为左右两个部分,左边主要显示MP3文件的基本信息,右边显示原始水印图片以及提取结果,同时设计了两个按钮来测试水印的嵌入和提取。水印嵌入后自动打开“Windows Media Player”播放携带水印信息的MP3文件,可以在嵌入后实时地听测音质。该软件在Win2003、WinXP、Win7等系统上进行了测试,性能稳定可靠。

3 仿真实验结果与分析

实验中使用三门峡职业技术学院校徽16*16像素的黑白图像作为水印(图3右侧“水印图片区域”),测试的MP3文件中包含了4种不同类型的音乐片段,包括乡村、流行、古典和民歌(采样频率为 44.1千赫,码率为 128kb/s,左声道),每段 MP3音乐播放时间大约为120秒。仿真实验以Matlab2010为主,辅助软件有Cool Edit、C#自制小软件等。

3.1 不可感知性测试

不可感知性是对音频水印的最基本要求,如果嵌入水印后,MP3音质有明显降低,则此水印方案不可行。我们通常采用主观评价方法和客观评价来测试水印的不可感知性。

主观质量评价测试:平均意见得分MOS(Mean Opinion Score)是常用的主观质量评价方法,随机对20个人进行MOS测试,测试结果如表2所示。

表2 主观质量测试结果

实验结果显示,MOS测试的结构为4.95分,即仅有1人听出原始音频文件与嵌入水印后的音频文件在音质上有细微的差别,可见,嵌入水印后音质并没有太大改变。

以流行音乐片段《美丽心情》为例,图4是嵌入水印前的音频信号的Cool Edit截图,图5是嵌入水印后的音频信号的Cool Edit截图。将两个信号放在一起对比,我们几乎看不出有任何差别。

图4 原始音频信号

图5 嵌入水印后的音频信号

客观质量评价测试:对音频信号的客观评价我们一般采用计算嵌入前后的信噪比SNR来确定(表3),SNR的计算方法见公式<2>:

表3 客观质量测试结果

从表3可以看出,四类MP3文件在嵌入水印后的SNR在33左右,处于较低的噪声水平。总之,由水印的主观质量评价测试和客观评价测试结果可以看出,该算法具有良好的不可感知性。

3.2 算法的鲁棒性测试

衡量一个水印算法的一个重要指标就是鲁棒性,鲁棒性决定了水印在受到攻击时是否能够正确的提取。水印的鲁棒性一般与水印的嵌入强度有关,水印嵌入的强度越大,该算法的鲁棒性越强。但是如果水印的嵌入强度过大,会对不可感知性产生较大影响。

通过MP3文件结构可知,MP3文件的帧结构信息包含帧头、帧边信息和音频主数据。

使用VS2008编写C#小程序,来实现对音频主数据进行仿真攻击,具体步骤为:

①打开携带水印信息的MP3文件;

②找到音频数据的存放位置;

③使用种子产生随机数,直接使用随机数修改音频数据;

④将攻击后的音频文件保存以备检测。

对四大类MP3文件进行音频主数据攻击,提取得到相关系数NC值和统计得到的比特误码率BER值见表4。

表4 音频主数据攻击实验

从上表可以看出,算法能够有效的抵抗随机数的攻击,原因是水印信息嵌入到了比例因子上,如果改变了MP3文件的帧结构,比如重采样,本算法将无法正确地提取水印。

3.3 运行效率测试

运行环境为Windows2003、Matlab 2010,电脑配置为 1.8GHz双核 CPU,1G内存,512M独立显卡,通过计算Matlab程序的运行时间来衡量运行效率。为了说明本算法的嵌入效率,实验中将本算法与经典的MP3Stego[7]算法在同等条件下进行了对比。测试结果见表5。

表5 不同类型音频水印嵌入算法嵌入时间(单位:ms)

从表5可以看出,对于时长为120秒的音乐片段,本文提出的算法的嵌入时间大约在1秒左右,具有一定的稳定性。经典算法MP3Stego的嵌入时间为14秒左右,嵌入效率较低,而文献[8]提出的改进算法效率与文献[7]大致相当;因此本文提出的修改比例因子最低有效位的水印算法嵌入速度较快,可以作为一种快速的MP3水印方案。

4 结束语

文章设计了一种通过修改MP3音频文件比例因子的最低有效位来实现音频水印方案。实验结果表明,该方案具有较好的不可知性,并且在抵抗随机攻击时具有较强的鲁棒性,同时本算法也具有较高的执行效率。MP3音频水印是伴随互联网音乐高速发展的过程中出现的,起步较晚但又涉及面较广,是一项艰难而又有挑战性的工作。本文设计的快速水印算法虽然具有不可感知性、执行效率高等特点,但是在应对量化等攻击方面存在一些局限性,那么今后可以考虑将水印同时嵌入到MP3文件的帧头信息和主数据中,来提高水印的可靠性。

[1]I.J.Cox,M.L.Miller,J.A.Bloom.Digital Watermarking[M].王颖,黄志蓓等译.北京:电子工业出版社,2003.

[2]孙宝瑞.试论入世后我国出版形势的几个问题[J].三门峡职业技术学院学报,2004(2):74-76.

[3]王建辉,李丽娟.一种基于倒谱域的盲检测音频水印算法[J].科学技术与工程.2008,8(19):5430-5433.

[4]B.M.Macq,J.J.Quisquater Cryptology for digital TV broadcasting Proceedings of IEEE,1995 (6):944-957.

[5]Bender,W.“Applications for data hiding”,IBM Systems Journal,Vol.39,Nos.3&4,pp.547-568,2000.

[6]李文治,张晓明,殷雄.基于LSB和量化思想的倒谱域音频水印算法[J].计算机应用,2010,30(3):705-708.

[7]Petitcolas F.MP3Stego 1.1.18[ED/OL].(2012).http://www.petitcolas.net/fabien/steganography/mp3stego/index.html.

[8]钟尚平,陈铁睿.提高MP3Stego性能的方法与实现[J].计算机工程与应用,2006(6):95-100.

猜你喜欢
鲁棒性音频比例
人体比例知多少
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法
基于非支配解集的多模式装备项目群调度鲁棒性优化
非接触移动供电系统不同补偿拓扑下的鲁棒性分析
按事故责任比例赔付
Pro Tools音频剪辑及修正