丁晓艳,赵慧民,2,郭一缜
(1.西安邮电大学通信与信息工程学院,陕西西安710121;2.广东技术师范学院电子与信息学院,广东广州510665)
随着计算机网络技术的迅速发展,图像、视频、语音等多媒体产品的应用也越来越广泛,与此同时,引起多媒体作品版权(Intellectual Property Rights)纠纷和保护[1]的问题日益严重,为了解决这种类型的问题,数字水印技术发挥了巨大作用,作为解决多媒体信息的版权保护及内容认证问题的有效方法,成为目前学术领域研究的焦点。
H.264/AVC是目前最新的视频编码标准,同时又被称为ITU-T H.264[2]建议和MPEG第十部分的编码标准,而后简称为H.264。与以往的视频编码标准MPEG-2,MPEG-4和H.263相比,H.264编码标准采用了很多全新的编码技术,例如:帧内预测、熵编码新特性、多帧预测、整数变换、高精度的亚像素运动补偿、率失真优化、低码率以及容错能力强等。使用这些新的技术,可以发现H.264比MPEG-4提高50%的压缩效率。H.264与旧的MPEG和H.263等编码标准相比,是一种性能更好的视频图像压缩编码形式[3]。此标准采用基于块的联合编码方式H.264新技术,包括帧内预测编码、多种编码方式相结合的编码和算法在概念级上的分层结构等[4]。由于H.264编码标准在数字视频电视广播、数字视频广播、网络多媒体传输以及多媒体通信等各方面都体现出了较好的性能,所以,H.264编码标准将会成为多媒体传输过程中普遍使用的编码方式。因此,研究基于H.264视频编码标准的视频水印技术具有很重要的意义[5]。
为了提高水印的嵌入容量,同时获取较高的鲁棒性,可以考虑选择帧中的一些语法元素完成水印信息的嵌入。H.264使用帧间编码技术,把运动向量差(Motion Vector Difference)和预测残差块经DCT变换的系数写入视频编码压缩所得的码流中,Altunbasak[6]分析H.264编码标准中DCT系数的分布,得知帧中非零系数的幅值在-1和+1中选择。系数值偏小,经过信号处理,系数很可能变为0,由此可见,在DCT系数中嵌入水印信息是不可行的,不满足水印鲁棒性[7]要求。相反,运动向量(MotionVector,MV)[8]可以预示宏块预测时确切的预测位置,具有一定程度的恒定性。
由于人类的视觉系统对视频中变化缓慢的区域不敏感,因此可以选择H.264中MV实现水印信息的嵌入,该方法不仅可以获得较高的鲁棒性,而且还可以降低水印嵌入对原始视频的影响。
H.264使用树状结构运动补偿、MV预测等较复杂的帧间预测编码,除去视频的冗余信息,可以采用CAVLC等编码技术,提高视频的编码效率。结合H.264的MV的特性,提出了如图1所示的水印嵌入方法。首先,选择帧宏块中MV作为水印嵌入区域,利用H.264标准的变换和量化特点,通过修改MV的幅值和方向,而后将水印信息嵌入到MV中。这里采用扩频技术使误差在宏块中分散,可以借此增强水印的鲁棒性。将水印信息同预测残差DCT变换系数一起写入压缩码流。
图1 水印嵌入方案流程图
一个P宏块可以分割为不同尺寸和形状的子宏块,而每一个子宏块对应有一个MV,P宏块中MV可以构成如下集合
视频中运动物体的最大运动即是P宏块中的最大MV。此时的MV变化范围较小,由于视频在运动量最大的区域有更多的嵌入空间,所以选择运动量最大的区域嵌入水印,对视频的主观视觉质量造成的影响较小。P宏块根据幅度最大原理,在视频MV集合中选取1/4像素精度的位置嵌入水印信息。用MVe为所要选的水印嵌入位置,可表示为
式中:MVex,MVey分别是水平和垂直方向上的MV。利用其运动补偿像素精度的特点,MVe可使用量化的方法获得其MV的位置,用CMVe表示MV,即
综上可得MV。由其位置可以确定8个相邻的1/2像素精度预测位置,形成方形的嵌入水印区域。水印是在方形区域通过修改嵌入。可将方形区域分成两个相互独立的区域Z1、Z2。图2为水印的嵌入过程。
图2 水印嵌入过程
由图2可知Z2是方形区域的外部范围,而Z1是Z2的内部区域,这两个子区域分别用来嵌入水印信息0和1。
假设要嵌入的水印w为0或1,可通过修改MV将水印嵌入。具体如下:
w=1,若MV在Z2区域,则需要改变MV,按照邻近最大原则移至Z1区域;否则,不做任何的改变。
w=0,若MV在Z1区域内,则需要改变MV,按照邻近最大原则移至Z2;否则,不做任何的改变。
P宏块有skip-mode[9]编码模式,当含有水印的视频在经压缩时,宏块的预测模式可能会有所改变。这就意味着以往skip-mode模式P的宏块可能存在MV,如果编码的模式改变,则有可能不再有MV,水印信息遭到破坏,甚至完全丢失。同时,水印的同步性也被破坏。为了保护水印的同步,增强该方案的鲁棒性,采用文献[10]的扩频水印方案对水印进行处理。
水印信息W={w(n),n=0,1,…,N},w(n)=0 或1,映射成双向向量
式中:N表示水印信息的长度。扩频水印为
式中:p(m)=±1是伪随机序列;S是扩频后长度,本文设为200。
水印的提取是在H.264/AVC解码端实现,可以将水印信息从压缩码流中有效地提取。具体步骤如下:
2)水印提取与扩频伪随机序列的相关和Hn的表达式为
3)水印提取可通过相关关系得出
式中:τ是相关和阈值,方案中设置为0。
为了测试本文水印的鲁棒性好坏,对4组经典的视频测试序列进行实验:Foreman,Salesman,Akiyo和News。测试选择H.264编码结构为IPPP。与文献[10]算法进行对比。对视频序列的前300帧进行处理,此时设量化步长QP为30,嵌入水印的信息量远大于文献[10]水印比特,同时考虑到常用的视频水印攻击方式[11],比如重压缩编码、旋转、加性高斯白噪声等,进行鲁棒性能的比较。
下面对4组测试序列在同等条件下进行实验,包括重压缩编码、对比度变化、椒盐噪声等下的鲁棒性。
1)由峰值信噪比PSNR分析
在此用到一个参数,即比特增加率(Bit Increase Rate,BER),定义为:设向视频序中共嵌入Mbit的水印数据,当进行水印检测时,能正确检测出Nbit的数据,则
图3给出了视频水印的嵌入前后PSNR变换图,由图可见,水印嵌入前后的PSNR变化趋势一致,由于本算法的水印嵌入是在H.264压缩编码过程中实现的,水印嵌入前后所产生的帧间预测误差会经运动补偿弥补计算,经过此过程预测误差没有扩散,从而能够保证原始视频图像与含有水印信息的视频图像在视觉质量上没有明显的差异。
图3 测试序列嵌入水印后的PSNR变化曲线
2)抗重编码攻击分析
图4给出了视频水印在不同量化步长(QP)下的抗重压缩编码的示意图,4组视频都是在相同的QP情况下嵌入水印信息的。如图4所示,News,Salesman,Akiyo这3组视频在取不同QP的情况下,进行压缩编码,此时提取的水印BER为0,嵌入的水印信息在重压缩编码攻击下可以保持其完整性。对于Foreman视频序列而言,QP等于32和34时,其BER逐渐变大,但是变化很小。这是因为当QP较大时,进行压缩编码,压缩后的视频质量有所下降,同时,运动补偿所产生的MV精度也发生了变化,则相应的BER变大。
图4 不同QP值下抗重编码压缩性能
3)抗噪声攻击性能分析
图5给出了在不同标准差的椒盐噪声攻击下的BER水印曲线图。随着噪声滤波标准差的增加,两种算法的比特增加率也随之增加,原因是噪声攻击严重影响了视频序列像素的空间分布,使H.264编码过程中的MV和整数DCT变换系数影响比较大,水印的提取会受到很大影响。虽然如此,本文算法的鲁棒性也较好。图5给出了文献[10]与本算法的对比示意图。
4)抗旋转攻击的分析
图6给出了含水印的视频序列在旋转攻击情况下鲁棒性示意图。由图可知,本文BER值随着旋转角度的增大而增加,最大可达0.3。这是由于本文算法是基于MV的水印嵌入方法,当视频序列受到旋转攻击时,运动估计所得的MV就会受到影响,相应地水印检测与提取过程都会受到影响,BER值也增大。当旋转角度很小时,MV的改变也很小,能提取出有效的水印信息,具有良好的鲁棒性。
图5 在不同噪声的攻击下视频质量曲线
图6 不同旋转角度下的鲁棒性
本文选择P帧宏块的最大MV作为该水印的嵌入位置,可以获得良好的视觉质量。在嵌入过程中,充分利用了H.264帧间预测编码的运动补偿和MV的特点,取得较好的水印嵌入方案,提高了水印的鲁棒性,水印信息嵌入后码率变化范围很小。同时该算法和以往提出的H.264水印算法做了对比,实验仿真结果表明该算法在抵御抗重压缩编码、高斯白噪声、旋转等的攻击下仍然具有良好的鲁棒性。
[1]李勇.用于流媒体版权保护的视频水印技术[J].电视技术.2012,36(8):41-43.
[2] ITU-T REC.H.264/ISO/IEC 11496-10,Advanced video coding,final committee draft document JVT-E022[S].2002.
[3]毕厚杰.新一代视频压缩编码标准——H.264/AVC[M].北京:人民邮电出版社,2005:84-91.
[4]余兆明,查日勇,黄磊.图像编码标准H.264技术[M].北京:人民邮电出版社,2006:5-10.
[5] KIM D,CHOIY,KIM H,etal.The problems in digital watermarking into intra-frames of H.264/AVC[J].Image and Vision Computting,2010,28(8):1220-1228.
[6] ALTUNBASAK Y.An analysis of the DCT coefficients distribution with the H.264 video coder[C]//Proc.International Coference on Acoustics,Speech,and Signal Processing.[S.l.]:IEEE Press,2004:177-180.
[7]谢斌,任克强,肖玲玲.一种基于HVS的DCT域稳健性视频水印算法[J].电视技术,2011,35(9):30-35.
[8]朱德庆,金文光.基于MV的鲁棒性视频水印算法[J].浙江大学学报:理学版,2010,37(3):286-290.
[9]孟巍,韩峥,崔慧娟,等.H.264中SKIP和帧内模式的快速判断[J].清华大学:自然科学版,2009,49(8):1160-1163.
[10] ZHANG J,ANTHONY T,QIU G,et al.Robust video watermarking of H.264/AVC[J].IEEE Trans.Circuits and System-II:Express Briefs,2007,54(2):205-209.
[11]毛颉.数字水印攻击及对策分析[J].信息安全与技术,2012(2):15-17.