范馨月,贺志恒,田增山
(重庆邮电大学移动通信技术重庆市重点实验室,重庆 400065)
近几年随着视频网站和网络电视的快速兴起,视频版权纠纷问题也日益严重。作为视频版权保护的主要技术—视频水印受到越来越多的重视。针对视频水印的嵌入方法已有多种,按嵌入域可分为空域和变换域视频水印。空域水印鲁棒性很差;变换域视频水印的能量被散布到整个视频信号中,不会在局部引起大的失真,与压缩标准相兼容有助于降低运算时间,有较好的鲁棒性。按检测与提取水印时是否需要原始信号可分为盲水印、非盲水印和半盲水印,需要原始信号的为非盲水印,视频的数据量非常大,非盲水印的运算时间较长。按载体类型的不同可分为非压缩域水印、编码域水印和压缩域水印,但后2种视频水印算法都会受到改变压缩编码方式的致命攻击[1]。
视频中一帧即为一幅图像,视频由许多帧组成,将图像水印的算法移植时,需要考虑许多问题,比如视频的数据量非常大,相邻帧之间存在大量的冗余,并且大量的视频都要求实时处理,需要较低的运算时间,所以,视频水印最好选择复杂度相对较低的盲水印或半盲水印算法;视频水印应具有随机检测性,不需要从视频数据开始位置一步一步地去检查;视频水印应具有更强的鲁棒性,除了图像传统的攻击外,还应保证视频水印对帧平均、帧交换及帧删除等特有攻击的稳健性[2]。
文献[3]提出了结合初级视皮层特性的基于感兴趣区域(region of interest,ROI)的水印算法,但没有考虑旋转和位移对水印提取的影响,并且ROI算法对亮度系数比较敏感,当亮度值过大时,提取的数据会有一定程度地丢失,如果要求对提取的亮度分量Y进行水印处理,ROI算法的效果会比较差;差分能量水印(differential energy watermarking,DEW)算法要对I帧的部分高频信号进行删除,制造一个能量差值,高频信号的能量不集中,容易被破坏,嵌入的水印容易失真,为了提高鲁棒性必然就需要提高嵌入量,但这样处理会使水印嵌入的视觉失真比较明显[4];H&G算法引入漂移补偿来克服水印嵌入时引起的预测误差累计的问题,提高了重建质量和稳定性,但漂移补偿增加了算法中数据记录的复杂度和解码的困难[5];合理抖动量化算法(rational dithermodulation,RDM)主要是在编解码端同时使用对增益不变的自适应量化步长来实现,但没有考虑人类视觉系统(human visual system,HVS)感知特性,水印的透明性不是很好[6];Watson视觉感知模型中的亮度掩蔽算法的量化步长和嵌入水印系数很难做到良好地匹配,如果匹配不当会造成解码错误[7];文献[8]提出了基于能量判断的 DCT-SVD(singular value decomposition)视频水印算法,先利用能量公式判断子块的能量,分别对高能量和低能量的DCT域的中频系数嵌入相同的水印,大大降低了运算量,但对高斯噪声、帧删除及帧平均等攻击的鲁棒性较差。
本文提出了一种基于伪三维DCT变换和量化索引调制系统(quantization index modulation,QIM)的非压缩域YUV视频盲水印方法,水印的嵌入位置是经过人类视觉系统模型和量化索引调制系统双重选择的模块,视频经过伪三维DCT变换后,通过QIM系统数据分析得到嵌入信息,利用原始帧非压缩域的量化信息得到秘密的嵌入系数,有利于水印的盲提取,降低了算法的复杂度。实验结果表明,该算法对视频质量的影响较小,并且能有效抵御旋转、缩放、剪切、加噪、滤波、帧交换、帧删除及帧平均等多种攻击,具有较强的鲁棒性。
QIM是近年出现的一种新颖思想,它根据水印信息,把原始载体数据量化到不同的水印值索引区间,其本质是微调载体值至指定的量化电平,从而在获得具有较高鲁棒性的嵌入水印的同时,具有较小的嵌入失真。QIM系统可以自适应地获得数字水印的嵌入信息,嵌入水印主要依赖量化技术,选择一个特定的量化器对信号进行量化,通过这样的编码方式得到水印信号,有利于水印抵抗MPEG(moving pictures experts group)压缩攻击。
QIM量化的根本思想就是嵌入水印用二元序列表示[9]。一个标准的均匀步长为Δ的量化器可表示为
Q0和Q1的点集如果用数轴来表示,○表示Q0,×表示Q1,在数轴上形成了Q0和Q1的2个点集合,2个量化器之间不管在数轴上哪个位置,相邻量化器之间的最小距离都为dmin=Δ/2,如图1所示。
图1 嵌入信息的标量QIMFig.1 Scalar QIMof embedded information
水印嵌入时引起的最大绝对量化误差不会超过Δ/2,当量化误差满足均匀分布时,水印信息可以等概率的取0或1值,引起的均方失真为Δ2/12[10]。
设水印信号为∞ ,噪声信号为n,则受到噪声攻击后的水印信号y可表示为
由(4)式可见,嵌入的水印有良好的均匀特性,水印检测时不需要原始水印,可以完全做到盲提取,并且当噪声系数的幅值,嵌入的水印可以做到无差错估计,使水印具有较好的鲁棒性,这是传统扩频通信水印算法不能超越的。
三维变换通常指空间与时间的结合,本文采用伪三维DCT变换,根据变换后的视频数据选择低频部分嵌入水印,减少了运算量,降低了算法的运行时间,提高了水印的抗攻击性。
伪三维DCT变换的示意图如图2所示。算法第1步将每一帧作为一个单独的模块进行分块处理,由随机帧的同一位置提取小模块,小模块的像素大小必须一致,对小模块分别进行二维离散余弦变换,变换后矩阵的左上角部分即为信号的直流值(DC);第2步将直流值作为一个整体进行一维DCT变换,得到新的直流值和几个交流值(AC)。
图2 伪三维DCT变换Fig.2 Pseudo 3-D DCT transformation
本文算法基于伪三维DCT变换,根据QIM和HVS系统模型自适应生成嵌入的水印,水印嵌入时记录的随机密钥既保护了水印的安全,又可用于盲水印的提取,原始视频序列被分成了多个随机帧集合,不同的帧集合嵌入水印有利于提高水印的有效性。视频水印嵌入新算法的流程图如图3所示,其具体步骤如下。
步骤1 从原始视频中随机地选择几个帧作为一个集合,也可由用户指定,对已选帧的位置进行记录,随机帧的选择数目与水印的像素大小密切相关,考虑算法的复杂度及运算时间等因素,选择个数不宜过多。
步骤2 明确原始水印的信号类型,对其进行Arnold置乱,将置乱次数作为密钥key:
(5)式中:x,y∈ {0,1,2,…,N - 1},表示某一像素点的坐标;(x',y')为Arnold置乱后的输出;N是图像矩阵的阶数。
图3 视频水印嵌入流程图Fig.3 Flow of video watermark embedding
(6)式中:i是选择视频帧的集合序号;k是分块后的视频帧的模块序号;l为选择的AC值的个数;Ws(i,k,l)为密码,初始值由用户设定。
步骤4 由高斯函数把权值和Sum(i,k)转换为Sumf(i,k),因不同的视频有不同的属性,权值Sum(i,k)可以是任意的,且认为其出现是等概率的,把所有这样的值的概率分布称为Sumf(i,k)。
步骤6 利用QIM模型改变Sum(i,k)的值,AC权值是否转换由嵌入的水印决定,当嵌入水印为0时,对应的权值和变为0,当嵌入水印为1时,对应的权值和变为1。
步骤8 记录视频帧选取的规则、水印置乱密钥、阈值 T(i)和 Ws(i,k,l)值,由新的 Sum(i,k)值得到更新后的AC值,经逆变换和帧重组后得到嵌入水印后的视频。
水印的提取是嵌入的逆过程,视频水印提取流程图如图4所示。
图4 视频水印提取流程图Fig.4 Flow of video watermark extraction
水印提取的具体步骤如下。
步骤1 利用记录信息,选取嵌入水印的帧集合,并得到每一帧的亮度分量Y;
步骤2 对嵌入水印的模块进行伪三维DCT变换,得到AC值,计算每一个模块的AC系数的权值和 Sumw(i,k);
步骤3 计算每一个模块的Qw(i,k),并判断水印的值,判决依据为
步骤4 由记录的置乱次数密钥key,经Arnold置乱的逆变换还原提取的水印:
本文测试环境为Windows XP系统、MATLAB 2009b仿真平台。视频测试时,只利用了一个集合进行视频水印处理,并选择了不同分辨率的YUV格式原始视频、多种帧数以及不同分辨率的二值水印图像进行试验,具体数值如表1所示。仿真时,二维DCT变换的子块大小设置为4×4。
表1 选择视频及水印的参数Tab.1 Parameters of the selected video and watermark
第1段视频的实验结果如图5所示,可见视频水印的不可感知性较好,提取水印的相似度很高。
图5 第1段视频实验结果图Fig.5 Experimental results about the first section of video
另外,3段视频嵌入水印前后的峰值信噪比(peak signal-to-noise ratio,PSNR)和提取水印的归一化互相关值 (normalized cross-correlation,NCC)如表2所示。
表2 3段视频的部分PSNR和NCCTab.2 Partial results about PSNR and NCC of three section videos
测试结果表明,当PSNR大于30 dB时,人的视觉很难分辨出原始图像和嵌入水印图像的差异,因此从视觉感知效果和PSNR都证明,本算法具有良好的不可见性。
对第1段视频选择一个集合共8帧进行水印嵌入,经旋转、缩放、剪切、加噪、滤波、帧交换、帧删除及帧平均等多种攻击后,将提取水印与文献[8]的结果进行比较,PSNR具体结果如表3所示,NCC值的比较如表4所示。测试结果表明,本文算法的PSNR均有明显提升,特别是对旋转、高斯噪声、帧删除及帧平均等攻击提高了约6 dB的性能;提取水印的相似度均有所提高。
表3 各种攻击后水印的PSNR对比Tab.3 Comparison of PSNR undermultiple attacks
表4 各种攻击后水印的NCC对比Tab.4 Comparison of NCC undermultiple attacks
本文提出了基于伪三维DCT变换和量化索引调制系统的非压缩域视频盲水印方法,保证视频水印的不可见性的同时,提高了视频水印的抗攻击能力。实验结果表明,该算法能抵御旋转、缩放、剪切、加噪、滤波、帧交换、帧删除及帧平均等多种攻击,具有较强的鲁棒性。
[1]许拔,张仲明,何英亮,等.基于LDPC码的盲视频水印算法研究[J].重庆邮电大学学报:自然科学版,2009,21(6):741-748.
XU Ba,ZHANG Zhongming,HE Yingliang,et al.A study of blind video watermarking algorithm based on low density parity check codes[J].Journal of Chongqing U-niversity of Posts and Telecommunications:Natural Science Edition,2009,21(6):741-748.
[2]谌志鹏,邹建成.基于对象的抗几何攻击的视频水印算法[J]. 北京邮电大学学报,2012,35(4):33-37.
CHEN Zhipeng,ZOU Jiancheng.Object based watermarking algorithm robust to geometric transformation attacks[J].Journal of Beijing University of Posts and Telecommunications,2012,35(4):33-37.
[3]吕皖丽,郭玉堂,罗斌.结合初级视皮层特性的感兴趣区域数字水印算法[J].电子科技大学学报,2011,40(6):915-920.
LV Wanli,GUO Yutang,LUO Bin.Novel ROI watermarking scheme combined with the behavior of primary visual cortex[J].Journal of University of Electronic Science and Technology of China,2011,40(6):915-920.
[4]冯佳琦,蒋兴浩,孙锬锋,等.基于有限状态机模型的非压缩域视频差分能量水印算法[J].上海交通大学学报,2010,44(7):907-910.
FENG Jiaqi,JIANG Xinghao,SUN Tanfeng,etal.An original video differential energy watermarking algorithm based on FSM mode[J].Journal of ShangHai JiaoTong University,2010,44(7):907-910.
[5]HARTUNG F,GIROD B.Watermarking of uncompressed and compressed video[J].Signal Processing,1998,66(5):283-301.
[6]PEREZ-GONZALEZ F,MOSQUERA C,BARNIM,et al.Rational dither modulation:A high-rate data-hiding method invariant to gain attacks[J].IEEE Transactions on Signal Processing,2005,53(10):3960-3975.
[7]高虎明,李凯捷,王英娟.基于SIFT抗几何攻击的数字水印算法[J]. 计算机应用,2013,33(3):748-751,755.
GAO Huming,LI Kaijie,WANG Yingjuan.Digital watermarking algorithm of anti-geometric attacks based on SIFT[J].Journal of Computer Applications,2013,33(3):748-751,755.
[8]CHENW M,LAIC J,WANG H C,et al.H.264 video watermarking with secret image sharing[J].The Institution of Engineering and Technology Image Processing,2011,5(4):349-354.
[9]马丽红,谢中华,刘小燕.视频数据隐藏的差分能量调制新算法[J]. 中国图象图形学报,2010,15(1):37-44.
MA Lihong,XIE Zhonghua,LIU Xiaoyan.Robust video concealment based on differential energy modulation[J].Journal of Image and Graphics,2010,15(1):37-44.
[10]CHEN B,WORNELL GW.Quantization index modulation:a class of provably good methods for digital watermarking and information embedding[J].IEEE Transactions on Information Theory,2001,47(4):1423-1443.
[11]张维纬,张茹,刘建毅,等.基于纹理特征的 H.264/AVC顽健视频水印算法[J].通信学报,2012,33(3):82-89.
ZHANGWeiwei,ZHANG Ru,LIU Jianyi,et al.Robust video watermarking algorithm for H.264/AVC based on texture feature[J].Journal on Communications,2012,33(3):82-89.
(编辑:魏琴芳)