李淑芝,吴晓燕,张 翔
(江西理工大学信息工程学院,江西赣州341000)
随着信息技术的快速发展以及计算机、手持移动设备的不断普及,催生了更多形式丰富的数字多媒体信息,而互联网络技术(特别是移动互联网)的广泛应用更是为数字多媒体信息的传播和使用提供了便利条件。数字视频产品是多媒体信息形式里最重要的产品之一,种类繁多,丰富了互联网媒体内容。然而由于网络的开放性和共享性特点,使得数字视频产品传播和使用过程中缺少合理监管,数字视频产品很容易遭到非法拷贝、传播和篡改等侵权行为。因此,对数字视频产品采取相应的版权保护措施变得极其重要。而数字视频水印技术作为数字产品版权保护和内容认证十分有效的手段,则逐渐成为信息安全领域的研究热点之一[1-2]。
数字视频水印技术作为信息隐藏技术中的一个重要分支,是将特定的标记信息嵌入到数字视频产品中。嵌入的标记信息不会对数字产品的使用价值产生影响且水印信息不易被感知和攻击篡改,以此达到对数字视频产品版权保护的目的,同时也可根据视频水印的正确性和完整性识别视频产品的真伪。运动特性作为视频区别图像的重要特点之一,针对视频的一般攻击无法对其进行破坏,因此关于视频运动特性的研究得到诸多学者的关注。目前视频水印嵌入算法主要分为3类:1)水印嵌入到压缩比特流。2)水印嵌入到视频量化系数。3)编码水印嵌入到原始视频序列。第1类算法水印嵌入到压缩比特流,不需要对视频进行解码和编码,也不会影响视频质量,但该算法不容易设计,水印容量也很有限;第2类算法水印嵌入在视频编码量化系数中,如DCT(Discrete Cosine Transform)系数和运动矢量,但此类算法会使视频质量会受到影响;本文采用第3类算法,这类算法主要是结合人类的视觉特性,水印嵌入后不易被感知且对常见的视频攻击具有较强的稳健性。
Jordan和Kutter等人[3]第一次选择在修改后的运动向量中嵌入水印信息,并为基于运动特性的视频水印算法研究开拓了一种新的视角。楼斌等人[4]提出了一种自嵌入式的水印算法,将提取出的运动目标作为水印,该算法针对MPEG压缩具有一定的稳健性,但遭受加噪攻击时表现相对脆弱,稳健性能较差。陈希等人[5]通过检测和标记运动目标,进行奇异值分解并自适应嵌入水印,但受限于水印的嵌入位置,因此嵌入效果并不好。郭燕等人[6]提出基于运动目标检测和纹理复杂度的视频水印算法,但水印嵌入算法实时性较差,且不能进行水印盲提取。Cheng等人[7]提出了一种基于离散小波变换(Discrete Wavelet Transform,DWT)跟踪识别多个对象的方法,在离散小波域采用帧间差分法对运动对象进行分割,但基于离散小波变换的方法对运动对象移位不敏感,不能准确分割运动对象。
针对上述问题,本文在相关研究的基础上,提出了一种基于小波变换域的运动目标检测并结合人类视觉系统(Human Visual System,HVS)特性的视频水印算法。进行Daubechies复杂小波变换后采用近似中值滤波检测帧间差,从中获得视频图像中已改变的像素值,标记运动区域,并结合HVS特性从静止区域中划分出高纹理复杂区域,水印自适应选择嵌入在运动区域及高纹理复杂区域;原始水印图像采用混沌加密和Arnold置乱进行预处理,置乱水印图像的相关性,确保了水印信息的安全性,并在小波域进行水印嵌入,较好地兼顾了水印的不可感知性和稳健性。
运动目标检测旨在从视频中实时检测并提取运动目标,是视频序列运动分析与理解的关键技术。运动目标检测会受到诸多因素的影响,比如光照强度突变、背景转换、物体的移动、阴影、噪声等。目前,运动目标检测方法主要有3种:光流法、帧间差分法、背景减法。帧间差分法因其复杂度低、对环境变化较不敏感、自适应能力好而成为研究热点。本文在进行Daubechies复杂小波变换后,采用帧间差分法并结合近似中值滤波算法检测帧间差,从而获取运动目标。
首先,在Daubechies复杂小波域内分解2个连续帧In和In-1,然后再用近似中值滤波来检测帧间差[8]。用式(1)计算每一个像素点(i,j)的帧间差
式中:FDn(i,j)是帧间差;WIn(i,j)和 WIn-1(i,j)是对应帧 In和In-1的小波系数。式(1)获得的帧间差FDn(i,j)可能会有一些噪声,在小波域可以应用软门限来消除噪声[9]
式中:FD'n(i,j)是消除噪声后的帧间差;λ是相应噪声。去除噪声后,采用Sobel边缘检测算子检测FD'n(i,j)中像素差很明显的边缘,如式(3)所示
在小波域,得到运动分割对象DEn(i,j),并标记在原图像中。为了适应背景和光照变化,背景模型的实时更新如式(4)所示
式中:In(i,j)是第 n 帧的(i,j)像素点的值;In-1(i,j)是第 n-1帧的(i,j)像素点的值。
在嵌入水印前先进行预处理,来提高水印的安全性。本文采用基于Logistic混沌映射的混沌加密技术并结合Arnold变换的置乱技术对水印信息进行预处理工作。Logistic混沌映射定义如式(5)所示
式中:0<μ≤4,称为分支参数。当3.569 945 6<μ≤4时,Logistic 映射处于混沌状态[10]。
本文选取二值图像作为水印图像,先利用密钥K1(混沌映射初始值)进行混沌加密,接着利用密钥K2(Arnold迭代次数)对加密后的水印图像进行Arnold置乱,使嵌入的水印对JPEG压缩和噪声干扰等常见操作有较强的稳健性,同时嵌入水印具有很好的不可感知性。
具体的视频水印嵌入示意图如图1所示。
图1 水印嵌入示意图
水印嵌入的具体过程如下:
1)8M×8M原始图像分为8×8子块,分别对子图像块进行Daubechies复杂小波分解。
2)采用基于近似中值滤波的帧间差分法进行运动目标检测,并将标记位插入运动区域D1的每个像素中。
3)将视频当前帧的图像分割为运动区域D1和静止区域D2。若静止区域D2的高频系数绝对值大于门限T,则标记该像素位置为高纹理复杂区域D2.1。T为预先设定的阈值,在此取T为最大系数绝对值的一半。
4)为了优化水印的不可感知性和强稳健性,水印选择自适应嵌入算法。运动区域D1和高纹理复杂区域D2.1选为嵌入水印区域。预处理后水印如式(6)所示
式中:w(x,y)为预处理后的水印。采用式(7)进行水印嵌入
式中:X(x,y)为嵌入区域小波系数;X'(x,y)为嵌入水印后小波系数;Q为水印嵌入强度;T1和 T2为阈值,实验中取T1=0.25Q,T2=0.75Q,mod(·)为求余数运算。
5)在原视频序列中嵌入水印信息后进行小波逆变换,即可获得已嵌入水印的视频图像。
提取算法具体过程如下:
1)利用水印嵌入后视频序列运动区域中的标记像素位,将视频当前帧图像分割为静止区域和运动区域。
2)当前帧图像的静止区域分为8×8子图像块,比较小波变换中的高频系数,若该位置的高频系数的绝对值大于门限T,则标记该像素位置为高纹理复杂区域。
3)运动区域和高纹理复杂区域选为提取水印区域,采用式(8)提取水印
式中:w'(x,y)是提取出的水印;X'(x,y)为嵌入水印后的小波系数;Q为水印嵌入强度;T1和T2为阈值,实验中取T1=0.25Q,T2=0.75Q。
4)对提取的水印序列进行重构,先用密钥K2逆Arnold置乱,然后利用密钥K1混沌解密,得到正确解密后的水印图像。
本文实验是在 Intel Core、CPU T6500,2.1 GHz的主频、2 Gbyte的内存,Windows7的操作系统环境下,采用MATLAB R2012b平台仿真。
本文算法选取Foreman视频第11帧图像作为待嵌入的视频图像。进行Daubechies复杂小波变换后,利用近似中值滤波算法检测帧间差,然后对运动目标进行定位并准确标记运动区域中每个像素。运动目标检测过程如图2所示,其中图2a表示原始图像,图2b表示帧间差分法运动目标检测,图2c表示标记运动区域。
图2 运动目标检测过程
为了确保水印嵌入的安全性,在水印嵌入原始视频之前,先后对要嵌入的水印进行混沌加密和Arnold置乱,因此嵌入水印的帧图像对JPEG压缩和噪声干扰等常见操作有较强的稳健性,同时嵌入水印具有很好的不可感知性。图3a是原始水印,图3b是置乱加密后水印,图3c是Foreman视频序列中提取的水印图像,图3d为在密钥K1和K2都正确且未遭受攻击的解密恢复水印,图3e为密钥K1,K2其中有一个不正确时的错误解密水印。由图3可以看出,当两个密钥全部正确且视频未遭受攻击,可正确提取出水印图像;然而当两个密钥中有一个错误,则嵌入的水印不能完整提取,故该算法的安全性较高。图4给出了Foreman11帧图像及嵌入水印后的图像,该算法没有降低视频帧图像的观感质量,较好地满足了不可感知性要求。
图3 原始水印和提取水印
图4 原始图像及嵌入水印后的图像
稳健性能是指视频水印应该能够抵抗各种有意或无意的攻击包括常见的信号处理攻击、几何攻击和针对视频的帧操作攻击,确保能从受到攻击的视频中获取较好的水印信息。为了测试算法的稳健性能,将归一化互相关系数NC(Normalized Correlation)作为判断稳健性能的尺度,NC定义如式(9)所示
式中:W,Y是水印的行列大小;w(x,y)为初始水印;w*(x,y)为提取出的水印。在NC值大于0.7时就认为提取出有效水印,NC值与水印的鲁棒性呈正相关性。
从视觉看图4a、图4b中嵌入水印前后图像对比,没有明显的差别,采用峰值信噪比PSNR来进一步验证水印的不可感知性,PSNR定义如式(10)所示
式中:D,H是视频图像的行列大小;max(I(i,j))2表示视频图像像素能取到的最大值;原视频帧图像为I(i,j);嵌入水印后的视频帧图像为Iw(i,j)。PSNR越大,水印的不可感知性越好。
因此,对已嵌入水印的视频帧图像分别进行多种针对视频的攻击处理,所提取出水印的实验结果如图5和表1所示。图5a和图5b分别为视频遭受方差为0.001的高斯噪声和椒盐噪声攻击后提取出的水印图像;图5c是对嵌入水印后的视频用均值为0,方差为10的加性噪声攻击后提取的水印;图5d和图5e是对嵌入水印后的视频分别用3×3的维纳滤波和中值滤波攻击后提取的水印;图5f和图5g分别为视频遭受MPEG压缩和JPEG压缩攻击后提取出的水印图像;图5h~图5j分别为视频遭受帧平均攻击(从视频序列中的每5帧图像中随机抽1帧,再用此帧相邻的2帧的平均替代被抽出帧)、帧删除攻击(从视频序列中随机删除2帧,再随机插入2帧)以及帧置换攻击(从视频序列中每10帧中随机置换2帧)后提取的水印图像。
图5 稳健性测试结果
表1 稳健性测试结果
表1和图5中的实验结果表明,本文算法满足不可感知性要求,且从图5看出,视频在经过常见针对视频的攻击后,所提取出的水印都容易被人眼识别,足以表明本文算法对常见视频攻击具有较强的稳健性。
为了验证算法及进一步讨论算法的性能,在MATLAB R2012b平台上进行实验仿真后,将本文算法和文献[13]中的算法(算法1)、文献[14]中的算法(算法2)及采用 LSB(Least Significant Bit)嵌入策略的算法(算法3)进行性能比较。算法1通过对亮度分量进行1级整数小波变换,水印嵌入在小波变换低频子带的最大奇异值上。算法2算法先对视频进行2级DWT变换,再对HL2子带进行SVD分解,根据LSB调制SHL2奇异值实现水印嵌入。算法3是先对视频每帧进行2级的整数小波变换,其次对低频子带LL2进行分块,并对每一分块进行SVD分解。针对稳健性能的测试,以Foreman视频序列为例,考察了几种常见噪声和滤波的攻击,对应的实验结果如图6a~图6d。在图6a高斯噪声攻击实验中随着高斯噪声的增大,NC系数均受到影响,而本文算法中的NC值受到影响最小;在图6b的加性噪声攻击对比实验中,随着加性噪声强度增加,本文算法和算法1的NC系数均减小,而本文算法中NC系数减小力度更小,算法2和算法3的NC系数则是上下波动较大不稳定;图6c、图6d是中值滤波和维纳滤波攻击对比实验,两个实验结果均显示本文算法的NC系数减小幅度最小且保持在较高水平。通过以上实验结果可以总结出,本文算法的稳健性能明显优于算法1、算法2及算法3,因此本文算法具有较强的稳健性能。
本文在保证视频水印算法稳健性前提下,结合视频运动特性,提出一种基于Daubechies复杂小波变换的运动目标检测视频水印算法。Daubechies复杂小波变换具有平移不变性和良好的方向选择性,解决了阴影、重影、噪声等问题。该算法在Daubechies复杂小波域采用近似中值滤波算法来检测帧间差,更加准确地检测运动目标,并采用背景更新法,以防止背景模型的退化。对嵌入的视频水印信息进行Arnold置乱和混沌加密处理,并结合HVS特性,将运动区域和高纹理复杂区域作为嵌入水印区域,以达到水印信息具有不可感知性和稳健性的目的。实验结果验证了本文算法对噪声、滤波器、压缩、帧平均等攻击有很好的稳健性和抗攻击性,并能实现水印盲提取,能够有效保护视频版权。
图6 攻击对比实验
[1]李淑芝,晏啟明,杨书新.基于关键帧和小波变换的盲视频水印算法[J].电视技术,2013,37(9):12-15.
[2]朱光,张军亮.基于SVD和小波包分解的自适应鲁棒水印算法[J].计算机应用研究,2013,30(4):1230-1233.
[3] KUTTER M,JORDAN F,EBRAHIMI T.ISO/IEC Document,JTCI/SC29/WG11,Proposal of a watermarking technique for hiding/retrieving data in compressed and decompressed video,Technical report M2281[S].1997.
[4]楼斌,沈海滨,严晓浪.基于运动目标检测的自嵌入视频水印[J].浙江大学学报:工学版,2008,42(3):382-386.
[5]陈希,周萍.基于运动目标检测的视频水印算法[J].计算机应用,2011,31(1):258-259.
[6]郭燕,卢忱,范九伦.运动目标检测和纹理复杂度与视频水印算法[J].西安邮电大学学报,2013,18(1):35-39.
[7] CHENG F H,CHEN Y L.Real time multiple objects tracking and identification based on discrete wavelet transform[J].Pattern Recognition,2006,39(6):1126-1139.
[8] ERDEM C E,SANKUR B,TEKALP A M.Performance measures for video object segmentation and tracking[J].IEEE Trans.Image Processing,2004,13(7):937-951.
[9] KHARE A,TIWARY U S,PEDRYCZ W,et al.Multilevel adaptive thresholding and shrinkage technique for denoising using Daubechies complex wavelet transform[J].The Imaging Science Journal,2010,58(6):340-358.
[10]张雪锋,范九伦.一种新的分段非线性混沌映射及其性能分析[J].物理学报,2010,59(4):2298-2304.
[11]徐少平,杨荣昌,刘小平.信息量加权的梯度显著度图像质量评价[J].中国图象图形学报,2014,19(2):201-210.
[12]朱宏,蒋刚毅,王晓东,等.一种基于人眼视觉特性的视频质量评价算法[J].计算机辅助设计与图形学学报,2014,26(5):776-781.
[13]熊祥光,蒋天发,蒋巍.基于整数小波变换和SVD的视频水印算法[J].计算机工程与应用,2014,50(1):78-82.
[14] RAJAB L,AL-KHATIB T,AL-HAJ A.Hybrid DWT-SVD video watermarking[C]//Proc.International Conference on Innovations in Information Technology,2008(IIT 2008). [S.l.]:IEEE Press,2008:588-592.