基于Contourlet 变换和神经网络的视频水印算法

2014-06-18 07:51李绍华等
电脑知识与技术 2014年11期
关键词:数字水印子带版权保护

李绍华等

摘要:针对数字水印技术在视频版权保护和抵抗攻击时存在的一系列问题。首先将原始水印图像使用Arnold变换和Hilbert曲线进行置乱处理,再对MPEG原始视频的I帧进行Contourlet变换嵌入数字水印,最后在提取时利用确定的神经网络实现水印的盲提取。实验结果表明,该算法具有良好的不可见性和鲁棒性。

关键词: 数字水印;视频;Contourlet变换;神经网络

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)11-2627-04

Abstract: In the view of a range of issues for digital watermarking used in video copyright protection and resistance to attacks. Firstly, the original watermark image scrambling processing by Arnold transform and Hilbert curve, and then on the I frame of MPEG video using Contourlet transform watermark embedding. Finally, the use of neural networks in the extraction of the watermark blind extraction. Experimental results show that the algorithm has good invisibility and robustness.

Key words: digital watermarking; video; contourlet transform; neural network

随着信息技术的快速发展和互联网的广泛普及,互联网用户正经历着从信息的消费者向信息的生产者的角色转化,多媒体数字信息变得越来越丰富,对其进行生产、存储、拷贝和传播变得十分方便。但与此同时,数字多媒体信息正面临着被非法拷贝、篡改和使用等严重的侵权问题。因此,如何在互联网上实现数字多媒体信息的内容认证和版权保护等,已成为世界各国政府亟待解决的知识产权保护问题。

数字水印是在数字多媒体(图像、音频和视频等)中将序列号、文字或图像等版权信息嵌入到数字作品本身之中,从而起到数字媒体的版权保护、真伪鉴别和产品标识等作用。数字水印最初研究的重点是图像水印,并且取得了很多研究成果,而视频水印的研究成果则相对较少。随着多媒体技术的发展和互联网带宽的增大,传播视频产品越来越方便,随之而来的侵权行为也不断发生,因此视频产品的版权保护问题亟需解决。考虑到数据存储和网络带宽,传播的视频绝大部分都是经过压缩处理的,因此视频水印的研究要和压缩编码标准(MPEG系列、ITU-T的H.261和H.263等)紧密联系在一起的[1]。

本文对目前各种针对视频的版权保护技术进行了研究和分析,给出了一种基于神经网络和Contourlet变换的视频水印算法,能有效解决视频版权保护问题。此算法先将原始水印经过Hilbert变换和Arnold变换置乱后,将置乱后的水印图像,使用Contourlet变换嵌入到压缩编码后的视频I帧,神经网络用于水印的检测过程,改善了水印算法的鲁棒性。

1 RBF神经网络

径向基函数(Radical Basis Function,RBF)网络[2]是由Moody和Darken提出的一种神经网络结构,是一种三层前向网络,包括输入层、径向基层和输出层。基本思想是:(1)用RBF作为隐单元的“基”构成径向基层空间,将输入矢量直接(即不需要通过权连接)映射到基层空间;(2)当RBF的中心点确定后,映射关系也就确定了;(3)径向基层空间到输出空间的映射是线性的。

RBF网络的学习等价于在多维空间中寻找训练数据的最佳拟合平面。径向基函数网络对输入空间的某一个局部区域只存在少数的神经元用于决定网络的输出,是一种局部逼近网络。如图1所示为一径向基函数网络的结构图。

RBF网络的优点:1)RBF神经网络具有较强的输入和输出映射功能,并且理论证明在前向网络中RBF网络是完成映射功能的最优网络;2)它具有唯一最佳逼近的特性,且无局部极小问题存在;3)分类能力好;4)学习过程收敛速度快;5)网络连接权值与输出呈线性关系。

2 水印图像的置乱

数字图像置乱技术是由经典密码学中的单表系统扩展而来,早期用于对模拟图像的位置空间进行置换。针对数字图像,可以在数字图像的空域和频域上进行置乱过程。数字图像置乱算法设计者可以自由控制算法的选择、参数的设置以及随机数技术的使用,从而达到使恶意攻击者无法对图像的内容进行解密的目的。经过置乱变换之后的图像已经改头换面,在不知道密钥情况下,想要将置乱图像还原成原始图像是难以达到的。

常用的数字图像的置乱方式有:Arnold、Hilbert、幻方和IFS模型等[3]。可以利用置乱技术进行水印图像加密,达到保证水印图像信息安全性的目的。

3 Contourlet变换

小波变换在二维空间以大尺度的正方形来逼近曲线会产生较大的冗余,而且精度较差;以小尺度的正方形逼近曲线可以提高精度,但数据量会成倍增加,如图3(a)所示。所以小波变换并不能最稀疏地表示二维图像。Minh等[5]提出一种图像二维表示法Contourlet变换,该多尺度几何变换具有小波变换的多分辨率和时频局部特性,而且提供了更高水平的方向性和各向异性,从而可以更全面地表示图像本身的几何特性,如图3(b)。

Contourlet变换是一种不可分离的多尺度信号表示方法,其支撑区间具有长宽比随尺度而变化的“长条形”结构,能有效地跟踪图像中的线奇异性和面奇异性。它将方向分析和多尺度分析分开进行,首先使用拉普拉斯塔式(Laplacian Pyramid, LP)滤波器对原图像进行子带分解,以捕获二维图像信号中存在的点奇异。LP分解首先产生原始信号的一个低通采样逼近及原始图像与低通预测图像之间的一个差值图像,对得到的低通图像继续分解得到下一层的低通图像和差值图像,如此逐步滤波得到图像的多分辨率分解。然后使用方向滤波器组进行方向变换,将分布在同方向上的奇异点连接成线,从而得到图像的稀疏表示,这种结构使Contourlet具有很好的非线性逼近性能,可以对图像进行有效逼近。endprint

4 水印嵌入和提取方案

4.1 水印嵌入算法

MPEG4视频编码标准中,视频是由一个或多个画面组(Group of Pictures,GOP)序列构成,画面组的长度没有严格限制,但要求至少有一个I帧图像,若干个B帧和P帧。I帧的全部像素均进行编码,其作用与静态图像相当,B帧和P帧使用运动补偿的方式,仅保存了块的运动向量。因此,该文算法选择I帧作为水印信息的嵌入目标。

水印的嵌入算法如下所示:

1)利用Hilbert变换和Arnold变换对水印图像进行置乱,将变换次数作为密钥存储。使用Zigzag扫描成一维二值水印序列W。

2)设置二值序列S=P+W,P是一个固定模式序列,长度为K,W是上一步加密后的水印信息,固定模式序列P用于训练RBF神经网络,通过机器学习得到嵌入了水印数字视频数据与模板特征数据的权值,利用此值和神经网络输出嵌入到数字视频中的的水印信息。

3)对MPEG4视频的I帧进行Contourlet变换。水印嵌入的位置综合考虑不可见性与健壮性之间的矛盾。将水印嵌入在逼近子带,则具有很好的健壮性,但不可见性差;嵌入到高频纹理子带则反之,所以选择低频纹理子带(即最高阶方向子带)作为水印嵌入区。同时考虑人眼对纹理的掩蔽特性,在各子带的相同带内坐标中选择纹理最丰富的位置作为水印嵌入位置。

6 结论

本文给出了一种基于Contourlet变换、Hilbert曲线结合Arnold变换和神经网络技术的视频水印算法,水印信息被嵌入到MPEG视频流的I帧当中,起到视频版权保护的作用。通过实验表明,该文算法能有效抵御目前常见的旋转、缩放、压缩和丢帧等多种攻击,具有很强的鲁棒性。

参考文献:

[1] 张玉杰,张媛媛.基于DCT和神经网络的视频版权保护算法[J].陕西科技大学学报,2012,30(1):49-53.

[2] 陈军,张伟.一种基于小波变换和神经网络的数字水印算法[J].计算机科学,2011,38(6):142-144.

[3] 刘学,张化祥.基于密钥的Arnold-Hilbert变换在图像置乱中的应用[J].信息技术与信息化,2009,(6):96-102.

[4] 王笋,徐小双.Hilbert曲线扫描矩阵的生成算法及其MATLAB程序代码[J].中国图象图形学报,2006, 11(1):119-122.

[5] DO M N,VETTERLI M. The Contourlet transform: an efficient directional multi-resolution image representation[J].IEEE Trans on Image Processing,2005,14(12):2091-2106.endprint

4 水印嵌入和提取方案

4.1 水印嵌入算法

MPEG4视频编码标准中,视频是由一个或多个画面组(Group of Pictures,GOP)序列构成,画面组的长度没有严格限制,但要求至少有一个I帧图像,若干个B帧和P帧。I帧的全部像素均进行编码,其作用与静态图像相当,B帧和P帧使用运动补偿的方式,仅保存了块的运动向量。因此,该文算法选择I帧作为水印信息的嵌入目标。

水印的嵌入算法如下所示:

1)利用Hilbert变换和Arnold变换对水印图像进行置乱,将变换次数作为密钥存储。使用Zigzag扫描成一维二值水印序列W。

2)设置二值序列S=P+W,P是一个固定模式序列,长度为K,W是上一步加密后的水印信息,固定模式序列P用于训练RBF神经网络,通过机器学习得到嵌入了水印数字视频数据与模板特征数据的权值,利用此值和神经网络输出嵌入到数字视频中的的水印信息。

3)对MPEG4视频的I帧进行Contourlet变换。水印嵌入的位置综合考虑不可见性与健壮性之间的矛盾。将水印嵌入在逼近子带,则具有很好的健壮性,但不可见性差;嵌入到高频纹理子带则反之,所以选择低频纹理子带(即最高阶方向子带)作为水印嵌入区。同时考虑人眼对纹理的掩蔽特性,在各子带的相同带内坐标中选择纹理最丰富的位置作为水印嵌入位置。

6 结论

本文给出了一种基于Contourlet变换、Hilbert曲线结合Arnold变换和神经网络技术的视频水印算法,水印信息被嵌入到MPEG视频流的I帧当中,起到视频版权保护的作用。通过实验表明,该文算法能有效抵御目前常见的旋转、缩放、压缩和丢帧等多种攻击,具有很强的鲁棒性。

参考文献:

[1] 张玉杰,张媛媛.基于DCT和神经网络的视频版权保护算法[J].陕西科技大学学报,2012,30(1):49-53.

[2] 陈军,张伟.一种基于小波变换和神经网络的数字水印算法[J].计算机科学,2011,38(6):142-144.

[3] 刘学,张化祥.基于密钥的Arnold-Hilbert变换在图像置乱中的应用[J].信息技术与信息化,2009,(6):96-102.

[4] 王笋,徐小双.Hilbert曲线扫描矩阵的生成算法及其MATLAB程序代码[J].中国图象图形学报,2006, 11(1):119-122.

[5] DO M N,VETTERLI M. The Contourlet transform: an efficient directional multi-resolution image representation[J].IEEE Trans on Image Processing,2005,14(12):2091-2106.endprint

4 水印嵌入和提取方案

4.1 水印嵌入算法

MPEG4视频编码标准中,视频是由一个或多个画面组(Group of Pictures,GOP)序列构成,画面组的长度没有严格限制,但要求至少有一个I帧图像,若干个B帧和P帧。I帧的全部像素均进行编码,其作用与静态图像相当,B帧和P帧使用运动补偿的方式,仅保存了块的运动向量。因此,该文算法选择I帧作为水印信息的嵌入目标。

水印的嵌入算法如下所示:

1)利用Hilbert变换和Arnold变换对水印图像进行置乱,将变换次数作为密钥存储。使用Zigzag扫描成一维二值水印序列W。

2)设置二值序列S=P+W,P是一个固定模式序列,长度为K,W是上一步加密后的水印信息,固定模式序列P用于训练RBF神经网络,通过机器学习得到嵌入了水印数字视频数据与模板特征数据的权值,利用此值和神经网络输出嵌入到数字视频中的的水印信息。

3)对MPEG4视频的I帧进行Contourlet变换。水印嵌入的位置综合考虑不可见性与健壮性之间的矛盾。将水印嵌入在逼近子带,则具有很好的健壮性,但不可见性差;嵌入到高频纹理子带则反之,所以选择低频纹理子带(即最高阶方向子带)作为水印嵌入区。同时考虑人眼对纹理的掩蔽特性,在各子带的相同带内坐标中选择纹理最丰富的位置作为水印嵌入位置。

6 结论

本文给出了一种基于Contourlet变换、Hilbert曲线结合Arnold变换和神经网络技术的视频水印算法,水印信息被嵌入到MPEG视频流的I帧当中,起到视频版权保护的作用。通过实验表明,该文算法能有效抵御目前常见的旋转、缩放、压缩和丢帧等多种攻击,具有很强的鲁棒性。

参考文献:

[1] 张玉杰,张媛媛.基于DCT和神经网络的视频版权保护算法[J].陕西科技大学学报,2012,30(1):49-53.

[2] 陈军,张伟.一种基于小波变换和神经网络的数字水印算法[J].计算机科学,2011,38(6):142-144.

[3] 刘学,张化祥.基于密钥的Arnold-Hilbert变换在图像置乱中的应用[J].信息技术与信息化,2009,(6):96-102.

[4] 王笋,徐小双.Hilbert曲线扫描矩阵的生成算法及其MATLAB程序代码[J].中国图象图形学报,2006, 11(1):119-122.

[5] DO M N,VETTERLI M. The Contourlet transform: an efficient directional multi-resolution image representation[J].IEEE Trans on Image Processing,2005,14(12):2091-2106.endprint

猜你喜欢
数字水印子带版权保护
一种基于奇偶判断WPT的多音干扰抑制方法*
图书出版版权保护的困境与出路思考
子带编码在图像压缩编码中的应用
基于网屏编码的数字水印技术
当前传统媒体版权保护的难点及对策
互联网环境下的音乐版权保护
传统媒体版权保护面临八大难关
基于虚拟孔径扩展的子带信息融合宽带DOA估计
基于数字水印的人脸与声纹融合识别算法
基于矩阵分解和混沌置乱的数字水印算法