李小璐,周晓谊,曹春杰
(1.海南大学信息科学技术学院,海南 海口 570208;2.北京大学软件与微电子学院,北京 100871)
基于改进的遗传算法和SVM的图像DCT变换域水印技术
李小璐1,2,周晓谊1,曹春杰1
(1.海南大学信息科学技术学院,海南海口570208;2.北京大学软件与微电子学院,北京100871)
由于一些不可避免的因素,现有的数字图像水印技术或多或少的存在各种缺陷,在图像采样、水印嵌入、图像合成、水印提取等各个环节都存在值得商榷的地方。采用支持向量机(SVM)模型,通过对大量不同纹理与亮度块的训练,使得图像块通过SVM得出相应的类别,从而实现水印强度的可变嵌入,并且,通过保留个别最佳个体进一步改进遗传算法,同时改变采样方式,在图像分块的DCT域中嵌入水印。实验证明,该方法使得嵌入水印图像与原始图像有较高的PSNR值,同时对JPEG、高斯噪声、旋转、低通滤波、直方图均衡化等具有较好的抗攻击能力。
支持向量机;图像下采样;离散余弦变换;图像水印
随着网络和数字媒体技术,包括数字图像、数字视频、音频以及3D计算机图形等的发展,网上多媒体信息量得以急剧膨胀。由于图像与人感知外部世界的基本手段相吻合,因此相关的信息量将涉及到军事机密、个人隐私、商业利益等,同时数字媒体信息的编辑、存储、修改和传播简单方便,所以网络传输过程中数字信息容易遭受有意或无意的破坏攻击,造成人们不能对数字媒体信息内容的真实性和完整性进行验证。因此,如何保证重要的图像信息在网络和其他信道上安全传输,并对发送的图像进行可靠的完整性和真实性的保护及认证,是目前各界广为关注的问题,也是当前信息隐藏研究领域的重要方向之一[1-2]。
目前,对数字多媒体实施版权保护主要采用两种方法:数字版权管理技术(DRM)和数字水印(Digital Watermarking)技术。传统的DRM技术对数字多媒体作品的完整性认证和保护仍然存在局限性,体现在:
(1)只在通信的信道中应用加密方法,因此非法用户如果解密成功,那么信息就成为完全的明文;
(2)在密码学中,多采用数字签名的方式实现完整性认证,而数字多媒体中并没有嵌入相关信息,信息无法通过加密系统的再次传播和内容改变而被发现或还原成原貌,因此数字水印技术应运而生。
作为传统加密办法的有效补充手段,数字水印技术在数字多媒体产品的版权保护和完整性认证等方面的应用已经引起了相关学者的高度关注,这已成为信息安全领域的一个研究热点[3-4]。
近些年,虽然数字水印技术正在快速发展,但是还没有特别成熟的研究成果和实际应用,就算是研究最多的版权保护技术,也还没有形成统一的国际标准。有鉴于此,对于目前的信息安全领域来说,继续对数字水印技术进行更加广泛而深入的研究是很有必要的。
目前,关于数字图像、音频、视频、文本、数据库等常规载体的数字水印技术研究较多,研究成果也较为显著,但基于SVM的水印研究还很少,而且已有的研究多集中在数据的版权保护方面,强调水印的鲁棒性。实际上,出版权信息外,也需要在传输过程中对数据进行隐式保护,能够实现数据内容的真实性鉴别和数据来源的可靠性认证,所以本文还关注水印的脆弱性和抵抗攻击的能力。支持向量机(Suppor Vector Machines,SVM)是小样本情况下的统计学习理论的一种机器学习方法,由Vapnik和Cortes于1995年提出,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[5-7]。Vapnik在SVM中提出了VC(Vapnik and Chervonenkis)维概念以保证期望风险最小,解决了神经网络的过学习问题[8]。不仅如此,SVM还具有小样本情况下训练效果好、泛化能力强、计算复杂度与维数呈线性增长等优点。结合数字水印技术,可将支持向量机应用于自适应确定数字水印的嵌入强度。相比传统的水印嵌入,本文首先着手的是水印嵌入位置。利用遗传算法选取最佳的水印嵌入位置。由于遗传算法的整体搜索策略和优化搜索方法在计算时不依赖于梯度信息或其他辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法对问题的种类有很强的鲁棒性。本文在确定基于遗传算法研究水印嵌入之后,又对遗传算法进行改进。改进的地方主要有两个方面:采用了自适应的选择、交叉和变异因子,保证了种群的多样性;在选择、交叉、遗传的过程中保留最佳个体不改变,保证最佳个体的优良部分能够参与遗传,提高了遗传算法的性能,优化了适应度函数的值。
遗传算法以生物遗传为基础,在解决实际问题时,从可能存在解集的一个种群开始,该种群则由经过基因编码的一定数目的个体组成。初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代演化产生出越来越好的近似解。因此末代种群中的最优个体经过解码,可以作为问题近似最优解。在机器学习中,支持向量机(SVM)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。
1.1支持向量机选择嵌入强度
本文采用可变的嵌入强度。为此,将通过支持向量机的方法对样本进行训练,决定各位置的嵌入强度。对于样本的选择,是在2 700张图片的纹理库中挑选50对纹理相似、明暗不同的图片进行操作,挑选的部分图像如图1所示。
图1 不同纹理与亮度图片
从这些图片中选取一定数量的具有不同特征的图像块(8×8),在本实验中,共选取了1 600个图像块,这些图像块所具有的不同特征作为SVM的训练集。由于人眼对不同纹理与不同亮度具有不同的敏感性,所以通过亮度与纹理这两个属性作为图像块的特征。亮度可以通过计算图像的明暗度来确定,计算方法如下:
式中:A(m,n)为8×8的子图块在中位置的像素值;β是伸缩因子,用于平衡b值的大小,在本文中,β=500。
纹理则通过计算图像的熵值和方差确定,对于熵值e和方差v的计算方法如下:
式中:zi表示灰度级;P(zi)表示子图块中灰度级的概率。
由于亮度与纹理度的程度不同,所以按照表1所示的规则将图像块进行9种分类。在本实验中,T1,T2,T3,T4,T5,T6,T7,T8,T9分别用1,2,3,4,5,6,7,8,9表示。通过以上步骤可以确定样本训练集的中的样本矩阵和与样本相对应的样本属性矩阵。样本矩阵包含的是1 600个图像块的(b,e,v)值,样本属性矩阵包含每一个图像块所对应的类别。在本次实验中,通过多次的试验与总结归纳,规定的1~9类别所对应的实验嵌入强度为:[21.190 5,15.409 6,17.697 4,18.118 0,25.131 5,18.440 4,18.490 4,19.872 5,18.618 7]。从上述的样本训练可以看出,试验中实际采用的是多分类支持向量机模型,在此,实验中采用的是林教授提供的多分类SVM算法,在Matlab工具箱的实际使用中,主要使用了svmtrain()与svmpredict()这两个函数。通过将原图每个位置分类,即可得到各位置与嵌入强度的映射关系,在实际的嵌入中,实现嵌入的强度的可变。
表1 子图块类型的确定
1.2遗传算法优化水印嵌入位置
本文对遗传算法做出了一定改进,具体修改内容如下:
(1)编码。本文中对图像进行分块,经过多次的实验数据分析,子图块大小为8×8,每个子图块中只嵌入一个水印分量。在经过实际的试验后,对个体的选择进行了优化,实际的程序运行中,选择每个子图块中的位置,因此每个个体的编码即:
(2)遗传算子。遗传算子用于遗传算法中的选择复制、交叉和变异中。传统的遗传算法的交叉概率和变异概率是固定的,适应性比较差。因此在本实验中对交叉概率和变异概率的选择做出了改进,具体实现如下:
在程序开始时,定义Pc,Pm的值,并在程序中,实现交叉概率与遗传概率的自适应如下:
该过程中,该遗传算子是根据循环代数自适应变更的,实际运行时,通过交叉算子扩大了搜索空间,积累高适应度模式,避免程序早熟,通过变异算子,提高局部搜索能力,避免出现特别的个体。
(3)选择。在以往的实验中,每一代种群的选择一般采用的是赌轮盘方法,此种方法虽然应用较广,也易于实现,但也存在一定的弊端。在轮盘赌方法中,用于判断下一代的概率序列是随机产生的,这样做虽然可以保证随机性,但无法保证每一代的最佳个体一定能够参与下一代的遗传,可能会产生一代不如一代的现象。
所以,在本文中,将对算法中的选择做出改进,依然是以轮盘赌作为选择的方法,但在轮盘赌结束之后,将每一代的最佳个体分别赋值给种群中的第一个位置与第二个位置,强制要求每一代的最佳个体参与下一代的遗传。
在这里,每一代第一个位置的最佳个体,不参与任何交叉、变异,直接进入下一代,直到被下一代更优的个体替换。每一代第二个位置的最佳个体,参与遗传中的交叉变异,保证最佳个体的优良部分能够参与遗传。
(4)交叉。进行交叉时,群体中的每个个体之间都以一定的概率Pc交叉,即两个个体从各自的某一位置开始互相交换,这类似生物进化过程中的基因分裂与重组。需要注意的是,种群中第一个位置的最佳个体并不参与交叉,即最佳个体的优良部分能够参与遗传。
(5)变异。基因的突变普遍存在于生物的进化过程中,变异的意义在于产生有利的变异,增加个体的适应度,并遗传给下一代。需要注意的地方也是不要让种群中第一个位置的最佳个体参与变异。
(6)适应度函数。适应度函数的目的在于对每一代的种群进行选择,找出每一代的最佳个体,用于最终的嵌入位置选择。在本文中,适应度函数选取的是两幅图片的PSNR值,并通过系数的增加,使得PSNR相差的值更明显,便于算法进行优胜劣汰的选择。
1.3水印的嵌入和提取
1.3.1水印嵌入
实验中采用的是可变嵌入强度的水印嵌入,通过前面的多分类,得到原图中各子图块与嵌入强度的映射关系,在具体嵌入时,方法如下:
(1)对于大小为M′×N′的二值水印图像,并随即用Arnold置乱以消除空间相关性,将W降维为一维序列,记为:
(2)对所有子图块进行DCT变换,并按zigzag顺序依次读取各子图块,得到多组一维序列,记为:
(3)根据Y,计算DCT系数位置的相关值:
(4)从Y中选取M′×N′个不同的子图块系数序列用于水印嵌入,需要注意的是,这里每个子图块系数序列仅嵌入一个水印位。选取的子图块系数序列记为:
式中:i表示依次选取的子图块;B(i)的值表示在该子图块内的嵌入位置。
(5)定义
式中,i表示依次选取的子图块,顺序与序列B中一致。
(6)第k个水印信息,将根据B(i)与C(i)之间的关系进行嵌入,判断方法如下:
式中:αk>0为第k个所选子图块系数序列对应的嵌入强度;B(k)表示嵌入水印后的系数序列。
(7)在所有水印信息嵌入完成后,将B恢复到Y中,随后对子图块系数序列进行逆zigzag读取与逆DCT变换,并将各子图块组合,得到最终的嵌入水印的图像。
1.3.2水印提取
在进行水印提取时,具体方法实现如下:
(1)按照嵌入时的类似方法,在将含水印图像分割为子图块后,对所有子图块进行DCT变换,并按zigzag顺序依次读取各子图块,得到多组一维序列,记为:
(2)根据Y′,计算DCT系数位置的相关值:
(3)从Y′中选取M′×N′个与嵌入水印时相同位置的子图块系数序列,选取的子图块系数序列记为:
(4)定义
(5)按以下方式,进行提取
(6)将得到的水印序列w1′,w2′,…,wM×N′进行反置乱,并生成二维的二值图像,即可实现水印的提取。
本节主要讨论基于遗传算法和支持向量机的鲁棒性数字水印的实验结果,并对嵌入水印的图像进行攻击分析,验证其鲁棒性。
2.1实验结果
图2是循环次数为100时,原图像与嵌入水印图像以及提取的水印和原水印。
图2 提取水印后的效果
图3是50次、100次和200次循环的最佳适应度的值。横坐标代表的是循环次数,纵坐标代表的每一次循环中种群的最佳适应度。遗传算法在循环中逐渐优化嵌入位置,取得更高的最佳适应度,提高了水印的鲁棒性。由图3中的三种结果可以看出,随着遗传算法的循环次数增加,算法选取的最佳嵌入位置越好,适应度函数的值越大,即水印图像的鲁棒性越好。同时,能够完全提取出嵌入的水印。
图3 代数循环为50次、100次、200次的遗传循环结果对比
2.2实验分析
在分析中,选取的是一张循环所产生的最优嵌入水印图片。首先对嵌入水印的图像有18种攻击,得出的提取水印与原水印的PSNR值和NC值如表2所示。由表2可以看出,本文的方法能够有效地抵抗一些攻击。
能够较好抵抗的攻击有JPEG,Gaussian low-pass filtering(3,0.5),Histogram Equalization,Image Darken,Contrast Increasing(0.5,0.6),Contrast Decreasing,Gaussian Noise(0.003),Salt-pepper Noise(0.01),Product Noise(0.2),Rotate和Speckle Noise等。其攻击后所提取的水印如图4所示。
表2 18种攻击后水印的PSNR和NC值
图4 攻击后提取的水印
由图4可以看出,本文的方法能够有效地抵抗一些攻击。下面就抗剪切的攻击能力进行分析,如图5和图6所示,将标准Lena图嵌入水印并剪切后,除了剪切掉78所恢复的水印不可见外,其余提取的水印效果良好。
与文献[9-11]中的数据比较,可以发现应用本文算法,哪怕水印图像被大面积剪切,提取的水印图像的NC值也比其他文献中得到的更加好。因此得到结论:当图像被剪切时,该算法仍具有良好的稳健性,尤其当图像剪切的范围越大,其水印的恢复效果与其他算法相比越具有优势。
图5 被剪切的水印图像
图6 剪切后提取的水印图像
图像被剪切后得到的NC值如表3所示。
表3 图像被剪切后得到的NC值
将表3转换成折线图,如图7所示。
图7 剪切后的鲁棒性测试对照折线图
通过与一些数据的比较发现,本文在水印鲁棒性上具有一定优势。对于以下几种攻击:JPEG,Crop,Gaussian low-pass filtering(3,0.5),Histogram Equalization,Image Darken,Contrast Increasing(0.5,0.6),Contrast Decreasing,Gaussian Noise(0.003),Salt-pepper Noise(0.01),Product Noise(0.2),Rotate和Speckle Noise水印都能够较好的恢复。
本文研究的是一种基于改进的遗传算法和SVM的图像DCT变换域水印技术,用改进的遗传算法优化了水印嵌入位置,改进的地方主要有两个方面:采用了自适应的选择、交叉和变异因子,保证了种群的多样性;在选择、交叉、遗传的过程中保留最佳个体不改变,保证最佳个体的优良部分能够参与遗传,提高了遗传算法的性能,优化了适应度函数的值。同时本文在进一步优化过程中采用了支持向量机SVM来选择图像不同子块的嵌入强度。通过对大量样本的训练,将图像块划分为9类,并根据每一类的纹理与亮度的不同特性赋予不同的嵌入强度,提高了水印的鲁棒性。当然,由于时间和个人能力问题,本文还存在一些问题:自适应的遗传算子未能与适应度函数值相关联起来,可能导致该过程不能保证遗传算法的收敛性;支持向量机SVM的样本分类未能通过权威认定与规范,只是通过计算相关值,人为分类,可能会导致分类不精准,继而导致输入的方块的分类与实际有所差异;没能实现较大容量的鲁棒水印嵌入。从以上问题来看,本文仍有很大的改进空间,很多工作需要继续做下去,实现更好的鲁棒性数字水印的研究。
注:本文通讯作者为周晓谊。
[1]THABIT Rasha,KHOO Bee Ee.Robust reversible watermarking scheme using Slantlet transform matrix[EB/OL].[2015-10-08]. http://www.doc88.com/p-9179558823636.html.
[2]BANERJEE M,ABBAS S.Existence and non-existence of spatial patterns in a ratio-dependent predator-prey model[EB/ OL].[2014-05-05].http://www.sciencedirect.com/science/article/ pii/S1476945X14000580.
[3]ZHOU Xiaoyi,MA Jixin,DU Wencai,et al.A Dynamic multiple digital watermarking model based on temporal series[C]// Proceedings of 9th International Conference on P2P,Parallel,Grid,Cloud and Internet Computing.Washington,DC,USA:IEEE Computer Society,2014:367-371.
[4]ZHOU Xiaoyi,WANG Lingfei.SoRS:An effective SVD-DWT watermarking algorithm with SVD on the revised singular value[C]//Proceedings of 2014 5th IEEE International Conference on Software Engineering and Service Science(ICSESS).[S.l.]:IEEE,2014:1001-1006.
[5]CORTES C,VAPNIK V.Review and performance comparison of SVM-and ELM-based classifiers[J].Neurocomputing,2014,128(2014):507-516.
[6]刘春雨,朱倩男,郭满才,等.双目标函数支持向量机在情感分析中的应用[J].微电子学与计算机,2016(1):127-130.
[7]CHOROWSKI Jan,WANG Jian,ZURADA J M..Statistical learning theory[M].New York:John Wiley&Sons Inc,1998.
[8]王晓燕,张能,王永瑛.基于SVM与特征提取的鲁棒性数字水印算法[J].青岛理工大学学报,2010(3):82-87.
[9]XU Guangxian,LI Yuhua,ZHANG Xin.Cropped-resistant spread spectrum watermarking algorithm based on magic-square transformation[J].TsinghuaUniversity(Sci&Technol),2013,53(8):1087-1090.
[10]ZHOU Yuxiao.A new color digital image blind watermarking algorithm protecting from shear transformation attackbased on chaotic sequences and LWT[J].Journal of engineering graphics,2010,31(4):82-86.
[11]邹长华,谭世恒,林土胜.基于混沌置乱和混沌加密的DCT域数字水印算法[J].微电子学与计算机,2011(5):58-62.
周晓谊(1979—),副教授,硕士生导师。研究方向为密码学、信息隐藏和数字图像处理。
曹春杰(1977—),主任,副教授,硕士生导师。研究方向为协议。
Image DCT domain watermarking technology based on improved genetic algorithm and SVM
LI Xiaolu1,2,ZHOU Xiaoyi1,CAO Chunjie1
(1.School of Information Science and Technology,Hainan University,Haikou 570208,China;2.School of Software and Microelectronics,Peking University,Beijing 100871,China)
The existing watermarking technology for digital image has defects more or less due to some unavoidable reasons. There are some issues in various links,such as image sampling,watermark embedding and extracting,image synthesis,etc. SVM model is used in this paper for classifying corresponding categories by training a large number of image patches with different textures and brightness to realize variable intensity watermark embedding.Moreover,the genetic algorithm is improved further by retaining the some best individuals.Meanwhile,sampling modes are reformed to embed image watermarking in the DCT domain.The experiment results show that the method makes the image with embedded watermark has a higher PSNR value,and has preferable anti-attack ability against JPEG,Gaussian noise,rotation,low-pass filtering and histogram equalization.
support vector machine;image down-sampling;discrete cosine transform;image watermarking
TN911.73-34
A
1004-373X(2016)20-0072-06
10.16652/j.issn.1004-373x.2016.20.019
2016-02-05
海南省自然科学基金(20156217);国家自然科学基金(61462023);2015年度留学人员科技活动项目择优资助项目(人社函[2015]192)
李小璐(1996—),硕士研究生。研究方向为密码学、口令认证和数字图像处理。