基于W ord文档信息隐藏技术的研究

2011-07-20 02:51刘宇苹
武汉船舶职业技术学院学报 2011年2期
关键词:编码方式字符文档

刘宇苹

(武汉船舶职业技术学院,湖北武汉 430050)

信息隐藏是研究如何将某一信息隐藏于另一个公开的信息中,然后通过公开信息传输来传递隐藏信息的一种技术。隐藏信息起源于古老的隐写术,早在公元前就被使用了[1]。如今,互联网、数字通信和多媒体技术的广泛应用,为信息隐藏技术的发展提供了更加广阔的空间。目前关于信息隐藏技术的研究大多集中在图像、视频和音频方面,这是因为图像、视频、音频等载体的信息冗余性较大,人的感官对这些信息的掩蔽效应明显,可隐藏的信息量也就相对较大。相比之下,文本信息中的冗余较小,想要嵌入不可感知的信息相对艰难。但是,在文本中的信息隐藏也具有重要的价值,文本水印同样能够在军事、政务、商务、网络出版等方面发挥重要作用。

1 Word文档中的信息隐藏技术

1.1 Word文档与VBA编程

目前,全世界使用最广泛的文字处理软件是Microsoft Office系列软件,如今M icrosoft Word已经成为办公自动化和日常编辑公认的标准。

VBA(Visual Basic for Applications)是基于Visual Basic For Window s发展而来的,专门用于Office的各种应用程序,VBA的项目仅由使用VBA 的 Excel、Word、PowerPoint等称为宿主的Office应用程序来调用。一个Word文档是由若干对象构成,常见的对象有文档、段、表、单词和字符。一个 Word对象又具有很多的属性,比如Characters属性定义了Characters对象大小、颜色或屏幕位置等特征,或者Characters对象某一方面的行为。在Word的高级版本中,都提供了利用VBA来操控Word对象的方法,本文就是通过VBA修改Word对象的属性在Word文档中嵌入水印数据的。

1.2 通过文字颜色在Word文档中嵌入水印信息

在Word文档中,一个字符的颜色值由32位组成。其中低八位是绿色分量,第9位到第16位是蓝色分量,第17位到第23位是红色分量,高八位是预留的数据位[2]。通常,人眼中的锥状细胞是负责彩色视觉的传感器,人眼对红色最为敏感,绿色次之,对蓝色最不敏感。基于此,我们可以通过变化文本字符RGB值蓝色分量的低两位,绿色分量的最低位和红色分量的最低位嵌入水印信息,将水印容量提高到4bit/1个字符。在Word文档中采用VBA技术编程,通过修改Characters对象的Font.Color属性来嵌入水印信息,如图1所示。

水印嵌入的过程为:将需要嵌入的数据分为8位一组,每一组数据依次嵌入在两个文字颜色RGB颜色值的蓝色分量的低两位,绿色分量的最低位和红色分量的最低位中。将嵌入数据与Word文档的 RGB颜色数据进行异或操作。嵌入过程中,隔一个字符修改两个字符的颜色值,未修改的文字用于提供参考值。

图1 w ord文档中字符信息的嵌入算法

基于字符颜色RGB值变化嵌入水印的方法有着比较高的容量,这是因为字符颜色RGB值三个颜色分量都有8bit数据,另外,我们还可以在字符下划线和纹底的颜色值以同样的方式嵌入水印信息,具有较大的开发潜力。在这些算法中,文字下划线和文字纹底颜色的调整都是在白色的基础上进行的,这是因为在一般情况下Word文档的背景颜色都是白色,添加的下划线或者纹底对使用者是不可见的。但是,当文档背景或者应用窗口背景的颜色不是白色时,添加的白色下划线和字符纹底就显示出来,使嵌入的水印信息暴露。另外,由于修改的是文字的颜色值,使得若想通过对文字像素分布的统计来检测嵌入的信息难度很大,不适用于二值文本图像中水印的检测。

2 Word文本中水印算法的分析

(1)不可感知性

数字水印的不可感知性,指文件因嵌入水印而产生的变化不被人感知。基于颜色信息隐藏编码方式具有较好的隐蔽性,人眼几乎不能发现编码前后文本的变化。几种传统的并且已经被广泛应用的客观评价方式,即均方误差(MSE)、信噪比(SNR)、以及峰值信噪比(PSNR)[3]。对于一个图像处理系统,可以认为输入图像信息为x={x(i,j)}(O≤i≤M-1,0≤j≤N 一1),其中 M 和N表示图像的宽和高。经过处理输出的图像信息为y={y(i,j)}(0≤i≤M 一1,O ≤j≤N-1),失真为 d={d(i,j)}定义为 d(f,/)=y(i,j)-x(i,j)。此处,我们分析嵌入水印的PSNR指标,峰值信噪比PSNR计算公式如下[4]:

基于颜色信息隐藏编码方式峰值信噪比PSNR可以用来检测两幅图像的相似性,字体颜色编码PSNR值为61.898b。

(2)鲁棒性

数字水印的鲁棒性(robustness),指水印在其载体经受各种操作或攻击后仍保持其完整性或仍能被准确鉴别。因为基于颜色信息隐藏编码方式是通过修改文字格式属性嵌入水印信息的,其鲁棒性是较高的。但是,若是将这些文本保存为其他的形式,如经历了将文本保存为文本图像变换后,基于颜色信息隐藏编码方式就较难准确从文本图像中提取水印数据。

(3)安全性

数字水印的安全性(security),指非授权用户无法检测和破坏水印。一般来讲,水印算法的安全性是由两个因素决定的,其一是水印嵌入算法中加密置换的复杂度,可以对水印原数据进行加密和对嵌入水印数据的规律进行置乱,该过程是由密钥Key决定的;二是嵌入水印的方式是否使得载体文本中保存隐秘信息的文字数据不能为用户所改变。我们针对基于颜色信息隐藏编码方式进行了分析研究发现,若是将Word文本内容保存为图片格式,会对水印检测造成不同程度的影响,对字颜色编码的水印检测影响较大。

(4)水印容量

基于颜色的编码方式水印容量较大,本文采用的算法容量为4bit/1个字符。由于算法中需要为隐藏信息提供还原时的参考数据,因此每三个Word文档数据只能隐藏一个字符。即便如此,通过字符颜色编码嵌入水印的方法仍然具有较高的容量。

(5)执行时间

字符颜色编码嵌入水印是通过改变W ord文档中文字属性来嵌入水印的,所以水印嵌入的时间主要是由需要嵌入的信息量决定的,同时还与所使用的计算机的性能有关。本文采用的水印嵌入算法,是对隐藏数据进行异或操作,所以算法的执行时间与图像的类型无关。该类算法提取水印需要的时间接近于嵌入水印时间的2倍。

3 结 语

随着计算机网络技术、数字通信技术、信息编码与压缩技术的快速发展,数字内容的交换和传输变得非常简单和快捷,针对文本信息的版权保护有着非常重要的意义。文本水印的发展和应用相对缓慢,投入到使用中的就更少了。因此,基于文本数字水印技术的版权保护在计算机技术的实际应用中是一个充满活力但又亟待开拓的研究领域。

1 王丽娜,张焕国.信息隐藏技术与应用[M].武汉大学出版社,2003

2 刘 豪,孙星明,刘晋飚.基于字体颜色的文本数字水印算法[J].计算机工程,2005

3 徐迎晖.文本载体信息隐藏技术研究[M].北京邮电大学出版社,2006

4 赵 倩.数字水印版权保护技术系统[M].首都经济贸易大学出版社,2004

猜你喜欢
编码方式字符文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
HBM电子称与西门子S7-200系列PLC自由口通讯
GCOA算法
可穿戴式多通道传感系统功能需求分析及设计
基于RI码计算的Word复制文档鉴别
混合编码方式自适应差分进化算法优化设计宽带天线