程玉柱 邱春荣 胡伏湘
(长沙民政职业技术学院,湖南 长沙 410004)
数字水印的研究进展与应用综述
程玉柱 邱春荣 胡伏湘
(长沙民政职业技术学院,湖南 长沙 410004)
数字水印作为网络环境下数字作品版权保护的重要技术,已得到广泛的研究和应用。文中对数字水印技术的研究与进展情况进行了论述。以文本水印为例,围绕水印鲁棒性、隐蔽性、安全性和盲检测性等关键问题,分析比较了文本数字水印技术的典型算法及攻击方法,并探讨了未来的应用前景和研究方向。
数字水印;文本数字水印;版权保护;鲁棒性;隐蔽性
多媒体存储和传输技术的进步使存储和传输数字化信息成为可能,同时,随着计算机通信技术的迅速发展,传播数字多媒体信息也越来越方便快捷。然而,这也使盗版者能以低廉的成本复制及传播未经授权的数字产品内容。出于对利益的考虑,数字产品的版权所有者迫切需要解决知识产权的保护问题。基于此考虑,数字水印技术应运而生。
目前对数字水印(digital watermarking)的普遍定义是指镶嵌在其他数据(宿主数据)中具有可鉴别性的数字信号或模式,用以证明宿主数据的版权归属。而且水印的添加并不影响宿主数据的可用性[1]。在某种意义上说,水印对局外人是不可见的(透明的),但算法本身能提供有效的检测手段。数字水印可以标识作者、所有者、发行者、使用者等,并携带有版权保护信息和认证信息,保护数字产品的合法拷贝和传播。
作为保护版权用数字水印需要满足以下四点基本要求[1-2]:
1.1.1 鲁棒性(Robustness):数字水印必须难以(最好是不可能)被除去,试图除去或破坏数字水印应导致水印文本严重的降质而不可用。
1.1.2 隐蔽性(Invisibility):数字水印应是不可见的,即水印的存在不应明显干扰被保护的数据,不影响被保护数据的正常使用。
1.1.3 安全性(Security):数字水印中的信息应是安全的,难以被篡改或伪造,只有授权方可以进行水印的检测。
1.1.4 盲检测性(Blind detection):水印检测过程不需要原始的、未嵌入水印的载体信息。这一方面简化了水印的检测,另一方面则是为了加强水印的安全性。
数字水印的分类方法有很多种,分类的出发点不同导致了分类的不同,各分类方法之间是既有联系又有区别的。按水印所附载的载体类型,可以将水印划分为图像水印[3]、音频水印[4]、视频水印[5]、文本水印[6]、数据库水印[7]等。随着数字技术的不断发展,会有更多种类的数字媒体出现,同时也会有相应载体的水印技术[8]。
本文以文本水印为例来说明典型的数字水印算法。
1.2.1 行间距编码
行间距编码就是在文本的每一页中,每间隔一行轮流地嵌入水印信息,但嵌入信息的行相邻上下两行位置不动,作为参照,需嵌入信息的行根据水印数据的比特流进行轻微的上移和下移[6]。在移动过的一行中编码一个信息比特,如果这一行上移,则编码为“1”,如果这一行下移,则编码为“0”。
1.2.2 字间距编码
字间距编码是通过改变指定的一行中的词块(一个或多个单词)之间的水平距离(间隔)来嵌入信息[6]。编码时,待嵌入信息的词块与其左边基准词块之间距离增大,则表示嵌入的信息位为“1”;与右边基准词块间距离增大,则表示嵌入的信息位为“0”。没有进行编码的基准词块用来作为检测水印的参考和补偿因打印、扫描等所引起的非线性失真。
1.2.3 字符特征编码
字符特征编码通过改变文档中指定字符的某一特征来嵌入标记,这些特征可以是各种各样的:字体、颜色、大小、下划线、笔划高度和方向等。水印的嵌入过程为使用特征的近似替代来嵌入信息,包括不易察觉的字体缩放、与背景同色的下划线、相似的字体、字体颜色等[9-11]。如文献[10]提出了用于矢量字体的特征编码法,通过修改字符的笔划宽度以嵌入水印。文献[11]提出了“基于字符拓扑结构”的文本水印算法,它利用人类对语言符号的“模糊”心理认知模型和生理视觉模型,通过适当改变字符的拓扑结构,设计出语义上相同的字符的多种字形,用字符字形映射的不同数学模型代表隐藏信息。文献[13]提出了一种面向中文文本的基于汉字数学表达式的特征编码法,利用该方法能较为方便和自动化地构造出相似字形的汉字字库,如“妆”和“丬女”,然后再进行替换编码。
1.2.4 不可见编码
不可见编码方法常用于非格式化的文本,一般是在行末添加空格或不可见编码来加载水印,如空格代表“0”,Tab代表“1”等方式[9]。行末是否有空格在视觉上难以区分,提取时可通过不可见编码的有无及数目进行解码。
1.2.5 语义水印
语义水印的主要指导思想是利用自然语言处理技术在不改变文本原意的情况下通过等价信息替换、语态转换等办法把水印信息嵌入文本中[12]。目前自然语言文本数字水印方法主要分为两类:一类基于句法结构,另一类则基于语义[12-13,18]。
基于句法结构的自然语言文本水印方法主要是对句子的句法结构进行转换以嵌入水印,其中最常用的变换方式有以下4种:移动附加语的位置、加入形式主语、主动式变被动式和在句子中插入“透明短语”。四种变换方式各不相同,但它们有着共同的特点:都会使句子的句法结构、句法树的形状发生变化,进而使得变换前后句子的二进制编码变得不同;都存在可逆变换;可以几种方法同时使用。
基于语义的自然语言文本水印方法主要是在基于对句子进行深层次理解的基础上,对句子进行变换以达到在文本中加入水印的目的。基于同义词替换可以算是最早的自然语言文本水印算法,它是在保持语义不变或相近的前提下对内容进行替换,将一个载体文本看成一系列的有意义序列,嵌入过程就是将载体文本转换成具有相同或相近意义的隐秘文本的过程。文献[12]提出了一种基于TMR树的自然语言文本水印方法,该方法是使用TMR(text meaning representation)树的方式对文本中的句子进行表达,并通过对TMR树的操作来实现对文本中句子的修改。此外,从提取文本内容特征以加载水印的角度,文献[14]提出了一种新的文本零水印方法。方法采用基于注册的机制,依据文本语义相似度度量文本相似性,从而确定文本版权归属。其他还有在符号级加入水印,以及通过在文本中添加图形,将文本水印转化为图像水印处理等方法[15]。
数字水印主要应用在以下几个方面[1-2]:
(1)版权保护:数字作品的所有者可用密钥产生水印,并将其嵌入原始数据,然后公开发布其水印版本作品,当该作品被盗版或出现版权纠纷时,所有者即可从被盗版作品中获取水印信号作为依据,从而保护其合法权益。
(2)数字指纹:为避免数字作品未经授权被拷贝和发行,版权所有人可以向分发给不同用户的作品中嵌入不同的水印以标识用户的信息,该水印可根据用户的序号和相关的信息生成,一旦发现未经授权的拷贝,就可以根据此拷贝所恢复出的指纹来确定它的来源。
(3)认证和完整性校验:认证和完整性校验的目的是检测对数字作品的修改。脆弱水印是一种当作品发生任何形式的改变后变得不可测的标志,该类水印还可以对数字作品被篡改的地方进行定位。
(4)访问控制:利用数字水印技术可以将访问控制信息嵌入到媒体中,在使用媒体之前通过检测嵌入到其中的访问控制信息,以达到访问控制的目的,它要求水印具有很高的鲁棒性。
(5)信息隐藏:数字水印可用于作品的标识、注释、检索信息等内容的隐藏,这样不需要额外的带宽,且不易丢失。另外,数字水印技术还可以用于隐蔽通信,这将在国防和情报部门得到广泛的应用。
面向版权保护的鲁棒水印技术是一个具有相当难度的研究领域,到目前为止,还没有一个算法能够真正经得住攻击者的任意攻击。在Internet上已经可以得到能够有效击垮某些商用水印系统的软件,如Stir-Mark等。以下是几种典型的数字水印攻击方法,各方法选取的进攻角度和方式各不相同[17]。
(1)实体攻击:通过直接修改水印作品,以达到破坏水印提取的攻击方法;
(2)算法攻击:在仔细分析水印嵌入特点或破译嵌入密码后,有针对性地去除水印的攻击方法;
(3)策略攻击:利用水印嵌入规范上的缺陷,通过重嵌水印质疑原水印信息的可信度的攻击方法;
(4)解释攻击(又称IBM攻击):首先对水印作品进行嵌入逆操作,得到伪造的原始作品和水印信息,使得水印作品中存在两个功能和法律上完全对等的水印信息。
具体就文本数据而言,目前应用比较频繁的水印攻击方法是实体攻击和算法攻击。包括针对基于格式修改的文本水印算法而对文本字符间距、行间距进行随机化处理;针对基于字符特征修改的文本水印算法而对文本字符特征进行修改;针对基于文档外边缘或附加空格编码算法而对文本内容进行置乱;针对字符拓扑结构转换和汉字拆分算法对文本内容进行重新录入等。
前文提到,一个实用的数字水印系统一般应具有鲁棒性、安全性、隐蔽性、大容量和盲检测等特点。下面结合这五个特点及上述两类攻击方法展开分析,阐述文本数字水印技术研究现状并探讨存在的问题。
在基于文本结构的各种文本水印方法中,行间距编码方法的容量最小,字间距编码的水印方法的隐蔽性好于行间距编码,但鲁棒性减弱,而且相对增加了提取水印的复杂度。空格编码不易引起词句的改变和读者的注意,但容量太小,而且有的编辑器会自动删除多余的空格。由于精确地分析和利用文档图像的特征存在难度,而且文本的操作习惯不同于图像,基于传统图像水印技术的文本水印方法普遍存在鲁棒性不高、操作复杂的缺点[3,4,12-13]。值得注意的是以上四种方法都只是停留在文本的表层,由于它们都是空间域的方法,安全性主要靠空间格式的隐蔽性来保证,攻击者可以通过将字符间距、单词间距以及行间距进行随机化处理而破坏水印,因此这些水印方案普遍存在安全性不强、鲁棒性较差的缺点。
特征编码法在水印容量方面有明显的优势,隐蔽性较好,且部分算法具有较强的鲁棒性,但绝大多数算法针对Retype(重新录入)攻击还没有找到好的应对措施。
自然语言文本水印的方法相对在鲁棒性上提高了系统的灵活性和承受攻击的能力,同义词替代、TMR树算法等就是其中的代表性算法。该方法具有良好的鲁棒性和一定的安全性,但是受限于自然语言处理技术,目前还存在很多尚待解决的问题,包括体裁、字数、变换效果的限制,嵌入水印后的载体文本容易发生语义改变和难以理解的情况,隐蔽性不够理想。此外,如何进一步增强系统的安全性等问题的解决很大程度上要借助、依赖于自然语言处理技术的发展[13]。
水印技术是信息安全技术的一个重要方面,是一种在开放的网络环境中多媒体版权保护的有效方法。目前虽然已经提供了不少水印嵌入方法,但是都或多或少存在一些不太令人满意的地方,很多问题和方法有待进一步的研究和解决。
(1)现在对于数字水印技术的研究主要集中在静态图像方面。至于音频方面,由于人们已能建立很好的语言模型,因此水印技术也相对成熟一些。而在视频方面,虽然目前已有基于动画的水印,但远不如在静态图像中的效果好。此外,针对文本水印的研究也不成熟,一方面因为文本不同于图像和音频、视频,没有充分多的冗余空间;另外由于自然语言处理技术的局限性,目前尚没有真正理想的文本数字水印算法。
(2)与其他学科交叉发展,数学水印技术不是万能的,需要与密码学技术及PKI技术、复制检测、数字签名等一起使用,构建综合的数据安全体系,才能抵抗各种攻击。
(3)从人类视觉系统出发,建立适合人眼视觉效果的数学模型。这方面的研究需要很多关于生理、心理和数学的知识。尽管难度不小,但仍被认为是数字水印的重要研究方向。
(4)要促进水印技术更好更快地发展,需要建立相关的理论体系和测评标准,建立一个开放的数字水印测评平台。
数字水印是一门具有挑战性的科学,近几年来数字水印技术取得了很大进展,但目前为止尚未形成一个完整的理论体系。尽管如此,随着研究的不断深入和数字版权管理技术的发展,它有着广阔的应用前景,必将成为版权保护的重要工具。
[1]Schyndel V R,Triklel A,Osbome C.A digital watermarking[C].Proceedings of International Conference on Image Processing,IEEE.Austin,1994.86-90.
[2]Cox I J,Miller M L.The first 50 years of electronic watermarking [J].Journal on Applied Signal Processing,2002,2:126-132.
[3]潘蓉,高有行.数字图象水印技术研究[J].湖南大学学报(自然科学版),2002,29(2):117-123.
[4]张华熊,仇佩亮.用于版权保护的鲁棒音频水印[J].计算机辅助设计与图形学学报,2002,14(8):786-789.
[5]孙建德,刘琚.基于独立分量分析的盲视频水印方案[J].电子学报,2004,32(9):1507-1510.
[6]Brassil J T,Low S H,Maxemchuk N F,et al.Electrical marking and identification techniques to discourage document copying [J].IEEE Journal on Selected Areas in Communications,1995,13(8):1495-1504.
[7]Agrawal R,Kiernan J.Watermarking relational databases[C].Proceedings of the 28th VLDB Conference,Hong Kong,China,2002.1-9.
[8]张新宇,彭维,张三元等.3D网格数字水印研究进展[J].计算机辅助设计与图形学学报,2003,15(8):913-920.
[9]Brassil J T,Low S H,Maxemchuk N F.Copyright protection for the electronic distribution of text documents[J].Proceedings of the IEEE,1999,87(7):1181 -1196.
[10]Stefan T,Martin S,Patrick W.A digital watermark for vector-based fonts[C].Proceedings of the 8th ACM Multimedia and Security Workshop. Geneva, Switzerland,2006.120-123.
[11]刘东,陈松,周明天.基于字符拓扑结构的文本数字水印技术[J].小型微型计算机系统,2007,28(5):812-815.
[12]Atallah M J,McDonough C J,Raskin V.Natural language for information assurance and security:an overview and implementation[M].New Security Paradigm Workshop,New York:ACM Press,2000.51-65.
[13]Sun X M,Luo G,Huang H J.Component-based digital watermarking of Chinese texts[C].Proceedings of the third International Conference on Information Security.Shanghai,China,2004.76-85.
[14]程玉柱.基于TMDS的文本零水印技术研究[J].计算机工程与设计,2008,29(24):6420-6422.
[15]李赵红,侯建军,宋伟.基于等级结构的二值文本图像认证水印算法[J].自动化学报.2008,34(4):841-848.
[16]Atallah M J,McDonough C J,Raskin V,et al.Natural language processing for information assurance and security:An overview and implementations[C].Proceedings of the 9th ACM New Security Paradigms Workshop,New York:ACM,2000.51-65.
[17]Voloshynovskiy S,Pereira S,Pun T,et al.Attacks on digital watermarks:classification,estimation based attacksand benchmarks [J].IEEE Communications Magazine,2001,39(8):118-126.
TP391
A
1671-5136(2010)02-0122-04
2010-04-25
程玉柱 (1980-),男,安徽安庆人,长沙民政职业技术学院软件学院讲师、硕士。研究方向:信息安全与自然语言处理。
book=125,ebook=330