高光勇,龚金林
(1.九江学院网络与信息安全研究所,江西 九江 332005;2.九江学院图书馆,江西 九江 332005)
数字图书馆是以电子格式存储海量多媒体信息,并能对这些信息资源进行高效操作,如增加、删除、修改、检索信息以及提供访问接口和信息保护等,是一个国家的数字教育平台、数字文化平台、数字资源中心,极大地推动国家信息基础设施建设。随着数字技术和网络化的发展,快捷准确的数字传输手段为无数商家带来了无限机遇,但是也提出了新的挑战,数字产品被侵权、盗版和随意篡改等现象不断发生,针对该现象国内外研究者已开始探索如何更好地保护自己产品的合法权益[1-2]。
对于数字图书馆信息资源知识产权认证技术的研究,始于20世纪90年代末,在21世纪初逐步发展起来,并取得了一定的进展,其研究包括理论研究和应用研究。
在理论研究方面,目前的研究主要包括DRM(数字版权管理技术)、数字水印和数字指纹技术等。1)对于DRM的研究,目前主要集中在介绍DRM技术[3]、DRM系统结构[4]及DRM 在电子图书(E-book)中的应用[5]。这些研究对现有DRM系统结构进行了分析,并说明如何应用在数字图书中,基本上都认为现有DRM技术能够有效地保护数字图书版权,而很少提及DRM技术的不足,并针对这些不足提出相应的改进建议。2)对于数字水印技术和数字指纹技术的研究在国内得到广泛的开展,其中对于数字水印技术的研究相对较成熟,尤其在数字图书方面的应用十分普遍[6],但现有的研究也没有太多的突破,尤其针对数字水印技术安全分析及如何解决这些安全的研究较少。数字水印技术主要用于盗版取证,而数字指纹可以用来在盗版发生后追踪盗版者,这方面的研究成为现在研究的热点。王祖喜等[7]在《基于残留特征跟踪的抗合谋数字指纹》一文中通过设计一种数字指纹的线性无关特征码,提出基于协同学的残留特征跟踪的抗合谋数字指纹,将协同学应用于数字指纹的合谋跟踪,建立了一套基于残留特征跟踪的抗合谋数字指纹方案,将指纹编码嵌入到数字产品中来追踪盗版者。无论是数字水印技术还是数字指纹技术,还是其他版权保护技术,都存在一些缺陷。如数字水印技术对盗版追踪能力较差,数字指纹在盗版预防能力较差。所以,一般情况都是将这些技术进行混合使用,这方面的研究也在进行中,应该是将来各个出版商努力的方向。
在应用研究上,以方正Apabi、超星及书生之家等为主的一批数字图书馆系统纷纷采用了数字版权认证技术,并取得一定的进展。如方正Apabi数字版权保护技术(Apabi DRM)在保护电子图书,防止电子图书的非授权二次传播,保证作者与出版商的利益在出版、发行、图书借阅、读者阅读各个环节不被侵害等方面发挥了重要的作用。方正Apabi DRM在数字图书交易的体系结构、数字图书馆对E-book DRM的支持以及E-book DRM计数机制等方面有所创新。超星、书生之家等也采用了一些成熟的版权保护技术,并很好地保护了相关电子图书的版权,阻止一些侵权行为发生。
在理论研究上,国外的DRM技术体系已相当完善,不论从安全性还是从实用性上看,都比较成熟,并且得到了广泛应用。文献[8]提出了一个适用于个人版权保护的DRM体系结构;DRM在移动内容应用中的研究逐渐成为一个研究热点,Irwin[9]提出了针对移动内容服务的OMA DRM体系结构,并对该体系结构进行详细分析研究;数字水印在数字版权保护中己经成为十分成熟的技术,新的研究主要是针对安全性研究,在算法上进行突破,使得数字水印技术更加安全。Lee等[10]介绍了一种混合水印技术对数字图像进行保护,这种水印技术将版权信息插入到数字图像中达到版权保护作用,并通过过滤攻击等试验,确保版权保护的安全性。Nezhadarya等[11]提出一种基于统一量化方向梯度向量的鲁棒数字水印方案,该方案通过对多小波尺度下的显著梯度向量角度进行量化来嵌入水印,算法增强了水印的不可见性,提高了对幅度缩放攻击及其他常见攻击的抵抗能力,同时也扩大了水印的嵌入容量。
在应用研究上,国外电子图书在版权认证上发展比较成熟,一方面是以软件公司为主的文件格式和浏览器的开发,如微软公司和Adobe公司等;另一方面体现在传统出版商的转型,如德国施普林格出版社的Springer Link电子图书采用了在PDF格式加密的技术,很好地保护了版权,而且使得用户在利用该电子图书时也很方便。此外,像NetLibrary、Ebrary及金图等电子图书系统在版权保护上也很成功,并受到世界各地读者欢迎。
目前,数字图书馆信息资源知识产权保护取得了长足的进展,但仍存在一些问题。如DRM、数字水印和数字指纹技术等实现了对数字作品版权的基本认证,但不能对遭受恶意篡改的数字作品的篡改位置进行定位以及恢复遭受篡改的内容,同时因为篡改引起的水印提取失真或根本不能提取,从而导致版权认证失败。此外,当授权用户对数字作品的质量要求较高时,不能很好地去除隐藏的辅助信息(如数字水印、指纹等)以便可逆地恢复至原始作品。针对这些问题,提出采用最新的压缩感知理论,利用智能可逆水印技术来实现对数字图书馆信息资源的知识产权保护,在对数字作品提供版权基本认证的同时,还可以达到篡改定位、篡改内容恢复以及数字作品的智能可逆还原的目的。因而对数字图书馆信息资源的知识产权保护具有重要的理论和现实意义。
首先介绍常规数字水印技术的原理,然后提出利用最新的压缩感知理论及智能可逆水印技术以更好地实现数字图书馆信息资源产权保护的无损认证方法。
数字水印是将文字、序列号、图像标志等标识或版权信息嵌入到数字作品中,然后通过软件系统对嵌入水印的读取与检测,以识别数字作品是否为盗版或是否被篡改。常规数字水印技术会对原始数字作品造成一定的损害,并且该损害是不可逆的。图1、图2显示了常规数字水印技术的嵌入和提取过程。常规数字水印技术能够实现信息资源的产权认证,但对授权用户来说,嵌入水印的数字媒体不能被可逆地恢复至原始作品,这会使得授权用户获得的是与原始作品有所不同的数字作品,从而造成授权用户的利益受损。可逆水印是一种无损认证新技术,可对水印后作品进行可逆还原,同时,结合最新的压缩感知理论,能实现对遭受篡改攻击的数字作品的篡改检测及篡改定位,并可将遭篡改区域恢复至原始状态。根据嵌入水印的可见性,可逆水印可分成不可见可逆水印和可见可逆水印。下两节将分别阐述这两种无损认证方法。
图1 常规数字水印技术的嵌入过程
图2 常规数字水印技术的提取过程
不可见可逆水印一般通过量化技术将水印信息嵌入到数字作品的变换域系数中,嵌入水印后的数字作品从表面上觉察不到水印的存在,当需要版权信息认证时,利用软件提取作品中的水印信息进行验证。当授权用户对数字作品的质量要求较高时,能通过去除隐藏的水印信息来恢复原始作品。为了保证水印方案的可逆性,嵌入时可采用逆变换不损失信息的整数小波变换[12]。
一定容量的水印信息嵌入可能降低水印后数字作品的可视性,影响其使用价值。如何保证嵌入可逆水印时既保证数字作品的可视性又保证最大容量的水印嵌入,这是可逆水印方案面临的关键问题。为了解决这个问题,可对水印嵌入过程中的水印嵌入阈值(嵌入强度)进行智能选择,以保证嵌入水印容量和水印后数字作品的可视性达到有效的折中,即在嵌入利于认证的一定大小的水印信息后,数字作品仍能保持与原始作品的基本一致性,不会影响用户的常规使用。智能选择过程一般可通过遗传算法[13]、符号混沌系统[14]等优化方法实现。
对数字图书馆的数字资源进行篡改是一种常见的攻击,具有较大危害性,可以利用最新的压缩感知(CS,Compressed Sensing)理论来检测篡改及还原内容。压缩感知[15]是传统信息论的一个延伸,但是又超越了传统的压缩理论,成为了一门崭新的子分支,其基本思路是从尽量少的数据中提取尽量多的信息,或者说利用提取出的少量特征信息来表示原始的大量数据。毫无疑问,压缩感知是一种有着极大理论和应用前景的想法,它从诞生之日起到现在不过几年时间,其影响却已经涉及大半个应用科学。在保护数字资源时,首先使用压缩感知方法感知数字作品的特征信息。该特征信息是数字作品的完整描述,使用特征信息可以对遭受篡改的数字作品的篡改位置进行定位。然后根据篡改位置所对应的感知特征信息,寻求合适的重建算法,实现对数字作品篡改内容的自动恢复,并可根据需要对篡改恢复后的数字作品进行水印嵌入逆处理,以去掉嵌入信息还原至原始数字作品。
图3直观显示了利用压缩感知的不可见可逆水印的嵌入方案框图。首先,对数字作品进行直方图修改,以防止嵌入水印后溢出现象的发生。其次,对修改后的数字作品进行整数小波变换,并对生成的小波系数进行适当的压缩和量化,把压缩量化系数与原始系数的差记为量化误差。接下来,将量化误差(作为辅助信息)和水印信息一起嵌入到数字作品中。信息嵌入通过小波系数的压缩和扩展来实现,同时,为了保证嵌入水印量和数字作品视觉质量的有效平衡,采用符号混沌系统对水印嵌入阈值进行智能选择。水印嵌入阈值是对嵌入容量进行调节的一个关键参数,嵌入阈值越大,能嵌入的水印信息就越多,但是同时导致水印后数字作品视觉质量下降越快。符号混沌系统具有良好的遍历性、随机性、规律性等特点,适合用于快速、准确地优化选择最佳参数,因而这里使用符号混沌系统来智能选择水印嵌入阈值,使得嵌入水印量和数字作品视觉质量满足用户的需求。换句话说,在嵌入固定量的水印信息后,水印后数字作品能获得最佳视觉质量。再次,对嵌入水印后小波系数进行逆整数小波变换以获得嵌入水印的数字作品。最后,对水印后数字作品信息进行分块压缩感知处理,获取其特征信息,将特征信息在IPR(intellectual property rights)数据库中注册,用于日后对数字作品的篡改检测。
图3 利用压缩感知的不可见可逆水印嵌入方案框图
利用压缩感知的篡改检测及水印提取基本是不可见可逆水印嵌入方案的逆过程,其流程如图4所示。在数字图书馆数字作品认证时,首先,对待检测数字作品进行分块压缩感知处理,提取出分块特征信息,并与IPR数据库中注册的分块特征信息进行比较,以检测数字作品是否被篡改及遭受篡改的分块区域。如没发现篡改,就进行水印提取;如确定篡改区域,则先利用已注册的对应遭受篡改分块区域的特征信息,采用感知重建算法对受篡改区域进行恢复。其次,通过对整数小波变换系数的扩展来提取水印信息和量化误差,并利用量化误差对小波系数进行恢复。最后,对恢复后的小波系数进行逆整数小波变换获得原始数字作品。
相对于不可见可逆水印技术来说,采用可见可逆水印技术嵌入的水印不仅具有可逆性,而且嵌入的水印对人眼可见,一般使用半透明的图标作为可见水印。可见可逆水印技术通常应用在需对数字作品的所有权或来源进行当场识别的特殊场合。当使用者获得授权后,即可利用特定的解码系统删除数字作品上的可见水印以获得完整的作品。
数字作品的中间部分一般容易吸引用户的注意力,所以将可见水印嵌入到该区域可以起到很好的广告及认证效果,这部分区域也称为感兴趣区(ROI,Region Of Interesting)。为了满足以后的数字作品还原,可见水印的嵌入算法应具有可逆性。同时考虑到可见水印的半透明性,在水印嵌入时对原始作品的改动不能过大,过大会完全遮住原始作品,当然改动不能过小,过小则可能不能显现可见水印。数学中的双边映射函数[16]具有一一对应性的特点,可以用来嵌入水印以保证可逆性。嵌入水印比特信息时可以把原始作品改动k△大小,△为双边映射参数,如将0映射为3,3映射为6,那么△值为3。k为嵌入密钥,以保证方案的安全性,同时可以利用k值调节可见水印的透明性。在去除可见水印时只要做相反的双边逆映射即可实现。
图4 利用压缩感知的篡改检测及水印提取方案框图
图5直观显示了可见可逆水印的方案框图。首先,选定数字作品的ROI区域,根据对可见水印透明性的实际需求选择合适的密钥k和双边映射参数△,然后通过改动数字作品信息嵌入水印比特,最终获得含有人眼可见半透明水印的受保护数字作品。如需在可见可逆水印中增加篡改攻击检测及篡改内容还原的功能,可参照不可见可逆水印的方案,引入压缩感知理论来实现。可见可逆水印去除方案如图6所示,通过密钥k和参数△做双边逆映射即可删除嵌入的可见水印,获得恢复后的原始数字作品。
图5 可见可逆水印嵌入方案框图
图6 可见可逆水印去除方案框图
在数字资源(数字图书、数字图像、数字视频等)进入数字图书馆之前,针对不同用户需求和数字作品的保护属性,选择在数字资源中嵌入不可见可逆水印或可见可逆水印以供有限权限读者阅读和下载,对具有完全权限的读者可通过提供密钥将水印删除以实现正常、清晰、完整地使用原始数字作品。当遇到数字资源版权纠纷时,可通过提取出的水印证明版权。一些用户可能会对下载的数字资源实施篡改,以求达到不能正确提取水印,导致认证失败。这时可利用IPR库中注册的特征信息进行篡改检测,并恢复篡改内容,进而实现水印信息的完整提取,最终完成版权认证。
随着数字图书馆的飞速发展,信息资源的产权保护技术也取得较大进步。虽然目前的保护技术实现了对数字资源版权的基本认证,但不能检测受篡改的数字作品的篡改区域,也不能恢复受篡改的原始内容,同时不能很好满足授权用户去除水印以获得原始作品的要求。对此,本文提出将一种无损认证新技术应用到数字图书馆中,以更好地实现对信息资源产权的保护。该无损认证方法通过将最新的压缩感知理论与可逆水印技术相结合,不仅满足了数字作品的基本认证需求,还实现受篡改数字作品的篡改定位、内容恢复,且能针对对数字作品质量具有较高需求的授权用户,可以实现水印去除以获得原始数字作品。
[1]周军.对数字图书馆的版权保护技术的比较研究[J].图书馆论坛,2006(3):104-106.
[2]杨晓秋.数字图书馆文献传递服务的著作权保护问题调查与分析[J].图书馆学研究,2013(4):93-97.
[3]孙晶,徐政萍.DRM技术在e-Book中的应用[J].情报技术,2005(9):37-39.
[4]殷沈琴,张计,龙郝群.电子书数字版权管理技术应用进展研究[J].图书馆杂志,2012(8):60-63.
[5]向林芳.论DRM在数字图书馆中的应用——以方正Apabi为例[J].高校图书馆工作,2011(6):85-87.
[6]沈生进.数字水印在数字图书馆中的应用[J].图书馆杂志,2001(8):27-29.
[7]王祖喜,王文宗.基于残留特征跟踪的抗合谋数字指纹[J].软件学报,2011(8):1884-1896.
[8]KENNY S.Applying digital rights management systems to privacy rights management[J].Computers&Security,2002(7):648-664.
[9]IRWINJ.Digital rights management:The open mobile alliance DRM specifications[J].Information Security Technical Report,2004(4):21-30.
[10]LEE Z,LIN S.A hybrid watermarking technique applied to digital images[J].Applied Softed Computing,2007(3):798-808.
[11]NEZHADARYA E,WANG J.Robust image watermarking based on multiscale gradient direction quantization[J].IEEE Transactions on Information Forensics and Security,2011(4):1200-1213.
[12]余先川,张君兰,张立保.基于整数小波变换的空间矢量数据压缩方法[J].地球科学(中国地质大学学报),2011(2):381-385.
[13]LEVY E,DAVID O,NETANYAHU N.Painter Classification Using Genetic Algorithms[C].Cancun:IEEE Congress on Evolutionary Computation,2013:3027-3034.
[14]王福来.基于复合符号混沌的伪随机数生成器及加密技术[J].物理学报,2011(11):110517-1-110517-8.
[15]BARKER P B,Ernst T M.Acceleration of 1H MR Metabolic Imaging with Compressed Sensing[J].Radiology,2013(2):686-686.
[16]VLEESCHOUWER C D,DELAIGLE J F.Circular interpretation of bijective transformations in lossless watermarking for media asset management[J].IEEE Transactions on Multimedia,2003(1):97-105.