秦 琪,孙 建,王 涛
安徽省电力科学研究院,安徽合肥 230022
PDF文档版权保护系统在企业数字图书馆中的应用
秦 琪,孙 建,王 涛
安徽省电力科学研究院,安徽合肥 230022
针对企业数字图书馆文档版权保护的需求,系统提出PDF文件加密解决方案,通过控制PDF文档的访问权限及在文档中添加标识信息并对文档加密完成保护操作,施加保护的文档必须在提供插件的前提下才能打开。
版权保护;加密;PDF文档;数字图书馆
网络技术的发展也使网络数据的传递变得更加方便快速,用户获取和传递数字图书馆资源也变得越来越容易。但随之而来出现了许多的问题,因此,如何既能充分利用网络传输的便利,又能有效地保护著者的知识产权,成为数字图书馆建设过程中急需解决的现实问题。数字版权管理技术因运而生。数字版权管理技术主要包括数字内容的加密、管理与使用,其核心是通过安全和加密技术锁定和限制数字内容传播,从而能够从技术上防止数字作品的非法复制和使用,或者在一定程度上使得复制和使用困难。
本企业数字图书馆在建设的过程中就采用PDF文档版权保护系统对大量电子文档实施保护。主要通过加密手段把PDF电子文档进行加密,只有授权用户才能得到解密的密钥,而且密钥是与用户的硬件信息绑定的。加密技术加上硬件绑定技术,防止了非法用户的使用和拷贝,从而有效地达到版权保护的目的。
系统通过控制PDF文档的访问权限及在文档中添加标识信息并对文档加密完成保护操作。施加保护的文档必须在提供插件的前提下才能在Adobe Acrobat 系列软件中打开。
2.1 系统整体架构
2.2 工作原理
系统首先对原始的PDF文件进行批量处理,处理过程包括添加数字标识、设置文档权限(如选择、打印、复制文本等)、数据加密;然后将处理后的文档放在在线处理服务器上,在用户浏览或下载PDF文档前通过在线处理程序再对该文档进行在线实时处理(设置下载日期/单机特征等),最后用户浏览或下载得到的是加密后的PDF文件。用户必须下载安装解密插件才能浏览该PDF文件。
2.3 软件组成
数字认证系统共有5个部分组成。
2.3.1 PDF文档加密与批量加密程
PDF文档批量加密程序主要负责对原始文档进行第一次加密,并放在服务器上供用户下载。主要
功能包括单文档加密、批量加密、参数设置、日志管理。
2.3.2 PDF权限配置程序
PDF权限配置程序运行在在线处理服务器上,由数字图书管理员操作,将文档名与权限结合,设置具体文档的使用权限或使用者,生成配置文档(或数据库文档),二次加密时将权限信息加密后写入PDF文档以供解密插件在离线认证时提取。
2.3.3 PDF认证配置程序
PDF认证配置程序是由施工人员随身携带,在web服务器上一次性使用,将数字图书馆服务器IP段、日期、MAC等信息加密后生成认证配置文件,以供最后一次加密写到文档中。
2.3.4 PDF文档解密插件
PDF文档解密插件是保证在客户端上正确查看下载的加密文档时必须调用的解密插件程序。当用户打开下载后的文档时,首先判断该文档是否需要权限认证,如果没有直接根据现有的认证方式进行判断。
2.3.5 IE在线下载程序
在IE中运行的ActiveX控件,用于内网用户自动下载并安装Acrobat PDF Reader认证插件等。
2.3.6 客户端软件及安装程序
用于内网用户下载的在本机上使用的客户端软件,在本地机器上安装客户端的有关软件及解密控制插件,以及修改相关注册表等等。
PDF文档版权保护系统实现对PDF的使用控制(过期失效,限制在本机或本网内),从而避免资源的扩散。
3.1 系统功能
3.1.1 保护手段
主要解决资源拥有者如何对其即将发布的数字资源进行保护的问题。具体内容分为两个部分。一个是控制打开的文档访问权限。包括文档是否可以打印、另存、修改、选择文本,复制选择的文本到剪贴板。另外一个是PDF文档中添加资源拥有者的特征信息。目前可添加的特征信息包括:水印、电子印章、数字签名。
3.1.2 授权方式
授权方式主要解决企业数字图书馆如何向客户提供资源的问题。为了适应不同用户各种各样的需求,目前系统支持以下几种授权方式:
文档期限:设置PDF文档的浏览期限。在这种保护方式下,PDF文档的有效期限自下载日期开始计算,以天为单位,过期则失效(在浏览器中无法打开)。文档期限保护方式适用于数字图书馆的借阅应用、文档试用等。
网络授权:只允许IP地址在许可范围内的机器从服务器上下载文档,下载后的文档可以复制到其它机器上。文档认证信息保存在服务器上,客户端必须获取到该认证信息方能打开文档。
远程用户权限认证:在打开文件时,根据用户信息情况到指定的服务器上认证,以确定能否打开及拥有什么样的访问权限。
网络+离线期限加密方式:在网络环境下IP允许范围内不限制,离开网络后限制期限。
3.2 加密策略
为了防止被保护的PDF文档被恶意破解,采用了128位的密钥对文档进行加密。每个文档使用一个密钥,使文档不能被成批的破解。
3.3 技术特点
采用标准的PDF格式,遵循Adobe的DRM规范;支持通用的Adobe Reader浏览器,利用Adobe提供的标准接口,通过开发Adobe阅读器专用插件来实现PDF资源保护,对PDF的功能、性能、兼容性、用户操作没有任何影响;IE客户端可以自动安装客户端阅读器插件,自动判断插件版本并更新插件;在尊重版权的基础上,可以在线提供电子资料的安全使用和数字版权保护;可将多种加密方式组合使用,满足多种保护需求。
该系统通过独立的外部程序对原始文档进行一次加密,数字图书管理员根据网络环境等要素生成配置文档,用户下载时服务器结合配置文件对待下载文档进行二次加密,用户打开文档时,自动调用插件对文档进行解密,系统综合PDF加密算法原理、Acrobat插件等技术对PDF文档实施版权保护。由于采用的是Acrobat插件开发技术对PDF文档进行内容级加密的方式,使得习惯于使用PDF文档的用户避免下载各式各样的阅读器,从而更加方便了本企业数字图书馆合法用户的资源使用.
[1]姜友好,吕婷,朱凤.数字图书馆版权问题解决模式分析[J].图书与情报,2010(3).
[2]张璐,胡凯,胡建平.基于网络发行的PDF文档版权保护系统的设计与实现[J].微电子学与计算机,2008(7).
[3]向宏,周贤林,徐光侠.DRM技术在电子文档安全保护中的研究与应用[J].计算机时代,2006(11).
[4]楼文高,孟祥辉.数字版权保护技术的现状及其发展趋势[J].学科建设,2007(4).
[5]戴文华.基于加密认证的DRM技术在数字图书馆中的应用[J].成宁学院学报,2005(6).
G251
A
1674-6708(2010)32-0217-02
秦琪,科技信息工程师,主要从事电力数字图书馆建设、情报研究、科技查新等工作