钱宇
[摘要]针对公共图书馆数字资源使用中存在的馆外访问困难的问题,比较分析馆外访问的主流技术,提出了统一用户认证的技术方案。结合常州数字图书馆的实践,阐述了技术实现的原理、方式和实施经验。
[关键词]资源馆外访问;用户认证;加密;SFX;反向认证
1引言
近年来,随着社会信息化水平的提高,人们对公共数字文化的需求愈来愈大。公共图书馆作为公共数字文化的主要提供者,正在加快数字图书馆的建设,其主要工作围绕着数字资源建设和数字资源使用两个方向开展。然而,数字资源使用中却存在着资源的馆外访问需求与使用权限的矛盾。
图书馆是知识的殿堂,一方面,图书馆承担着传播知识、服务大众的社会责任,需要维护好公众的信息使用权。另一方面,图书馆也肩负着保护知识产权的法律责任,还要兼顾资源商的经济利益。图书馆权利的公共性与知识产权的专有性存在天然的冲突[1],在图书馆数字化建设中如何处理好这个矛盾一直是业界关注的焦点。通过一定的技术手段,合理共享数字资源是解决这一矛盾的切入点。
2数字资源馆外访问的主流技术
公共图书馆的数字资源现有三大类:自建资源、试用资源和外购资源。其中,自建资源也包括数字地方文献。对于自建资源,图书馆拥有知识产权,资源使用有自主性,可以开放给所有读者甚至全体市民。试用资源是由数据库供应商提供在一段时间内免费使用的数字资源,大部分是通过IP认证限制在馆内使用,一些供应商为推广产品而降低使用权限,以提供固定账号等方式供馆外读者使用。外购资源则是图书馆斥巨资购买的,但数据库供应商从自身商业利益出发,常以IP限制、并发限定、流量控制等手段对资源使用做出诸多限制。特别是外购资源大多限制在馆内使用,馆外使用则要通过供应商各自的用户认证系统,这影响了读者的合理使用,降低了资源的利用率。
从图书馆现有三大类资源的使用范围来看,在图书馆内是都能使用的。为了实现合理共享数字资源,大部分馆外访问技术是通过把馆外访问转化为馆内访问,来实现资源馆外共享的。这些技术主要有:反向代理技术、VPN技术、URL重写技术等。它们与统一用户认证技术的主要特点如下(见表1)。
现在业界对馆外访问技术研究和应用较多的是前三项技术,市场上的一些应用级产品,比如:数字图书馆远程访问服务系统(RasDL)就采用了代理网关模式(Proxy内核技术)和web网关模式(URL重定向技术)[6];易瑞授权访问系统(IRAS)则用到了页面重写技术和VPN技术[7]。虽然它们各有优势,都有相应的适用环境,但是它们的共同特点是单方面回避了知识产权问题,而且专业性太强,部署复杂,应用困难。
对公共图书馆来说,选择一个适合本馆的馆外访问方式,需要根据本馆的资源情况、读者的使用习惯、经费及技术储备等因素来决定。
3统一规范的用户认证
公共图书馆的读者,信息素养参差不齐,最适合广大读者的资源访问方式还是网页登录。然而,由于各个资源的用户认证系统互相独立,访问权限各不相同,给读者使用带来诸多不便。统一用户认证技术通过协商的用户认证规范和SFX整合技术实现了用户统一访问,做到了一站式信息服务。
3.1 协商的用户认证规范
3.1.1 原理及定义。通常,资源商的认证系统对自己的用户会开放馆外访问。只要能把图书馆读者转化为资源的用户,就可以实现馆外访问。以此为思路,统一用户认证技术实现了馆外访问。它是以协商的认证规范为基础,对所有数字资源提供统一的认证方式,以识别馆外用户身份的合法性[8]。
3.1.2 认证接口。认证接口是协商认证规范的具体形式,格式为“http://资源站点域名或IP:端口/验证页面?uid=安全码”。参数约定:uid为安全码,该码由“读者证号|当前时间戳”混合串经由DES算法加密得到。时间戳在此采用长整型数值,为了避免MD5不可逆带来的明文传递,选用DES算法。由于不同的开发语言,使用同样的DES算法可能会导致加解密结果不同,所以选择能够兼容不同系统的算法,并约定好统一的公共密钥。
3.1.3 认证流程。首先,读者使用借书证登录到统一认证平台。当点击某个资源时,平台服务器发送URL加密串到对应的资源站点,资源站点根据认证规范验证加密串的有效性。确认有效后,判断当前读者是否为资源的已有用户,是已有用户则通过认证,如不是的则先把当前读者信息加入到资源用户库中,再通过认证跳转到资源站点页面。
3.2 SFX整合资源
现在的数字资源不仅种类繁多,而且类型、形式各有不同。常州数字图书馆除了外购的数字期刊、电子图书、少儿动漫、音视频外,还有自建的关系数据库和一些网络资源。对于读者来说,这些资源零散、使用麻烦。因此,就有必要把各类资源有机整合起来,统一提供给读者使用。
常州数字图书馆采用了万方公司的UNIRMS.NET平台来提供资源统一检索。UNIRMS.NET是基于SFX的统一资源整合服务平台。而SFX是一个基于统一资源定位器(OpenURL)标准的上下文相关的参考链接系统,其工作原理是支持OpenURL的信息源产生一个包含资源元数据和http请求的OpenURL,传递给SFX链接服务器,SFX链接服务器解析OpenURL获得资源的元数据后,把资源的链接返回给用户[9]19。具体来说,万方公司提供了一个iSFX虚拟整合工具(见图1),可以完成异构数据库检索和字段内容提取,文章内容提取,原文转发等功能,提供基于http协议类似OpenURL命令串访问方式和提交方式,从而实现资源代理检索。
iSFX整合资源的主要步骤有:新建分类后配置URL,自定义变量描述,格式化数据输出。通过对资源URL、变量等参数的配置,iSFX提取到资源内容,这样就可以对资源进行统一管理和检索,按照格式化的形式把资源检索结果合并输出。