吴 洋
(国家图书馆 人事处,北京 100081)
从古至今,私人藏书就是图书馆的一种形式,事实上,图书馆的早期雏形就是以私人藏书楼或个人收藏品等形式为代表的。在图书馆发展的初期,收藏家或学者需要耗费大量的人力、物力和财力收集其所感兴趣或需要的书籍与文献,这些也同时成为其阶层身份与品味的象征。而在当前技术条件下,每个普通公众都可以运用数字化存储、处理和查询技术,获得丰富的“私人馆藏”,这些馆藏更大程度上是为了其自身信息需求的满足,或个体学习、研究和创新能力的提升。在这样的背景下,个人数字图书馆开始逐渐被学者和业界所关注,并已经广泛地走入普通公众的视野。
2000 2002年是国内个人数字图书馆研究引入概念的阶段,这个阶段发表的3篇论文基本上都以个人数字图书馆这一理念以及个人数字图书馆的一些萌芽形式的介绍为主。陈光祚在文章中指出,个人数字图书馆是当前网络条件下私人藏书楼的一种新兴形式,在当前技术环境下,构建个人数字图书馆是非常有必要而且可行的。[1]戴华胜对RoyTennant 1999年发表的论文Personalizing the Digital Library进行了编译,介绍了当时在美国尚属新兴领域的个人数字图书馆的基本原理、可操作模式及可能对图书馆发展产生的影响。
2003 2007年是国内个人数字图书馆研究不再单纯研究概念和内涵或简单介绍国外的发展,而开始逐步走向深入性和实践性研究的阶段。这个阶段研究人员们开始将注意力转移到个人数字图书馆研究的一些深层次问题的探讨,如在法律问题层面,李莉于2004年发表文章提出了个人数字图书馆建设可能会引发个人数据隐私权的纠纷,从而分析了在个人数字图书馆建设和运行中,应依据告知/知情、选择/同意、查阅/参与、完全/完整、执行/救济等基本原则保护个人数据隐私。[2]
2008年至今是国内个人数字图书馆研究的广泛拓展阶段。在本阶段,研究人员除了继承性地对已有的研究主题进行更深入的探索之外,还开始与当前各种研究方向交叉融合,形成新的切入点和创新机会。
在构建模式方面,一些学者将个人数字图书馆构建的模式分为远程和本地两种 ;[3]有些将其分为单机个人、系统依附、个人平台三种。[4]在与新兴技术结合方面,有学者对个人数字图书馆资源共享的关键性技术——P2P技术、互操作技术、中间件技术、Web Service技术进行了介绍,并分析了个人数字图书馆资源共享关键技术的应用模型;[5]有学者将个人数字图书馆与云计算技术关联研究,认为基于分布式处理、并行处理和网格计算的云计算技术,可以以用户为中心,利用其强大的数据处理、共建共享和安全保证能力,促进个人数字图书馆的建设与发展;[6]有学者关注了 P2P技术与个人数字图书馆的模型构建,提出了一种基于SuperP2P的个人数字图书馆虚拟社区,并就其知识组织模型进行了构建和分析。[7]
通过对国内外一些主要的个人数字图书馆或存在个人数字图书馆特征的服务进行比较分析,我们认为个人数字图书馆的实现路径主要有3个方面,一是通过软件和数据库系统在本地建库实现本地馆藏。目前很多研究机构、大学和企业研发了针对个人用户自行收藏文献的个人数字图书馆软件,通过用户下载到本地计算机实现用户馆藏,并提供了相关的资源组织和利用功能,如美国帕洛阿尔托研究中心研发的Universal Personal Digital Library(UPLIB)产品;二是通过专门的数字图书馆网络平台,利用服务商的数据存储和服务业务实现个人馆藏,如美国洛斯阿拉莫斯国家实验室(LosAlamosNational Laboratory)开发的MyLibrary3.0系统;三是通过视频系统资源的整合,搭建可满足用户多媒体信息资源的平台,进而实现个人数字图书馆的全媒体化,如土耳其中东科技大学计算机工程学院的智能系统实验室基于个人视频信息管理系统框架项目(AFramework for Personal Video Information Management Systems)的研究所尝试构建的个人视频数字图书馆系统实验性平台(Metu Advanced Video Intelligence System,MAVIS)。
UPLIB系统是由美国帕洛阿尔托研究中心2003
2005年研发成功的一种个人数字图书馆实现软件。其研发的最初目的是作为 Productive Reading研究项目的一部分,供研究中心的研究人员保存和组织其撰写或需要的文献、照片等信息,以便于他们在其他项目研究过程中对所涉及的文献信息资源进行分析或储存起来作为知识库利用。通过两年的研发,UPLIB系统可以提供网页、邮件、照片、扫描文件、单据、论文、书籍,甚至音频文件的储存和检索功能。
此后,研究中心还对该软件进行了不断的升级,从2008年至今,中心推出了七个补丁以修正或提升软件功能,最近的一次更新在2011年2月20日,形成的最新版本是UPLIB1.7.11,本次修订主要包括:用TornadoWebService系统代替了之前使用的Medusa系统以适应该应用的发展趋势;在添加文档功能中增加了 rip选项,以对一些临时性的信息资源进行短期储存;添加了Windows MSIInstaller的软件安装方式,提升与Windows操作系统的兼容性;添加了网页信息过滤基本拓展功能,便于用户在添加网页文件时,剔除掉网页中与中心内容无关的框架信息,仅保存网页主体信息;添加了网页URL多级路径拓展保存功能,以兼容Google的Google Web Toolkit(GWT)应用等。
UPLIB系统的工作流程是采集(Capture)—标准化(Normalization)—储存(Storage)—检索(Retrieval)—利用(Use)。在采集过程中,UPLIB 能够自动跟踪和锁定用户在Windows操作系统界面下打开的窗口(包括各种类型文件和浏览器窗口)。对于窗口中的内容,有研究表明,65%的文献是用通用尺寸标准展示的,而这其中有63%的文献仅有一个页面的长度;仅6%的文献超过3幅页面长度。[8]基于这样的研究成果,UPLIB通过内嵌机制解决不同类型、格式、篇幅、环境的数据采集问题,也可以处理数码照片的有效采集。在数据采集的过程中,将各种数据和文献资源表现为TIFF文件格式,并同步自动(或用户手工)进行缩放、标签和分类存储(以文件夹的形式),为数据的存储和检索建立基础。之后,系统会依据事先制定的标准,以数据保存时间为核心为每一个文件命名,并利用元数据标准对其进行标准化处理,继而对每一个文件进行保存。当数据保存下来后,UPLIB提供利用浏览器显示的用户界面提供检索功能,目前主要使用的节目有两种形式,一种是将所有文档以可视化形式展示在窗口中,并支持用户从其他窗口抓取信息,另一种是通过全文或元数据检索界面现实。此外,UPLIB系统还支持RSS定制推送内容和移动设备阅读功能。
高等学校和研究机构是对个人数字图书馆产品需求最旺盛的群体,加之很多大学和研究机构都有能力和条件进行个人数字图书馆的开发,因此这些主体也针对自身成员需求开发了一些有代表性的个人数字图书馆产品,如美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)开发的MyLibrary3.0系统。
通过MyLibrary@LANL系统,用户可以收集、组织阿拉莫斯国家实验室研究图书馆网站资源和其他网络资源,并建立一个存储空间。该系统用更个性化的空间构建,确保用户获得更可靠和更有针对性的数据。MyLibrary@LANL利用类似文件、文件夹、外部链接的分类和相互关联机制建立用户收藏的信息资源之间的逻辑联系,并允许用户利用书签形式进行个性化的标记。此外,系统利用动态链接技术保持用户所藏文献与信息源的一致性更新,还提供针对用户馆藏文献的信息组织与检索功能。因此,MyLibrary@LANL可以为用户提供个性化的、及时更新的、组织有序的、灵活定制的资源管理模式和服务模式。
MyLibrary@LANL的主要功能特色包括七个方面:①书签功能。书签是一种可以延伸网络浏览器浏览和搜索功能的简易工具,它通过一些Javascript代码的相互关联和超链接作用发挥功能,系统利用书签功能保障用户能够方便地将外部 URL地址添加到馆藏文件夹中形成一个新的馆藏内容,通过该地址用户也可以随时链接到目标网页获取所需要的信息。②共享功能。一些相互关联的用户可以就大家共同感兴趣的内容共享这些网络信息和数据,这样的共享功能可以通过系统提供的SharedLibrary模块来实现,定义了这样的模块,用户可以指定不同权限的用户访问本馆资源。③链接检测功能。系统提供对外部链接的定期(每周)自动检测功能,可以在用户发现其无法访问之前就探测到该链接失效并向用户提示,用户可以及时对链接进行删除或转移指向其它有效链接。④个性化定制功能。用户可以根据自己的需求个性化定制系统界面,包括颜色主题、内容布局等。⑤自动更新功能。系统可以自动地下载和更新用户所定制的数据库、电子期刊和网络资源,特别是针对阿拉莫斯国家实验室研究图书馆所馆藏的大约4000种电子期刊。200个数据库和500个主题网络资源进行自动更新。⑥信息发布功能。对于用户所定制的学科领域、主题等,系统设计了一个信息发布窗口,如果有新的相关领域期刊在实验室可获得,用户可以根据系统发布的信息及时选择是否导入到个人数字图书馆中。⑦安全机制。系统提供了一些保护策略以保护用户的个人信息、账户信息等隐私信息。
事实上,目前随着个人数字图书馆的发展和广泛应用,很多用户不仅对电子文献信息资源需求旺盛,更产生了对多媒体信息资源的需求。中东科技大学计算机工程学院的智能系统实验室通过个人视频信息管理系统框架项目(AFrameworkforPersonal Video Information Management Systems)的研究,构建了一个个人视频数字图书馆系统实验性平台(Metu AdvancedVideoIntelligenceSystem,MAVIS),以适应用户的多媒体信息资源需求和动态网络环境。该项目开始于2008年,完成于2011年2月1日。目前,该平台还在试验阶段,尚未推广使用,研究人员试图将其进一步完善。
该实验室的研究人员通过对当前用户对包括音频、视频信息在内的多媒体信息资源的广泛需求和这些类型在网络环境中的普遍存在,以及动态网络环境中智能信息系统对网络信息内容的理解和抽取机制进行研究,认为信息内容是信息本质和元数据的统一整体。
其中,系统参考MPEG 7标准中的多媒体内容描述机制,引入集成和互操作理论和本体论思想进行元数据生成;通过面向自然语言、图形、语音辨识中自动抽取元数据的研究成果应用于本系统的元数据抽取;在信息存储、咨询和检索模块,设计了一种人性化界面,提供了范例式帮助系统,以便于用户快速了解系统运作机制,并通过对元数据索引实现多媒体元数据检索功能。
MAVIS系统研发人员认为,基于本体论的视频信息内容的智能描述系统,能够将这些描述信息和视频信息本身一起进行关联存储,项目分为三个子项目进行,一是基于本体的视频信息管理系统。该子项目力图基于 MPEG7标准和本体系统结构的设计提升系统的交互性和互操作性,基本功能包括基本本体的抽取与集成、本体的组织与利用、用户基于本体的查询3个方面;二是视频信息(半)自动语义标签。该子项目的研发目的是自动检测视频信息内容,并基于语义层面进行数据标签的提取与组织,目前该项目组仅完成了半自动,即需要人工辅助的标签提取与组织功能;三是语义搜索。通过前两个子项目的研究成果,实现基于自然语言检索的视频信息语义搜索功能。
从理念层面、机制层面、技术层面、业务层面、服务层面等多方面,数字图书馆都应该深入思考和研究泛在智能环境下用户需求的变化模式,并有针对性的制定对策,以期最大效能地提供服务,进行知识服务创新。
个人图书馆职能化的实现需要图书馆建设者深化协作共建理念,创新管理机制。变革需要需求和管理机制的双重作用,在需求导向下,组织业务或功能发生转变,并以随之变革的管理机制为依托。数字图书馆面对泛在智能环境,首先必须从理念上认识到这是当前全球信息环境的大趋势,研究数字图书馆如何在管理机制创新的保障下,适应这个大环境的变化,并形成个人图书馆的核心理念。
此外,个人图书馆的建设还应积极构建基于网格技术的泛在信息资源库。任何一个数字图书馆都不可能拥有所有社会用户所需要的全部信息资源,因此数字图书馆在建设之初就考虑到这个问题,并借由标准化建设、集团采购、统一检索平台构建、协作服务等方式,将多个数字图书馆的资源整合在一起提供服务。随着泛在环境特征的不断显现,网格技术由于其知识聚集度高、综合处理能力强等技术优势和对用户需求描述科学、定位准确等理念优势,可以在建立泛在信息资源库工程中得到广泛应用。事实上,和Google数字图书馆一样,很多图书馆已经开始进行利用搜索引擎和网格存储技术,构建全球化信息资源库的工程,其中规模最庞大的当属联合国教科文组织发起的,由美国国会图书馆主导开发的,由32个合作团体共同参与的,法国、英国、中国、俄罗斯、埃及、巴西、沙特阿拉伯等国家积极参与的世界数字图书馆项目。该项目所建立的资源库以统一元数据标准,采用多种语言形式,构建协作机制,形成了一个全球泛在信息资源库的雏形。
[1] 陈光祚.营造e时代的私人藏书楼——个人数字图书馆[J].现代图书情报技术,2002,(4):3.
[2] 李莉.数字图书馆建设中个人数据信息被侵犯的原因与保护原则[J].大学图书馆学报,2004,(4):80 82.
[3] 石德万,李军.个人数字图书馆模式的分析[J].现代情报,2005,(9):93 94.
[4] 李艳辉.个人数字图书馆类型研究[J].现代情报,2009,29,(7):92 94.
[5] 黄义侠,张银犬.个人数字图书馆资源共享的关键技术[J].国家图书馆学刊,2009,(1):56 59.
[6] 秦志华.云计算与个人数字图书馆建设[J].科技情报开发与经济,2009,19,(26):55 56.
[7] 赵捧未,郭利伟.基于SuperP2P的个人数字图书馆虚拟社区知识组织模型构建研究[J].情报理论与实践,2010,33,(6):108 112.