易炳明
重庆市开县图书馆,重庆 634400
随着网络技术及信息技术的不断发展,信息的种类及其形式也越来越多样化,传统图书馆模式已经不能很好地满足这些需求,数字图书馆应运而生。数字图书馆是经过电子化处理的信息仓储资源,可以存储并组织大量的信息,用户可以不受时间与空间的限制,通过网络方便地访问所需要的信息资源。本文将着重探讨一下有关数字图书馆的发展及应用。
数字图书馆属于高技术发展下的产物之一,信息技术的集成是数字图书馆建设中的重要功能。细化而言,数字图书馆涉及到许多关键技术,比如:数字化技术、网络技术、多媒体技术、安全保密技术、检索技术、自然语言理解技术以及海量数据库技术等等。
数字图书馆的内涵比较广,其并不是单纯的基于网络的图书馆主页,而是一个整合的数字化资源集合,是将传统的资源进行数字化转化或者以电子化形式呈现的信息资源。
数字图书馆的组成结构是系统建设的基础,是借助于网络以及计算机技术实现的关键。它的目标是能够更好地与下一代互联网相匹配,从而发展成为一个开放、实用的系统结构。其组成主要包括四大部分,如下描述:
1)资源加工系统。该部分能够对传统资源进行数字化处理,并多媒体信息进行格式方面的规范处理及整理;
2)存储管理系统。该部分主要负责对数字化信息资源进行分类、组织及存储,并提供信息数据的安全备份服务;
3)资源调度系统。该部分主要是针对于分布式存储的数据资源,实现共享、协调以及检索等核心功能;
4)网络运营系统。该部分可能为数字图书馆系统的用户提供一些在线服务,比如:在线检索、在线下载、信息发布等等。
在数字化的发展浪潮中,我国与世界发展步伐紧紧跟随,越来越多的单位企业都在积极建设各种类型、各种规模的数字图书馆项目,其中有国家级、省市级以及单个子项目等。下面根据我国主要的数字图书馆项目,阐述一下我国数字图书馆的发展现状。
首先,中国数字化图书馆工程。中国数字化图书馆工程是一个宏大的系统工程,是基于宽带网络的信息资源库群。该工程的建设思路是:先建设急需求的、容易的,从小到大循序渐进。而在技术实现的途径方面,则是采用与国际同类主流技术相一致的方案,如:通用化的置标语言、公共对象请求代理模式、统一化的资源名称等等,选择支持分布式面向对象的软件技术,为用户提供对各种信息资源的检索服务。
其次,国家科技数字图书馆。国家科技数字图书馆是虚拟化的科技信息资源机构,主要是根据国家科技发展的需求,收集、组织并管理有关理、工、农、医等各个学科文献资源,并面向全国提供服务,不断促进科技资源的有效传播及共享。
另外,中国知识基础设施工程。中国知识基础设施工程简称CNKI,主要是由清华同方与中国学术期刊研究院联合承担创建的,也是一项很大的系统工程。其涉及到的主要信息资源有:资源的数字化建设和挖掘、知识整合、知识仓库的建设、网络传播体系以及数据库生产基地建设等。CNKI项目是以中国学术期刊最为有名,已经成为我国最大的期刊文献检索系统,并形成了完整的经营链,建立了产业化的服务体系。
首先,当前大部分的数字图书馆可以为每一个数据源提供独立的检索界面,如:超星电子图书馆系统、期刊图书馆系统都有各自不同的界面。但数据库资源类别越来越多,对于每个数据源都有一个对应的界面,显然会带来一些不便。因此,建立一个统一的快速检索平台,并提供异构数据库以及分布式数据库快速检索的需求是必须的。
其次,全文检索技术能够很好地弥补单纯以字段为关键词进行检索的不足,其可以根据文件信息资源生成对应的索引数据库,当用户进行检索时,就可以直接从全文索引数据库中进行匹配定位。
另外,数字图书馆系统中的电子信息资源还涉及到了音视频等多媒体信息资源,对其采用类似于编目的方式进行结构化标注可以实现多媒体信息的检索,其关键之处在于多媒体信息的特征提取。比如:基于内容的检索就需要对多媒体信息进行语义分析;视觉特征的提取涉及到颜色、形状以及纹理等。
数字参考系统是伴着近代图书室的发展而得到应用的,其应用形式也从原先的BBS模式发展到了多样化模式,是个性化服务的很好体现。目前,数字参考系统所涉及到的参考对象、服务模式以及服务层次都有了很大的应用扩展,其中服务应用模式主要涉及到:帮助系统、FAQ模式、实时网上参考、同步咨询的决策支持以及信息调查等。另外,在数字参考系统的实现方面也有多种方式,比如:用户登陆系统可获得参考结果的自动反馈信息;系统可提供关键问题的检索目录以及历史记录等。
信息过滤是数字图书馆应用过程中的一个系统化分析方法,可以根据动态的多元信息流,获取与用户需要相匹配的信息。信息过滤需要考虑多种因素,如:用户的历史检索记录、用户间的相似性、资料间的相似性等。通常情况下,信息过滤的数据源是动态非结构或者半结构的数据,而信息需求则会以用户的兴趣为参考进行定义,过滤行为就是将与用户无关的信息进行过滤。
数字图书馆系统中涉及到的文献间相关性分析、用户需求模型的优化、用户的访问序列、Web页面采集、近期热点文献分析等问题都可以依靠数据挖掘技术的应用来解决。特别是近来的数据挖掘技术可以很地为个性化服务提供良好地支持。一个完善图书馆的个性化系统能为用户自动推荐用户感兴趣的文献、能统计分析用户的文献需求规律、能自动整合不同的信息源、能发现不为人知的有用的知识,这些也都可以依靠数据挖掘技术的应用来实现。
数字图书馆的发展正处于一个充满机遇和挑战的时代。在这种情况下,分析数字图书馆发展现状及应用、探究其未来发展情景,将有助于进一步理清发展战略、明确建设发展方向,具有重要的理论和现实意义。
[1]周欣颖.数字化图书馆建设的发展[J].中国新技术新产品, 2009(24).
[2]黄炜宇.我国数字图书馆资源数字化建设研究[J].内蒙古科技与经济, 2009(14).