数字图书馆统一检索系统功能与设计研究

2013-04-12 11:01傅立新
科技视界 2013年22期
关键词:检索系统数据源统一

傅立新

(邵阳学院 图书馆,湖南 邵阳 422000)

0 前言

数字资源对于数字图书馆和图书对于传统图书馆一样,是图书馆提供服务的核心建设内容。根据目前图书馆现状,数字资源建设主要有两种方式,一种最大量的获取方式是直接购买成熟的数字资源数据库产品,另一种是当本图书馆具有特色资源和具有数字化加工能力时进行特色资源的数字化加工。

1 需求分析

购买的数字资源都具有完整的检索发布系统,可以直接通过图书馆门户向读者提供。但由于各数据资源商的数据格式、浏览窗口不同,造成了读者在访问这些数据资源时对同一个检索词需要分别进入各个不同的系统,当资源的种类很多时是非常不友好、不方便的。因此需要使用具有异构资源集成检索功能的应用软件系统。系统能根据读者的检索要求,在指定的数字资源范围内,模拟读者检索过程完成检索并可以连接到该资源浏览信息。

将资源的元数据整合到一起就可以实现二次检索(对检索结果的再检索)和关联检索(例如通过书名检索到作者,又通过作者检索到该作者的其他著作)。元数据整合需要将数字资源的元数据提取出来并装载到元数据库中,这需要资源提供商的配合、图书馆系统管理员的操作和装载的时间和存储空间。

2 模型分析

统一检索系统为用户提供统一的检索界面和统一的检索语言,使用户能对本地和异地各种资源系统同时检索,提供简单检索、高级检索、二次检索、原文/文摘获取、相关文献检索等多种服务,对用户提供个性化的检索服务。该系统既可独立使用,又可作为综合文献服务环境的核心组件之一,与其他应用系统(如资源调度、馆际互借等)无缝集成。

3 统一检索系统体系结构

3.1 软件系统主要功能

统一检索系统由检索服务子系统、个性化服务子系统、管理子系统、数据源配置工具、统一检索引擎服务器五个部分组成。

3.1.1 检索服务子系统

检索服务子系统是读者用于选择和同时检索多个资源的Web应用,具有以下功能:

用户注册:提供用户注册的全部功能,包括个人用户注册和个性化用户注册。

用户登录:提供三种用户登录方式,包括机构用户,个人用户,个性化注册用户。

资源导航与资源选择:用户在检索前,首先选择要检索的各个资源。用户可以通过四种方式选择资源:使用关键字查找资源,选择首字母进行浏览,学科资源导航,直接选择资源。

同时检索:主要分为简单检索和高级检索两种方法。采用四级资源分类映射体系,最大程度体现原始文献库的原貌,可以同时检索分布在本地和异地的多个异构资源,实时返回检索结果,可以在多个结果集之间迅速切换,可以进行结果集合并,提供二次检索,重新检索等功能。

资源集成:由于采用了先进的元数据抽取技术,系统可以精确区分每条元数据信息,在此基础上,除了可以提供全文,文摘等链接外,更可以与其它系统进行无缝的集成。这些可集成系统包括资源调度系统,馆际互借系统,门户系统和统一认证系统等。

统计报表:统计各种学科,机构或者资源的使用情况,从不同角度,不同层次展现系统资源利用现状。分年报和月报两种,不同人有不同的报表权限。

3.1.2 个性化服务子系统

我的资源列表:用户可以将常用的资源添加到“我的资源列表”,便于经常使用。

我的学科列表:一个学科对应一个资源集合,用户可以自定义学科。通过选择学科可以快捷地将此学科所对应的资源集合选中,然后进行检索。

检索历史:用户对检索历史进行保存和再利用,再次登录后可以查看以前曾经检索过的资源、采用的检索方式以及检索结果数等情况。与此同时,可以快速还原检索条件。

我的收藏夹:用户可以将检索结果置于“我的收藏夹”内,随时进行查看,或者进行保存,发邮件等后续处理。用户可以创建多个收藏夹来分类整理。

个人基本信息:可以修改用户的基本信息及口令。

3.1.3 管理子系统

系统管理:提供更改密码:在线监控 服务器配置 强制刷新服务器等系统功能。

用户管理:用户管理包括:查找用户、创建用户、黑名单列表。可以对用户分配角色和进行授权。角色管理:可以在角色列表中添加或者删除角色,设置角色权限。学科管理:学科管理用以建立学科和资源的映射关系,实现资源导航体系。

机构管理:机构管理是用来管理机构用户的,对机构用户进行基本信息,IP范围以及相应权限的设置。

资源管理:资源管理是后台用来管理数据源的,对此处的改动将直接影响到检索主界面所显示资源的个数、标题、简介等。

3.1.4 数据源配置工具

利用该图形化配置工具,系统管理员可以快速完成对新资源的配置过程并将其加入到系统运行体系当中,为读者提供服务。

目前数据源配置工具能够支持的资源类型包括:Web资源:元数据级整合、链接级整合;支持ODL协议的资源;支持Z39.50协议的资源;支持OAI协议的资源;提供RDBMS数据库结构的裸数据库资源;XML资源;Web Service资源。对于部分特定资源,统一检索系统还提供插件技术,通过二次开发来实现对这些资源的整合。

3.1.5 统一检索引擎服务器

统一检索引擎是整个统一检索系统中的核心部分,采用统一检索语言对每个用户的并发检索请求进行转换、调度、转发,并对返回的结果进行解析、转换、缓存、显示等处理。采用异步技术支持对各个资源的并发访问,采用自行开发的HTML/XML解析器具有极高的页面元数据处理和抽取能力。

对于该引擎,管理员还可以配置和管理里以下信息:配置数据库连接:管理员可以方便的配置各个数据库连接信息;配置邮件服务器:管理员可以配置自己的邮件服务器,邮件服务器用以在系统中完成发邮件功能;扩展服务配置:在扩展服务配置中,管理员可以配置与本系统相关联的馆际互借,统一调度等系统的相关参数,以便为读者提供这些扩展功能。

3.2 软件系统遵循的标准规范

统一检索系统所遵循的主要国际标准如下:

表1

3.3 软件系统互操作机制和集成方式

统一检索系统与综合文献服务平台中的其它各个系统通过互操作协议无缝集成为一个整体,形成系统之间统一的信息共享和信息交换机制,实现系统的灵活配置以及新资源的灵活加入,实现统一的资源访问和个性化服务方式。

4 结语

结合各馆本地数据库实际情况,利用计算机开发工具,进行了系统设计与开发,以统一的形式为用户提供检索的服务,为资源库的用户提供了一种更好的统一检索服务,集成更多数据源检索接口,对结果融合算法进行优化,是今后工作的重点。软件系统的运行环境为Windows 2000及以上,数据库建议Oracle 10g。

猜你喜欢
检索系统数据源统一
坚持严管和厚爱相统一的着力点
碑和帖的统一,心和形的统一,人和艺的统一
统一数量再比较
收录《信号处理》的检索系统及数据库
收录《信号处理》的检索系统及数据库
本刊被以下检索系统及数据库收录
本刊被以下检索系统及数据库收录
Web 大数据系统数据源选择*
基于不同网络数据源的期刊评价研究
基于真值发现的冲突数据源质量评价算法