DOI技术在推进数字信息资源共建共享进程中的应用探讨

2011-04-12 01:01中国人民解放军空军第四飞行学院图书馆河北省石家庄市050071刘晓林赵建玲
河北科技图苑 2011年3期
关键词:数字信息号码解析

中国人民解放军空军第四飞行学院图书馆〔河北省石家庄市 050071〕 刘晓林 赵建玲

当前,在信息技术与网络技术日新月异的形势下,人们面对浩如烟海、内容复杂、类型繁多、更新迅速的数字信息资源往往感到无所适从,准确选择与获取所需数字信息资源的难度日益加大。对数字信息资源的准确识别与定位已成为数字信息资源管理领域研究者关注的一个重要问题。DOI技术正是在这种情况下应运而生的。它产生之初只是为了保护与管理电子出版物的版权,现在已在电子出版、电子商务等多个领域得到广泛应用。目前,DOI技术在国外的发展已经比较成熟,而在中国,DOI技术的应用尚处于初级阶段,还未得到广泛普及。本文正是基于对DOI技术在数字信息资源共建共享进程中应用意义的认识,将DOI技术与我国数字信息资源共建共享的实际结合起来,并提出几点策略,希望能够为推进我国数字信息资源共建共享进程提供有益的借鉴。

一、DOI技术概述

(一)DOI技术的定义

我国学者大多将DOI(DigitalObjectIdentifier)翻译为“数字对象标识符”,它是一种对互联网上的数字信息资源进行标识的工具,正如每件商品的条形码是商品识别的唯一依据一样,DOI号码在全球的唯一性使其能够对数字信息资源进行准确识别与定位。因此,有的学者将其形象地称为数字信息资源的“条形码”或“身份证”。

(二)DOI技术的原理

我国学者大多将 DOI系统分为四个部分:编码规则、解析系统、元数据方案以及分配和管理机制。

1.DOI号码的编码规则。在 DOI系统中,一条DOI号码实际上就是一条 Handle。DOI号码的编码规则完全遵从于 Handle,同 Handle一样,DOI号码也由前缀和后缀两部分构成。 DOI号码的结构式为:〈DIR〉.〈REG〉 /〈DSS〉。 其中〈DIR〉为 Handle System(句柄系统)分配给DOI系统的命名授权,其值为 10;〈 REG〉(RegistrantCode)是 DOI系统注册代理机构的代码,由 DOI基金会—— IDF(InternationalDOIFoundation)负责分配,由 4位阿拉伯数字组成;〈DSS〉是数字信息资源本身的号码,由 DOI系统注册代理机构自行给出,无统一规则、无规定格式,可以是任何字母或数字。既可以采用已有的国际标准号码,如 ISBN、ISSN等,如某篇中文论文的 DOI号码:10.3772/j.issn.1674-1544.2008.04.011,也可重新编制号码,只要该号码具有唯一性即可,这就使 DOI号码具有了灵活性与可扩展性。

2.DOI号码的解析系统。DOI号码的解析系统是 DOI系统运行的核心机制,它在 HandleSystem解析机制的基础上进行了扩展。 HandleSystem提供的解析机制在数字信息资源名称与数字信息资源地址之间建立链接,由服务器将数字信息资源名称解析为数字信息资源地址(URL)返回给用户。 DOI系统在此基础上实现了从单一解析机制到多重解析机制的技术突破,即一个 DOI号码可以对应多个URL,可链接多种数字信息资源目标。当用户点击某一数字信息资源的 DOI号码时,用户请求会被传送到 HandleSystem服务器上,服务器可将该 DOI号码解析为多个URL返回给用户,使用户不仅可以实现对所检索数字信息资源的获取,还可以访问该数字信息资源的引文、参考文献等信息,无形中扩大了信息获取范围,有利于用户对所查找内容的深入理解,有利于图书馆等信息管理机构对数字信息资源进行高效整合,提升信息服务水平。

3.DOI号码的元数据方案。DOI号码的元数据是 DOI系统中必不可少的重要因素,是 DOI技术发挥数字信息资源链接及数字信息资源整合功能的根本。尽管从表面上看,DOI号码仅是一串标识数字信息资源的字符,但其之所以能实现对数字信息资源的准确定位及原文、摘要、引文之间的相关链接,与其存储的元数据是分不开的,出版机构向 IDF及DOI号码注册代理机构提出申请时需要同时将所标识数字信息资源的元数据(包括数字信息资源的存储地址、版权信息、内容信息等)一并提交与上传。由于可赋予 DOI号码标识的数字信息资源种类繁多,对其进行揭示所需要的元数据各不相同,还要考虑不同元数据的互操作问题,因此DOI号码的元数据开发并非易事。目前,DOI系统采用的元数据方案可分为两类,分别是核心元数据与扩展元数据。核心元数据由 8个揭示数字信息资源的最小限度要素构成,是最简单的元数据;扩展元数据是针对不同类型的数字信息资源,通过对核心元数据的要素进行添加或限定,从而将图书、论文、会议文献等不同数字信息资源加以区分。

4.DOI号码的分配和管理机制。DOI号码的分配和管理机制是 DOI系统运行的保障。 1997年,DOI系统在德国法兰克福世界图书博览会上首次亮相,并成为数字信息资源命名的一项世界标准。1998年,DOI基金会—— IDF在法兰克福成立,负责有关 DOI技术的政策制定、技术支持、申请注册等业务。各国可在IDF授权下成立分支机构,即DOI注册代理机构(RA)。目前,全球已有8个RA。RA作为IDF的下属机构,在IDF的领导下开展工作,主要负责本国数字信息资源的 DOI号码申请注册、号码分配、元数据管理等具体业务。每个 RA的代码由IDF分配,每一数字信息资源的具体号码则由 RA自行分配。除此以外,DOI号码还要求注册的出版商将数字信息资源的元数据一并上传到服务器,并负责对其进行管理。当某一数字信息资源的存储地址发生改变时,要及时更新该数字信息资源的 URL并重新提交给 DOI技术服务器,这就保证了 DOI技术对数字信息资源的链接不会随数字信息资源存储地址的改变而失效。

(三)DOI技术的特点及功能

通过上文对 DOI技术原理的介绍,不难看出,DOI技术与其他标识系统不同。归纳起来,DOI技术主要具有以下几个特点及功能,即:第一,DOI号码具有唯一性。 DOI号码的编码规则决定其号码在全球具有唯一性,因此可实现对数字信息资源的准确识别。第二,DOI号码具有永久性。 DOI号码与URL不同,它对数字信息资源的链接不会随数字信息资源存储地址的改变而失效,有学者称其为“下一代 URL”,因而它能够实现数字信息资源的长期保存。第三,DOI号码具有兼容性。DOI号码灵活的编码规则使其可以兼容 ISBN、ISSN等已有的国际标准号码,因此它可以实现不同标识系统之间的互操作。第四,DOI号码具有关联性。DOI号码的多重解析机制使其可实现原文、文摘、引文之间的相互链接。这样,一方面提高了信息检索的检全率,另一方面有利于实现数字信息资源的深度整合。

二、DOI技术的应用对于推进数字信息资源共建共享进程的意义

通过上文对 DOI技术原理及其特点与功能的阐述,可以看出 DOI技术在数字信息资源管理方面具有一定优势。因此,将 DOI技术引入图书馆的数字信息资源建设之中,使其在数字信息资源建设与共享中发挥应有作用,对推进我国数字信息资源共建共享进程具有重要意义。

(一)DOI技术的应用有利于节约图书馆采购经费

近年来,图书、期刊、数据库等文献信息资源价格的飞速上涨与图书馆经费的短缺形成了一对突出矛盾。如何提高经费使用效益,增加文献信息资源采购量成为大多数图书馆不得不考虑的问题。DOI技术的数字信息资源链接功能正好为解决图书馆经费紧张问题提供了一种途径。以NSTL为例,NSTL作为我国最大的科技文献信息中心,承担着为我国科研工作提供信息保障的重任,每年都需要采购大量的外文数据库。外文数据库高昂的价格也曾经使NSTL的经费比较紧张,但现在该问题随着它加入DOI系统已经得到有效解决。 2007年,NSTL成为CrossRef联盟的会员后,对于联盟其他成员单位订购的外文文献,可以通过CrossRef联盟查找DOI标识和元数据,并将 DOI标识和元数据储存到本地服务系统。目前,可以用购买外文文摘数据库的形式,通过DOI编码的匹配与查询,实现文摘信息与全文信息的链接,从而实现引文到全文的链接。文摘数据库的价格相对于全文数据库的价格自然要低很多,这就使NSTL在很大程度上减少了用于购买外文数据库的支出,提高了图书馆经费的使用效益,也意味着数字信息资源共建共享效益的提高。NSTL的成功经验同样值得其他图书馆借鉴。

(二)DOI技术的应用有利于数字信息资源的高效整合

数字信息资源在网络环境下的分散存储给数字信息资源的存取与利用带来了很大不便,如何将数量丰富、内容各异、形式多样的数字信息资源进行系统整合,将相关数字信息资源集中起来,统一提供给用户,成为数字图书馆发展需要解决的问题之一。如前所述,在数字信息资源之间建立参考链接是 DOI技术的特点之一。正是由于其对数字信息资源赋予的唯一标识和采取的多重解析机制使 DOI系统能够实现相关数字信息资源之间的动态链接,能够实现从原文到引文之间的一站式检索,能够实现同类主题数字信息资源的集中获取,这就为数字信息资源的高效整合创造了有利条件。仍以NSTL为例,NSTL为其外文期刊数据库中收录的论文、会议文献、科技报告等数字信息资源申请注册了 DOI号码,用户在利用NSTL的外文期刊数据库检索信息时,通过点击数字信息资源的 DOI号码链接,便可访问文章全文及参考文献,包括尚未购买的数据库中的文献(前提是这些文献都申请注册了 DOI号码)。这样,就使用户一次性尽可能全面地获取了与其检索指令相符的数字信息资源。数字信息资源管理者,通过对用户检索、访问数字信息资源的记录进行统计,便可将这些同类主题的相关数字信息资源整合在一起,为今后满足用户相似的信息需求做好准备。可见,DOI技术的参考链接功能,既方便了用户检索信息,又方便了工作人员对数字信息资源的管理,可为我国数字信息资源的共建共享提供借鉴。

(三)DOI技术的应用有利于数字信息资源开发与利用的标准化

标准化是制约数字信息资源共建共享实现的又一个关键因素。目前,我国数字信息资源共建共享发展中存在的突出问题就是标准不统一,分布式异构数据库之间的互操作实现困难,导致数字信息资源共建共享进展缓慢。如何实现数字信息资源开发与利用的标准化成为数字信息资源管理领域急需解决的重要问题。DOI技术作为数字信息资源应用的规则体系,其编码规则与号码分配及其管理机制与解析机制都为数字信息资源的开发与应用提供了统一的规范。首先,DOI号码的编码规则统一了数字信息资源标识符的格式,实现了数字信息资源标识的一致;其次,DOI号码的分配及其管理机制,保证了在 DOI系统申请注册的数字信息资源更新、维护、管理的统一;再次,DOI号码的解析机制使用户能够实现对数字信息资源的统一检索,以某一数字信息资源的 DOI号码为检索词即可实现一次输入、多次输出,从而有利于解决异构数据库之间的互操作问题。由此可见,DOI技术在实现数字信息资源开发与利用标准化问题上也具有重要意义。

三、我国图书馆应用DOI技术的策略

从DOI技术在国内外的发展现状看,中文 DOI系统的发展落后于国外,而且国内外参与 DOI系统的大多都是出版商与数据库商,作为保存和传播数字信息资源重要机构的图书馆却很少参与。毕竟数字信息资源是全人类的共同财富,不是出版商的专利。数字信息的编码和互通对数字信息资源的共享和利用关系巨大,需要有关各方的共同参与,体现各方的利益要求。 DOI技术的价值绝不应仅仅体现在出版领域,始终以实现数字信息资源共享为奋斗目标的图书馆应当积极参与 DOI技术的研究与应用。现提出几点关于我国图书馆应用 DOI技术开展数字信息资源建设与服务的策略。

(一)图书馆应当加入 DOI系统

为了充分利用 DOI技术,图书馆应当加入 DOI系统,成为DOI系统的会员。目前,中文 DOI号码注册中心制定的相关政策规定:图书馆、出版商、数据集成商均可以成为该中心的注册会员。图书馆成为该中心会员以后,可以把中文 DOI系统作为本地链接方案的一部分,为馆藏数字信息资源提供 DOI链接,进一步丰富馆藏数字信息资源,扩大馆藏数字信息资源检索与获取范围,实现从原文到引文之间的一站式检索。

(二)图书馆应当加强同国外 DOI系统的交流与合作

目前,西文 DOI系统的发展已经比较成熟,很多出版机构、行业协会、政府部门与图书馆等都已加入了 IDF(英特尔开发者论坛),多数西文出版社和全文数据库均采用 DOI号码作为文献的唯一标识。其中,以 CrossRef为代表。据 2008年~2009年CrossRef的年度报告统计数据显示,目前每天新增注册记录 15000条,截至 2009年底,DOI号码的注册数量已达37101562条。而据中文DOI网站统计数据显示,截至 2010年 7月 30日,接受的中文 DOI号码注册总量为1350217条,中文注册总量显然与国外相差很多,由此可见 DOI技术在我国还未得到普遍推广。因此,图书馆加入中文DOI系统的同时,还应当加强同国外 DOI系统的交流与合作,积极参与 IDF有关 DOI技术政策的制定与元数据的开发,为数字图书馆建设与实现数字信息资源共享提供技术支持。

(三)图书馆应当加强同出版商、数据集成商的沟通与交流

数字信息资源建设是数字图书馆发展的关键问题。图书馆进行数字信息资源建设的方式一般有两种:一种是从出版商、数据集成商那里购买与引进数字信息资源,另一种是通过对馆藏纸质文献信息资源进行数字化或自建特色数据库的方式充实数字信息资源。而自建数据库的结构往往与引进的数据库不同,标准不统一,从而导致数据库之间的互操作困难,不利于数字信息资源的共享。 DOI系统能够实现图书馆、出版商、数据集成商所提供数字信息资源之间的链接,达到各方的共赢。可见,利用DOI系统的技术优势有利于实现图书馆数字信息资源的建设与共享。因此,图书馆应当加强同出版商、数据集成商之间的沟通与交流,在购买数据库时尽量选择那些在 DOI系统注册了的数据集成商开发的产品,既可以节约经费,又能最大限度地实现数字信息资源的使用价值。

四、结束语

DOI技术作为一项新技术,目前还未引入我国图书馆。但是,随着我国数字图书馆建设的进展,DOI技术凭借其在数字信息资源管理方面的优势,必将在我国图书馆的数字信息资源建设与服务领域得到广泛应用,从而推动我国数字信息资源共建共享的发展进程。

[2]田杰,吴琳.DOI在数字图书馆科技外文文献共享服务中的应用探讨[J].数字图书馆论坛,2007,(10):23~27.

[3]柯藐茜.论网络环境下图书馆文献信息资源的共建共享[J].河北科技图苑,2008,21(6):63~65.

[4]蔡焰辉.我国数字资源唯一标识符的发展与应用研究[J].情报探索,2009,(4):62~64.

[5]江泽琴,杨曦,周厚永.中文期刊论文 DOI的概念、构成及其意义[J].西南军医,2009,11(4):806.

猜你喜欢
数字信息号码解析
三角函数解析式中ω的几种求法
说号码 知颜色
北京尚水数字信息产品介绍
一个号码,一个故事
猜出新号码
数字有形状吗?数字信息精确性和品牌标识形状的匹配效应*
睡梦解析仪
电竞初解析
对称巧用解析妙解
这个号码很吉祥