欧阳宁,王 莹,谢丽佳(中国药科大学图书馆)
随着互联网的普及,数字对象的内容、生成方式和格式越来越多。数字对象唯一标识符作为互联网环境下标识及解析数字对象的一种内容识别符系统,[1]具有唯一性、永久性、多重链接等特点,能在网络环境下对数字对象进行标识、定位及管理。[2]数字对象唯一标识符分为静态和动态两种类型,如ISBN、ISSN、ISRC等是静态唯一标识符,而 URL、DOI、CIDF等属于动态标识符。两种标识符都有特定的构成规则和专门的管理机构,区别在于静态标识符缺乏基于网络的解析,而动态标识符具有网络环境下分布式解析与管理的机制,是可产生行为的、可解析的、可链接的标识符。[3]
动态唯一标识符的特性,决定了应用动态唯一标识符是未来网络环境下对信息资源进行链接及共享的发展趋势之一。[4]而在动态唯一标识符中,DOI(DigitalObject Identifier)是图书出版行业公认的唯一标识符事实标准,它的产生是针对ISBN、ISSN及URL标识的局限性,力图通过唯一标识符、元数据、应用系统的结合,在数字环境下对内容对象进行标识和解析。[5]目前,国外很多大型出版社和全文数据库均采用DOI作为文章的唯一标识,如Elsevier、Springer、JohnWiley&Sons等,国际 DOI基金会(InternationalDOIFoundation,IDF)已经分配并解析了几千万个DOI号码,并且越来越多的机构在加入这个联盟中。
尽管多数国外出版社均采用DOI作为文章的唯一标识符,但因其昂贵的费用,所以很多国家也在试图摆脱IDF的控制并在本地建立类似的解析系统及相关服务。[6]如,中文DOI是在IDF之下注册的,在国内万方与IDF共同开展中文DOI的注册登记工作。可是万方中文DOI系统与DOI处于不平等的地位,永远要给IDF交费,目前中国每年需要交纳100多万元的高额费用。[7]2002年,我国科技部科技基础条件平台专项资金项目“我国数字图书馆标准规范建设”的子项目“数字资源唯一标识符应用规范”课题组提出建立中国本土的唯一标识符解析框架CDOI系统,[7]并于2012年由中华人民共和国文化部发布并实施《WH/T 48-2012数字对象唯一标识符规范》。[8]本文对CDOI结构及具体的编码规则进行分析讨论并提出自己的设想,希望能抛砖引玉,吸引学者们从更多的角度对CDOI的标识符系统方案进行研究与推广。
DOI是美国全国研究创新联合会根据美国出版协会的要求研发的数字对象唯一标识符,以Handle System解析系统作为支撑,在1997年法兰克福图书博览会上首次亮相,后逐渐成为数字资源命名的事实标准。[9]DOI根据数字对象的内容,通过水印或其他技术将数字内容与唯一标识符永久关联。[10]DOI的结构式为:
与URL不同,DOI实际上是一种URI(Universal Resource Identifier) 或 URN (UniversalResourceName),DOI的多重解析功能可以指向多个相关的URL以及其他类型的元数据,为用户提供了更多的选择和便利(见图2)。[11]DOI的唯一性和持久性,保证了它能提供准确、高效的检索质量。
图2 DOI的多重解析
2007年初,中国科学技术信息研究所和万方数据联合向IDF申请取得了DOI的中文注册权,并在此基础上成立了中文DOI注册中心,成为中文信息服务领域的第一个IDF组织下的中文代理。
由上表可以看出,中文DOI在后缀中使用多个节点。第一个节点用一位英文字母代表内容的类型,第二个节点可使用ISO标准的标识符方案(如ISBN、ISSN、ISRC等),后面的节点依次为论文的年期号、图书的章节号、图片编号、表格编号等。多个节点的应用使中文DOI后缀编码清楚明了。另外,在中国使用中文DOI解析代理服务器http://dx.chinadoi.cn进行解析,比使用IDF的DOI代理服务器的解析速度更快。[12]
CDOI系统于2012年发布并实施,是基于Handle技术体系建立的数字对象唯一标识符规范体系框架,目标是在国际开放的技术标准和协议的基础上,建立一个既能与国际主流唯一标识符体系兼容、实现互操作,又能在发展政策、管理运行机制等方面不受制于国外某个商业化系统的唯一标识符体系。[13]CDOI与DOI兼容但独立于DOI,不受DOI管理规则的约束。
CDOI由前缀与后缀两部分组成,并用斜线号“/”分开,前缀由两个层次的命名授权段组成(见图3)。
图3 CDOI前缀构成
WH/T 48-2012标准规定,CDOI是一个无任何含义的字符串,能分配给任何类型、格式、载体的对象,如:文本文档、数据集、录音带、音视频文件等,并且CDOI名称字符串以及前后缀元素的长度都没有限制。在同一个前缀元素下的每个后缀都是唯一的,可以是一个顺序号,也可采用其他ISO标准的标识符方案,或者非ISO标准但被广泛认可和使用的标识符方案,以及系统自定义的标识符方案等。[8]
CDOI规范中关于前缀命名的授权由两个层次的命名授权段组成;CDOI名称扩展规则规定,当前缀中第二个层次的命名授权段(由唯一标识符专门管理机构分配的注册机构代码部分)不能满足实际中对注册机构分类和唯一标识的需求时,可对其进行扩展,CDOI解析系统应在技术上支持新的命名授权段分配法。WH/T 48-2012标准规定命名授权段扩展的语法为:name-autority[.sub-name-authority*]。[8]
随着科技的迅速发展与深入,资源的类型及数量激增,仅仅是通过机构注册代码已经很难准确地表达复杂数字对象。例如,曾经发现同一出版社两种不同的图书居然注册同样的ISBN,若不对名称进行扩展,这两种图书所分配的CDOI号将无法分辨。早在1998年,G.Cleveland就提出,对作者进行唯一标识与为书籍赋予ISBN号一样重要。国内外相继有学者一直在研究人员唯一标识符的重要价值与作用,若对数字对象的责任者进行标识,必然大大提升标识符的唯一性。因此本文建议CDOI名称扩展时采用人名代码方案。
根据WH/T 48-2012标准,CDOI虽然名称字符串以及前后缀元素的长度都没有限制,但是根据超文本传输协议HTTP/1.1(RFC 2616)3.2.1,CDOI名称的长度不宜过长。因此,CDOI前缀中第二个层次的命名授权段扩展所标识的责任者应取排名第一位的人名,团体责任者可仿个人。人名代码系统有多种选择,如汉语拼音、著者号码等,也可参考国内外已研发的科研人员唯一标识符系统。本文采用四角号码著者标识系统来举例,作为CDOI命名授权扩展段的人名代码。如国家图书馆收藏的一本ISBN为978-7-5034-6986-2的梁启超的著作,可标识为cdoi:CDOI.011001.3334/isbn.9787503469862,其中3334是梁启超在四角号码系统里的著者号,这样CDOI的唯一性大大加强。“机构注册代码+人名代码”方案不仅可以用来表示并帮助识别、定位数字对象的唯一身份,还可以在后期通过二维码等工具创建持久稳定的“机构+责任者”链接。
WH/T 48-2012规定,后缀可以是包含任何字母和数字的字符串。[12]虽然可以将编目信息包含在CDOI编码中,但是将这些信息包含在系统中没有语义含义。较为可行的是将其他系统中应用的标识符方案引用到CDOI自身标识符中,如果表示对象同时被多个其他标识符方案标识,可重复著录资源标识符字段。我国虽已采用多项ISO标准,但除ISBN、ISSN和ISRC外,其他类型如古籍、网络资源等如何分配标识符系统并未推广。为避免标识符过长,本文建议CDOI的后缀非ISO标准可参考Calis的《信息资源名称规范列表》中资源的英文简称(见表2),[14]后或随机生成流水号,或注明网址。但网址中若含有URIdingyide保留字符、不安全字符,应对其进行十六进制编码。[12]
表 2 信息资源名称规范列表
二维码与条形码一样,都是CDOI的一种体现形式,二维码是用某种特定的几何图形按一定规律在平面分布的黑白相间的图形记录数据符号信息的,是近几年来移动设备上超流行的一种编码方式。[15]二维码的特点是信息容量大,持久耐用。
因此,同一个数字对象不论是纸质版、 PDF版或HTML版都应共享同一个二维码,只要在使用CDOI的链接形式(即CDOI解析服务器地址+CDOI号)制作二维码时,在页面中加入不同的链接,指向同一数字对象的不同格式。这样既能方便读者下载,又能实现对数字对象利用率的跟踪。另外,根据CDOI描述对象性质的不同,可以一种刊物设计一个二维码;可以一本书设计一个二维码;也可以一篇文章设计一个二维码;文章中的图、表也可设计个二维码;或者根据CDOI中的人名代码将同责任者的资源集中设计成一个二维码等,手机扫描后自动链接到URL地址。
每个数字对象的CDOI一经确定后终身不变,通过二维码,其对应的数字对象信息以及URL地址都可以更改,只要及时在CDOI系统中进行更新即可。随着图书馆界对二维码研究的深入以及二维码自身安全性技术的发展,未来的CDOI系统也许会开启二维码新时代。
综上所述,国内的数字对象唯一标识符目前有三条道路:一条是向IDF付费并成为注册代理;另一条是所有的中文数字资源都在中文DOI系统上;还有一条就是自主开发并使用中文数字资源唯一标识符系统CDOI。原则上我们应坚持并大力推广CDOI,这也是为中国出版界、图书馆界共同遵守的唯一标识符规范打下基础。[3]但是目前CDOI系统尚在发展之中,并且利益的不均衡多少会造成目前CDOI在国内推广应用上的困难。CDOI的规范体系的建设与应用,需要国家相关部门的支持,需要出版界和图书馆界的联合与合作。[16]
[参考文献]
[1]祝清松.国内外数字对象唯一标识符应用现状述评 [J].情报科学,2012(8):1254-1257.
[2]毛军,等.URI和数字对象唯一标识符[J].现代图书情报技术,2003,19(2):9-12.
[3]宋文,等.CDOI规范及在国家图书馆的应用[J].现代图书情报技术,2008(10):1-5.
[4]刘怡辰,等.科技期刊论文参考文献著录DOI的重要性[J].科技与出版,2013(11):90-91.
[5]胡新平.文献资源云平台构建研究[J].情报理论与实践,2012,35(4):81-84.
[6]毛军,等.试论我国数字资源唯一标识符发展战略[J].现代图书情报技术,2005,21(2):1-4.
[7]任瑞娟,等.中文DOI路在何方——从参考文献著录与DOI的关系探讨中文数字对象唯一标识符的发展方向[J].中国图书馆学报,2010(2):115-121.
[8]WH/T 48-2012,数字对象唯一标识符规范[S].北京:中华人民共和国文化部,2012.
[10]窦建爽.日本CIDF的实施及对我国数字内容标识符的影响研究[J].中国环境管理干部学院学报,2010(6):75-78.
[11]潘松华.CrossRef在数字图书馆中的应用[J].图书馆理论与实践,2005(6):63-65.
[13]夏翠娟.数字对象唯一标识符DOI与 CDOI[EB/OL].[2017-06-02].http://www.docin.com/p-961199408.html.
[14]CALIS数字对象唯一标识符命名规范[EB/OL].[2017-05-31].http://www.doc88.com/p-779438 3815020.html.
[15]赵迪,李振婷.二维码技术在OTO商业模式中的应用分析[J].中国管理信息化,2014(9):90-92.
[16]蔡焰辉.DOI系统在数字图书馆建设中的应用[J].情报探索,2010(4):89-91.