文/郭晓峰 涂 勇 蔡京生
涂 勇 中国科学技术信息研究所
蔡京生 新闻出版总署科技与数字出版司
DOI(Digital Object Identifier)是数字对象唯一标识符的英文缩写,原意是对网络环境下的数字对象进行唯一标识和管理,后来演化为“对象的数字化标识符”,即可对任何形式、任何类别、任何颗粒度的实体进行标识,并提供与对象信息持久、动态的链接。例如DOI既可以标识网络期刊论文,也可以标识纸质图书。
DOI最初起源于互联网知识产权保护,是由美国出版商协会(AAP)在1998年创立的非赢利组织IDF(国际DOI基金会)管理和运行的。DOI被誉为互联网上的条形码,因为它可以像条形码在物理世界里标识商品那样,在网络世界里标识、追踪数字内容。DOI已成为国际出版界事实上的标准并得到广泛推广应用。
目前,内容产业的数字化发展越来越复杂,需要各种系统相互配合。如在内容资源的创作和支持服务方面,需要内容创作、编辑、管理、出版、印刷等系统;在内容资源的分销和销售环节,需要版权服务、电子商务、分销代理服务等系统支持;在为各类直接、间接用户提供服务中,需要提供包括文摘索引服务、搜索服务等系统的支持。这些系统相互配合的前提是能够相互理解和交换与内容有关的信息。
DOI满足内容产业数字化发展需求的特性
DOI作为持久性的内容标识符,通过DOI系统的基础服务和增值服务,将内容的相关信息在各系统间进行可靠的交换、传递,如最基础的内容元数据(或称文摘数据)、内容的链接地址等,保证各系统可以对内容获得一致的理解、确认,以及保证对内容本身的持久访问;还可以包括内容的版权信息、电子商务信息等,为内容的合法使用、快速传播等提供保障。从这个角度讲,DOI的确堪称互联网上数字内容的条形码。基于先进的信息管理理念、完整的体系结构、稳定的技术系统而产生和运行的DOI系统具备突出的特性。下表描述了DOI系统在满足内容产业数字化发展需求方面体现的特性。
相比之下,内容产业中传统的标识符如ISBN、ISSN等,只能标识特定的出版物种类,而且这种标识主要用于出版物的管理,对于网络环境下的数字内容管理与传播缺乏有力的服务支持。目前普遍使用的URL地址,虽然可以提供数字内容的访问地址,但URL本质上是数字对象的网络位置,而非其永久的名称标识。而且,URL缺乏管理机制,更谈不上权利保护。消费者面对分散在互联网中的海量内容,没有统一的发现机制,也无法区分哪些URL提供的内容是可靠的、可信的。因此,上述标识符或者原始的定位机制都难以满足内容产业数字化发展的需要。
DOI自诞生来,伴随着数字出版、互联网信息服务的发展浪潮获得了快速发展。近年来,DOI系统已成为学术出版、科技信息服务等领域无可争议的标识与链接标准,并且在出版产业链、影视产业链中也发挥着越来越重要的作用。其最新动态如下:截至2012年11月15日,DOI注册总量达6300多万个,DOI解析链接总量每月最高超过8000万次;DOI系统于2010年11月经ISO投票正式成为ISO标准(ISO),2012年4月出版印刷;DOI的发展和应用从广度上已超越了传统出版行业,向更广阔的内容产业进军;从深度上向传统出版业进一步渗透。DOI注册服务的内容类型已涵盖了期刊、图书等传统的科技文献,同时涉足科学数据、图表等新型学术内容出版;DOI国际基金会(IDF)已与ISBN国际机构达成协议,将DOI用于ISBN-A业务,即将一个ISBN号以DOI形式表达,利用DOI技术和服务,在网络环境下使图书产业链中的传统标识符ISBN具有更多功能和更强大的生命力。
1.DOI在科技出版中的应用。DOI目前在科技出版行业的应用最为成功。其中DOI引文链接服务功不可没。该服务最初是在2000年由IDF(国际DOI基金会)的RACrossRef创立并运行的。作为由美国出版商协会的12家成员建立的出版商国际链接协会(PILA)的商业品牌,CrossRef要求其出版商会员将出版的内容注册DOI,并规定会员不仅要在自己出版的原文上标注DOI,而且必须在引文中使用DOI链接到其他会员的出版物,否则将进行处罚。这样,在出版商之间,就通过引文DOI构建了相互链接的学术内容网络。同时,图书馆会员可以免费获取文章的DOI号,从而通过论文DOI和引文DOI链接到出版商的原始数字内容。这样不仅增加了出版商内容的发现机会,而且也沟通了行业的上下游,从而通过DOI技术、标准和服务带动了整个学术内容产业的发展。
由于引文链接服务在技术、商业模式等各方面的合理设计和良好运行。截至2012年11月,已有来自世界各国的4169家学术出版商、协会,以及1919家图书馆加入CrossRef的引文链接网络,DOI注册总数量已接近5700万。
引文链接的内容类型也从最初的期刊扩展到期刊、图书、学位论文、会议论文、标准、技术报告等。自2010年以来,越来越多的学术和专业出版商都基于网络出版电子图书,图书DOI注册已成为CrossRef增长最快的业务。为此,CrossRef发布了一系列指南,促进图书的参考文献链接应用,并且希望能够建立图书引用的报告机制,利用这种机制为图书内容建立知名度和信誉度,实现与目前期刊内容类似的图书内容衡量标准。
在科技文献领域之外,由另一个RA-DataCite建立的科学数据DOI服务在科技出版或科技信息管理领域也形成了一定影响力。DataCite的前身是德国科技图书馆(TIB)。2009年12月1日,TIB联合其他来自欧美等国领先的研究型图书馆、信息中心等机构,成立了一个国际联合体,其目标主要是为科学研究数据在互联网环境下的访问提供便利的途径,方便人们对研究数据的认可、引用、验证和重新利用。
实际上,科学数据也是非常重要的科技资源,但目前对于科学数据的共享、传播、利用、保存远没有像科技文献那样成熟。因此,DataCite的会员向数据集分配DOI,并开发通过DOI引用科学数据的规范格式,促进科学数据与科技文献之间的相互引用和链接等。目前DataCite提供注册的资源种类包括:数据集、论文等。值得注意的是,国外学术期刊已开始将科研数据作为重要的出版资源,作为学术论文的补充材料进行引用,或者与学术论文相互引用和印证。
在我国,中文DOI于2007年重点开展了中文资源的DOI引文链接服务,包括期刊论文、科学数据DOI的注册、查询、引用等,是目前简体中文领域唯一的DOI服务。中文DOI是由IDF批准的中国RA在国内建立的DOI注册服务,目前由中国科学技术信息所下属的中国DOI注册与服务中心管理和运行。5年来,中文DOI的注册数量已达到198万余条,自2009年以来一直保持世界第二位;覆盖的期刊数量达到1800种;注册的资源种类也从最初的期刊扩展到科学数据、图书、图表等,并在中西文资源引用链接、文献与科学数据的引用链接等方面进行了大量研究与实践。
2.DOI在出版产业链中的应用。IDF的一些RA原本就是大出版商或者出版协会,如Bowker、mEDRA等。这些RA提供DOI服务的初衷,就是为了在完整的出版产业链中应用DOI对内容进行标识、链接,促进内容的追踪、管理、电子交易等。
2010年,欧洲多语言DOI注册机构mEDRA与德国ISBN中心MVB联合推出了ISBN-A业务,堪称DOI应用于出版产业链的典范。ISBN-A即“可点击的ISBN”,是一个从现存的ISBN导出而获得的DOI名称。ISBN国际中心与IDF协商,确定了标准的ISBN-A语法在传统的出版产业链中,ISBN可以充分为实物产品提供贸易服务,但在数字内容的产业链中却无法轻松地为网络数字内容提供服务。因此,ISBN-A既可以使出版产业链继续利用ISBN完成供应链订货程序、进行供应链中的数据交换等,又可以充分利用DOI的优势。
ISBN-A是DOI与其他ISO标识符标准融合的一个实例。实际上,从2009年开始,ISRC国际中心多次与IDF讨论类似的合作。另外,在出版供应链中影响巨大的ONIX标准,也将DOI作为出版内容的标识符纳入多个数据项中。这些都反映了出版产业链在不同层面上对DOI的嵌入和利用。
IDF于2010年底宣布接受娱乐业标识注册(EIDR)为新的RA。EIDR于2011年开始运行,它是一个标准化开放式的DOI注册系统,目标是帮助娱乐业在数字电影和电视内容的商业传播过程中,实现对这些数字内容的识别与追踪。EIDR一经诞生,就获得了主要娱乐公司的强力支持,目前其DOI注册数量已超过30万条。
2011年9月7日,EIDR宣布世界领先的娱乐公司已经开始将EIDR标识符使用集成到他们的数字分发工作中,华纳兄弟、迪斯尼等机构都开始在其数字供应链中使用EIDR。鉴于DOI提供的跨媒体类型、跨平台、跨系统的标识和链接能力,可以预计,将有越来越多的影视、媒体公司紧跟行业领先者,使用DOI标识各种媒体资源,以促进数字媒体资源在产业链中的管理和流通。
国际数字内容产业发展的先进经验以及DOI在多个领域成功的应用案例都表明,DOI对于网络环境下数字内容的出版、发布、传播、知识产权保护都有非常切实的促进作用。
我国相关行业在近10年来,也对DOI进行了较深入的研究,并在标准化方面取得了一定成果,同时实践应用的规模也在不断扩大,而且开始获得更多平台商的支持:继万方数据公司从2009年开始为其全文合作期刊提供免费DOI注册与链接服务之后,2011年,国内主流的三大期刊编审系统玛格泰克、勤云、三才先后成为中文DOI的合作伙伴,在其系统中提供了DOI一键注册、批量注册等功能,为使用其系统的科技期刊快速注册DOI提供了便利。2012年,国内领先的高等教育出版社成为中文DOI的出版机构会员,将其优质期刊和图书资源注册DOI。这些都表明,DOI服务正逐渐被我国科技期刊、图书出版等行业接受。
因此,我国新闻出版、广播电视、信息服务等行业应充分利用DOI这个由数字网络催生的利器,促进我国内容产业的数字化发展。一方面,应尽快实施相关国家行业标准,建立与DOI兼容的、我国独立自主的数字资源唯一标识注册与服务体系,使我国相关行业产业链中的内容生产、出版机构、信息服务机构、技术提供商以及广大消费者可以广泛获益;另一方面,应尽快开展DOI国家标准的采标工作,并充分利用国内已运行的DOI服务,对于适合与国际交流的数字内容,鼓励其生产、出版单位使用DOI对数字内容进行标识与链接,通过国际统一标准加强与国际数字内容的相互链接,促进我国数字内容的发现、传播及交易,推动我国优质数字内容的对外交流。
[1]张旭.DOI在学术出版产业链中的应用研究[J].数字图书馆论坛,2007(10).
[2]李颖,赵蕴华,郭晓峰.中文DOI系统的应用研究与开发——从战略规划到国内外合作[J].数字图书馆论坛,2009(8).