孙红 万绍华
(1.长江大学 计算机科学学院,湖北 荆州 434023;2.长江大学 期刊社,湖北 荆州 434023)
在一个日益增长的数字化的学术环境中,如何区分同名字的研究者呢?如果研究者的工作单位或联系信息发生了变化,又怎么维持研究者与其学术著作之间的联系呢?目前最好的解决方案是采用唯一的研究者的ID ,即ORCID(Open Researcher and Contributor ID,开放研究者与贡献者身份)。
ORCID计划开始于2009年11月,用以解决学术交流作者姓名歧义问题。作者姓名歧义是指作者姓名不能用来可靠地识别所有的学术作者,从而使它不可能毫无歧义地将学术著作与正确的作者联系起来。由于有同名现象,如在美国可能有多个叫史密斯的人,就像在中国有许多叫张伟的人一样,作者姓名作为唯一标识符的不足之处是显而易见的。虽然计算机可以使用地点、日期、主题以及合作者等信息来标识大多数作者,但错误率仍会达5-10% 。
作者姓名歧义问题困扰着参与学术活动的每个人。对于高校来说,要准确地收集教师和学生的学术信息也不是件容易的事。大多数高校通过以下方法来收集需要的信息:查阅图书馆资料、查看行政部门登记信息、研究人员定期汇报、求助商业机构等,大多数高校使用这些策略的组合。但各个地方收集的信息都不太完整,需要花费大量的精力去整理。
姓名歧义问题,只能通过给定作者一个唯一的标识符来解决。在过去十年里,有些作者已经拥有了自己的的唯一的标识符,其中一些被广泛应用于特定的学科或地理区域,例如经济领域的RePEC与巴西的拿铁(LATTES。有些作者的标识符虽然是全球性的,但并没有在学术界得到广泛的支持,因为它们或被单一的商业实体所拥有,或因缺乏资金而没有得到持续的维护。加上有些标识符是由消歧算法生成的,可能会给同一个人创建多个标识符。因此,由于没有可用的作者识别服务可解决姓名歧义问题,ORCID便应运而生了。ORCID开始于2009年底,2010年 8月在美国特拉华州威尔明顿市正式成立了 ORCID Initiative,并设立董事会,ORCID倡议作为非赢利组织于正式启动,有越来越多的机构和赞助商加入。
在开始阶段,ORCID组织主要靠各大学、图书馆、学术社团、基金组织、出版商等的捐款开展工作,从 2011年开始将会有其他收入,并开始雇佣职员。ORCID组织下分商务工作组(BWG)、技术工作组(TWG)、扩展工作组(OWG)、法律工作组(LWG),现由全球各学术研究协会的 14名成员组成董事会进行管理。人员多来自世界知名大学、基金组织、社团协会、出版商、公司等单位的领导者,截至 2011年底,有超过 250家机构注册为参与单位,42%是学术研究机构,23%是学会和学术团体以及其他非盈利机构,15%的商业出版商,剩下的 21%是政府机构,基金会以及企业[1]。
ORCID的最初目标是解决学术作者的姓名歧义问题,通过建立一个集中的名称标识符注册表,为每一位作者分配唯一标识符,是使作者标识符成为个人学术信息的基础设施,类似于DOIs或其他的永久学术标识符。同时通过开放、透明的链接机制和现行通用的其他责任者唯一标识方案系统相连。这些唯一标识符以及它们之间的关系,与研究人员的科研成果相关联,可以加快科学发现进程,提高科研资金和合作的效率[2]。
ORCID不单是一个作者标识符注册机构。一个唯一的作者标识符的价值是有限的,虽然最初的重点是学术期刊上的文章,ORCID打算收集所有与作者相关的学术贡献,从研究数据集到各种委托。为了实现这一功能,ORCID将与CrossRef、DataCite以及其他提供永久学术标识符的服务商密切合作。据预测,由ORCID提供的一个开放的、通用的、唯一的作者标识符将有助于学术机构、非营利组织和商业实体提供额外的其他服务。ORCID还将通过链接作者、他们的出版物和其他作品以及相关的指标(引文、使用数据等)来促进新的学术指标的发展。
在ORCID创建初期,为了满足作者、高校、基金组织、出版商以及其他组织的需求,通过建立阿尔法原型环境来考察它的互用性。ORCID决定提供基于ResearcherID源代码的服务,该服务已于2011年8月得到Thomson Reuters许可。ResearcherID代码为创建一个可行的ORCID系统提供了良好的开端,为了符合阿尔法(alpha)模型的要求,某些系统需要进行更改,这项工作开始于2011年第三季度。
ORCID服务最初的重点是针对一些活跃的研究人员,他们能够免费创建、编辑和维护自己的ORCID标识符。 ORCID标识符由16位数字组成,每4位数字分成一组,中间用“-”连接,写法类似于HTTP URL(例如http://orcid.org/0137-1963-7688-2319 )。 ORCID标识符不包含语义信息,其中无年份与作者所在国家等信息,仅表示创建顺序。该ORCID服务不仅可发布作者唯一的标识符,而且也能链接到作者已经建立的识别服务上,这是ORCID服务的核心功能,从ORCID计划开始的第一天起,许多提供作者识别服务的组织(例如Researcher ID、 Scopus Author ID、RePEC、INSPIRE)已经成为了它的一部分。
另一个ORCID被广泛采用的关键因素是:它是可持续的,并能保证长期提供服务。 但提供一个全球性的作者识别服务需要资金。虽然已获得多项资助、捐赠和贷款,但ORCID明确表示从2013年开始提高会员费。会员费的多少将取决于组织的类别和规模,小规模的学术机构支付的会员费比大型商业出版商要低。此外,对于存储数据和个人使用永远是免费的。
为了便于使用,ORCID对任何有兴趣的学术组织开放,目前已有310多个组织参与。 ORCID由不以营利为目的的利益相关方的代表管理,其数据和源码是开放的。ORCID可免费提供研究人员通过CC0宣布弃权的资料和数据,在开源软件许可下ORCID开发的所有软件也可公开发布。
登录http://orcid.org,选择“Register now”,输入相应的信息后,再单击“Register”按钮,就可以拥有自己独一无二的ORCID标识符了。
注册后,就可以建立自己的记录,包含个人所属单位、基金、专利、学术论文、研究成果;从CrossRef资料库导出自己的发表记录;或是与其他系统如ResearcherID跟Scopus同步。另外,如果是让别人帮助注册,只要验证本人的记录即可。ORCID 注册系统免费供个人使用,他们可以获取 ORCID 标识符,管理其活动记录或在注册系统搜索其他内容。 组织可以通过成为会员将其记录与 ORCID 标识符相关联、更新 ORCID 记录、从 ORCID 接收更新,以及为其员工和学生注册 ORCID 标识符。
虽然ORCID是开放注册平台,但还是可以自行设置隐私,设定本人愿意分享的个人档案及公开的研究活动信息,ORCID 记录不保留任何敏感信息,如名称、电子邮件、组织和研究活动。
1)解决作者姓名歧义问题。作者一旦拥有了的自己的ORCID,只要在互联网上输入http://orcid.org/个人ORCID号,就可以无歧义地查阅个人的相关登记信息。
2)允许科研人员跨学科、跨地域、跨国界共享他们的个人资料及研究成果,允许科研人员委派他人对个人资料进行持续管理;
3)提供一个全球的开放的可互操作的平台,便于不同的利益相关者获取不同ORCID服务,支持系统间通信和身份验证的API(Application Programming Interface,应用程序编程接口)。科研人员从中寻找理想的合作对象,研究机构、出版商、资助机构、中介等也可从中为各自的目的收集所需的信息。
ORCID是一项社区驱动的非盈利开放性组织,专注于为研究者创建并维护唯一标识符注册系统,以及将研究活动和研究成果与这些标识符相关联的透明方法,它是研究者与研究的连接枢纽,可将ORCID标识符嵌入关键工作流程。ORCID的独特之处在于能够跨学科、研究部门和国界进行交流。
参考文献:
[1]ORCID,ORCID funding and development efforts ontarget: Thomson Reuters Provides Royalty-Free Li.cense for ResearcherID Code toAccelerate Develop.ment [Z].ORCID inc,2011.
[2]ORCID.Mission Statement [EB/OL].http://www.orcid.org/mission-statement,2012-08-24.