关联数据URI设计规范探讨*

2016-11-08 05:32夏翠娟
国家图书馆学刊 2016年5期
关键词:词表标识符设计模式

许 磊 夏翠娟 刘 炜 张 磊

关联数据URI设计规范探讨*

许 磊 夏翠娟 刘 炜 张 磊

统一资源标识符(URI)是互联网领域重要的基础技术之一,是在网络虚拟空间标识和定位事物的基本方式。作为统一资源定位符(URL)的上位概念,URI在形式和功能上规范了互联网资源标识体系,为基于概念和模拟真实世界的关联数据应用提供了基本的标识和解析技术。当前业界关联数据应用正处于起步阶段,亟需引介推广重要的技术规范并交流相关实践。本文遵照万维网协会(W3C)有关URI设计原则的推荐规范,从URI的类型、设计原则和模式等三个方面介绍国外关联数据URI设计的最佳实践。最后结合上海图书馆的实践,设计关联数据应用的URI应用规范,以供同行参考。图2。表8。参考文献21。

URI设计规范 统一标识符 关联数据

1 引言

名称通常是事物最重要的属性。古希腊哲学家巴门尼德认为,事物没有名称就可以被认为是不存在的。互联网上的资源正是如此。万维网协会(World Wide Web Consortium,W3C)将网络资源定义为:“任何用URI标识的对象”[1],这就是说网络上任何资源,其唯一且必需的属性是URI,即统一资源标识符(Uniform Resource Identifier)。有了URI的资源就是网络“公民”,就能够被管理、存储、跟踪、调用,进行生命周期管理;没有URI的资源就不是一种网上的独立存在,必须附属于其它具有URI的资源。网页是万维网上的一种常见资源,其URI就是URL(Uniform Resource Locator,统一资源定位符)。万维网发明人蒂姆·伯纳斯-李于2006年提出“关联数据”概念,推动万维网由文献的Web向数据的Web发展,关联数据四原则中第一条即“使用URI命名事物”[2]。

URI是一组按照特定语法规范构成的字符串,为网络资源的标识提供了一种简单和可扩展的方法[3]。URI作为网络中对象的唯一标识符,经其标识的地址可以获得关于被标识对象的有用信息,并可关联到其他相关资源。URI的特点体现在“统一”“资源”和“标识符”三个方面[3,4]。“统一”保证了不同类型的资源标识符可以采用统一的使用方式,并为新的资源类型提供统一的标识框架;也保证了这些不同类型的资源标识符在相同的语法规范下有统一的语义解释,并允许在不同的环境下重用。“资源”是指能够被标识的任何对象,不只限于网络文档和数字内容,也包括现实世界的物理实体和抽象概念。“标识符”是一个对象可以引用的名称。URI使对象能够实现标识和定位、访问与获取、参引和规范控制等目标。

URI设计是关联数据应用过程中至关重要的一环,合理的URI设计模式,是数据得到更好地组织和管理、传输和交换、共享和重用的保障。

2 URI的作用

2.1 标识和定位

URI的本质是一种标识符。所谓标识符,是指对象的名称标识,是特定背景下资源的明确指向。标识符的基本功能就是对资源进行标识,即对资源的命名和区分。如ISBN用7501309086与7544130967标识了两本同名但不同内容的书。在一个开放式的网络世界中,使用全球唯一的URI对实体对象进行标识,可以有效地对不同名称的相同对象,以及相同名称的不同对象进行命名和区分。

URI可以进一步地分为统一资源定位符(URL)、统一名称(URN)或两者的结合[3]。ISBN号就只是一个URN,而telnet://192.0.2.16:80/则是一个URL。在语义网语境下,URI可被视为定位符,不仅可以标识一个资源,而且能够提供该资源的定位信息。

2.2 访问与获取

严格意义上,URI本身并不总是提供资源的访问信息,它只对资源标识提供保障。同样地,在语义网语境下,URI同时作为统一名称和定位符而存在,它不仅命名了该资源,还提供了定位该资源的主要访问机制。如http://www.ietf.org/rfc/ rfc3986.txt,不仅标识定位RFC3986这份文档资源,也可以通过HTTP协议进行访问并获取相关内容。

2.3 参引

参引是指为了获取引用资源的相关信息,在万维网上查找URI的过程[5]。可参引的URI提供了使用任何网络传输协议获取被标识资源的表示形式的信息检索机制。如,传统网页检索中,对URL的参引可以直接返回HTML页面。而在关联数据环境中,对URI的参引可以返回HTML、XML或JSON等形式。因此,参引一个URI,将指向一个资源的描述,这个描述中可能会有更多的URI链接,同时这些URI也是可参引的,最终个体资源互相关联形成一个数据网。

2.4 规范控制

规范控制是图书馆编目工作中的重要一环,通过建立规范检索点保障书目系统中重要属性描述的一致性,满足用户查找、识别、提供情境、证明、选择和探索等需求。传统的规范控制工作是运用信息资源标目法,确定人名、团体、地名、题名、主题等检索点及其规范形式,同时建立和维护规范文档的过程[6]。但随着信息爆炸和载体类型的多样化,严格的规范控制工作对于人工来说已不堪承受。

规范控制的本质是实现基于概念的描述和匹配,即利用表征概念体系的符号体系构建一个概念空间。而以RDF为基础的关联数据技术,其目的正是构建概念化的知识空间[7]。URI标识的实体概念将独立于其表示形式,各种语言或符号的表达都可以作为标签属性。URI就是传统的标目,任何形式的符号在检索和显示中都将具有相同的优先级。而概念之间的语义关系,也可以通过RDFS、SKOS、OWL等编码模式得到清晰的描述。另外,URI可以标识任何对象,也就是说书目数据中的任何属性都是可控制的,传统意义上的规范数据将得到极大的丰富。在元数据生产过程中,规范控制也将无处不在。

3 URI设计与应用案例分析

在关联数据实践中,为每一个对象分配唯一标识符URI至关重要。URI确保了被标识对象的识别、定位、参引、重用和规范控制。因此,设计一个“酷”的URI成为必须。“酷”URI不仅为人机提供描述,同时也应该简洁、稳定和易于管理[8]。为此,政府部门、图书馆和W3C等机构团体都对URI设计原则和模式进行了研究。

3.1 URI标识资源类型

URI标识的对象不仅有传统的网络资源,如网页、图片、视频等;也包括了人、团体、作品、时间、概念等非网络资源,相对于网络信息资源,这些“真实世界的事物”统称为非信息资源[9]。由于标识对象类型的不同,因而在后续的设计模式与技术实现环节会有不同的处理方式。因此,在制定URI设计原则时,首先需要对URI类型进行区分。

按照被标识对象的类型,URI可以简单分为信息资源URI(Resource URI)和非信息资源URI(Thing URI)。但在实践过程中,由于数据类型的多样性,URI类型会进一步地细分。Sonya Abbas和Adegboyega Ojo就综合已有的URI设计实践将URI分为了6种类型:事物URI(Thing URI),概念URI(Concept URI),资源URI(Resource URI),表达URI(Representation URI),分层URI(Hierarchical URI)和本体URI(Onto URI)[10]。其中,概念URI标识的对象主要是抽象的概念、主题;表达URI是与内容协商机制有关的URI,具体内容将在3.3中加以说明;分层URI更多的是出于结构角度而非标识对象类型角度分类,表示了URI的层次结构。

具体到图书馆领域,W3C图书馆关联数据孵化小组根据数据的使用特性将图书馆数据分为三类:数据集、元素集和属性值词汇。数据集是结构化元数据的集合,用来描述实体,主要即为书目数据集。元素集定义了描述实体的类和属性,如FRBR、BIBFRAME等。属性值词汇定义元数据记录中资源(如主题、艺术类型、作者)元素的属性值范围,如LCSH、VIAF、DDC等[11]。

3.2 政府及机构URI设计原则与应用

作为关联数据最主要的推动者,W3C在2008年即发布了有关 URI实施的指导性文件 Cool URIs for the Semantic Web[8]。2011年,W3C又发布了政府关联数据URI设计的最佳实践,提出了3条基本原则:使用HTTP URIs,提供至少一种机读格式和不使用变量字符串,以及URI稳定性和国际化的要求[12]。

2007年,欧盟空间信息基础设施建设(INSPIRE)2007/2/EC指令提出“拥有通用结构的空间对象标识符在各国系统间的映射可以确保互操作性”[13],从政策方面阐述了URI设计原则和模式的必要性,推动欧盟成员国制定国家层面的设计原则。2012年“欧洲公共机构互操作性解决方案”(InteroperabilitySolutionsforEuropean Public Administrations,ISA)发布了由Phil Archer等人编写的关于永久性URI的研究报告[14]。该报告从URI格式、设计原则和管理三个方面对欧盟机构及其成员国、国际性组织和文化遗产领域进行了调研。在此基础上,Phil Archer提出了URI的建议模式和原则。其URI模式为http://{domain}/{type}/{concept}/{reference},基地址{domain}由服务器地址和政府类型组成,如education.data.gov.uk;{type}是表明被标识对象类型的词汇,如id表示非信息资源,doc表示信息资源,def表示本体概念,set表示数据集;{concept}表示具体对象集合,如 person、road、school等;{reference}表示标识符。URI设计原则共10条,具体内容见表1。

表1 欧盟ISA的URI设计原则[15]

2009年,英国发布了政府部门URI设计原则Designing URI Sets for the UK Public Sector,并于2014发布新版的URI Patterns[15]。英国政府关联数据的URI类型除有非信息资源URI、信息资源URI、规范词表URI(包含规范数据、取值词表和本体)和数据集URI外,还定义了URI集 URI(URI set URI)。它提供了关于URI集合的管理元数据信息,如URI集的时空信息、主题范围、出处、数据质量等。在其他机构复用 URI时,URI集URI能够提供背景信息,保证数据的权威性和可追朔性。英国政府各类型URI的模式见表2。

表2 英国政府开放数据URI模式[15]

在参考英国政府2009年的实践后,澳大利亚政府于2014年发布了自己的URI设计原则[16]。澳大利亚政府关联数据将URI分为数据集URI、非信息资源URI、信息资源URI和本体URI等4种类型,同时从数据集URIs、域名结构、URI模式、URIs发布和URI命名约定等5个角度规定了多达40条的原则,并将其分为必须、不可以、应该、不应该、建议、可以和可选各种等级。其中“必须”原则就有12条,如必须使用HTTP URI,至少提供一种机读格式和人工可读的HTML,URI的基地址是data.gov.au等。同英国的URI集URI类似,澳大利亚在原则 5—7中,以“应该”等级规定了为数据集URI提供出处、质量等元数据信息,并“建议”使用数据目录词表(DCAT)。澳大利亚政府关联数据建议的 URI模式见表3。

表3 澳大利亚政府开放数据的URI模式[16]

3.3 图书馆URI设计原则与应用

在图书馆领域,虽没有发布单独的URI设计文档,但在URI设计中都遵循了Cool URI的基本原则和统一的模式。2011年,大英图书馆将其书目数据发布为关联数据,其标识的对象有人、团体、家族、主题、事件、书目等。英国国家书目数据(The British National Bibliography,BNB)的URI按照非信息资源、信息资源、规范词表和本体分为了4类[17]。在BNB的URI设计中,将人、团体、家族和地点同时作为非信息资源和主题概念进行处理,两者的 URI采用不同的模式,并使用foaf:focus进行关联,具体内容见表4。

表4 大英图书馆URI模式

美国国会图书馆(Library of Congress,LC)于2009年将其规范数据发布为关联数据,截至目前,其关联数据词表已经包括规范部分、保存词汇表、MARC代码和取值词表与代码表4大类共54种[18]。LC的URI类型分为规范数据URI、取值词表URI以及本体URI。URI模式是http:// id.loc.gov/{type}/{concept}/{reference},其中type的取值有authorities、vocabulary和ontologies,Concept取值有 subjects、relators、preservation、roles等。

法国国家图书馆(Bibliothèque Nationale De France,BNF)在2011年将责任者、主题和作品发布为关联数据。BNF的URI类型分为了非信息资源URI(包含规范数据URI)、本体URI和取值词表URI[19]。非信息资源URI模式为http://data.bnf.fr/ark:/12148/{reference},本体URI是http://data.bnf.fr/ontology/bnf-onto/,取值词表URI是http://data.bnf.fr/vocabulary/{type}/{reference}。其他图书馆,如德国国家图书馆、日本国会图书馆的URI设计模式基本相同[20]。表5对部分图书馆关联数据项目的 URI类型进行了统计。

表5 图书馆关联数据项目URI类型统计

4 上海图书馆的URI设计原则

参考已有的设计原则和Sonya Abbas、Adegboyega Ojo的URI设计模式,上海图书馆确定其URI设计原则为:无变量、稳定性、使用 HTTP URI、可读性和国际化。

4.1 无变量

无变量即为保持URI的稳定和可靠,在URI字符串中应避免使用文件扩展名、所有权信息、版本信息等变量内容,避免包含主题词、自动增量,避免与具体时间的技术捆绑。如 http://example.com/people/v01/123456、http://example.com/ people/123456.rdf就不是“酷”的URI。

URI一般由三部分组成:访问资源的命名机制,存放资源的主机名和资源自身的名称或路径。接下来就是两个可选部分,以“?”开头的查询字符串和以“#”开头的片段标识。其中,查询部分是没有结构的字符串,其语法、语义取决于具体的应用,没有统一规定。因此,此部分不应出现在URI的构成中,即避免与具体的技术捆绑。

4.2 稳定性

研究发现学术出版物的URL在发布7—10年后,有一半会失效[21]。图书馆作为人类文化知识的保存和传播中心,在发布数据时,应该为标识对象分配稳定长久的URI,以确保资源长久地可获取和重用。因此在URI设计中应遵循一致的表达、统一的模式,并复用已有的内部标识符。如美国国会图书馆的 URI统一模式为 http:// id.loc.gov/{type}/{concept}/{内部标识符},“鲁迅”的URI是http://id.loc.gov/authorities/names/ n50047988,n50047988即为LC/NACO的内部标识符。

4.3 使用HTTP URI

URI语法[3]规定其以表示资源访问协议的[schema:]开头,常见的有http、ftp、mailto、file等。依据关联数据四原则[2],选用HTTP作为URI的访问协议。HTTP作为主流的网络传输协议,保证了最广泛的工具和系统可以访问。任何资源均可由 URI标识。因此,当客户端参引 HTTP URI时,需要根据所标识对象的类型和表示形式支持303转向和内容协商机制。

4.3.1 支持303转向

由上文已知,URI标识的对象可简单地分为非信息资源和信息资源。当参引信息资源URI时,服务器端直接返回请求的网页。而非信息资源URI不可以被直接参引,服务器会返回303 See Other的状态码给客户端,表示“这是一个非信息资源,因此无法为您提供资源本身,但可以为您提供一些链接,帮助您获得更多相关信息”。这个过程就是303重定向。

另外,非信息资源URI有两种形式,Hash URI和Slash URI。Hash URI一般用于小型的相对稳定的数据集,在参引Hash URI时,HTTP客户端通过剥离#后面的部分而返回整个URI,以达到类似于303重定向的效果[5,8];Slash则适用于大型的、经常进行更新的数据集。澳大利亚政府URI文档中建议,当关联数据发布机构对域名、web服务器拥有控制权,并且数据集中的实体数量较多时使用Slash URI,否则使用Hash URI[16],如图1所示。

图1 Hash URI和Slash URI的选择流程[16]

4.3.2 内容协商

一个URI标识的资源可以有不同的表示形式,如HTML、RDF、PDF等格式,或不同的语种。因此,当客户端参引URI时,服务器端需要根据其发送请求的HTTP报头返回合适的表示形式。图2显示了参引非信息资源URI时303重定向和内容协商的结合。

图2 303重定向与内容协商[5]

如参引法国国家图书馆“维克多·雨果”的URI http://data.bnf.fr/ark:/12148/cb11907966z,就会303重定向到http://data.bnf.fr/11907966/ victor_hugo/,并根据HTTP报头进行内容协商返回合适的格式[19]: http://data.bnf.fr/11907966/victor_hugo/fr.html http://data.bnf.fr/11907966/victor_hugo/en.html http://data.bnf.fr/11907966/victor_hugo/rdf.xml http://data.bnf.fr/11907966/victor_hugo/rdf.n3

4.4 可读性

URI作为标识对象实体的一组字符串,在保障唯一性和稳定性的前提下,需要简短易记、利于人读、同时尽量使用小写字母(本体中的类名除外),以便于管理和使用。

4.5 国际化

URI的使用是全网域的,为了便于URI的复用和解析,应使用UTF8编码,不使用特殊字符,如汉字、下划线等。

5 上海图书馆的URI设计模式

在设计URI模式时,首先需要考虑本馆的数据类型,据此进行URI类型的划分。再根据URI设计原则,制定适合的URI模式。

上海图书馆关联数据项目包括了家谱数据、盛宣怀档案数据和书目数据,以及本体、实体数据、规范数据和取值词表等。因此,该馆将URI分为6种类型:数据集URI、本体URI、规范词表URI、取值词表URI、非信息资源URI和信息资源URI。数据集URI是用于特定资源的URI,如家谱数据集URI;规范词表URI主要标识对象为主题、分类等;取值词表URI主要标识对象为责任方式、版本类型、装订方式等取值词汇;非信息资源URI,即标识人、地、时、团体等实体对象的URI;信息资源URI则标识作品、实例、单件等对象。

5.1 总体设计模式

根据上文调研结果,在URI设计模式中,一般将要标识的对象分为本体词表、规范词表、非信息资源、信息资源、取值词表等类型。根据URI设计的5条原则,上海图书馆的URI模式由域名(domain)、要标识的对象所属的类型词(type)、本体中的概念(concept)或取值词表中的术语所属的类型词(termtype)、内部唯一标识符四个部分组成:http://{domain}/{type}/[concept][termtype]/{IRI}。各部分内容如下。

(1)domain=Base URI+[dataset prefix]。当所发布的数据为诸如机构、地名、时间等通用的规范数据时,dataset prefix省略,详见表6。

(2)type的取值详见表7。

(3)concept或type。concept取本体中的类名,type为自定义的类型词。如,edition表示版本取值词表,person表示非信息资源的人,work表示信息资源的作品。

(4)IRI,系统唯一内部标识符。由于上海图书馆历史数据的规范控制不完善,资源与实体没有统一的内部标识符。因此,在新发布的关联数据中,为每一个对象重新分配了系统唯一标识符。根据数据的不同,IRI分为两种类型,一种是标识本体、规范数据和取值词表,另一种是信息资源和实体。前者使用术语的英文或拼音形式,后者使用16位随机符号,由26个小写字母和1至9数字的混合。这即遵循了无变量和国际性的URI设计原则,也保证了IRI有足够的冗余量。

表6 上海图书馆URI模式domain示例

表7 上海图书馆URI设计模式中的标识对象所属类型词(type)定义列表

5.2 数据集的URI设计模式

数据集URI主要标识对象是特定数据集,如家谱数据集、名人档案数据集、书目数据集等。URI模式为http://data.library.sh.cn/{dataset}/。dataset是数据集类型词汇,如家谱数据集URI为http://data.library.sh.cn/jp/。

5.3 本体词表的URI设计模式

本体URI作为一种非信息资源URI,有Hash和Slash两种形式。而上海图书馆的本体词表,包括家谱本体、书目本体、档案本体等,将共用一个域名。该本体词表将是一个不断更新和进化的大型词表。另外,作为该本体词表基础的BIBFRAME使用了Slash形式。因此,上海图书馆的本体URI使用 Slash,模式为:http://{domain}/ ontology/[class][property]。其中,Class是首字母大写的类名,如http://www.library.sh.cn/ontology/ Person;Property是首字母小写的属性名,如http://www.library.sh.cn/ontology/name。

5.4 规范数据的URI设计模式

规范数据URI主要标识对象是主题和分类。URI模式为:http://{domain}/authority/{termtype}/{term}。Type是主题分类的类型,如FDC表示四部分类法,LGJ表示刘国钧分类法。Term是主题分类术语,如”jing”表示四部分类法中的“经”。完整的URI模式如:http://data.library.sh.cn/authority/ FDC/jing。

5.5 信息资源的URI设计模式

信息资源URI主要标识对象是作品、实例、单件等。URI模式为:http://{domain}/resource/{concept}/{IRI}。其中,Concept表示资源类型,如work表示作品,item表示单件;IRI为16位字母和数字随机组合的内部唯一标识符,如http:// data.library.sh.cn/jp/resource/work/ullep7uwac4n 8cbt标识了题名为“敖氏支修家譜”的家谱作品。

5.6 非信息资源的URI设计模式

非信息资源URI主要标识对象是人、地、时等。URI模式与信息资源 URI相同,如 http:// data.library.sh.cn/entity/person/mwe1ui6bww62a4 l7标识了姓名为“敖开甫”的实体人。

5.7 取值词表的URI设计模式

取值词表的URI主要标识的对象是属性的取值,属性的取值范围限定在一个特定的词汇列表。根据取值词表的适用范围,上海图书馆将取值词表分为通用取值词表和专用取值词表。前者如版本类型的取值词表包括“石印本”“木活字本”“铅印本”等,装订方式的取值词表包括“经折装”“蝴蝶装”“散叶”等;后者如先祖类型为家谱专用取值词表,其取值词表包括“始祖”“始迁祖”等。

上海图书馆的取值词表URI模式为:http://{domain}/vocab/{termtype}/{term}。通用取值词表的 doamin为 BaseURI,专用取值词表为BaseURI+dataset prefix。termtype表示取值词表的类型,如 ancestor表示先祖,edition表示版本。term为取值词的拼音全拼,中间用中划线分隔。如,先祖类型的取值词“始迁祖”的URI为http:// data.library.sh.cn/jp/vocab/ancestor/shi-qian-zu,装订方式的取值词“经折装”的 URI为 http:// data.library.sh.cn/vocab/binding/jing-zhe-zhuang。

表8列举了按照URI设计规范上海图书馆家谱关联数据中各类型资源URI的设计模式。

表8 上海图书馆家谱URI设计模式

6 结语

随着关联数据在图书馆、档案馆等文化遗产机构的广泛应用,将会有更多的文化遗产资源与实体数据链接到关联开放数据的云图之中。URI作为其基础技术之一,是标识世间万物的重要手段。永久稳定的URI,保证了被标识对象的可访问和重用,这符合图书馆的目标和职责。因此,图书馆在实施关联数据项目时,可参考国内外关联数据应用中URI设计模式所遵循的总体框架和最佳实践,再根据实际需求制定适合本馆的URI设计模式,保证项目实施的一致性和稳定性,促进资源的全网域共享和融合。

1刘炜.关联数据:概念、技术及应用展望[J].大学图书馆学报,2011(2).

2Berners-Lee,T.Linked Data[EB/OL].[2016-02-22].http://www.w3.org/DesignIssues/ LinkedData.html.

3Uniform Resource Identifier(URI):Generic Syntax[EB/OL].[2016-02-22].http://www. ietf.org/rfc/rfc3986.txt.

4孙坦,等.国家图书馆数字资源唯一标识符规范和应用指南[M].北京:国家图书馆出版社,2010:37.

5Chris Bizer,et al.How to Publish Linked Data on the Web[EB/OL].[2016-02-22].http:// wifo5-03.informatik.uni-mannheim.de/bizer/ pub/LinkedDataTutorial/#relationaldata.

6万爱雯,周建清.图书馆资源建设与编目工作研究[M].北京:当代中国出版社,2013:108.

7刘炜,等.万维网时代的规范控制[J].中国图书馆学报,2015(3).

8Leo Sauermann,Richard Cyganiak.Cool URIs for the Semantic Web[EB/OL].[2016-02-22].http://www.w3.org/TR/cooluris/.

9Rhys Lewis.Dereferencing HTTP URIs[EB/ OL].[2015-09-03].http://www.w3.org/ 2001/tag/doc/httpRange-14/2007-05-31/HttpRange-14#sec-information-resources.

10Sonya Abbas,Adegboyega Ojo.Applying Design Patterns in URI Strategies-Naming in Linked Geospatial Data Infrastructure[J/OL].[2015-09-03].http://ieeexplore.ieee.org/stamp/ stamp.jsp?tp=&arnumber=6758863.

11图书馆关联数据孵化小组:数据集、属性值词汇及元数据元素集[EB/OL].[2015-09-03].http://iskocn.org/lld/LLD_Datasets_ Report_zh.html.

12223 Best Practices URI[EB/OL].[2015-09-03].http://www.w3.org/2011/gld/wiki/223_ Best_Practices_URI_Construction.

13INSPIRE Directive(2007/2/EC)[EB/OL].[2015-09-03].http://eur-lex.europa.eu/ LexUriServ/LexUriServ.do?uri=OJ:L:2007:108:0001:0014:EN:PDF.

14Phil Archer,et al.Study on persistent URIs, with identification of best practices and recommendations on the topic for the MSs and the EC[EB/OL].[2015-09-03].http://philarcher. org/diary/2013/uripersistence/.

15Stuart Williams.URI Patterns[EB/OL].[2015 -09-03].https://github.com/UKGovLD/URI -patterns-core/blob/master/URI%20Patterns. md#reference.URISetsV1.

16Australian Government Linked Data Working Group.URI Guidelines for publishing linked datasets on data.gov.auv0.1[EB/OL].[2015-09-03].https://github.com/AGLDWG/TR/ wiki/URI-Guidelines-for-publishing-linkeddatasets-on-data.gov.au-v0.1.

17British Library URI patterns[EB/OL].[2015-09-06].http://www.bl.uk/bibliographic/pdfs/ british_library_uri_patterns.pdf.

18编目精灵.LC关联数据服务:数据集现状(2015)[EB/OL].[2015-09-06].http:// catwizard.net/posts/20150825140838.html.

19French National Library,Semantic Web and Data Model[EB/OL].[2015-09-06].http:// data.bnf.fr/en/semanticweb.

20小河尘.URI设计模式[EB/OL].[2015-09-06].http://1drv.ms/1XsAHEw.

21ANDS Guides.Persistent Identifiers[EB/OL].[2015-09-06].http://ands.org.au/guides/ persistent-identifiers-working.html.

(许磊 馆员 上海图书馆,夏翠娟 高级工程师 上海图书馆,刘炜 研究员 上海图书馆副馆长,张磊 高级工程师 上海图书馆)

URI Design Patterns in the Context of Linked Data

Xu Lei Xia Cuijuan Liu Wei Zhang Lei

As one of the basic technologies of the semantic web,Uniform Resource Identifier(URI)is a crucial approach to identify resources on the internet.Different from the common Uniform Resource Locator(URL),URI is a generic concept to regulate the internet resource identification system and provide basic identification and resolving methods for linked data technology.The linked data applications have just started in its infancy. So it is necessary to promote the implementation of related technical specifications and to exchange relevant practices.Three aspects of URI design best practices in abroad,including URI types,design principles and patterns,are introduced in accordance with the related URI design principles of World Wide Web Consortium(W3C).Finally,this paper gives an explicit explanation as the best practice of URI guidelines for the linked open data applications in Shanghai Library.2 figs.8 tabs.21 refs.

URI Patterns;Unique Identifier;Linked Data

2016-08-26

* 本文系国家哲学社会科学基金青年项目“W3C的RDB2RDF标准规范在关联数据服务构建中的应用”(项目编号:13CTQ008)的研究成果之一。

猜你喜欢
词表标识符设计模式
基于底层虚拟机的标识符混淆方法
“1+1”作业设计模式的实践探索
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
三维协同设计模式下的航天项目管理实践与展望
基于区块链的持久标识符系统①
交通机电工程设计模式创新探讨
科研人员唯一标识符的理论研究现状剖析
数字图书馆推广工程唯一标识符体系构建研究*
互动式设计模式研究
国外叙词表的应用与发展趋势探讨*