人名规范的语义描述与关联探讨

2017-11-14 10:57朱燕
西部论丛 2017年4期

摘 要:本文通过讨论互联网时代下规范控制的现实意义,分析了语义描述与关联在人名规范中的应用现状。分析了关联集成思路和形成基础语义描述词汇集之间的关系,对比中国机读格式,并以此为例,阐述了其发展的展望和建议。

关键词:规范控制 人名规范 语义描述 关联探讨

现阶段的开放性关联不单单与技术相关,还与开放政策管理有着极为紧密的联系,需要分步实施,是规范数据依托于自身的开放,与其余规范数据集成操作,从而构成开放网络数据的组成。实际应当分为以下几个阶段:其一,数据语义描述的规范;其二,和其余规范文档的互操作,分布式集成或者将VIAF作为中枢;其三,开放规范与书目数据,将其引入同步周期当中,对关联机制的改造升级有着极大的必要性。其四,集成广泛互联网资源,这是较为长远的目标。本文运用现存规范的著录规则与机读格式,设计出中文人名规范数据语义描述词汇集合。以往规范著录准则比较注重标目的唯一性与可识别性,并未综合考量其标目的利用程度,在选择标目附加成分的过程中会集中体现,包括顺序方面的选取。比如,生卒年为首要选择的附加成分,国别、性别、职业、活动领域如果出现生卒年不详,亦或是标目重复,可以根据上述顺序择一作为附加成分。这样一来能够充分的揭示这一中文人名,使相关应用的开展更为顺利。

一、人名规范的语义描述与关联描述

以往所设计出的机读规范格式主要目的是对书目进行标准化的检索。在实际工作当中,国家图书馆对附加成分有着较大的使用力度与范围,这与文中规范人名予以描述的目标相符。所以,在对规范数据MARC格式子字段与中字段开展语义描述的过程中,详细语义描述5XX与2XX中的附加成分子字段。

将FRAD和FRBR的实体分层与面向的对象当做重要思想,深入了解人名规范数据关联集成理念,对现阶段人名规范语义表征方式进行研究,结合人名特征,运用RDA第二组元素集、FOAF、OWL、SKOS这一系列词汇集,在框架RDF之中对人名规范数据语义词汇进行定义,从而能够和以往机读格式进行对比。文中在对语义描述定义的过程中,需要对现存的标准描述词汇集进行有效利用,在特殊情况当中,需要对已有词汇进行精细划分,杜绝新词汇的出现。以下结合数种词汇特征,以及它们的实用性,进行深入的研究。

其一,在对个人实体信息进行描述,或者对实体间伙伴关系进行描述的过程中,FOAF能够发挥有效的作用,能够对人际关系进行描述。在FOAF规范当中,foaf:name能够对人姓名进行定义,它的取值运用简易文本字符来进行定义,与面向对象概念建模观念有所出入。

其二,SKOS将概念作为中心,能够合理的区分出词汇与概念,能够配合FOAF来规范人名,从而使人名能够一致化与概念化的连接,对于词汇语言的别名,能够采取skos-XL来扩展。

文中采取概念化的方式来定义人名。将名称规范数据当做整体,运用VIAF本体当中所定义的viaf:authorityScheme当做skos:ConceptScheme的子类。在对人名规范数据进行语义描述的过程中,都具备相应的skos: inScheme。如此,任意语义描述词汇能够通过现存的描述规范進行连接,不会导致难以集成关联数据的情况发生。RDA第二组元素对家族、团体、人名等实体属性关系进行了一定的描述,能够直接性的予以采用。

由于人物名称有着非常复杂的种类,不仅包括艺名、笔名、网络昵称、曾用名,我国人名还包括缢名、号、字,并且有着极为庞大的数量。比如,在规范记录的过程中,鲁迅先生就有一百多个别名。现阶段社会所存在的人物都有一定的独特性,一系列的别名也只存在词汇方面的关联,不包含对语义关系的定义需求。此外,因为单单意味着同一名任务所拥有的词汇之一,因此相互之间并不具备直接性的关联性。所以,文中skosxl:altLabel属性之下对别名类型进行细分。在SKOS推荐准则当中,并不具备实际的skosxl: labelRelation关系类型,可以使用DC元数据限定词dcf:description来对该别名类型进行指明。除过关联化规范数据,还应当实现规范数据对互联网信息源进行优化,可以通过正反操作来进行实现。

二、建议与展望

对以往机读规范格式准则与著录准则进行参考,结合定制扩充对数据语义描述词汇集合来进行规划,对人名规范数据语义描述以及开放关联具备一定的可实施性,也需要为其余规范数据类型提供可以参考的方案,这样能够在术语资源库当中融入更庞大的数据,在今后可以运用更加丰富的术语应用服务。依托于规范数据MARC格式来设计语义词汇描述,因为世界范围内在选取附加成分标目的过程中,往往运用简洁明了的理念,针对责任者的附加信息,往往运用注释的方式来展现,因此将子字段亦或是子弹当做粒度来转化语义,势必会导致部分语义信息出现损失,很难进行相应应用于展示的开展。本文认为,在规范中文人名的过程中,不仅需要对标目的唯一性与可识别性进行综合的考量,还需要站在客户利用的层面上进行深入的分析。例如,需要全面的著录与解释附加成分,包括学科、职业民族、活动领域、国别、性别等,从而使人名规范的效用得到充分的发挥,这样也会对相关应用的有效开展提供重要的数据支撑。

参考文献:

[1] 郝嘉树,王广平. 中文人名规范的语义描述与关联探讨[J]. 图书情报工作,2012,56(14):47-51.

[2] 石燕青. 中文个人人名规范文档共享研究及语义化探索[D].山西大学,2016.

作者简介:朱燕(1980~),女,湖北潜江人,博士在读,讲师,研究方向:汉语言文字学。