从FRBR-LRM到IFLA LRM

2018-11-02 01:16
山东图书馆学刊 2018年5期
关键词:单件名称实体

蔡 丹 罗 翀

(国家图书馆,北京 100081)

1 引言

1961年,著名的“国际编目原则会议”所确立的《巴黎原则》曾对国际编目的规范化和标准化产生过深远的影响。此后,图书馆资源从数量到类型的迅猛增长,机读目录的异军突起,读者需求的与日俱增,都迫使业界重新审视《巴黎原则》对编目环境的适应度,确立国家级记录的“基本要求”以解决编目积压和促进书目信息交换成为一种新的思路,《书目记录的功能需求》(Functional Requirements for Bibliographical Records,简称FRBR)应运而生。在其影响下,《规范数据的功能需求》(Functional Requirements for Authority Data,简称FRAD)和《主题规范数据的功能需求》(Functional Requirements for Subject Authority Data,简称FRSAD)随之产生,三者均以“实体—关系”(Entity-Relationship)为框架建立模型,将对书目领域的研究延伸至规范控制领域,由此构成了彼此补充,相互联系又各自独立的“概念模型家族”。

然而,分立建模也存在明显的局限性,主要表现在:即使针对相同的问题,其界定及处理方法也存在差异;平面结构使模型重复冗赘;在一个编目系统中同时使用三个模型存在障碍等。对模型的统一与完善由此提上了日程。模型的统一版编制由FRBR评估组下属的统一版编辑组(Consolidation Editorial Group,简称CEG)负责。该项工作始于2013年,经过三年的努力,2016年2月模型草案编制完成,并被命名为“FRBR图书馆参考模型”(FRBR-Library Reference Model,简称FRBR-LRM)。草案于2016年5月进行了全球评审,CEG随即汇总反馈意见并着手修改草案。修改之后的草案以新名称“IFLA图书馆参考模型”(IFLA-Library Reference Model,简称IFLA LRM)示人,并提交至IFLA专业委员会审议。2017年8月,IFLA LRM最终获得批准并正式发布。

除名称变化之外,相较于草案,正式版在框架结构、实体定义、属性特征、关系类型等方面均有一定程度的变化。IFLA LRM是概念模型,虽不能直接作为编目规则使用,但却是制定编目规则的基础。基础发生变化,势必会对编目规则的修订产生重大影响。可以预见,以FR家族为基础的国际编目规则——《资源描述与检索》(Resource Description and Access,简称RDA)即将依据IFLA LRM进行大规模修订。

从草案到正式版,多方面的变化值得总结,变化背后的原因更值得思考。笔者通过对草案和正式版的详细比对,洞悉两者差异,探究变化原因,以期促进IFLA LRM的未来研究,进而明确其即将对编目规则的修订带来的影响。

2 主要变化

2.1 名称的变更

从草案到正式版,最显著的变化莫过于名称由“FRBR-LRM”改为“IFLA LRM”。变化背后其实有着多方面的考虑:首先,FRBR本身的含义具有明显的局限性。“FR”指功能需求,容易误导理解为计算机系统的需求,而“BR”指书目记录,但是模型实际上已经涵盖了整个书目世界,其范围已远远超出了“书目”的范畴;其次,该模型是FR家族三模型的合并版,如果名称上仅出现FRBR,则FRAD和FRSAD的信息无法体现。目前,图书馆、档案馆、博物馆等正寻求使用统一的信息组织标准,RDA就是一个突破图书馆藩篱的范例,但是模型之所以依然保留了“图书馆”(Library)的字样,是因为计划为这几类机构分别建模之后,再建立跨界的统一版。为了清晰表达模型依然仅应用于图书馆范畴的内涵,正式版还增加了一个副题名“书目信息的概念模型”(A conceptual model for bibliographic information)。

2.2 框架体系的变化

从整体结构来看,正式稿变化并不大,仅增加了第七章“建模术语词汇表”,将草案中的第七章“参考来源”变为第八章,且章名变为“参考概念模型”。然而,纵览模型全文框架体系,还是可观诸多变化:

2.2.1 整体结构更逻辑化

为了提升模型的逻辑性,正式版中添加了若干汇总性的表格,便于用户概览。最主要的是在正式版4.2(属性)和4.3(关系)部分添加了若干表格,分别是表4.3(属性层级表)、表4.6(关系层级表)、表4.5(按名称排序的属性索引表)、表4.8(按域排序的关系索引表)。添加之后使属性和关系的文本变为,正式内容的列表之前是层级表,正式内容的列表之后是索引表。这样的结构无疑大大增加了文本的逻辑性,使属性和关系得到很好的归纳总结,从而一目了然。

关于层级表,模型认为由于实体具有层级结构,附着于实体的属性和关系也因此具有层级特征。其中属性层级表部分内容如表1所示。

模型将顶层实体“Res”的属性“类别”列为顶层属性(第3列),该属性可被分为子类型,从而为“Res”实体的子类实体(如作品、内容表达、载体表现、单件)提供“类别”属性,而这些子类实体的“类别”属性被列为低层属性(第4列),其他属性由于不是某个属性的子类型,因此模型将其均列于顶层属性。关系层级表的部分内容如表2所示。

模型认为只有与顶层实体“Res”相关的关系才是顶层关系(第1列),其他所有关系都是顶层关系的细化,均属于第2层关系(第2列)。为使列表更为紧凑,模型仅列出了关系名称(第3列),未列出反向关系名称。

关于索引表,模型将属性按名称进行排序,将关系按关系中的领域的编号进行排序。其中属性索引表的部分内容如表3所示。

表1 属性层级表[1]

表2 关系层级表[2]

表3 属性索引表[3]

表4 关系索引表[4]

表格按属性名称的字母顺序排序,列于第1列,当不同实体的属性名称相同时,再按实体编号排序。后面三列分别列出了相应的属性编号、所属实体编号以及实体名称。关系索引表部分内容如表4所示。

模型根据关系中作为领域的实体编号对关系进行排序(第2列),领域实体相同的,再按关系名称的字母顺序排序,若仍相同,进而按关系中作为“范围”的实体编号排序。第1列是关系编号,如果是反向关系,则在关系编号后加“i”,如“LRM-R12i”是“LRM-R12”的反向关系,即“Res是作品的主题”,其对应的正向关系是“作品有主题Res”。

调整模型的编号体系可以说是正式版提升逻辑性的又一举措。在草案中,属性的编号体系构成为“模型名称—属性序号”,所有属性不标识其所隶属的实体,均按序号进行大排序,如实体“内容表达”的属性“数量”的编号为“LRM-A6”,实体“载体表现”的属性“载体类别”的编号为“LRM-A13”。在正式版中,属性编号体系构成变为“模型名称—实体编号—属性序号”,如上述为“LRM-A6”的编号变为“LRM-E3-A2”,“LRM-A13”变为“LRM-E4-A1”。新的编号体系既直接表明了属性所隶属的实体,还间接反映了每个实体所定义的属性数量,模型的逻辑性和文本的可读性由此大大增强。

2.2.2 标识符更明确化

模型中提供了大量样例,样例标识符的合理使用能够使用户更好的理解模型中纷繁复杂的概念。正式版对样例标识符的修订主要体现为两点:一是,“Res”实体的实例置于大括号内这一做法得以全面落实,草案中只有“Res”实体的实例加了“{}”,正式版为其他实体中表示“Res”实例的样例均添加了“{}”;二是,正式版为实体“名称”(Nomen)新增了一个属性,即“名称字符串”(nomen string),为了将其与“名称”实体的实例加以区分,正式版规定将代表“名称”实例的术语置于单引号内,而将“名称字符串”属性的值置于双引号内。例如,‘Agatha Christie’是指代实体“个人”{the person Dame Agatha Christie,Lady Mallowan}的“名称”,而拉丁字母字符串“Agatha Christie”是“名称”的属性值。

值得注意的是,“Res”可以理解为表象背后的本质,是最抽象的概念,在正式版中,“作品”“个人”“集体代理”“地点”和“时间段”几个实体均可归入“Res”,因此需添加“{}”,而“内容表达”“载体表现”“单件”几个实体不能视为最抽象的“Res”,而是与“作品”相关联的具象化的实体,因此这些实体的实例没有添加“{}”。另外,“Res”与“名称”以及“名称字符串”之间的区别和联系也至关重要。“Res”是事物本质,其实例需要通过与其相联系的实体“名称”来指代,而“名称”又需要通过“名称字符串”这一属性来识别。

此外,在定义关系时,正式版修改了名称术语,将原来的“正向关系”全部改为“关系名称”。笔者认为原来“正向关系”与“反向关系”相对应,似乎二者地位对等,修改之后,则打破了对等地位,而强调了从领域到范围的关系。

2.3 用户任务的变化

在用户任务方面,正式版与草案相同,仍然是“查找”“识别”“选择”“获取”和“探索”五项,内容上也无实质变化,仅对个别用户任务的定义及释义在措辞上进行微调。例如,将“查找”和“识别”任务中的“实体”(entities)均改为“实体的实例”(instances of entities),这一变化更符合用户检索行为的实际情况。又如,在“选择”任务的定义中删去了与用户任务本身重复性的文字“选择”,使文字更加凝练,同时在其释义“……从而让用户做出决定”之后添加了“并付诸行动”(act on it),因为“选择”的目的不是决定而是行动。再如,草案中“探索”任务的定义表述为“To use the relationships between one resource and another to place them in a context”[5],而正式版表述为“To discover resources using the relationships between them and thus place the resources in a context ”[6],增加了反映任务目的性的短语“发现资源”,从而明确表达了“探索”的关键意义,不仅是“利用关系”,更重要的是要由此及彼,找到意想不到的资源。

2.4 实体的变化

正式版与草案相较,所定义的实体从名称到数量均未变化,仍为11个实体,发生变化的是某些实体的定义和范围注释。其中,定义发生变化涉及5个实体,有的变化仅是措辞上的微调,如“内容表达”定义中的“系列”(constellation)一词改为了“组合”(combination);有的是删除了部分文字,如“单件”定义中删除了“物理的”(physical)和“由制作过程产生的”(resulting from a production process),反映出单件不一定是物理载体,还可能是电子载体,也不一定是在制作过程产生,也可能自然存在,使其范围更加广泛;有的是增加了一些文字,如“集体代理”定义从原来的“作为一个单位活动”(acting as a unit)变为“能够作为一个单位活动”(capable of acting as a unit),强调了集体代理实施活动的能力,这样与实施责任关系的联系更紧密;有的是表述完全被改变,如“名称”的定义,草案中表述为“一个实体为人所知的名称”(A designation by which an entity is known)[7],正式版变为“一个实体及指代其的名称之间的关联”(An association between an entity and a designation that refers to it)[8],以关系的角度来表述“名称”的定义,从而更准确地表达了“名称”是实体“Res”与“名称字符串”之间纽带的内涵。

范围注释发生变化涉及9个实体,例如,“作品”的范围附注中增加了关于内容相似的不同作品的判定;“载体表现”的范围附注中增加了关于产生了新的载体表现的判定;“名称”的范围附注中引入了“名称字符串”属性,强调“名称”本质上是实体“Res”和字符串之间关系的具体化;“地点”强调了作为空间范围的地点和行政管辖区的区别;“时间跨度”增加了时间范围的精度等。

2.5 属性的变化

模型对属性定义的指导思想与草案相同,即尽量保持模型的通用性,提取实体具有高度代表性的属性,并非穷尽所有,也并非要求实体的所有实例都具备这些属性。从整体来看,模型所定义的属性数量没有变化,仍为37个,但其中删除了两个,增加了两个,此外,模型还重新定义了一些属性。

2.5.1 新增的属性

正式版新增了两个属性,分别是实体“作品”的 “代表性内容表达的属性” (representative expression attribute)和实体“名称”的“名称字符串”(nomen string)。

作为实体“作品”的新增属性,“代表性内容表达的属性”是指“对体现作品特征具有重要意义的属性,其值取自作品有代表性的或典型的内容表达”[9],例如,莎士比亚的作品“哈姆雷特”的一个“代表性内容表达的属性”是“语言”,其值为英语。关于该属性,模型在5.6有专门说明,涵盖了几层含义:一是,有代表性的内容表达通常是首个或原始内容表达,但由于某些作品内容表达衍生历史的复杂性,其代表性内容表达的属性可能并未出现在原始内容表达中,而是基于终端用户的文化推断和约定俗成;二是,该属性的值严格来说,涉及的是内容表达的特征而非作品的特征,但由于特征对描述和识别作品很有用,因此,相关内容表达属性的值可以名义上“转移”给作品并用于作品的识别;三是,该属性依作品类型而有所不同,且是多值的,例如,对于文本作品,“语言”“读者对象”可以作为代表性内容表达的属性;对于音乐作品,“调”“表演媒介”可被选作代表性内容表达的属性;对于地图作品,“地图比例尺”“投影”可被选作代表性内容表达的属性。

作为实体“名称”的新增属性,“名称字符串”是指“构成一个通过‘nomen’与某实体相联系的名称的符号组合”[10]。实体“名称”的字符串可以任何形式的标记符号来表示,如字母组合、数学符号、化学结构符号等。在真实世界里,同一实体可通过多个“名称”来指称(如同义词),而“名称字符串”属性的值在没有语境的情况下,对于不同实体的实例来说也有可能是相同的(如一词多义或同形异义)。但是,在书目系统的受控环境中,实体“名称”的属性“名称字符串”被消除了歧义,从而做到每个“名称字符串”仅与一个“Res”实体的实例相联系。

2.5.2 删除的属性

正式版删除的两个属性分别是实体“内容表达”的“代表性”(representativity)和实体“名称”的“状态”(status)。

“代表性”是指“说明被视为代表‘作品’的‘内容表达’是否实现”[11],仅有两个取值“是”和“否”,用于标记特定上下文中具有代表性的内容表达。该属性已经被正式版中“代表性内容表达的属性”所取代。

“状态”是指“‘名称’建立体系中‘名称’的状态”[12],其取值在自然语言中包括“废弃的”“文学的”“方言的”,在正式体系中包括“提议的”“临时的”“废弃的”“当前有效的”。不难看出,该属性属于管理型元数据,对图书馆终端用户任务没有影响,因此不在本模型范围之内,正式版中予以删除。

2.5.3 重新命名或定义的属性

正式版重新命名和重新定义的属性主要是文字表述上的一些变化,属性内涵并没有实质性的改变,但从表述来看更加恰当、准确。其中,重新命名的属性有4个,分别是“比例尺”(scale)变为“地图比例尺”(cartographic scale),有三个实体的属性名称从“权利”(rights)变为“使用权利”(use rights)。重新定义的属性有10个,基本都是措辞的微调,例如,“附注”的定义中删除了“文本材料”,突破了附注形式的局限性;“表演媒介”的定义中删除了与属性名称重复的文字,改为表述更准确的“演奏工具的组合(声音、乐器、合奏等)”;载体表现的“检索条件”和“使用权利”两个属性的定义中均将“载体”(carrier)改为“物理载体”(physical carrier),使概念表达更为具体;将名称实体的“语言”和“文字”两个属性中的“被表达”(is expressed)分别由“被证实”(is attested)和“被标记”(is notated)替代等。

2.6 关系的变化

模型正式版定义了36种关系,比草案多两种,同时对部分关系的定义进行了重新描述,并调整了很多关系的顺序编号。

2.6.1 新增的关系

正式版增加的两种关系分别是LRM-R25内容表达之间的集合关系(expression was aggregated by/aggregates expression)和LRM-R28单件和载体表现之间的复制关系(item has reproduction/is reproduction of manifestation)。

内容表达之间的集合关系被定义为“表明某个作品的一个特定内容表达被选作一个计划的集合内容表达的一部分”[13]。该关系有两层含义:一是,一个集合内容表达选择不同作品的特定内容表达集中在一起;二是,被选中的特定内容表达在一个集合载体表现中被一起具体化。该关系与原有内容表达之间的“整体—部分”关系有所区别,那种关系适用于那些所实现的作品本身就是整体—部分关系的情形,而新定义的关系中集合和被集合的内容表达所实现的作品并不存在整体—部分的内在特质。从模型所列出的样例可以发现,丛编就被认为是内容表达集合关系的一种体现,例如:丛编“IFLA series on bibliographic control”可以看作一个集合内容表达,它集合了“ISBD:International standard bibliographical description”2011年统一版的英文文本这个特定的内容表达。模型在5.7“集合的建模”中详述了集合作品、集合内容表达和集合载体表现之间的关联,本文不再赘述。

单件和载体表现之间的复制关系被定义为“向终端用户提供完全相同的内容,一个特定的单件为后来载体表现的创造提供来源”[14]。该关系强调的是作为复制来源的单件具有重要特征,如特殊的起源,或是特殊的所有权标记,或是有特殊的注释等。该关系不同于原有的载体表现之间的复制关系,那种关系通常指重印或再版,在选择复制来源时无需选择载体表现中的特定单件,即便是选择了特定单件作为复制来源,该单件也被认为代表的是载体表现的整体。

2.6.2 重述定义的关系

正式版对原有的10种关系的定义进行了重述,主要是措辞的变化或扩充,此外还包括两种关系方向的反转,但关系实质并未发生变动,其中变化较多的关系如“载体表现和代理之间的制作关系”(MANIFESTATION was produces by AGENT)变为了“生产关系”(MANIFESTATION was manufactured by AGENT),使其范围涵盖了工业生产及手工产品的范畴;“Res”和“名称”之间的关系定义中“为人所知的符号或符号组合”变成了“一个给定体系或环境中被赋予的符号或符号组合”,从而将对“Res”和“名称”的理解限定在了特定的书目环境之内,消除了理解上的歧义;作品之间的“整体—部分”关系,方向发生了反转,草案中的正向关系是“作品是整个作品的部分”,反向关系是“整个作品有部分作品”,而正式版中变为正向关系是“整个作品有部分作品”,反向关系是“作品是整个作品的部分,这样似乎更合乎常人的逻辑,即先说整体,再说部分;内容表达之间的整体部分关系亦发生了类似的反转。

2.7 其他变化

正式版除了上述变化之外,其他主要变化是在第5章增加了两个小节,分别是5.2“实体和校准之间的限制”和5.3“在线发行的建模”。前者主要说明了实体的不相交性,即某个实体的实例不可能同时是另一个实体的实例,对于由于人们对同一实例的不同理解而导致的认为其属于不同实体的情况,模型认为可以通过附加新的实体和关系进行模型的扩展。后者主要说明了在线发行过程中产生的单件、载体表现甚至内容表达之间的关联,在应用中,也可以通过附加“数字单件”实体对模型进行扩展,从而为数字发行情况建立更清晰的模型。

3 IFLA LRM对RDA的影响

IFLA LRM是FR家族概念模型的统一版。自1998年FRBR产生之后,编目界的变革有目共睹。可以预见,IFLA LRM的正式发布将对编目的未来产生不可忽视的影响,首当其冲的就是对RDA的影响。RDA的编制机构“RDA指导委员会”(RDA Steering Committee,简称RSC)已于2017年2月在其官方网站发布了一份声明,明确表示“要采用IFLA LRM作为修订RDA的概念模型,从而取代FR家族模型(FRBR,FRAD,FRSAD)…… RDA Toolkit的重构重建项目(RDA Toolkit Restructure and Redesign Project,简称3R)将以当前RDA实体和元素与LRM的兼容为目标,并将使用LRM来指导RDA Toolkit适应国际社区、文化遗产社区以及关联数据社区的修订。”[15]此外,RSC还就LRM的影响与其他相关工作组达成了协调机制,包括FRBR评估组、ISBD评估组、ISSN国际中心、PRESSoo评估组,以及UNIMARC常务委员会,保证信息互通。该声明还简要列出了一些RDA会作出的变化,如引入全新的实体——集体代理、名称和时间跨度,整合已经隐含的实体——代理和地点;将现有的个人、家族和团体实体作为代理和集体代理实体的子类,适当整合归纳相关说明;需要对RDA中个人的定义进行重大修改,将其范围限定在真实的人类,虚拟的、非人类实体以及责任说明中出现的笔名等交替名称的处理将列入新的“名称”实体予以说明;LRM允许属性和关系互换的方式使RDA元数据使用的范围得以扩展等。

RSC的上述声明发布时IFLA LRM尚未正式通过,但其认为最终版本不会有太大变化,决定将尽早启动修订工作。因此,目前在RDA Toolkit上已经出现了LRM的身影,RDA正文中已经引入LRM的实体“代理”,在相关章节都采用了新的术语,如第三部分“记录个人、家族和团体属性”变为“记录代理的属性”,第六部分“记录个人、家族和团体的关系”变为“记录代理的关系”,第九部分“记录个人、家族和团体之间的关系”变为“记录代理之间的关系”,附录I“关系说明语:资源和与资源相关的个人、家族和团体之间的关系”变为“关系说明语:作品、内容表达、载体表现和单件和与资源相关的代理之间的关系”,附录K“关系说明语:个人、家族和团体之间的关系”变为“关系说明语:代理之间的关系”[16]。此外,还在各部分的一般性规则中介绍了“代理”的概念。

然而,RDA的3R项目并非易事,RDA Toolkit已发布声明表示该项工作将于2017年4月正式开展,计划历时一年,将于2018年4月完成此次重大改版[17]。同时,RDA Toolkit的改版还希望广大使用者的参与并完善用户资料信息,“以用户为导向”的最高原则再次体现,让我们积极投身其中并拭目以待。

猜你喜欢
单件名称实体
现场电子音乐与单件乐器结合时的功能及其实现方式
西门子推出紧凑型视觉单件分离器
前海自贸区:金融服务实体
垂直层3D打印新技术助力波音制造单件大尺寸工装
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
沪港通一周成交概况
沪港通一周成交概况
沪港通一周成交概况