段荣婷
(南京政治学院上海校区信息管理系,上海,200433)
近日,中共中央办公厅、国务院办公厅印发了《关于加强和改进新形势下档案工作的意见》,强调指出了要建立健全覆盖人民群众的档案资源体系,建立健全方便人民群众的档案利用体系[1]。而档案规范控制是档案知识管理的重要内容,关系到档案资源体系与档案利用体系等的建设。
对档案规范控制的研究可分别从档案专业视角与概念逻辑视角进行。
从档案专业视角对档案规范控制的实质进行分析,可以得出:
*档案规范控制是一种情报控制,能够确保档案情报价值的实现。档案规范控制是广义档案著录的重要组成部分(如下图1所示),它通过创建者著录,实现对实体(机构团体、个人或家族)名称检索点的控制。
*档案规范控制(主要是实体名称)是一种背景控制(如下图2[2]所示),能够确保档案凭证价值的实现。档案规范控制通过创建者来源背景的著录,实现对档案的前端乃至全程控制。档案规范控制的背景控制属性是档案规范控制区别于图书规范控制的核心,也代表着档案规范控制的发展方向。
从概念逻辑视角对档案规范控制的实质进行分析,可以得出:档案规范控制是对实体(机构团体、个人或家族)概念的控制[3],这也包括两个层面:
*概念的语义控制:档案规范控制通过对档案机构团体、个人或家族实体概念本身内涵的描述,及对档案实体之间、档案实体同信息资源之间外部关系的描述,来明确档案实体概念的语义。
*概念的语词控制:档案规范控制通过对档案机构团体、个人或家族实体概念名称的规范化形式的确定,来确保概念语词标识的唯一性,使标识与概念尽可能一一对应,从而达到控制检索点、提高检索效率的目的。
档案规范控制研究的档案专业与概念逻辑这两个视角均为档案工作者明确了实施档案规范控制的需求,即应侧重背景控制,为档案可信网的构建奠定基础;同时在情报控制方面,应侧重明确档案机构团体、个人或家族实体的概念体系,并将其形式化,即构建档案规范记录本体,为档案知识组织系统、语义网的构建奠定基础,为档案关联数据的利用奠定基础。
在档案规范控制理论的指导下,国际档案规范控制的实践应用也取得了较快进展。
国际档案规范控制应用主要体现于档案规范记录检索系统的构建,其总体上可分为两大类,即:档案规范记录嵌入集成式检索系统与档案规范记录专门独立式检索系统。
图1 档案规范记录与档案著录的逻辑关系示意
图2 档案规范控制与背景控制关系示意
档案规范记录嵌入集成式检索系统的典型代表是国际档案理事会的记忆存取(International Council on Archives“Access to Memory”,简称ICAAtoM)[4],及美国国家档案馆(NARA)最新的“在线公共存取”(Online Public Access,简称OPA)。此处以国际档案理事会的记忆存取(ICAAtoM)档案规范记录应用研究为典型案例。
国际档案理事会的记忆存取(ICAAtoM)档案著录开源软件是档案界目前唯一的国际性项目。ICAAtoM作为生成与发布规范记录工具的原因在于:
-该软件运行于网络环境;
-该工具使用简便,易于操作;
-规范记录的生成与其网上出版几乎是同步的;
-输入的数据既可被用户输出至 XML/EAC-CPF[5],亦可被重新输入至其它信息系统。
正是基于如下图3所示的数据模型,ICAAtoM能够提供规范记录(authority records)的添加(著录)、检索浏览等功能。
ICAAtoM的浏览页面,创建者的名称与其它执行者实体能够通过事件实体(同时还记录了同事件相关的日期与其它信息)由档案著录链向规范记录,提供名称(names)的检索入口项,检索结果以EAC格式输出,即支持规范记录输入与输出的EAC XML模板,提供与相关实体的关联链接。同时在ICA-AtoM中,创建者信息,如行政管理历史与存在日期等均保存于独立的规范记录中,并通过向现存或新建ISAAR(CPF)[6]规范记录链接而添加至档案著录。
图3 ICAAtoM的数据模型
档案规范记录专门独立式检索系统的典型代表则是美国等的社会网络与档案背景(Social Networks and Archival Context,简称SNAC)计划的成果。
2.2.1 SNAC规范记录原型检索系统的结构功能
(1)SNAC原型系统的基本检索结构与功能
SNAC原型系统提供了机构团体(Corporate)、个人(Personal),及家族(Family)档案规范记录(档案背景记录)的检索与浏览。
SNAC原型系统所提供的规范记录的基本检索途径包括以下:
①统一检索(search)框,可输入机构团体、个人或家族的名称或关键词(目前已有128,787个名称,所有名称以字顺索引排列);
② 名 称 索 引(A ll Names→Alphabetical Index),所有个人、机构团体和家族的名称均以字母排序;
③ 特 色 记 录 (Featured Records)列表,可通过个人、机构团体和家族名称的特色记录列表直接从中选择链接,从而实现快速浏览与检索;
④ 高 频 职 业 (Top Occupations)列表;
⑤ 高频主题(Top Subjects)列表。
其中②、④和⑤都随着机构团体、个人或家族具体选项卡的专指选择,而相应有所不同。
(2)SNAC原型系统的高级检索结构与功能
SNAC原型系统所提供的规范记录的高级检索功能包括以下:
①可通过限定匹配EAC-CPF的某著录项而精炼检索结果,如可仅检索
②通过职业(Occupation)或主题(Subject)缩检。
③通过关联款目(Related Entries)及其链接,提供档案检索与图情等资源检索两种科研功能。
2.2.2 SNAC规范记录原型检索系统的优点小结
SNAC的发展趋向是国家档案规范合作计划(National Archival Authorities Cooperative, 简 称NAAC),并成为国家档案规范基本 设 施 (National Archival Authorities Infrastructure)的有机组成部分。在档案规范控制及其合作发展方面,其具体优点可概括总结如下:
对于档案工作者而言,成功维护共享规范记录:
*能够最终实现档案规范控制。
*能够确保在著录中对同一实体名称使用的一致性。
*档案规范控制合作著录具有经济效益:
*共享的国家规范记录将是一个充实的历史资源库。
因此,对于档案利用者而言,档案规范记录是其工具书:
*能够统一集成检索存取利用分散的档案资源;
*能够获取档案文件及其它一切文化遗产资源的背景信息;
*能够获知实体(如人物)所生存与工作的社会-职业-情报网络;
*能够获取历史沿革或生平资源;
*不仅服务于学者,还满足于终生学习者对历史轶事、家谱等的好奇心。
从以上分析可知,档案检索系统建立规范记录是科学有效地开发档案信息资源的关键性措施。无论是档案规范记录嵌入集成式检索系统,还是档案规范记录专门独立式检索系统,它们都以特有的结构使其具有很好的检索功能,极大地优化了档案检索系统的检索效率。总体的,从其构建的共性中我们都可以得到有益的借鉴。
档案规范控制的国际实践证明,建立档案规范记录检索系统必须要标准先行,这也是档案规范控制应用顶层设计的重要需求。
国际档案规范记录标准化取得了快速发展,如美国档案就制定了符合国际标准《国际标准—团体、个人和家族档案规范记录(简称 ISAAR(CPF))》(第二版)[7]的《档案著录内容标准》(Describing Archives:a Content Standard(Second Edition)(DACS))(2013年最新的第2版),尤其是其将档案规范记录(Archival Authority Records)独立作为标准的第Ⅱ部分[8],加拿大也制定了《档案著录规 则 》(Rules for Archival Description)(2008年7月修订版),对人物、机关团体的标目及参照等进行了规范[9],再如欧洲档案门户网站则应用了符合国际标准ISAAR(CPF)的《团体、个人与家族档案背景编码》(Encoded Archival Context for Corporate Bodies,Persons,and Fam ilies,简称 EAC-CPF)[10],并将其最佳实践本地化为 apeEAC-CPF[11]。
目前,国内档案界也开始重视档案规范控制及档案规范记录标准化的理论研究[12],但在应用研究方面却仍有所欠缺。国内除香港、台湾(例如,明清档案人名权威系统[13]等)外,大陆地区仅有的档案著录参考依据——《DA/T 18-1999档案著录规则》,仅仅对著录进行规范,而没有相应的具体规范控制。这恐怕也就是我国目前档案计算机检索系统中缺乏规范记录检索途径的重要原因。
因此,根据国际档案规范记录应用及其标准化研究结论,建议必须遵循国际标准,为我国档案规范记录构建标准体系。
图4 三个世界视角下的档案规范记录著录概念模型的地位,档案规范记录著录的基本数据需求,及档案规范记录著录标准的逻辑关系示意
图5 档案规范记录概念模型
图6 档案规范记录数据模型实例化构建
实践证明,档案规范记录著录标准的制定,必须首先构建档案规范记录概念模型。从档案著录的三个世界视角来看,档案规范记录概念模型的逻辑作用如下图4[14]所示,即建立概念模型能够通过明确实体及其关系而明确档案规范记录著录的基本数据需求及最佳实践需求,并进而据此制定档案规范记录著录标准。
具体做法可以目前国际最权威的《规范数据功能需求(Functional Requirements for Authority Data,简称 FRAD):概念模型》(2013年修订)为依据,构建档案规范记录概念模型(如下图 5[15]所示)。
如上图所示的档案规范记录概念模型,实质是一种实体-关系方法,体现了著录实体同名称/标识符,及受控检索点之间的关联。如从档案文件背景及其凭证价值的角度可细化建立以下关系类型的概念模型:文件与机构团体、个人或家族实体的关系;机构团体、个人或家族实体与业务的关系,及机构团体、个人或家族实体之间的关系,等等。仅以人名规范记录文档与机构团体规范记录文档之关联为例,可具体构建档案规范记录数据模型如下图 6[16]所示:
如上所述,通过档案规范记录概念模型的构建,可以更清晰地分析出档案规范记录著录所涉及实体及其属性之间的关系。这为确定档案规范记录数据层面的功能需求奠定了基础。而档案规范记录系统的整体构建与实现不仅包括数据层面的功能需求,还包括系统层面的功能需求。综合档案规范控制的国际应用案例,档案规范记录需求规范的完整的内容要素如表1所示:
档案规范记录著录标准不仅需以实体著录的基本数据需求为基础,还需以国际标准ISAAR(CPF)为基础,即我国也有必要据此而制定出本土化的相关标准。我国档案规范记录格式标准不仅需要与本国的《DA/T 18-1999档案著录规则》相协调,更需同《国际标准——档案著录规则(总则)》(ISAD(G))等相对应。
我国档案规范记录需与相关的档案元数据(Metadata)格式相对应,应以国际标准ISAAR(CPF)(语义标准)结合EAC-CPF(语法标准)为基础,制定我国档案规范记录编码标准,并与EAD标准、“规范记录的功能需求与编号(FRANAR)”[17]等兼容与一致,并加强档案与图书、博物馆规范控制的互通[18]。
此外,目前国际上已有档案规范记录EAC-CPF本体应用的实践案例,如意大利档案界就通过档案规范记录EAC-CPF本体编码及外部RDF词表引用,实现了关联档案数据的检索利用。档案规范记录EAC-CPF本体应用代表着国际档案规范控制的最新发展趋势,即知识组织、语义网,这也应是我国档案规范记录及其标准化的重点发展方向。
广义地,档案规范记录是个体系,其标准化具有不断细化的特征,如国际档案规范记录标准,除ISAAR(CPF)外,还逐渐分化出《国际标准——档案职能著录规则》(ISDF)[19]和《国际标准——档案保管机构团体著录规则》(ISDIAH)[20]等,这就要求体系配套,也符合档案规范控制向背景控制发展的趋势。
一般而言,国际档案规范记录标准(如 ISAAR(CPF)、ISDIAH等)属于数据结构标准,国家档案著录规则(如《DA/T 18-1999档案著录规则》)属于数据内容标准,而具体的名称规范档(如《美国国会图书馆名称规范档》(LCNAF))、叙词表,及ISDF等则属于数据值标准。在我国规范记录标准制定与应用过程中,应在档案著录标准体系内做到数据结构标准、数据内容标准及数据值标准的配套[21],这也符合档案著录标准开发模型[22]。
*本文系2010年国家社科基金青年项目“网络环境下的档案规范记录系统研究”(批准号:10CTQ020)的研究成果之一。
表1 档案规范记录需求内容要素
[1]中共中央办公厅.国务院办公厅印发《关于加强和改进新形势下档案工作的意见》[EB/OL].[2012-07-19].http://www.saac.gov.cn/zt/2014- 05/04/content_44880.htm。
[2]Jean Dryden,From Authority Control to Context Control.Respect for Authority:Authority Control, Context Control,and Archival Description.Journal of Archival Organization,Volume 5,Numbers1/2 2007:5.
[3]注:从概念逻辑的视角分析,机构团体、个人或家族的具体实体均可被看作是个别概念.
[4]ICAAtoM:open source archival description software [EB/OL].[2012-10-16]。 http://ica-atom.org/.
[5]注:EAC-CPF是国际标准《团体、个人与家族档案背景编码》(Encoded Archival Context for Corporate Bodies,Persons,and Families)的简称.
[6]注:ISAAR(CPF)是国际档案理事会2004年修订的《国际标准—团体、个人和家族档案规范记录(International Standard Archival Authority Record for Corporate Bodies,Persons and Families)》(第二版)的简称.
[7]ICA.ISAAR(CPF)International Standard Archival Authority Record for Corporate Bodies,Persons and Families(Second Edition)[S].2004:1-70.
[8] SAA.Describing Archives:a Content Standard(DACS)(Second Edition)[S].2013.
[9]Canadian Comm ittee on Archival Description.Rules for Archival Description (RAD) (Revised version)[S].2008.7.
[10] Encoded Archival Context Working Group of the Society of American Archivists and the Staatsbibliothek zu Berlin.Encoded Archival Context—Corporate Bodies,Persons,and Fam ilies(EAC-CPF)Tag Library(Version 2010(initial release))[S/OL].[2012-10-15].http://www3.iath.virginia.edu/eac/cpf/tagLibrary/cpfTagLibrary.ht -m l#d1e8025.
[11]APEx project-Standards[EB/OL].[2013-07-01].http://www.apexproject.eu/index.php/outcomes/standards.
[12]注:国内已发表了相关学术论文:张文友,徐维。《国际标准——团体、个人和家族档案规范记录著录规则》的制定及其结构特点[J].档案与建设,2001(2):55-56;李超,常晓茹.档案检索系统中的规范记录研究[J].档案时空,2009(2):16-18;冯留燕.图书与档案的规范控制工作研究[J].云南档案,2011,(4):56-58.等等.
[13]洪一梅,王蕉.中國人名權威控制之建置與應用:以明清檔案人名權威系統为例:174-186.
[14] 注 :据 Abelardo Santamaría.Report on the work of CNEDA(2007-2012):toward a conceptualmodel for archival description in Spain[R].(July 11,2012):8.修改.
[15]注:据 IFLA Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional Requirements for Authority Data: A Conceptual Model [R].2008.12:7.修改.
[16]注:该图反映了个人同机构团体之间的成员关系,二者之间是通过个人实体的“经历”属性与机构团体的“机构团体首长”属性进行关联的.
[17]IFLA UBCIM Working Group on Functional Requirementsand Numbering of Authority Records(FRANAR).Functional requirements for authority records:a conceptualmodel,draft 2005-06-15.[2013-02-12].http://www.ifla.org/VIId40FRANAR2Conceptu -al2M 2Draft2e.pdf.
[18]冯留燕.图书与档案的规范控制工作研究[J].云南档案,2011(4):56.
[19]ICA.ISDF International Standard for Describing Functions(First edition),2007.5
[20] ICA.ISDIAH International Standard for Describing Institutions w ith ArchivalHoldings,2008.3
[21]段荣婷.国际档案规范记录标准化研究[J].档案学研究,2013(5):70-71.
[22]段荣婷.论国际档案信息标准化现状、发展趋势及我国的对策[J].档案学研究,2008(1):45.