我国档案元数据互操作的现状、问题和对策研究

2023-05-30 23:38孔祥盛
档案管理 2023年1期

摘  要:档案元数据互操作对档案信息资源整合意义重大。通过分析我国新旧《档案著录规则》、不同格式档案元数据标准、不同门类间档案元数据标准和不同领域间档案元数据的互操作情况,提出结构、语义和技术三个层次的互操作问题,并从重视档案元数据标准制定、切实提高档案元数据质量、加强档案资源整合实践和重视语义本体技术应用四方面提出对策。

关键词:档案元数据;档案著录;互操作

Abstract: Archival metadata interoperability is of great significance to the integration of archival information resources. By analyzing the interoperability of Rules for Archival Description(1999) and Rules for Archival Description(2022), archival metadata standards in different formats, archival metadata standards among different categories and archival metadata among different fields, we propose the interoperability problems at three levels: structure, semantics and technology, and then we propose four countermeasures: attaching importance to the formulation of archival metadata standards, effectively improving the quality of archival metadata, strengthening the practice of archival resource integration and attaching importance to the application of semantic ontology technology.

Keywords:  Archival metadata; Archival description; Interoperability

從“互联网+政务”“一网通办”的服务要求,到政府开放数据、开放科学数据的兴起,大数据时代给档案信息资源整合开放提出了更新、更高的互操作要求。2021年中办、国办发布《“十四五”全国档案事业发展规划》,要求“加强本区域档案信息资源共享平台建设,实现本区域各级综合档案馆互联互通,推动共享平台向机关等单位延伸,促进档案信息资源馆际、馆室共建互通,推进档案信息资源跨层级跨部门共享利用”。档案元数据互操作是在数字转型、在线公共服务和开放数据背景下的新需求,也是档案资源整合和提供多元利用服务的必经之路。

1 引言

1.1 概念界定。互操作是指两个或多个系统及其组成部分之间交换数据并相互使用已交换数据以实现协同共享的能力。互操作概念最早应用于铁路工程系统领域,用于解决铁路和列车零部件、信号系统以及操作规范等兼容性问题。随后,开始应用于各个领域的信息系统中,如军事领域美军基于C4I作战指挥系统、电子政务领域的泛欧洲互操作框架(EIF)、电子医疗领域的健康信息系统等。

所谓互操作,那么就至少需要存在两套不同系统。如果系统间采用相同的数据编码、命名、格式、结构和传输方式,那么就不存在元数据互操作问题。一般而言,规定元数据的元素、结构和描述方法等规则集合称之为元数据标准或元数据方案。因此,本文所讨论的元数据互操作是指不同元数据标准或方案之间映射问题。

1.2 文献综述。元数据互操作并不是一个新的研究领域,在图书情报、电子政务等领域较早受到广泛关注。研究主要集中在二个方面:

一是元数据互操作的层次和方法。国内张晓林[1]较早提出应从元数据结构分析,从数据内容、元素语义、编码规则等七个层面来实现元数据互操作,并指出其中语义、描述规则和语法结构三项互操作是核心,后续张东[2]、毕强[3]、彭静[4]等也提出了各自关于元数据互操作的划分层次观点。国外方面,William Y. Arms等[5]根据实现互操作的效果和性价比程度将元数据互操作分为联盟(Federation)、采集(Harvesting)和搜集(Gathering)三个级别。Lois Mai Chan 和Marcia Lei Zeng,[6,7]从元数据标准构建、元数据记录产生到信息检索应用的全过程将元数据互操作分为模式级(Schema)、记录级(Record)和仓储级(Repository),并总结了14种互操作方法,对后续学者研究元数据互操作范式影响深远。总的来看,从语义、语法、结构等层面的互操作已基本成为共识。

二是元数据互操作核心技术,主要可以概括为互操作规范、互操作描述语言、数据转换技术和符号标识技术四类,其中互操作规范包括OAI、Z39.50等,互操作描述语言包括XML、RDF、JSON等,数据转换技术包括中间库、WebService、XSLT、RestfulAPI等,符号标识技术主要指唯一标识符如DOI、Handle、CSTR、ORCID等。

目前国内档案领域关于元数据互操作的研究成果较少,主要包括元数据互操作协议[8-11]、元数据互操作技术[12-14]以及互操作框架构建[15]等,大多以理论层面介绍和分析为主,缺乏互操作实际应用场景的视角研究。

2 我国档案元数据互操作现状

本文筛选了我国有代表性的元数据标准或方案,包括通用的著录规则以及不同门类、不同领域的元数据方案,通过映射的方式对比总结互操作现状。美国档案学者David Wallance曾指出“元数据是著录的替代策略(an alternative strategy)”,[16]刘越男也曾提出“电子环境中可以将文件管理元数据理解为著录信息”。理论上所有的元数据标准/方案中值域和类型都应遵循通用的《档案著录规则》的相应要求,故本文也将档案著录标准视为元数据标准的子集,纳入讨论范围。

2.1 新旧《档案著录规则》的互操作情况。2022年,国家档案局时隔23年正式发布了修订《档案著录规则》(以下简称“《规则》”),新《规则》在实现多级著录、调整著录项目和适应电子环境的著录等方面做了较大调整。[17]

从著录项来看,新《规则》较好地兼容了旧《规则》原有的著录项目,仅删除了不常用的“电子文档号”,以及将“提要”修改为“范围和提要”,其他著录项目均得到保留。但是新《规则》同时新增了17个著录项,其中必著的有著录层级、开放标识等,这也意味着从旧《规则》转向新《规则》时可能需要补充缺失的必要信息。

从著录层级来看,旧《规则》仅适用于文件级、案卷级的著录,而新《规则》著录层级包括文件级、案卷级、类别级和全宗级四类,其中包含一些必填著录项如著录层级(所有)、档号(所有)、题名(所有)、档案保管沿革(全宗级)等,这导致新旧《规则》相互映射时可能无法对应层级,造成互操作障碍。

从著录细则来看,由于旧《规则》是基于传统手工整理和检索需求编制,如今看来许多格式要求已不再有必要,因此新《规则》在内容格式上也做了修改。比如,旧《规则》要求在第一个责任者前加“/”,新《规则》无此要求;对于文件责任者不完整、有误的情况,旧《规则》要求照原文著录,并直接附上加“[]”的考证结果,新《规则》要求将原文责任者注明在附注项目;旧《规则》要求主题词和关键词之间用空格分割,新《规则》要求用“;”分割。这种格式上细微差异虽然不影响人的正常识读,但是会影响机器理解,为后续资源开发带来阻碍。

2.2 我国不同格式档案元数据标准的互操作情况。我国现行的通用档案元数据标准主要包括基于置标语言的XML封装格式(即《DA/T 48-2009 基于XML的电子文件封装规范》和《DA/T 46-2009文书类电子文件元数据方案》)和基于MARC档案机读目录格式(即《GB/T 20163-2006 中国档案机读目录格式》)两类。

从结构上看,档案机读目录数据由头标区、目次区、数据区和记录分隔符四部分构成,其中数据区主要记录著录信息。一条机读目录数据可对应一个全宗、类别、案卷或文件,整体呈现扁平的结构。基于XML封装的档案元数据由声明、元素和注释组成,其中元素包括标签、文本、属性等信息,且元素可以嵌套,整体呈现多层次的树结构。

从著录项数量上看,档案机读目录格式包括10个记录块和77个字段,《文书类电子文件元数据方案》包括88个元素(如果加上封装元数据,共有129个),考虑到机读目录中的字段仍可包含多个子字段和数据元,因此档案机读目录格式的著录粒度实际上远超过XML封装格式的元数据。

从映射情况看,两种不同格式的元数据标准基本能够相互映射,主要存在“一对多”或“多对一”映射障碍。《基于XML的电子文件封装规范》只是封装规范,要结合具体元数据方案使用,以《文书类电子文件元数据方案》为例,如:

①以日期著录项为例,《文书类电子文件元数据方案》中的“日期”著录项对应《中国档案机读目录格式》的“100通用处理数据”和“210档案形成时间”两个字段中数据元。

②《中国档案机读目录格式》将“附注”分为一般性附注、标识号附注、编码信息附注等25种不同类型的附注,而在《文书类电子文件元数据方案》中仅有“M75附注”一种,无法完整映射。

③《中国档案机读目录格式》将“主题词”分为受控主题词(如600人名、601机关团体名、602家族名、606职能、607地名等)和非受控主题词,可从多维度进行主题标引。而《文书类电子文件元数据方案》中仅有“M26主题词”“M27关键词”“M28人名”,两者对于主题词的详略以及采用主题词表、著录规则不完全一致,无法完整准确映射。

④《文书类电子文件元数据方案》中“M87关系”字段的值域包括转发/被转发、来文/复文、正文/附件等若干常用关系,而《中国档案机读目录格式》的“4--记录连接块”仅提供了继承/由……继承、替代/由……替代4种可选关系,无法完整映射。

⑤《文书类电子文件元数据方案》中“M56图像压缩方案”对应《中国档案机读目录格式》中的“135编码数据字段:电子档案”中子字段“电子档案的压缩级别”,虽然含义相近,但是值域范圍不同,无法准确映射。

⑥《中国档案机读目录格式》中缺少关于电子签名、权限管理、实体及实体关系相关的元数据项。《文书类电子文件元数据方案》中缺少关于著录行为、国别地区、历史沿革、奖惩、参见关联等元数据项。

虽然档案机读目录格式是出于档案数据共享、交换和传输的目的而产生,但是由于结构规则复杂、人工可读性差等缺点,目前实际中应用并不广泛,因此互操作需求并不旺盛。

2.3 我国不同门类间档案元数据标准的互操作情况。我国目前针对电子文件/电子档案的现行档案元数据方案共涉及三个门类,分别是《DA/T 46-2009 文书类电子文件元数据方案》《DA/T 54-2014 照片类电子档案元数据方案》和《DA/T 63-2017 录音录像类电子档案元数据方案》。其中文书类的档案元数据方案制定最早,为后续其他门类档案元数据奠定了基础。照片类和录音录像类院属方案制定较晚,结构和内容上两者较为相似,即使考虑各自个性化的元素,它们之间能够相互映射元素的比例也分别达到了73.96%和72.34%。录音录像类电子档案元数据方案作为制定最晚的元数据方案,在元数据项的数量上略多于其他两者。

《DA/T 46-2009 文书类电子文件元数据方案》《DA/T 54-2014 照片类电子档案元数据方案》和《DA/T 63-2017 录音录像类电子档案元数据方案》中必选元数据项映射关系如表1所示。考虑到涉及元数据项较多,表中仅展示了三个门类元数据方案中的必填项映射情况,可以发现主要存在以下映射问题:

①《文书类电子文件元数据方案》中“立档单位名称”“年度”“脱机载体编号”等字段无法映射到其他两个门类元数据方案中。《照片类电子档案元数据方案》中“生成方式”“图像参数”等字段无法映射到其他两个门类元数据方案中。《录音录像类电子档案元数据方案》中“时间长度”等字段无法映射到其他两个门类元数据方案中。

表1 各类方案中必选元数据项映射关系

②由于容器型元数据并不实际著录信息,因此容易出现容器型元数据与字符型元数据的映射障碍。如《文书类电子文件元数据方案》中“档号”字段是需要组配多个元数据形成,无法直接对应其他两个门类元数据的中“档号”字段。

③同样的字段在不同元数据方案中的必选、可选或条件选属性差异,导致无法完整映射。如“密级”在《文书类电子文件元数据方案》中属于必填,但是在其他两个门类元数据方案中属于选填。

④同样的字段实际定义不同,导致无法准确映射。如《录音录像类电子档案元数据方案》中的“责任者”描述的是对录音录像内容负有责任的组织或个人,而在《照片类电子档案元数据方案》中与之含义相对应的实际应为“人物”字段,并不是名为“责任者(容器型)”的字段。

⑤相似字段在定义上有所差异,导致无法完整映射。如《照片类电子档案元数据方案》中“软件信息”字段包括创建、形成、处理电子档案的软件名称、版本等信息,而对应《文书类电子文件元数据方案》中“文档创建程序”字段仅包含创建电子文件的软件信息,在定义范围上有所差异。

2.4 我国不同领域间档案元数据的互操作情况。除了按照档案门类划分元数据,各领域也根据自身特点形成了各自的档案元数据,如《LD/T 03-2021 社会保险业务档案元数据规范》《QX/T 514—2019 气象档案元数据》《NB/T 20418-2017核电电子文件元数据》《CJJ/T 187-2012建设电子档案元数据标准》等。经过比对,大部分领域的档案元数据方案制定是参考了《文书类电子文件元数据方案》,理论上都可以《文书类电子文件元数据方案》为中间元数据从而实现互操作。但也有学者通过专门比对发现,即使不考虑标准之间的结构差异,《文书类电子文件元数据方案》与《核电电子文件元数据》之间相互能够映射的元素比例也很低(分别为23.86%和12.85%),而其中完全映射的也仅占65%,同时两个标准与DC元数据映射的覆盖率也十分不乐观(分别为6.82%和5.03%)。[18]

值得一提的是,一些领域针对档案目录数据交换制定了专门的规范和格式要求,如《GJB 4500-2002 军队档案机读目录信息交换格式》《HJ/T 79-2001 环境保护档案机读目录数据交换格式》《QJ 2878A-2005 航天档案数据采集规定》等,虽然不是元数据方案,但也提供一条可行的互操作路径。

3 我国档案元数据互操作问题

从上述我国档案元数据互操作现状可以看出,我国档案元数据互操作在结构、语义和技术三个层面存在问题。

3.1 结构互操作问题。结构问题包括语法结构和内容结构两方面,目前国内大多数学者习惯将语法互操作和结构互操作分开阐释,但是这忽略了元数据的语法和结构往往是一体的,很难区分开。比如XML和MARC,既规定了数据结构,也是标记语法/句法规则,元数据的语法和结构往往取决于采用什么定义语言(Definition Language)及建模语言(Modelling Language)来表达,因此在本文将内容结构和语法结构统一概括为结构问题。语法结构冲突指不同元数据方案在命名、表达、定义能力和方式上的问题,包括命名及标识冲突、语法/句法冲突和元素定义冲突。内容结构问题主要指两种或两种以上元数据方案在结构映射时出现的问题,包括一对多/多对一、层次错位、无对应。

①命名及标识冲突。命名冲突是指不同元数据方案中同一实体的元素被赋予不同命名名称所带来的冲突。

②语法/句法冲突。语法/句法(syntax)规定了机器可读的编码方式,语法冲突是指不同元数据方案采用了不同的编码方式带来的互操作差异。

③元素定义冲突。不同元语言提供不同的定义能力,例如XML描述语言一般可以从约束性(必选/可选)、可重复性、元素類型、数据类型、值域、缺省值等方面提供丰富的定义。即便是同一实体的元素在不同的元数据方案中也可能采取不同的定义。

④一对多/多对一映射冲突。元数据方案映射时,源元数据中的一个元素可能对应目标元数据中的多个元素,即一对多冲突。考虑到映射的双向性,也必然存在源元数据中的多个元素对应目标元数据中的一个元素,即多对一冲突。

⑤层次映射错位。一般领域的元数据方案仅起到多角度描述作用,元素之间的层级简单,结构扁平,而档案元数据方案通常有着明显的多层著录特征,因此在与其他元数据方案映射时常常会出现层次错位现象。即便同是档案元数据方案,也可能因为元素属性(如容器型、复合型和字符型)造成准确对应层次。

⑥无对应映射关系。无对应是指源元数据中的一个元素无法对应到目标元数据中的任何一个元素。这在跨门类、跨领域元数据之间互操作时最常见。

3.2 语义互操作问题。语义问题是目前元数据互操作研究的共识,主要包括领域冲突、术语冲突、表达冲突、多语言等问题。

①领域冲突。这里的领域冲突皆可以指元素概念之间的相交、包含或相离关系带来的语义冲突,也可以指定义语言表达能力之间的差别带来的语义冲突。比如电子文件领域的元数据和地理信息领域的元数据之间领域重叠范围小,互操作存在冲突。再比如OWL可以表示两个元素之间的相等关系,而XML Schema并不能做到。

②术语冲突。术语冲突是元数据互操作中最常见的问题之一,是指将相同域的概念映射到不同名称的元素(即命名冲突)会发生同义词冲突。

③表达冲突。表达冲突主要表现为单位不一致和编码规则不一致。当元数据元素值涉及测量数字时,往往可能出现由于单位不一致导致的互操作冲突。如在DC中规定采用厘米作为长度单位,而在照片类电子档案元数据方案中采用分辨率(即像素)作为单位。此外,编码规则不一致问题在诸如日期表达中常见,不同的表达规范会在语义上造成歧义。

④多语言。不同语种之间也存在互操作的要求,跨语言的互操作一般使用受控词表及多语言的叙词表,通过翻译建立不同元素之间的关联。我国是一个多民族多语言国家,解决好多语言间的互操作问题也是语义互操作关注点之一。

3.3 技术互操作问题。①文件格式不一致。目前档案领域常用的XML格式作为元数据存储和交换格式,但使用MARC机读目录格式、DBF数据库文件格式甚至Excel格式的情况也仍然存在,不同的文件格式在转换过程中会造成数据失真、缺失等情况,影响元数据互操作效果。

②数据交换协议/接口缺失。系统之间及系统内部各组件之间常用的元数据交换方式包括Web Service、SOAP、OAI-PMH、Restful API等。目前我国各领域内的信息壁垒、信息烟囱现象较常见,信息系统间普遍缺少数据交换接口。

③安全问题。互操作打破了原有封闭环境,引进了新的数据必然会带来新的风险。互操作安全问题如未鉴权访问、元数据传输泄露、跳板攻击、恶意爬虫及DDOS攻击等。

4 促进我国档案元数据互操作对策

4.1 重视档案元数据标准制定。通过现状总结不难发现,我国档案元数据标准的制定相对滞后,严重限制了元数据互操作以及档案资源开发。在档案元数据互操作中,档案元数据标准/方案无疑是处于核心地位,其制定和实施将直接影响档案元数据的格式和形态,决定了与其他元数据互操作的难易程度。因此重视档案元数据标准的制定尤为重要。

一是遵循制定元数据标准通用原则。元数据标准设计原则包括简单性和准确性、专指度和通用性、易转换性、可扩展性和用户需求导向等。[19]目前我国的《文书类电子文件元数据方案》《照片类电子档案元数据方案》和《录音录像类电子档案元数据方案》在元数据元素的选择和定义上体现的通用性不足,没有复用国际上通用的档案元数据元素,未来制定我国通用档案元数据标准时需要注意这一点。可以通过制定档案元数据标准框架,明确设计档案元数据标准时需要遵守的规则和方法。

二是参与国际元数据标准研究。国际上主要的元数据标准主要包括由DCMI主导的DC、SAA主导的EAD和EAC-CPF、ICA主导的RiC等,这些标准大多以专业组织为单位,广泛结合国际各国的力量和实践经验展开研发。元数据标准规定了数据在电子环境下的存储和传输方式,可以说元数据标准就是网络空间的话语权。随着我国经济和政治影响力不断提升,我国档案界有责任和义务在国际元数据标准舞台上发声,积极融入国际档案元数据标准的研究进程中,努力与世界水平接轨。

三是引入国际成熟标准,加快研究档案语义本体。EAD、EAC-CPF等标准已经成为事实上的通用国际标准,现有的大多数档案语义本体标准也是基于此研制。由于我国尚无类似的档案通用元数据标准,导致档案资源开发和利用很难直接借鉴国外的经验和方法。为了保障和其他国家档案资源的互操作,有必要引入成熟的国际标准,并在全国范围内推行,同时加强研究中文语境下的档案本体,构建具有中国特色的档案元数据标准。

4.2 切实提高档案元数据质量。受限我国各地区、各领域參差不齐的信息化水平以及著录人员的负责程度,档案元数据质量水平高低不等令人担忧。有调查曾指出,现有档案目录数据库建设中存在诸如著录格式不规范、数据库设计不合理、分类标引工作停滞等,为建设统一元数据目录中心以及后续合并数据带来了困难。[20]因此,必须首先提高档案元数据质量,才能为后续互操作打下坚实基础。

一是要加强档案信息化建设。档案信息化是资源整合的前提,也是元数据互操作的前提。加强数字档案资源建设,尤其是原生电子文件的管理,确保档案元数据及时准确捕获。二是加强档案元数据著录工作。新《规则》对档案内容著录提出了更高的要求,档案著录不再是“一次性”工作。档案元数据著录工作必须严格遵守相关的著录规则,确保在格式和内容上保持统一。三是开发元数据自动著录技术。面对海量的存量档案资源,仅依赖人工手动著录是不现实的,也不可能完全避免错误,因此开发基于AI的自动著录技术是有必要的,再通过人工审核进一步确保档案元数据质量。

4.3 加强档案资源整合实践。目前我国档案元数据互操作实践大多还停留在以地域为单位或特定类型档案资源整合方面,表面看起来问题并不突出,但在整合理念、整合主体和整合范围等方面都有较大的提升空间。

一是转变重藏轻用思想,加快档案开放共享。开放共享数字档案资源是实现档案元数据互操作的重要基础。加快开放共享档案资源具体可以从法律、政策和社会环境几个角度着手。法律层面,尽快给档案资源“松绑”,确定档案开放的法律义务和责任,针对信息公开和档案开放之间的不适应,及时做出修订和调整,为开放共享打下基础。政策方面,政府和档案部门要积极推动档案资源的开放,更加强调档案资源的文化属性而不是政治属性,发布促进档案资源开发和利用的政策和保障措施。社会层面,努力改善公众对档案的认识,提高档案利用意识,通过开发历史档案资源激起社会对档案研究价值的重视。

二是积极开展跨领域档案资源整合。首先,档案机构要革新自我定位,要认识到除了有保存的职能,更有传播和开发文化遗产、历史记忆的职能,树立为公民服务的理念,为公众提供一站式服务。其次,积极和其他领域文化机构合作,如图书馆和博物馆等,以专题项目为契机,关联共性资源,提供更丰富的档案元数据信息。最后,探索与非公共文化领域的合作,鼓励跨界合作,比如与百度百科链接,提供专业词条撰写和链接;与国际相关数据集建立(如人名、地名、事件)关联,充实元数据内容;建立众包平台,吸引不同专业背景的用户参与添加标签,丰富档案著录信息等。从整合内容看,可以保持目前以整合历史档案为主做法,同时适当放开其他类型档案的利用限制,如民生档案、名人档案、非遗档案等,以特色档案资源整合服务为抓手,扩大档案元数据互操作的实践面。

4.4 重视语义本体技术应用。结构/语法和技术层面的互操作问题目前已经通过统一XML和API技术基本解决,语义互操作成为下一步关注的核心问题,因此重视语义及本体相关技术的应用就显得尤为重要。

一是积极开发和应用档案本体标准。RiC作为档案领域最新的国际著录标准,在设计理念上引入了本体概念,构建了一套基于实体的概念体系。目前国外已经在PIAAF、Docuteam、SNAC等多个项目中开始应用实施RiC。

二是语义网环境下的叙词表开发。叙词表、分类表、主题词表等作为传统手工管理常用的标引工具,具有良好的检索性能,但是并不能被机器直接读取和理解。通过SKOS数据模型规范、统一组织后可以形成各类知识组织系统,并且彼此相互映射、相互兼容,共同组成了语义网的重要部分。

三是关联技术的广泛应用。目前比较常用的关联技术包括OWL、知识图、知识图谱等,其本质都是构建实体之间的RDF关系三元组,再将彼此链接起来形成一张复杂的语义网,从而实现语义关联。

参考文献:

[1]张晓林.元数据研究与应用[M].北京:北京图书馆出版社,2002.

[2]张东.论元数据互操作的层次[J].情报理论与实践,2005(06):91-93.

[3]毕强,朱亚玲.元数据标准及其互操作研究[J].情报理论与实践,2007(05):666-670.

[4]彭静,高林,张展新.元数据互操作技术研究[J].信息技术与标准化,2008(11):50-53.

[5]Arms W A,Hillman D,Lagoze C,et al.A Spectrum of Interoperability,The Site for Science Prototype for the NSDL[J].D-Lib magazine;2002(08):1,2002.

[6]Chan L M,Zeng M L.Metadata interoperability and standardization-a study of methodology part I[J].D-Lib magazine,2006,12(06):1082-9873.

[7]Zeng M L,Chan L M.Metadata interoperability and standardization-A study of methodology,Part II[J].D-Lib Magazine,2006,12(06):1082-9873.

[8]王芳,王小丽.基于OAI协议的数字档案馆元数据互操作问题研究[J].现代图书情报技术,2007(03):18-24.

[9]王萍,鄧君,高渐.开放获取理念及技术在档案领域中的应用[J].档案学通讯,2007,No.179(06):43-46.

[10]包海峰,陈刚.基于OAI互操作协议的档案信息资源整合模式研究[J].档案与建设,2012,No.286(12):13-16.

[11]彭桢,包海峰,徐泺燚.支持元数据和服务共享的三类互操作协议比较[J].档案与建设,2016,No.336(12):23-27.

[12]安海宁,程子彧.档案系统互操作问题研究[J].合作经济与科技,2013,No.466(11):125-126.

[13]房小可.OAI环境下基于本体的DC元数据与档案元数据EAD的映射[J].兰台世界,2018,No.554(12):41-45.

[14]郭学敏,Ryan Shaw.基于关联数据的档案语义转换实践分析[J].档案学通讯,2019(05):50-57.

[15]吕元智.数字档案资源体系的语义互操作实现研究[J].档案学通讯,2013,No.214(05):53-57.

[16]Wallace D A.Managing the present:Metadata as archival description[J].Archivaria,1995,39.

[17]王熹.《档案著录规则》修订解读[J].中国档案,2022,(09):28-29.

[18]苏洲,刘娟.核电文档元数据比较研究[J].浙江档案,2014(12):12-16.

[19]肖珑,陈凌,冯项云,冯英.中文元数据标准框架及其应用[J].大学图书馆学报,2001(05):29-35+91.

[20]浙江省档案数据库建设调查组 ,韩李敏.档案信息化建设 数据质量是关键──浙江省综合档案馆信息数据库建设调查报告[J].档案学研究,2002(03):45-48.

(作者单位:中国科学院档案馆 孔祥盛,硕士,馆员  来稿日期:2022-10-20)