从2016年展开非物质文化遗产(下称“非遗”)数字信息资源管理研究以来,课题组在关键性的研究思路和方向上逐步达成一致:一是基于非遗本身看待数字化问题,容易出现“只见树木不见森林”现象,必须在更广泛的“文化遗产数字化”视域下进行数字化理论构建,充分汲取物质文化遗产、文献遗产等相关领域的经验;二是数字化问题绝对不是我们想象的那样,完全无拘于“实体束缚”,恰恰相反,它是历史性、实践性、地方性的。在这一前提下,应当认识到我国当前已然进入“后申遗”时代,非遗数字化的研究需要与这一进程相适应。本文关于MIDAS Heritage的研究,即是基于以上的共识展开。
信息描述标准是非遗数字化道路上必须克服的关键难点,该领域代表性的研究主题包括三方面。
(1)对国际上已有的代表性元数据标准进行介绍和研究。熊拥军等分析八种元数据标准,总结其在结构特点、功能需求、元素组成、核心元数据和编码等方面的异同[1];陈艳等介绍以CIDOC CRM为中介机制的元数据集成方案,初步讨论了DC与CIDOC CRM之间的映射[2]。
(2)通过研究相关领域的元数据标准,提出非遗元数据标准的设计方案。许鑫等以国际上比较有影响力的八种元数据标准为基础,从资源内容及属性、管理规范两个角度提炼非遗资源的核心元数据集,再根据非遗特点进行元素扩展,构建更具兼容性、互操作性和非遗特色的元数据规范体系[3]。
(3)面向特定文化遗产信息资源的特点,设计适用的元数据核心元素集或规范体系。李建伟基于梅州客家山歌的资源属性分析、特征提炼和规范控制,设计与客家山歌艺术特性相符的元数据方案[4]。部分研究并非直接以非遗为研究对象,但也有参考价值,如肖婷根据宋代绘画作品数字化过程中的特定要求,在借鉴CDWA的基础上,以《宋画全集》丛书为对象,提出宋画的元数据应用规范[5]。
学术社群通过对代表性元数据方案的研究,借鉴图情领域的元数据标准设计实践,已经在相关领域形成了一定的积累。但是,我们要关注的不仅仅是元数据标准的设计逻辑问题——事实上,学界对元数据标准设计原则的讨论已非常充分,几乎所有相关论文都离不开对“扩展性、广泛性、互操作性、规范性”的阐述——更重要的是考察特定元数据方案的设计与实施语境。元数据标准的建立或许只需要考虑逻辑上的合理性,但是它们能否成功普及、能否得以长期使用,与世界不同地区、不同时期的特定需求密切相关。课题组选择MIDAS Heritage作为本文的研究对象,正是因为该方案的创建、发展与使用语境与我国当前非遗数字化领域所面临的情景有一定的相似之处。
当前我国非遗领域的主要变革是从“申遗”时代走向“后申遗”时代,是从普查式、清单式的保护走向纵深的非遗保护。在这一转型过程中:首先,我国已建立起一套以“申遗名录机制”为中心,覆盖国家、省、市、县四个级别的非遗保护体制。这套体制在过去十余年间获得了巨大的成功,形成了具有中国特色的保护经验[6],这意味着在设计相应的元数据方案、构建数字化设想时需要配合这一“国家-地方”名录机制来展开,而不是从无到有地重起垒土。其次,各相关机构在过去一段时期依托名录机制完成了大量非遗资料的采集和数据搜集工作,为避免重复建设,需要充分利用已有资源和标准话语。因此,在元数据标准设计中,必须持续回顾《国家非物质文化遗产代表性传承人抢救性记录工程操作指南(试行本)》(下称《操作指南》)等一系列在“申遗”和“抢救”过程中发挥过重要指导作用的文件,考虑是否继承它们对“纸质”“实物”“文献”等关键概念的定义,而不是简单地移用来自图情领域的固有概念。例如,在《操作指南》中,正式出版物被明确定义为“古籍、普通图书、期刊、报纸、地图等”,这明显和我们传统理解的“正式出版物”有所出入。最后,还要关注如何实现后申遗时代对非遗保护的新要求和新设想,如构建全流程保护、联合多元主体展开保护工作。
基于上述的实践需求,课题组对国外不同领域的元数据方案进行调查,其中MIDAS Heritage是诸多元数据方案中颇具参考价值的一个,刘峰、张晓林等在评述科学数据元数据标准时就曾将其列为社会与人文领域的代表性元数据方案[7],但或许由于这一标准偏向物质文化遗产和建筑保护领域,因而并未引起图情界的重视。MIDAS Heritage诞生于英国的“国家-地方”双重历史文化遗产保护体系机制,因应了英国的实践内涵与语境需求,对以上三个诉求能够做出一定程度的回应。
MIDAS或MIDAS Heritage一般被视为“The Monument Inventory DAta Standard”的简称,其全名经过多次调整[8]5。严格来讲,MIDAS Heritage可归类为英国文化遗产与历史遗迹领域的数据结构标准(data structure standards),并非我们传统上熟悉的数据内容标准(data content standards)和数据值标准(data value standards),它更类似于一个信息描述框架,从宏观层面指导细分领域的元数据标准构建。正因为如此,MIDAS Heritage针对如何具体标引馆藏、如何利用本标准设计数据库和信息系统等问题只给出方向性指导,而不讨论具体细节。
英国重视保护文化遗产和历史遗迹。1882年英国通过首个相关法案——《古迹保护法》(Ancient Monuments Act)(此后英国政府又通过了一系列与文化遗产保护相关的法案,如The Historic Buildings and Ancient Monuments Act、The Protection of Wrecks Act、The Ancient Monuments and Archaeological Areas Act 1979)。为支持该法案及其后续的修订案,苏格兰、威尔士和英格兰设置专职的文化遗产管理机构——苏格兰皇家历史遗迹委员会(Royal Commission on the Ancient and Historical Monuments of Scotland,RCAHMS)、威尔士皇家历史遗迹委员会(Royal Commission on the Ancient and Historical Monuments of Wales,RCAHMW)和英格兰皇家历史遗迹委员会(Royal Commission on the Historical Monuments of England,RCHME),主要职责是调查区域内具有保护价值的历史古迹和建筑物[9]。由于英国作为“联合王国”具有一定的独特性,三者都可以视为“国家级”管理机构,但实际上存在较大差异[10]。MIDAS Heritage最早来自英格兰地区的RCHME体系,其后拓展到英国其他地区。
这一时期英格兰地方政府成立了记录文化遗产的专职机构——遗址古迹记录(Sites and Monuments Records,SMRs),以记录并维护当地考古和历史遗址数据,为规划者和开发者提供参考。随着历史遗迹记录管理体系的建立,英国掀起了历史古迹和建筑物清查的第一轮高潮。此后70余年间,英国建立起一个从国家到郡县的文化遗产记录和保护体系,重要历史古迹和建筑物的名册编制工作基本完成,积累了大量信息资源[11]7-57。显然,这个过程与中国在“申遗”时代的清查和摸底工作有一定的相似性。
随着计算机和信息化技术普及,RCHME于1985年首次将“英格兰国家考古记录”(English National Archaeological Record)转换为计算机可读格式,拉开了英国文化遗产数字化潮流的序幕[12]179-185。但是,在强调“统一”“通用”的信息化工作面前,之前建立的文化遗产保护和记录体系由于层次复杂、机构繁多,反而造成许多困扰。在这一背景下,1989年SMRs转由RCHME领导,此后RCHME将来自全国各地的历史古迹和建筑物清单信息进行整合,建立数据共享系统[11]。1993年RCHME发布题为《记录英格兰历史》 (Recording England’s Past)[13]的指导文件,为提高数据的规范性和统一性提出了一系列文化遗产信息化工作的建议字段和指定术语,其后又提出以标识数据(Tagged data)的方式实现历史遗迹的信息交换和共享[12]181。该文件奠定了英国文化遗产领域跨机构合作的基础,成为MIDAS Heritage元数据方案的前身,后者的第一版本就是在该文件的基础上形成的[12]182。
1998年MIDAS Heritage的最初版本《历史遗迹清单指南和元数据标准》(A Manual and Data Standard for Monument Inventories)发布[14][8]5,主要目的是为历史遗迹(monuments),如建筑物(buildings)、考古遗迹(archaeological remains)、沉船遗址(wreck sites)、文物发现地(find-spots)等提供通用的信息描述框架[8]20。在该版本中,MIDAS Heritage由信息单元(Units of Information)和信息方案(Information Schemes)组成。信息单元是反映描述对象的具体款目,信息方案则是某一类信息单元的集合,以反映描述对象某一方面的整体特征[8]59。
1999年RCHME并入“英格兰遗产”(English Heritage,EH),MIDAS Heritage 转由EH负责至今,同年10月发布MIDAS Heritage在线版本。EH成立于1983年,是隶属于英国文化、新闻和体育部(Department for Culture Media and Sport,DCMS)的非政府组织,主要工作是系统调查、研究和保护国家级遗址[11]19。
2000年MIDAS Heritage的第二个版本发布,对初期应用过程中发现的问题进行修订,在内容和架构上没有太大修改。2003年MIDAS Heritage的第三个版本发布,增加了四个信息单元,修改了一个信息方案的名称。2007年EH颁布MIDAS Heritage的新版本,实现了一定的外部扩展,如引入GIS(Geographic Information System)来描述地理空间信息。
MIDAS Heritage的最新版本是2012年发布的,其对接和兼容多种不同的元数据标准,如SPECTRUM、英国电子政务元数据标准(e GMS,UK e-Government Metadata Standard)和国内学界较为熟悉的CIDOC CRM,适用范围扩展至区域环境(Area)、历史遗迹(Monument)、可移动文物(Artefact and Ecofact)三大类;之前版本中的信息方案更名为信息组(Information Groups),并将信息组分为主要主题(Main Themes)和辅助主题(Supporting Themes)两大类。
通过回顾以上版本变迁,我们发现MIDAS Heritage在不同版本中均未做出颠覆性变动。这种克制符合它作为历史文化遗产领域国家级基础信息框架的定位。
MIDAS Heritage[15]分为三层架构,由下至上分别为信息单元(Units of Information)、信息组(Information Groups)和主题(Themes)。在最新版本中,MIDAS Heritage共有141个信息单元、16个信息组和六个主题(见表1)。处于核心地位的是第二层的信息组,不同的项目、数据库或主体在利用MIDAS Heritage时,可根据自身需求选用不同的信息组,以设计和建立相应的信息系统。
表1 MIDAS Heritage的信息组和信息主题
信息单元是构成款目(Entry)的基本项目或元素,是进行信息标引和描述的最小单元,以反映描述对象的某一方面的具体内容或特征。最新版MIDAS Heritage手册中包含141个信息单元,对每一个信息单元都有对应的著录说明,主要包括:
(1)名称(Unit Name):信息单元的名称。
(2)定义(Definition):信息单元的内涵,尤其是其覆盖的具体范围。
(3)指导(Guidance):使用的注意事项,如常见错误、相关联的信息单元;受控词(Controlled Entry):该信息单元是否需要使用受控词汇。正如上文所说,MIDAS Heritage的目的是用于指导其他数据标准,因此尽量不做具体规范,但为了便于其他元数据标准使用,相关维护者也为其建立了一个主题词表,由一个名为INSCRIPTION的项目发布和维护。INSCRIPTION由英国多个文化遗产机构组成的文化遗产信息标准论坛(Forum on Information Standards in Heritage,FISH)发起,截至目前已发布23个领域的主题词表。不需要使用受控词汇的信息单元则可以直接采用自由文本(Free text),但为了提高检索质量,MIDAS Heritage认为自由文本的格式应该遵循一定的受控规范,如尽量减少标点符号的使用、不使用缩写、设立机构内部词汇列表。
(4)信息组(Information Group):该信息单元所属的信息组。
(5)示例(Examples):该信息单元的使用举例。
信息组在2012年前的版本中被称为信息方案,是某一类型信息单元的集合,可简单地理解为信息单元的上一级统合类目,反映描述对象某一方面的主题特征。MIDAS Heritage共有16个信息组,代表着描述对象的16个分面(Facet),使用者可选择特定信息组对相应对象进行描述。在手册中,关于信息组有以下的说明:
(1)定义(Definition):信息组所涵盖的领域。
(2)介绍(Introduction):对该领域文化遗产进行标准化信息描述的目的和价值说明。
(3)关键问题(Key Questions):是一个值得标准研究者关注的说明项目,目的是确定为使用者提供具体、清晰地认识信息组的清单,明确这一类目的使用情景。定义是:特定信息系统在使用这一信息组时应该回答的系列问题。例如,“历史事件”(Historical Event)的关键问题为:在这里(遗迹或者古迹处)发生了什么事件?本遗产形成了怎样的历史语境?
(4)关键事项和建议(Key Issues and Recommendations):为保证 MIDAS Heritage标准的有效使用,手册通过本版块为各个信息组在数据采集、标引、记录管理等方面提供建议。
(5)信息组之间的关键关系(Key Relationships between Information Groups):信息组与信息组之间是相互关联的,MIDAS Heritage通过表格列举了该信息组与其他相关信息组的对应关系,其中包括两类关系:M/O和S/R。M指的是必选的(Mandatory),即使用A信息组时必须同时使用B信息组;O则是可选的(Optional)。S指的是单个的(Single),即该信息组所对应的信息,即便在另一信息组中有所涉及,也只能选取单一值;R则意味着可以使用一个或多个可重复值(Repeatable)。比如,信息组“历史事件”(Historical Event)和信息组“时间日期”(Date and Period)是M-S的对应关系,M代表在描述某一历史事件时,必须同时描述其发生时间;S则代表历史发生时间只能有一个,不能有多个数值。通过限定信息组之间的关系,有助于有效提高信息描述的全面性和准确性,这在很大程度上澄清了信息组间的关联关系。
(6)规范表(Compliance Table):每个信息组包含哪些信息单元,且这些信息单元的属性如何。属性包括两类:M/O和S/R,前者指某一信息单元是否必需,后者指信息单元可否是多个值。值得注意的是,规范表的目的不是用来控制,而是用于评估某信息系统是否符合MIDAS Heritage的框架,如数据库中的列或字段是否符合对应信息单元的要求,如果符合则方便进行数据交换、数据整合或数据迁移。
主题(Themes)是2012年版本的新增内容,是位于信息组之上的一层架构。如同信息组是某一类信息单元的集合,主题也是某一类信息组的集合。主题和信息组之间的对应结构请见表1。
MIDAS Heritage把文化遗产领域分为六个主题,这些主题分为两大类:主要主题和辅助主题。主要主题包括文化遗产资源、活动和信息源;辅助主题指的是在主要主题外,对文化遗产具有补充描述意义的信息组集合,包括空间信息、时间信息和责任人信息。设置“主题”这一层级的目的是为数据库或信息系统规划提供指导。譬如,主要主题中的信息组对构建任何信息系统而言,一般都是必要的。
MIDAS Heritage是围绕历史遗迹而制定的元数据标准,主要影响发生在建筑相关的文化遗产领域[16]414,尽管经过多次改版,应用场景和范围逐渐扩大,但一直未突破传统的物质文化遗产领域。然而,MIDAS Heritage的启发意义比许多其他的元数据标准大,因为它诞生于英格兰的文化遗产记录和保护实践之中,与英国政府的保护体制变革密切结合。以往我们谈元数据标准的通用性、扩展性和实用性,都是“去语境化”“去历史化”的理论探讨,但结合相关领域的体制发展史,MIDAS Heritage为我们深入认识这些特性提供了可能。
尽管MIDAS Heritage也被称为“标准”,但实质上它的定位是国家为地方建立元数据标准所提供的信息框架[15]5,9[16]414。英国文化遗产保护开始较早,MIDAS Heritage出现之前,在其“国家-地方”二级保护体制内已积累了大量异构的文化遗产信息资源。在这样的背景下,直接推出一个面面俱到、覆盖各个历史遗迹领域的元数据方案并不现实,因此,MIDAS Heritage的目的是提供兼具实用性和简洁性的信息描述基础,这一标准并不是强制性的,而是建议性、指导性的,具有较大的弹性空间。
MIDAS Heritage的通用性主要体现在为各地方、各机构制定更详细、更有针对性的元数据标准提供基础。通过这种方式,英国出台了《船舶和飞行物的元数据方案》(Watercraft and Aircraft Annexe)等一系列数据标准,由于它们以MIDAS Heritage为底基,因此可实现不同层次、不同机构之间数据记录体系的互通互联。当然,相比DC核心元数据等,它凸显了领域的专业化特征。为了更好地实现信息共享和长期保存,文化遗产信息标准论坛(FISH)还发布了一个与MIDAS Heritage配套使用的“FISH互操作工具箱”(FISH Interoperability Toolkit),核心是三个组件:MIDAS XML、数据校验器(The Data Validator)和历史环境交换协议(The Historic Environment Exchange Protocol, HEEP)[16]14,它们帮助那些采纳MIDAS Heritage标准的信息系统实现与其他信息系统的完成数据交换和集成,推进不同信息系统之间的共享。
如果把语境转换到我国非遗领域,会发现颇有雷同之处:通过四级名录保护体系,我国留存了大量的信息资源,它们的内部异构程度异常复杂,现有的非遗元数据标准研究多只是针对特定领域展开,未能充分解决非遗信息资源的通用性问题。MIDAS Heritage的思路正好能应对这一问题,从国家层面讲,建设相应的数据结构标准,可提供一个继承历史资料、相对简单且扩展性的基础架构,既可以发挥国家相关部门对非遗数字化领域的宏观调控作用、实现数据互通,也可以满足地方和机构的个性化保护诉求。
当前制定各类元数据标准的过程中均强调“规范性”问题,那么,是否与已有的诸多标准实现对接,对相应款目进行明确的规范控制,就是所谓的规范化?
尽管MIDAS Heritage对每一个信息单元和信息组都做出了明确定义,也通过INSCRIPTION项目等提供的主题词表来实现一定程度的规范控制,但在MIDAS Heritage出台之前,英国建筑遗产领域已经形成了深厚的记录规范化传统。建筑事业基于测量工作,对数据描述的精准度非常敏感,因此,该领域建立了多种机制以保障建筑记录的规范化。宋雪提出,“……英国建筑遗产记录具有规范化的特点,(但)这是我们扣给英国建筑遗产记录的一顶帽子,其实它们自始至终从未出现过关于记录规范化的讨论或研究”。所谓“规范化”,实际上是日益完善的法律法规体系,权职明确的主管机构和大量权威文献、出版物互相交织和博弈后表现出来的特征[11]149。
以上观察的启发是:元数据规范控制的实现程度取决于相应领域的规范建设。具体来讲,在非遗元数据标准的设计中,一方面应当注重对非遗领域已有描述习惯的继承和吸纳,即便某些习惯并不“规范”,要认识到元数据标准设计中应当秉持的认识论立场是建构主义的;另一方面,作为信息和数据专家,我们的工作远不止于元数据标准的制定,还应努力做好一系列“建立规范传统”的工作,包括在相关法律法规的制定过程中嵌入“规范记录”的理念,促使非遗研究社群达成统一观念和规范话语,等等。
MIDAS Heritage还有很多其他值得借鉴的地方,可为我们开展非遗领域的数字化研究提供启发:(1)记录和数据的规范化是后申遗时代深入开展非遗保护的基础,建立专门化的数据记录研究和管理部门有很大的必要性;(2)MIDAS Heritage的改进一直非常谨慎,但它仍然注意持续吸收、借鉴和引用外部的标准方案和新兴的技术体系,以确保良好的可扩展性和互操作能力;(3)尽管它主要是物质文化遗产领域的元数据标准,其具体的信息单元设置与非遗类目相去甚远,但由于具备宏观的信息描述框架特质,它在信息组和主题方面的设置亦可考虑借鉴到非遗领域。