汶川地震信息资料库元数据规范解析*

2010-08-08 08:12邵熠星
档案与建设 2010年10期
关键词:音频文件资料库汶川

□邵熠星

近年来,地震灾害时有发生,给人们带来了巨大的伤痛。从全球范围看,近期已有超过10次6级以上强震,海地的7.3级、智利的8.8级等较大地震相继发生。在我国,2008年5月12日发生的汶川8级地震造成了惨重的人员伤亡与巨大的经济损失,社会影响强烈。地震发生后,党中央、国务院举全国之力,组织开展了规模空前、卓有成效的抗震救灾斗争,并取得了阶段性胜利。在抗震救灾工作中,形成了大量文件材料,是党和政府领导人民抗震救灾的真实记录,是今后工作查考、历史研究、经验借鉴以及弘扬中华民族伟大精神的珍贵载体。同时,汶川地震是一种重要的地球动力学灾变过程,它发生在我国城市化和现代化的特定阶段,是我国地震灾害学、城市布局设计、防震社会工程等研究的不可多得的地震灾害破坏样本。从档案学的角度来看,汶川地震相关灾害记录、抗震救灾资料和科学观测数据等都具有不可或缺的档案价值,应当得到妥善的保存和管理,充分发挥其在记录历史、借鉴经验、促进科研、谋求发展等方面的作用,为防震减灾事业发展和相关研究提供帮助。

国家对汶川地震资料归档工作十分重视。国务院颁布的《汶川地震灾后恢复重建条例》第二十三条明确规定:“地震部门、地震监测台网应当收集、保存地震前、地震中、地震后的所有资料和信息,并建立完整的档案。”国家档案局也就汶川地震文件归档工作专门下发了《国家档案局关于做好抗震救灾工作文件材料收集归档工作的通知》(档函〔2008〕127号),用于指导汶川地震档案建设工作。根据相关文件要求,中国地震局开展了汶川地震信息资料库的建设,希望能够对汶川地震震前、震中、震后产生的文件、材料等及时进行收集、整理和归档,保存真实可靠的汶川地震信息资料,建立实用、稳定、先进、高效的数据库,实现汶川地震信息资料管理的数字化、网络化,满足社会的利用需求。

在汶川地震信息资料库的建设过程中,为了确保数据的真实性、完整性与长期可读性,制定了一整套元数据规范,以实现对数据的整个信息生命周期的有效管理。笔者有幸参与到该项工作之中,受益匪浅。

一、元数据规范编制核心思想

在汶川地震信息资料库中,需要保存多种类型的文件、资料,如图像、音频、视频、报刊文章、图件等等。于是,针对不同类型文件的特征,相应地编制了13个适用于不同类型文件的元数据规范,具体包括:汶川地震文本文件元数据规范、汶川地震视频文件元数据规范、汶川地震音频文件元数据规范、汶川地震图像文件元数据规范、汶川地震图书元数据规范、汶川地震报刊文章元数据规范、汶川地震图件元数据规范、汶川地震标准规范文件元数据规范、汶川地震观测仪器文件元数据规范、汶川地震观测数据文件元数据规范、汶川地震观测台站文件系列元数据规范、汶川地震会商元数据规范、汶川地震日志文件组合元数据规范。同时,还配套制定了一个基于XML的电子文件封装规范。

在整套元数据规范的编制过程当中,设计思想主要源自ISO 23081-1信息与文献-文件管理过程-文件元数据第1部分:原则(Information and documentation—Records managementprocesses—Metadata for records Part 1:Principles)与澳大利亚政府文件保管元数据标准2.0版本(Australian Government Recordkeeping Metadata Standard Version 2.0)。在 ISO 23081-1中指出,元数据可分为以下几种类型:关于文件自身的元数据、关于责任者的元数据、关于业务工作或过程的元数据、关于业务规章制度、政策以及法规的元数据、关于文件管理过程的元数据。在文件保管的过程中,必须具备以上所有类型的元数据,才能实现对电子文件的有效管理。图1就展示了这几种类型元数据及其之间的相互关系。

澳大利亚政府文件保管元数据标准2.0版本于2008年7月颁布,替代了之前的《联邦机关文件保管元数据标准1.0版本》,以适应不断变化的文件保管需求。该版本与1.0版本相比,最大的变化在于它在遵循ISO23081的基础上,以多实体模型(multiple-entitymodel)为基础,能够对五个单独的实体进行描述:文件(Record)、责任者(Agent)、业务(Business)、法规(Mandate)和关联(Relationship),并且定义了一套26个基本的元数据元素(properties)和44个附加的限定元素(sub-properties)来描述这些实体。汶川地震信息资料库元数据规范的核心编制思想正是借鉴了这一描述方法。

此外,为了保持规范的先进性,在规范编制过程中还参考了南澳大利亚文件保管元数据标准3.0版、ISO15489-1:2001信息与文献文件管理第1部分通用原则、ISO 23081-2:2007信息与文献文件管理流程文件元数据第2部分概念与实施问题、ISO11179信息技术—元数据元素的规范与标准化,以及国家档案局发布的电子文件管理细则第一部分:文书电子文件元数据方案(征求意见稿)、电子文件管理细则第二部分:电子文件长期保存格式需求(征求意见稿)、电子文件元数据标准(征求意见稿)等等。

同时,在编制每一个具体的元数据规范的过程中,还参考了相关领域的一些标准规范。如在编制音频文件元数据规范的过程中,就借鉴了我国数字图书馆标准规范建设项目成果之一的音频资料描述元数据规范,以适应不同类型文件的独特属性。

二、元数据规范总体框架

为了确保一致性,每个规范的框架结构基本相同,均包括范围、编制目的、规范性引用文件、术语和定义、元数据元素框架、元数据元素描述方法、元数据元素的描述、附录方案,以及附件元数据著录规则。

其中,“范围”主要是对每个元数据规范的适用范围进行规定,以使不同类型的文件能够根据其相应的元数据规范进行著录;“编制目的”描述了通过规范的编制,预期达到的目标;“规范性引用文件”则列举了引用的若干标准规范文件;“术语和定义”对提到的术语在本规范中的含义进行了规定;第五部分“元数据元素框架”对规范中所包含的所有元数据元素及限定元素的组成情况进行列表展示。每个规范的元数据元素框架都遵循多实体模型的核心思想,同时根据自身的特点进行相应的调整;第六部分“元数据元素描述方法”解释了在对每个元素进行描述时,各项目的含义。参考GB/T18391,规范采用表1所示的方法对元数据元素进行全面的描述。对每个元素进行详细描述时,需要覆盖表中所列的每个项目;第七部分“元数据元素的描述”则是对元数据元素框架表中所列的每个元素按照表1所示的项目依次进行详细的解释;第八部分“附录方案”是对规范中涉及的参考著录方案进行说明。比如,在对“数据格式”元素进行描述时,“方案”一栏中填写的是“附录2数据格式方案”,那么,在著录时,便需要按照附录2的内容来进行描述。

此外,每个元数据规范都附有一个相应的元数据著录规则,里面对每个元素的著录都进行了细致的说明和举例,与规范配合使用,便于工作人员的操作。

表1 元数据元素描述方法表

三、实例

为了便于理解,在此选用汶川地震音频文件元数据规范为例,进行较为详细的说明。汶川地震音频文件元数据规范适用于汶川地震音频文件的收集、归档、存储、保管、利用等环节,目的是对音频文件进行标准化描述,实现不同机构、不同系统之间信息的互操作,确保汶川地震音频文件的真实性、完整性、可用性,同时有利于说明音频文件与机构、业务之间的关系,使得这些音频文件更便于查找和检索。整个汶川地震音频文件元数据元素框架如表2所示。

随后,在元数据元素的描述部分就对表2中所列的每个元素进行了详细的解释,以音频文件的“权限”元素为例,描述如下:由于“权限”元素是一个容器型元素,包含了“访问权限”、“安全等级”、“存取时间”这三个限定元素,因此,在对其描述时,需要对这三个限定元素分别进行描述,并且其编号是由这三个限定元素的编号所组成的。

以其中的“安全等级”为例描述如下:在对“安全等级”的描述中,方案一栏注明的是“安全等级方案”,则在附录中我们就可找到下表,需要根据表中的内容进行著录,不可随意而定。

最后,还附有一个汶川地震音频文件元数据著录规则,对每个元素的著录情况进行细致的说明和举例。至此,一份完整的元数据规范编制完成。

四、结论

以上所介绍的就是这次汶川地震信息资料库元数据规范的编制情况。在这次规范编制的过程中,最为创新之处就是参考了国际和国内先进的标准规范,采用了多实体模型,对文件、责任者、业务、法规等方面的元数据进行了全面而细致的规定。这一方法比以往的元数据描述方法更具灵活性和可扩展性,能够适应新的信息时代的要求,保护数据的证据价值并确保其真实、完整和长期可读性。通过在文件与其背景信息之间进行逻辑链接,并以一种结构化的、可靠的和有效的方式维护这种链接,能够实现高效率的检索,并且为实现文件在不同环境、计算机平台或保管策略之间的有效迁移提供支持。目前,元数据规范仍在广泛地征求各方意见,并初步尝试应用于资料库的建设,相信在建设过程的推进中,还将根据需要不断地进行修改,以适应实践的需求。

表2 元数据元素框架

表3 音频文件元数据规范中对权限的描述

表4 安全等级的描述

表5 安全等级方案

*本文为国家自然科学基金项目“我国电子公文文档一体化协同与管理策略研究”(项目编号:70773088)系列论文之一。

注释:

①引自标准《信息与文献-文件管理过程-文件元数据第1部分:原则》(征求意见稿),Information and documentation—Records managementprocesses—Metadata for records Part 1:Principles(ISO 23081-1:2006,IDT).

②由于篇幅有限,在此仅列举了音频资料元数据元素框架表的一部分,省略号表示还有若干元素及限定元素没有展示。

①ISO15489-1:2001.Information and Documentation Documentation-Records Management.

②ISO23081 Information and documentation-Records management processes-Metadata for records.

③Australian Government Record keeping Metadata Standard Version2.0.

④South Australian Record keeping Metadata Standard Version3.

猜你喜欢
音频文件资料库汶川
云上远眺新汶川
基于内容与协同过滤的GitHub学习资料库推荐
国家社科基金重大项目“‘古今字’资料库建设与相关专题研究”成果鉴定会顺利召开
施工企业技术资料库的建立与完善
音频录编任我行
实现科学教材中资料库的教育价值
基于Android手机的音频文件取证技术研究
健康中国的汶川实践
提取APP中的音频文件
我在汶川挂职的日子