杨盼盼
摘要:为解决秦陵博物院人工讲解无法满足游客需求的问题,通过对代表秦陵文化的秦陵、秦俑、铜车马、出土文物、文物故事等知识分析分类和知识表达规范的研究,指出知识分类与表达规范的内在联系。通过调研收集博物馆相关VRA Core、CDWA、CIMI等元数据和映射分析研究,提出秦文化知识元数据基本框架和元数据模型描述以规范秦陵文化知识表达。从博物馆语音导览应用的角度对表达规范进行实例应用介绍和验证,以全新方式和视角,为秦文化传承利用提供参考,以缓解人工讲解的需求压力。
关键词:元数据;语音导览;表达规范;文化遗产;博物馆
Research on Metadata Expression Specification and
Voice Guidance of Qin Ling Cultural Heritage
YANG PAN pan
(Instrumentation Technology and Economy Institute,Beijing 100055, China)
Abstract:In order to solve the problem that there are not enough culture guides in Qin Ling Museum to meet the needs of tourists, a set of metadata expression standards of culture in Qin Ling and classification of cultural knowledge including Qin Shi Huang cemetery, figurines,bronze chariots and horses, excavation cultural relics,stores are studied. The relation between knowledge classification and expression specification is pointed out. Through investigation at Metadata such as VRA Core, CDWA and CIMI, the framework of Qin culture knowledge metadata and metadata model, are proposed to regulate the knowledge expression so that the metadata specification is applied and tested on the museum voice guide application to make a reference for the inheritance and utilization of museum culture and relieve guides′ work pressure.
Key Words:metadata, voice guide, presentation specifications, cultural heritage, museums
0 引言
秦陵文化遗产是一个内涵丰富,集历史、文化、艺术、科技于一身的国家宝藏,主要包含秦始皇帝陵及其遗址、陪葬坑出土的俑、车、各色文物等,以及文物背后的秦朝政治、军事、文化生活、工藝技术、神话典故等。秦文化遗产独特的文化底蕴、文化形态、文化意向具有重要的社会经济、科学技术、文化艺术、历史传承等多重价值。目前博物馆多用数字化手段对馆内文物资源进行数字化建设以实现资源共享,这些举措对保护博物馆珍贵文物资源具有重要意义[1]。元数据是关于数据的数据,是对信息资源进行结构化描述[2],为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具,是建设数据库、数字图书馆、数字文物博物馆的基础[3]。
当前我国博物馆文物资源元数据研究应用大多集中于数字博物馆建设,很少应用于博物馆智能语音导览。研究基于智能语音导览系统的元数据对秦文化文物保护、知识传播与知识有效利用颇有裨益,同时也有利于我国文物信息标准化建设。
1 秦文化遗产元数据表达规范研究现状
1.1 世界元数据规范现状
元数据是描述某种类型资源(或对象) 的属性并对该资源进行定位和管理、有助于数据检索的数据[4]。国际上,不同领域的专业人员针对不同类型的信息资源,研究和制定了用于多个领域和场合的元数据标准[5]。通过总结国内外研究,本文列出目前在国际上较有影响的4 种元数据标准,如表 1所示。
1.2 秦陵文化遗产元数据表达现状
博物馆对元数据的应用主要体现在博物馆数字化中,博物馆数字化依托统一规范化的元数据,对文物信息资源进行保存、管理和利用。当前数字博物馆在国内外已成为信息化建设热点和重要领域之一,已有一批数字化博物馆在网络上向公众开放[7]。基于博物馆数字化的智能语音导览系统是将文物本体数字化、信息传播网络化和观赏游览公众化。目前秦始皇帝陵博物院已开展相关文物数字化工作,但尚未建立统一的秦陵文化遗产元数据相关标准规范。
1.3 秦文化遗产元数据与智能讲解应用
本文主要研究如何利用国内外元数据表达秦文化知识,复用现有艺术品类元数据,对无法充分表达秦文化知识的元数据进行创新。目前国内元数据多应用于文物数字典藏等领域的数字化建设,本文聚焦于博物馆应用的一个全新领域——传播文化知识的智能语音导览。
秦文化元数据表达规范将知识结构化表达以方便计算机存储与应用,是智能语音导览的基础。为避免智能语音导览讲解重文物、忽略内涵主旨,知识相互孤立和枯燥的问题[8],本文从观众观展角度研究元数据表达,使智能语音导览讲解内容丰富、浅显易懂、有互动交流之感,从而达到人工讲解的体验。
2 秦陵文化遗产分类与元数据表达规则及框架
2.1 秦陵文化遗产分类
通过整理大量的秦文化知识并将其分类,根据元数据表达规范将知识以语音讲解形式规范化表达出来。本文将秦文化遗产进行4个层级的分类,以便知识存储和在语音导览中应用,具体包括将秦文化分为秦始皇帝陵、秦俑、铜车马、出土文物、历史故事5大类、22个知识小节和300余知识点,详见图1。
2.2 秦陵文化遗产元数据表达规范应用介绍
依照元数据规范的通用性、可扩展性、元数据之间可交换性、系统之间互操作性原则[9],结合梳理的秦文化知识体系、分类进行元数据表达规范研究。
秦陵文化遗产元数据是将秦始皇帝陵博物院中文物、历史资料等有选择地数字化,并将数字化的内容应用到秦文化历史旅游价值传播中。秦文化历史旅游价值传播有数字博物馆、虚拟现实、智能导览、知识大讲堂、特色旅游等多种形式。选择智能导览的应用形式,即以游览博物馆观众为中心,以其容易接受的形式表达知识,并规范各个知识属性,以便知识传播和利用。
2.3 秦陵文化遗产元数据表达规范与世界元数据表达规范映射
目前国际上通用的DC元数据、VRA视觉资料元数据、CDWA艺术作品描述元数据影响较大[10]、应用较广,考虑到秦文化资源特殊性和应用场景的人文特点,在秦文化表达元数据基础上尽量复用目前国际通用的元数据标准,实现不同元数据之间的映射,将一种元数据规范的元素、语义和语法,映射到另一种元数据规范的元素、语义和语法上[11]。秦文化知识体系分类复杂庞大,仅列出一个实例以供参考,具体内容见表2。
2.4 秦陵文化遗产元数据表达规范框架
元数据为描述数据的数据,主要描述数据属性信息。由于秦陵文化遗产比较丰富,经过研究整理出秦始皇帝陵、秦俑、铜车马、出土文物、秦代故事5个体系,每个体系又有旁支,例如:秦始皇帝陵包含秦始皇帝陵建筑遗址、陪葬坑、历史信息。以面向观众的秦文化知识普及应用为导向,采用字典型元数据对秦文化遗产进行表达,控制每个知识文字表达长度和知识颗粒度,使公众对研究组整理后的知识更容易理解。本方案根据每个体系知识特点进行相应属性描述,共分5个大类、22个小类,每一个小类有若干项属性元素,以描述秦俑为例,具体情况见表3。
2.5 秦陵文化遗产元数据元素研究说明
秦俑基本信息是秦俑元数据规范核心元素,其中秦俑种类分类方法参照业界比较认可的分类方法,直接应用于秦俑表达规范中,角色属性描述是对秦俑种类的进一步补充,例如:种类是跪射俑,属于重装步兵、弓弩兵、武士俑。秦俑使用兵器的描述只是简单描述兵器种类或造型,秦文化遗产表达规范中对秦俑兵器还制定了详细的属性描述,
例如:种类、造型、使用者、使用方式、科技工艺等,通过编号对秦俑和兵器使用者进行关联,以达到智能推荐效果。
秦俑相关历史信息意在表达描述秦俑其它要素等相关知识时无法辐射到的知识,有丰富的历史内涵和价值,所以单独对历史信息进行属性规范,例如:秦俑考古、秦俑修复、秦俑挖掘方法、不继续挖掘的原因等。
秦俑装束是对出土秦俑装束特点的描述,例如:出土秦俑中有多种俑佩戴帽冠,并且不同帽冠形状代表不同等级,将军俑佩戴鹖冠、中级军吏俑佩戴双版长冠、三级军吏俑佩戴单版长冠、骑兵俑佩戴皮弁,表达规范中还记录了秦俑装束图片。该部分的研究不仅能满足游客对知識的述求,还可帮助设计师在产品创意中对秦文化细节把握。
由于秦文化遗产出土大量科技、艺术水平极高的文物,表达规范中制作工艺是秦文化非常重要的一部分,秦历史文化遗产中秦俑、铜车马、战车、陶马、兵器都体现了高超的科技、艺术水平,制作工艺中对从属属性的描述可使记录在数据库中的知识追溯到文物实体上,使秦陵文化遗产知识形成一个内部关联、相互交叉的大网。
秦俑彩绘描述是秦艺术研究、文化创意应用、公众知识普及必不可少的部分。两千多年前,秦代艺术工匠制作的俑本是由绚丽多彩的颜色装扮而来,经过火焚和自然破坏,现已无法得知色彩绚丽的全貌, 但是绝大部分陶俑和陶马身上仍有颜色残迹,个别色彩仍然比较完整,艳丽如新。例如,上衣多朱红、枣红、粉绿、天蓝;幞多为朱红,冠为褐色或朱红,但冠带一律朱红色[12]。秦俑服饰彩绘属性描述为设计师研究秦代服饰提供参考。但是由于秦俑彩绘工艺、出土湿度、温度、空气变化等原因,部分彩绘残迹已脱落,所以大部分俑呈现陶质本身的颜色。
3 秦陵文化遗产元数据表达规范在智能语音导览中的应用
文物承载灿烂文明,传承历史文化,维系民族精神 [13]。宝贵的历史文化遗产隐藏在文物背后,非专业人士很难从纷繁的文物外表解读文化内涵,大多停留在走马观花的程度,急需语音讲解满足观众对知识的诉求。然而人工语音讲解员受人数、时间、地理环境等诸多因素限制,无法满足广大博物馆参观观众的需求,所以急需依托移动终端开发智能语音导览缓解讲解人员压力。
面向公众的语音讲解,需要将知识系统化再将碎片化的表达输入给观众。秦陵知识体系分为秦陵、秦俑、铜车马、出土文物、秦文化故事5个体系,每一个体系都是一个庞大的知识整体。知识体系内部知识之间相互交错、相互联系,复杂度如知识图谱。通过研究构建智能语音导览系统,将秦文化知识按照元数据表达规范语义化的描述,通过元数据之间关联组织实现秦文化智能化推荐。智能语音导览系统基于秦文化元数据表达规范的知识语义化描述与封装、秦文化知识组织、元数据关联,实现语音导览系统的数据结构,知识抽离提取、存储与应用。
3.1 秦文化知识语义化描述与封装
知识语义化描述与封装主要采用RDF数据模型描述和封装底层各知识对象[14],知识语义化描述主要采用人工抽取的方法,将知识按照元数据规范进行语义化描述。知识封装主要基于RDF资源描述框架,为底层知识资源提供统一的描述封装模型。
秦文化遗产的知识有其特定的文化内涵,对秦文化知识的描述(即概括性知识的描述)应反映其特殊的文化内涵特征[15]。以秦俑元数据为例,通过知识属性可分为5个大类:①基本信息:包括俑相关的基本信息,相关属性有名称、度量、出土坑、种类、角色、形态、装束、使用兵器、自定义描述,8个基本属性和1个可添加属性;②历史信息:包括名称、类别、描述3个属性;③秦俑装束:包括名称、分类、图片、描述4个属性;④制作工艺:包括名称、从属、描述3个属性;⑤秦俑彩绘:包括名称、从属、部位、颜色、颜料、方法及其它7个属性。以该规范框架进行秦文化知识描述规范,每一大类形成一个基于俑的文化知识单元,有利于统一有序地陈述复杂庞大的秦文化系统。
以制作工艺为例进行知识语义化描述,秦俑制作工艺分为俑头、手、足履、躯干、甲衣等捏塑方法,臂与躯干、手与臂套接方法、俑烧造工艺等。以俑头制作为例,通过元数据表达规范使用人工抽取方法进行语义化描述,见表2。
3.2 秦文化知识组织
知识组织层可分为两个关联子层,分别为知识描述子层和知识分类子层[17],知识描述子层旨在基于标准词汇集实现对知识及知识之间的外在描述与著录,知识分类子层旨在通过构建一个可反映知识资源蕴含内在知识元的主题分类本体,以表示包含各类结构化、非结构化、半结构化资源的隐性知识,实现资源基于知识元的聚类与浏览[18]。
以秦俑基本信息表达为例,对知识组织进行半结构化整理,实现秦俑内涵隐形知识挖掘。通过制定秦俑各个属性之间关系规则,实现秦俑知识推理。例如秦俑种类分为:将军俑、中级军吏俑、三级军吏俑、袖手俑、百戏俑、跽坐俑、驭手俑、车马俑、骑兵俑、立射俑、跪射俑等,与秦俑角色关系(见表4),通过半结构化整理及规则制定,满足知识语义化描述的半自动抽取。
3.3 元数据关联方法
本体是领域概念及概念之间关系的规范化描述,这种描述是规范化的、明确的、形式化的,可共享的[19]。虽然通过元数据本体,可在语义层面上描述文献资源元数据信息,并揭示它们之间的显性关系(如两个知识是整体和部分的关系),通过采用关联数据的形式对本土化元数据进行再组织,并采用关联数据原则在网络上进行发布。在类层面上,通过不同体系间秦文化知识相互联系,可将秦文化不同知识单元资源在语义层面上相互关联起来;在数据层面上,可将同一知识单元中的相同或相似资源进行关联,从而使秦文化知识构成一个有机联系的整体[20]。
将秦文化知识相互联系,使不同知识单元的知识在语义层面上相互关联。本文在挖掘秦文化知识对象的语义关联时,重点关注知识内容特征元数据和内部元数据之间的关联,例如秦俑属性中种类与出土特色文物中的兵器属性等各分面的关联。不同分面元数据的关联方法存在一些差异,故需要设计不同的元数据关联方法。本文主要针对内容分面,通过专家使用元数据父子关联方法,将秦陵文化知识通过层级关联,将复杂庞大的文化知识有机联系起来,以便进行智能推荐。
以秦俑知识体系为例,通过秦俑种类元数据属性与秦俑装束进行关联,实现通过种类了解秦俑帽冠等级、上衣样式、鞋子款式、发饰胡须样式;通过秦俑装束元数据与秦俑彩绘进行关联,通过上衣样式推荐秦俑服饰特点、服饰彩绘颜色分类等知识。通过元数据父子关联方法,在智能导览系统中智能推荐用户感兴趣知识。
3.4 智能语音导览系统介绍
语音导览系统包含前端讲解和知识库,观众既可看到文物文本描述,又可以随时随地听语音讲解。前端讲解知识点播放依照观众参观秦始皇帝陵博物院路线,按顺序调取规范化表达在知识库中的讲解知识并语音播报。知识库遵循元数据标准,规范形成数据模型框架,保证系统数据单元拥有合理的存储结构和应用模式,保证知识数据的准确性、一致性、有效性,为系统应用和服务提供坚实基础。同时将元数据表达后的知识通过人工语音录入音频,并将其输入到知识库中。观众通过现场体验秦文化遗产的宏大,结合文字和语音讲解,从多个维度立体地理解秦文化遗产,避免走马观花地观看展览。
4 结语
本文从博物馆语音导览视角,对秦文化遗产知识进行表达规范方面的全面调研和深入分析研究,介绍了表达规范的应用。通过对秦文化知识提取、组织与元数据框架模型及关联研究,提出秦文化知识以秦俑为代表的、包含基本信息、秦俑装束、历史信息、制作工艺、秦俑彩绘的表达框架和父子元数据关联方法。本研究以智能语音导览为例,对秦文化知识进行语义化描述与封装,使知识组织与元数据关联,实现知识结构表达、智能推荐。在后续研究中还将在应用层面进一步实现,其关键是如何对涉及多个知识本体的关联数据实现基于语义的智能化推荐,进一步研究知识、元数据关联,实现具有如人工向导用户体验的智能语音导览。
参考文献:
[1] 龚花萍,胡春健,刘春年.数字文物博物馆信息资源与元数据设计研究[J].情报杂志,2014(1):182 183.
[2] 刘学荣.基于数字博物馆的文物元数据研究[J].软件导刊,2009(4):155 156.
[3] 龚花萍,胡春健,刘春年.文物信息资源元数据建设原则、模型与方案讨论[J].图书馆学研究,2012(19):31—35.
[4] 冯项云,肖珑,廖三三.国外常用元数据标准比较研究[J].大学图书馆学报,2001(4):15 16.
[5] 董焱.数字博物馆元数据标准初探[J].北京联合大学学报,2005,19(2):61 65.
[6] 許鑫,张悦悦.非遗数字资源的元数据规范与应用研究[J].图书情报工作,2014(21):14 15.
[7] 冯甲策.国家博物馆元数据规范建设与应用[J].博物馆研究,2013(3):33 34.
[8] 唐闻欣.浅议博物馆中的语音导览——以南京博物院为例[D].南京:南京师范大学,2016.
[9] 刘士军,孟祥旭,向辉.基于XML的文物数字化博物馆数据集成研究[J].系统仿真学,2002,14(12):1624 1627.
[10] 蒋景瞳,刘若梅,贾云鹏.国际元数据标准的发展和研究现状[EB/OL].https:∥wenku.baidu.com/view/fb18f174366baf1ffc4ffe473 3687e21ae45ff71.html
[11] 黎焰.服装图片元数据核心元素[J].数字图书馆,2014(1):39 40
[12] 张军,蔡玲,高翔,等.对秦兵马俑彩绘保护技术的思考与建议[J].文物保护与考古学,2007(1):48 49.
[13] 中国共产党新闻网.文物保护十六字方针[EB/OL].http://cpc.people.com.cn/xuexi/n1/2016/0414/c385474 28275331.html
[14] 董坤.基于关联数据的高校知识资源语义化组织研究[J].情报理论与实践,2016,39(3):92 93.
[15] 李波.非物质文化遗产信息资源数据模型研究[J].图书馆界,2011(5):38 39.
[16] 何宏,任浩东.秦始皇帝陵博物院讲解资料汇编[M],西安:陕西人民出版社,2015:29 30.
[17] MATTEO G,FRANCESCO O. S WOLF: semantic workplace learning framework [J]. IEEE Transaction on Systems,Man and Cybernetics: Systems,2015,45(4):56 72.
[18] 黄文碧.基于元数据关联的馆藏资源聚合研究[J].情报理论与实践,2015(4):75 76.
[19] 王庚.基于本体知识库的文物素材智能检索系统设计和实现[D].杭州:浙江大学,2014.
[20] 欧石燕.面向关联數据的语义数字图书馆资源描述与组织框架设计与实现[J].中国图书馆学报,2012,38(6):58 71.