文化传承视角下馆藏文物多粒度知识组织研究*

2022-09-09 06:24李迎迎孙玉琦
数字图书馆论坛 2022年8期
关键词:细粒度粒度馆藏

李迎迎 孙玉琦

(1. 淮阴师范学院经济与管理学院,淮安 223001;2. 中国科学院武汉文献情报中心,武汉 430071;3. 中国科学院大学经济与管理学院,北京 100190)

文物作为人类文化的重要物质载体,承载着文化传承的重要使命[1]。随着文物考古工作的不断推进和人们对文物认识的不断深入,文博领域逐渐积累了大量的文物知识,这些文物知识共同构成文博领域知识空间。馆藏文物作为文物知识的重要来源之一,主要是指收藏于博物馆、图书馆和其他文物收藏单位的文物[2],本文中以收藏于博物馆的文物作为研究对象。当前环境下,馆藏文物研究工作中存在的最大挑战不是如何获取文物知识,而是如何对现有文物知识进行系统化整理,并且采用计算机可读的方式展示出来,以结构化的方式呈现给用户,进而构建统一的馆藏文物知识体系[3]。针对馆藏文物这种比较特殊的资源,用户在获取馆藏文物知识过程中越来越追求粒度的细化,通过对馆藏文物多粒度知识进行数字化表示,可以为用户提供精细化的馆藏文物知识。馆藏文物多粒度知识组织有助于对馆藏文物资源进行组织和管理,实现馆藏文物资源的高效利用,同时也可提供不同格式资源之间的交换,提高资源互操作的效率。另外,还可使结构异质、复杂多样、分布散乱的馆藏文物资源得到有效集成与整合,提高馆藏文物资源的知识服务能力,便于其他领域学者对馆藏文物进行研究。

1 相关研究

1.1 馆藏文物知识服务

目前知识服务在文博领域的研究相对较少,文博领域知识服务的研究首先应借鉴信息资源管理领域的研究成果、研究理论及研究方法,实现知识服务从数字图书馆到数字博物馆的成功融合与迁移。Proctor[4]提出通过社交媒体(如Flickr、Wikipedia、YouTube、Facebook、Twitter等),加强博物馆文物的知识分享功能,加强博物馆资源(如图像、视频和链接)的知识分享。Marty[5]做了关于在线博物馆的调研,认为绝大多数在线博物馆用户期望各博物馆网站之间可以进行资源交互,提供博物馆网站上文物数字化资源的使用,并且利用先进的信息技术改变用户使用博物馆和博物馆资源的方式。Kolay[6]提出新媒体在文化遗产服务中发展十分迅速,如虚拟文化遗产及数字文化遗产等,但新型文化遗产拓宽了文物的复杂性。国内针对知识服务的研究大多集中在信息资源管理领域,尤其体现在知识服务理论研究方面,而馆藏文物资源知识服务研究尚不深入,缺少从知识服务的角度对文物进行资源组织,包括知识服务的过程、知识服务的内容等。

1.2 馆藏文物知识组织

目前国内外学者除利用元数据对文物资源进行组织之外,还利用本体实现文物资源的组织。在元数据方面,文博领域通用的元数据标准主要是CDWA[7]、VRA Core[8]以及DC[9]等,此外还有针对某一类文物(如拓片、古籍等)的专门元数据标准,以及针对不同数字博物馆的专门元数据标准。在本体方面,王超英[10]提出了基于本体的文物知识库构建方法,构建了知识库扩充推理的框架和知识库扩展检索的模型,形成了满足用户需求的文物知识库。在其他组织方式方面,高劲松等[11]从细粒度的角度对文物图像资源进行知识表示,揭示了视觉图像与语义特征的关联。总的来说,目前有关知识组织的研究大多数集中在图书馆知识组织、信息资源组织及网络信息资源组织等方面,未将已有的研究成果及方法成功迁移至文博领域。就文物知识组织而言,研究方法较为单一,大部分集中于文物元数据的设计与创建,未形成系统且完整的研究方法体系,未能综合本体、关联数据、知识地图等多种研究方法,对于某些特殊类型的文物描述粒度相对较粗。因此,本文从多粒度角度出发对馆藏文物知识进行高质量组织。

2 馆藏文物多粒度知识体系构建

2.1 馆藏文物知识的多粒度划分

本文主要依据馆藏文物实体本质属性特征和馆藏文物知识粒度的大小情况对馆藏文物知识进行分类。粒度,顾名思义就是颗粒的大小,徐绪堪等[12]对知识粒度做了明确定义,认为在知识层面,粒度是知识的基本构成单元,粒度的大小表示知识抽象程度的大小,可以从不同角度或不同层次对知识粒度进行划分,形成若干个不同的知识块或知识单元。一般来讲,细粒度指的是不可再划分或者无须再划分的最小知识单元;中粒度则是处于细粒度和粗粒度之间,由最小知识单元构成的,没有达到最小划分,而又处于最大划分之下的知识粒度;粗粒度是知识的最大粒度,也可以称为父粒,中粒度和细粒度知识都是在粗粒度下进行的深层次划分[13]。根据知识粒度的不同,本文将馆藏文物知识分为粗粒度馆藏文物知识、中粒度馆藏文物知识以及细粒度馆藏文物知识[14]。根据图书馆馆藏资源多粒度划分模式[15],结合馆藏文物特征进行馆藏文物知识多粒度划分(见图1),将馆藏文物知识划分为事件知识、特征知识、概念知识、实例知识,以有效识别馆藏文物知识单元。

图1 馆藏文物知识的多粒度划分模式

(1)粗粒度馆藏文物知识。粗粒度馆藏文物知识主要是宏观意义上的馆藏文物知识,是相比于其他学科来讲的,指的是馆藏文物实体。由于馆藏文物资源除实体资源外,还包括大量文物数字资源,如图片、视频、三维立体模型等,本文在研究过程中,对馆藏文物进行知识组织是基于馆藏文物实体数据进行的。一般情况下,文物只有通过历史的发展、事件的洗礼才能称为文物,这是区别于其他类型资源的典型特征。因此,粗粒度馆藏文物知识指的是馆藏文物实体,包括在馆藏文物背后发生的历史事件,本文称为馆藏文物事件知识。

(2)中粒度馆藏文物知识。中粒度馆藏文物知识介于粗粒度馆藏文物知识和细粒度馆藏文物知识之间,是3种粒度中最重要的粒度,作为知识元素提取的依据,也是细粒度馆藏文物知识进行提取的依据。本研究将中粒度馆藏文物知识划分为馆藏文物特征知识和馆藏文物概念知识。馆藏文物特征知识主要指的是馆藏文物的属性特征,也可称为馆藏文物的客观知识,如文物的外观、纹饰、铭文、尺寸、技法、工艺等。馆藏文物概念知识主要指的是馆藏文物的背景知识,从馆藏文物事件知识中提取出的文物背后事件的时间、地点以及人物等,可以表述为时空范围、来源、创造者等中粒度馆藏文物知识元素。

(3)细粒度馆藏文物知识。细粒度馆藏文物知识是指不可再分的最小粒度的馆藏文物知识单元,主要是馆藏文物实例知识,是可以进行知识著录的基本单元。铭文作为中粒度馆藏文物特征知识,是可以进行细粒度划分的,例如筑于青铜器上的铭文,其细粒度馆藏文物知识就可以包括徽记铭文、祭辞铭文、册命铭文、追孝铭文、记事铭文、乐律铭文等知识单元,这基本可以定义为馆藏文物领域不可再分的知识单元。再如中粒度馆藏文物概念知识中的创造者,也可以进行细粒度划分,主要包括制作人员、使用人员以及出土人员等细粒度知识单元,以现藏于湖北省博物馆的越王勾践剑为例,它的使用人员就是越王勾践,这些都可以称为细粒度馆藏文物知识。

2.2 馆藏文物多粒度知识体系

由于文物种类多样,涉及内容十分烦杂,因此需要尽可能地提取文物的共性元素,实现对多类型文物及文物资源的统一组织,以保证文物知识的互操作性及共享性。对馆藏文物知识元素进行组织的有效工具为元数据,因此本文以文物元数据中的元素作为馆藏文物多粒度知识体系构建及知识元素提取的标准。

由于研究对象是文物类型中的馆藏文物,因此本文基于现有常用文博领域元数据标准CDWA、VRA Core、DC以及目前国内现行使用的标准,如国家文物局发布的《博物馆藏品信息指标著录规范》[16],制定了馆藏文物多粒度知识体系。同时依据北京大学参与的国家科技支撑计划“文物数字化保护标准体系及关键标准研究与示范”课题研究成果“文物数字化保护元数据标准研究”制定的文物核心元数据标准和各种专门元数据标准进行知识体系构建[17]。

在馆藏文物多粒度知识划分模式的基础上,通过对比前文提到的各种文物元数据标准,最终确立17个中粒度馆藏文物知识元素,其中7个元素为馆藏文物特征知识、10个元素为馆藏文物概念知识(见图2)。中粒度馆藏文物知识元素必须有元素修饰词作为支撑,如馆藏文物的描述信息一般情况下包括铭文、标记及其他信息等。细粒度馆藏文物知识是对中粒度知识元素修饰词进一步细分的结果,根据不同的分类标准有不同的分类结果。以青铜器铭文为例,依据《中国青铜文化》[18],将青铜器铭文划分为徽记、祭辞、册命、训诰、追孝、约剂、律令、记事、符节、媵辞、乐律、工名等铭文。

图2 馆藏文物多粒度知识体系框架图

2.2.1 馆藏文物知识元素提取

在进行馆藏文物具体知识著录过程中,中粒度馆藏文物知识元素需要知识元素修饰词作支撑,依据相关元数据标准,确定17个中粒度馆藏文物知识元素的修饰词,如表1所示。

表1 馆藏文物知识元素提取

中粒度馆藏文物知识元素名称和元素修饰词都是在已有元数据标准的基础上进行的复用和扩展,包括馆藏文物概念知识和馆藏文物特征知识两大数据集。由于CDWA、VRA Core以及DC元数据元素之间具有重合性,例如:馆藏文物概念知识中“名称”就可

复用CDWA的Titles or Names、VRA Core的title、DC的title;“文物类型”可复用CDWA的Classification、VRA Core的worktype、DC的type;“馆藏机构”可复用CDWA的Place/Location Authority、VRA Core的Location;“时空范围”可复用VRA Core的date、DC的date;“创造者”可复用CDWA的Creation、DC的creator;“权限”可复用CDWA的Copyright/Restrictions、VRA Core的rights、DC的rights。馆藏文物特征知识中“规格”可复用CDWA的Measurements、VRA Core的Measurements;“技法”可复用CDWA的Materials and Techniques、VRA Core的technique;“描述信息”可复用CDWA的Descriptive Note、VRA Core的description、DC的description。除此之外有些元素只可复用一种元数据标准,例如:馆藏文物概念知识中的“相关文物”可复用CDWA的Related Works;“相关数字资源”可复用CDWA的Related Visual Documentation;馆藏文物特征知识中的“文物识别号”可复用DC的identifier;“材质”可复用CDWA的Materials and Techniques。另外,根据馆藏文物中粒度知识元素还扩展了对馆藏文物特征知识十分重要的一个元素“外观”。此外,“来源”“入馆”“现状”这3个元素是专门针对馆藏文物的管理信息,是比较特殊的且十分重要的元素,归为馆藏文物概念知识。此外,将馆藏文物根据粒度进行划分之后的中粒度馆藏文物知识可以辅助制定更加合理的元数据元素,这些元素基本可以满足用户和机构管理者对馆藏文物的知识组织需求。

2.2.2 馆藏文物知识著录

馆藏文物知识需要明确著录规则,在细粒度知识组织过程中才可游刃有余。著录规范需要对每一个元素及元素修饰词进行明确规定,才能确保馆藏文物知识组织过程中的结构一致性。目前,国际上应用较为广泛的文物著录规范主要是CCO(Cataloging Cultural Objects)[19],CCO可用于不同的数据结构中,这有利于建立数据结构的一致性。

由于CCO与CDWA、VRA Core、DC以及本文所提出的馆藏文物知识元素之间有交叉重合,因此本文在依据CCO对元素进行著录过程中,必须根据实际需求进行选择性利用,同时参考DCMI术语定义的内容,给出知识元素及修饰词在著录过程中需要呈现的主要事项,如表2所示。

表2 馆藏文物知识著录规范事项

根据馆藏文物著录规范事项,以“名称”知识元素为例,说明馆藏文物知识如何著录,如表3所示。

表3 “名称”知识元素著录规范

3 馆藏文物多粒度知识表示实例

以中国国家博物馆迄今为止世界上出土的最大最重的青铜礼器——“后母戊”青铜方鼎为例,进行馆藏文物知识表示实例验证。“后母戊”青铜方鼎现已被国家列为一级文物,并且在2002年列入禁止出国(境)展览文物名单,足以证明“后母戊”青铜方鼎在国内文博界的地位。通过中国国家博物馆获取“后母戊”青铜方鼎的文物知识,利用本文提出的多粒度视角下的文物知识组织方法,将“后母戊”青铜方鼎文物信息转化成为结构化的知识数据,结果如表4所示。

表4 “后母戊”青铜方鼎多粒度知识表示

4 馆藏文物多粒度知识组织的启示

知识体系是伴随新兴的数字环境发展起来的数字资源交流及长期保存的平台与模式,这种知识管理组织形式有助于提高资源管理的效率,促进科学组织管理的发展。馆藏文物知识体系可以促进馆藏文物知识库的构建,这不仅可以使馆藏文物活起来,同时也为馆藏文物信息资源及馆藏文物知识的科学传播与共享提供了一个高效的平台。从实践意义上来看,馆藏文物知识体系不仅是一种知识组织管理理念,同时也是一个知识管理组织的系统或者平台,因此馆藏文物知识体系在构建过程中应该嵌入科学的馆藏文物资源管理机制,才能保证馆藏文物知识体系构建的顺利进行。馆藏文物知识组织是对涉及馆藏文物信息知识的一系列人、事、财、物的科学管理流程与方法,包括对馆藏文物信息资源的管理、知识产权的管理以及资源知识的长期保存等问题,以此实现馆藏文物知识体系的科学建设,同时还应注意馆藏文物知识体系的可持续发展。

4.1 明确馆藏文物知识库分类管理机制

分类管理机制是馆藏文物知识组织中十分有效的管理方式,通过对不同级别的文物资源实行不同级别的分类管理政策,可便捷高效地实现馆藏文物分类组织。根据国家标准,依据文物的珍贵程度、年份的长短、学术价值的大小等将文物分为一级文物、二级文物以及三级文物,其中一级文物又分为甲、乙两个等级,一级甲等文物就可以称为国宝级的文物。针对不同级别的文物,应提供不同的知识库分类管理机制。

4.2 建立馆藏文物知识体系开放共享机制

馆藏文物知识体系的开放共享有利于文博事业的发展,促进文博科学研究的进步,因此具有重要的价值与意义。馆藏文物知识的分级共享开放机制依托于馆藏文物知识分类管理机制,不同级别的文物开放共享程度不同,同时也为了对不同级别的馆藏文物实行知识产权保护机制,馆藏文物知识体系需要对资源的开放共享程度做出明确规定。从用户的角度来讲,根据用户需求的不同,可开放共享的知识资源也应该有所区别,这不仅提高了知识利用率,也提高了用户检索效率。

4.3 完善馆藏文物知识产权保护机制

所有的文物都归属于国家,文物数字化后的资源可供用户观赏和科研,但文物信息和知识是人的智力劳动成果,因此是具有知识产权的。在馆藏文物知识体系的共建共享中,必须完善知识产权保护政策和机制。当然,通过分级分类的管理机制,使不同层次馆藏文物知识对不同层次的人员开放,对资源使用者的身份和使用方式做出明确规定,也可以实现馆藏文物的知识产权保护。

4.4 促进馆藏文物软硬件协同可持续发展

可持续发展政策作为馆藏文物知识体系的基本原则和行动指南,在知识体系构建与发展过程中具有举足轻重的地位,可持续发展政策为知识体系构建提供了重要依据和战略方针。在馆藏文物知识体系构建过程中,应做到软件硬件协同作用,使馆藏文物知识体系健康发展。馆藏文物可持续发展的硬件方面主要体现在馆藏文物资源建设方面,包括资金、人力资源等,资源建设的可持续发展需要保证信息和知识的不定期更新,保障知识的新颖性,提供给用户足够的吸引力。馆藏文物资源可持续发展的软件方面主要体现在馆藏文物的知识服务方面,通过知识服务的可持续发展,提供给用户更佳的文物观赏以及科学研究的体验。

馆藏文物知识库分类管理机制、开放共享机制以及知识产权保护机制三者之间息息相关,环环相扣,密不可分,馆藏文物信息知识的开放共享,依托于馆藏文物信息资源的分类管理,而在信息资源开放共享过程中,必然产生馆藏文物信息资源知识产权保护问题。馆藏文物知识体系的构建最终需要在实践过程中,总结面临的主要问题和现实障碍,针对这些问题与障碍提出切实可行的解决方案,因此必然面临可持续发展问题。这“三机制一发展”打破以往只关注资源建设本身的界限,将馆藏文物知识体系构建置于整个社会化大环境中,在理论与实践中完善馆藏文物知识体系构建的政策,为馆藏文物知识体系构建提供重要的支撑,以使馆藏文物知识体系成为真正的知识资源平台和知识服务平台。

5 结语

通过馆藏文物知识体系构建,能够对不同来源、不同内容的馆藏文物知识进行有效揭示,同时还可以实现资源重组。基于多粒度进行馆藏文物知识组织,可以从粗粒度、中粒度及细粒度等方面进行全方位整合,几乎可以涵盖馆藏文物必备的知识元素。针对馆藏文物实体从粗粒度角度提取有效事件知识,再从中粒度馆藏文物知识对馆藏文物概念知识和特征知识进行提取及表示,继而对馆藏文物实例知识进行有效著录,满足管理者在知识组织过程中所需展现的内容,同时也满足用户获取馆藏文物知识内容的需求,有利于中国文化的传播与传承。

猜你喜欢
细粒度粒度馆藏
融合判别性与细粒度特征的抗遮挡红外目标跟踪算法
粉末粒度对纯Re坯显微组织与力学性能的影响
馆藏几件残损《佚目》书画琐记
动态更新属性值变化时的最优粒度
基于SVM多分类的超分辨图像细粒度分类方法
博物馆的生存之道:馆藏能否变卖?
知还印馆藏印选——古印篇
基于型号装备?角色的IETM访问控制研究
基于web粒度可配的编辑锁设计
双粒度混合烧结矿颗粒填充床压降实验