大运河文化遗产知识库内容构建研究*
——以镇江段为例

2022-08-17 03:55李永卉周宇婷周树斌
图书馆学刊 2022年7期
关键词:知识库镇江大运河

李永卉 周宇婷 周树斌

(1.江苏大学科技信息研究所;2.江苏大学法学院,江苏 镇江 212000)

中国的运河始建于春秋时期,见证了我国2000 余年的历史,其蕴含的文化与文明特质,成为中华民族重要的物质和精神财富。中国的大运河主要是指元朝在北京建都后,为了解决运粮问题,修浚了部分隋唐以来原有的运河和一些天然水道,又开凿了部分河道,最终形成的京杭大运河。京杭大运河曾经被国际工业遗产保护委员会在《国际运河古迹名录》中列为最具影响力的水道之一,2014 年6 月被正式列入《世界文化遗产名录》。习近平总书记指出:“大运河是祖先留给我们的宝贵遗产,是流动的文化,要统筹保护好、传承好、利用好[1]。”联合国教科文组织通过的《保护世界文化和自然遗产公约(1972)》,对“物质文化遗产”进行了界定。2003 年公布的《保护非物质文化遗产公约》,对“非物质文化遗产”相关概念也进行了界定。概括而言,“文化遗产”就是由先人创造并保留至今的一切文化遗存,包括物质文化遗产和非物质文化遗产[2]。因此,笔者研究涉及的大运河文化遗产概念,即是指与中国大运河相关的一切物质与非物质文化遗产。

由于大运河在中国历史上的重要地位,运河研究一直是热门议题之一,特别是2014 年大运河申遗成功以后,学者们围绕文化资源开发与遗产整合等问题,开展了大量研究。安作璋[3]主编的《中国运河文化史》是运河史研究中的代表性成果之一,该书从农业、商业、城市发展、社会思想等多个角度对运河文化和历史进行探讨。俞孔坚等[4]的《京杭大运河国家遗产与生态廊道》一文,从自然条件、经济环境、遗产现状等方面探讨了运河遗产保护措施,为运河遗产的保护提供了指导性意见。郭文娟[5]以京杭大运河济宁段为分析对象,根据文化遗产的构成特点,提出了针对性的保护策略。徐奇志与王艳[6]则对大运河(山东段)物质文化遗产与非物质文化遗产进行细分,并引入活态保护理论进行了系统分析。郗志群等[7]人通过代表性、多元性和整体性3 个不同视角,对北京大运河文化遗产的突出价值、文脉特征以及遗产体系评估进行了阐述。2021 年《东南文化》第3 期[8]刊登了系列文章,主要从运河博物馆构建和文化遗产开发角度,对中国大运河资源的开发与展示作了系统阐述。随着数字技术的发展,国内对大运河的研究不止停留在理论上,还出现了很多运河相关网站或数据库平台。如大运河遗产网,就是由大运河遗产保护管理办公室创建,主要传递与运河遗产相关的要闻以及存储相关影音资料。2019 年6 月21 日,中国首个大运河文化数据平台正式启动,随后不少地方开发了相关数字化平台进行展示。但是这些平台存在内容分散、关联性不强、缺乏后期维护、内容粗糙、缺少对资源系统梳理等问题。近年来,随着大数据、云计算、5G 等数字技术的飞速发展,使得知识传播更为高效、快捷,并形成了可开放获取的共享状态。因此,笔者将在以往研究的基础上,利用知识库技术对大运河文化遗产资源进行知识组织、知识挖掘和关联,构建大运河文化遗产专题知识库,以期为学术研究、地方经济和旅游以及运河遗产保护等提供参考。

1 大运河文化遗产本体建模

1.1 大运河文化遗产本体核心类的定义

本体是一种新型的知识组织体系,不仅能准确规范描述概念及其之间的关系,构造丰富的语义关系网络,而且还具有知识推理功能,可以深度挖掘概念之间隐含的知识关系[9]。文化遗产资源本体是对文化遗产的组成要素和内涵抽象概括后形成的一种形式化概念模型。笔者通过参考国际通用文化遗产数字资源本体模型CIDOC CRM[10]、CDWA、AAT 等,按照本体设计与构建的思路及步骤,分析大运河文化遗产构成要素,构建本体模型,旨在为大运河文化遗产领域相关概念描述与知识关联提供统一规范的数据模型。

基于大运河文化遗产资源复杂、繁多的结构特点和领域构成的核心要素,本研究将本体确定为人物、事件、文献、事物、地点5 大核心类。其中人物类主要包括与运河相关的代表性非遗传承人,历代与大运河相关的诗人、作家以及大运河相关大事件中涉及的主要人物等;事件类指有关运河文化遗产的一切相关活动,诸如军事战争、节日庆典、特定的礼仪活动等;文献类包括记载大运河文化遗产的历史文献和相关研究成果;事物类主要指出土文物、相关河道名称、运河制度、聚落遗产等大运河核心物质文化遗产,以及诸如方言、饮食、习俗等非物质文化遗产,此类又与当地的地理特点紧密相连;地点类主要是运河物质文化遗产所在地及非物质文化遗产分布地。该分类尽量将代表农业文明时期我国杰出的水运治理制度和治水工程技术,具有鲜明地域特色的人居环境模式,以及活态化线性文化遗产进行充分展示,5 大类既互相区别又有内在的联系机理。

1.2 大运河文化遗产本体模型构建

本体被认为是共享概念模型的明确的形式化规范说明[11]。构建本体模型的一个重要参考原则是尽可能复用现有本体词表。在确定核心类后,笔者参考文化遗产领域通用的CIDOC CRM 本体模型,并结合数字文献通用的DC 元数据标准框架,针对人物相关数据内容属性描述的FOAF、上海图书馆人名规范库本体(SHLNames)词表,以及广泛被使用的地理关联数据集之一的GeoNames,在此基础上进行适当扩展,用CCH(Canal Cultural Heritage)词表来表示运河文化遗产领域特有的概念,以此进行资源实体属性描述。完成本体属性的确定后,通过本体间相互映射,可实现不同本体间的相互关联。

运河文化遗产的5 类核心实体均根据自身特点复用并补充了相应的属性。人物(cch:Person)类,继承和复用了FOAF 词表,使其可以对艺人、诗人、作家等属性进行充分描述,将人物相关信息进行标识,与事件实体、事物实体及文献实体相关联;事件(cch:Event)类,主要对CIDOC CRM 进行复用,其他属性均使用自建词表进行规范,通过上述属性可以对运河遗产相关活动进行较为完整的规范性描述;文献(cch:Document)类,对DC 进行复用,将记载运河文化遗产及其相关资源的文献进行描述,这也是本研究的创新点和特色;事物(cch:Thing)类,对CIDOC CRM 进行复用,将运河文化遗产相关实物进行描述,是文化遗产保护重要组成部分;地点(cch:Place)类,对GeoNames 进行了复用,同时根据大运河文化遗产的特点进行补充性描述,通过对遗产资源地理信息的描述凸显了地域属性。根据本体词表的设定,对概念、属性、关系进行定义说明,最终构建运河文化遗产本体模型(如图1所示),基本可以描述大运河文化遗产资源的共同属性特征。

图1 运河文化遗产本体模型

本体是领域知识库构建的基础,能在语义层次上进行知识组织。知识库用于存储大量复杂的结构数据或非结构数据。本研究以本体模型为理论基础,在此基础上构建运河文化遗产知识库,有利于相关资源关系的梳理和有序存储。笔者以大运河镇江段为例,构建大运河镇江段文化遗产知识库。

2 大运河镇江段文化遗产知识库内容构建

根据开放获取知识库名录(OpenDOAR)统计,DSpace 是全球范围内使用最广泛的开源知识库之一[12],支持不同格式资源存储,包括文本、图片、音频、视频等媒体资源,能够满足大多数研究和资源开发者对数字资源储存、开放获取和检索的需求。鉴于大运河文化遗产资源的丰富性和特殊性,DSpace 不仅能够满足多层次资源描述,还能够对软件进行二次开发,也可以与其他数字平台建设仓储联盟,因此,完全可以实现大运河文化资源真正的整合与互通。

2.1 大运河镇江段文化遗产知识库内容构建

构建大运河镇江段文化遗产知识库首先需确定知识库的内容范围。结合镇江地域的实际情况进行对照、筛选,将镇江物质文化遗产按照形态特点主要分为:航道及水利工程遗存,其中包含航道遗存(破冈渎遗址、上容渎遗址、九曲河、镇江市区内老河道等),重要港口(大京口、小京口、甘露口等),堤坝遗址(丁卯埭、京口埭等),桥梁遗存(丁卯桥、虎踞桥、开泰桥等),涵闸遗存(京口闸、九曲河闸等),津渡(西津渡等),漕运粮仓(宋元粮仓等);运河沿岸文化历史遗存,主要包含古城遗址(铁瓮城遗址、丹阳古城遗址等),庙宇遗址(金山寺、焦山寺等),历史文化街区(西津渡历史街区、新河一条街等)[13]。镇江段非物质文化遗产资源亦极为丰富,如,民间文学、曲艺、传统戏剧、传统舞蹈、美术以及往来客商留下的著名诗词等,极具文化和地域特色。其诗词资源尤为丰富,且包含大量镇江地理信息和人文情怀,故特此构建镇江段运河特色诗词库,为丰富运河文化提供新的方向。

结合镇江段文化遗产知识库的内容范围,确定以下建库原则:一是数据收集标准。收集的范围包括大运河镇江段物质文化遗产、非物质文化遗产以及相关的文化资源,格式包括文档、图片、视频、音频等;二是平台操作标准。针对不同的用户权限,向所有用户都开放浏览功能,部分资料可支持下载,对于机构人员内部人员提供上传和下载权限等;三是平台服务标准。在建库过程中,充分考虑用户需求,积极采纳合理的意见或建议,分析用户偏好,设置定制服务等。同时,为确保流程中各个环节都具备故障分析和容错能力,对各个层次的访问进行了权限设置,并充分利用日志记录操作流程,保证研究的科学化、合理化、规范化。

根据运河文化遗产本体模型发现,地点类与人物类、事件类、文献类、事物类都有一定的内在联系,因此,笔者以大运河镇江段的沿线物质文化遗产为切入点,再与该地点相关的人物信息、活动信息、文献信息、事物信息分别进行关联。通过遵循制定的建库原则,最终形成了大运河镇江段文化遗产知识库的首界面(见图2)。

图2 大运河镇江段文化遗产知识库首界面

2.2 实例展示——以镇江运河诗词特色知识库为例2.2.1 数据采集

历史上的运河最主要的功能就是漕粮运输。镇江地处长江与大运河交汇之地,是江南运河的起点,地理位置十分重要,到了南宋时期,这里更是前线粮草运输的命脉。尤为重要的是从南宋到元代,镇江就设有转般仓专门用于存储运输粮食,同时还设有京口闸等重要的水运设施工程。因其特殊的地理位置和历史文化积淀,镇江留下了一批非常有特色的与大运河有关的诗文,体现了在当时的历史背景下人们对大运河的认知。

首先,对如古诗文网、中国基本古籍库等网络上的有关诗词进行检索,再核对权威纸本文献以及留存的个人诗文集等文献,如《全唐诗》[14]《全宋诗》[15]《全宋词》[16]《全元诗》[17]《全明诗》[18]《清诗总集丛刊》[19]等著作,对诗文进行第一批次筛选。如检索“西津渡”,即有“西津渡,去府治九里,北与瓜洲渡对,唐张祜诗:金陵津渡小山楼,一宿行人自可愁。潮落夜江斜月里,两三星火是瓜洲”,这样的地名解释。然后,通过查阅《嘉定镇江志》[20]《至顺镇江志》[21]《镇江港史》[22]等镇江地方资料,同时辅以谭其骧《中国历史地图集》[23]《舆地纪胜》[24]《方舆胜览》[25]以及《读史方舆纪要》[26]等历史地理书籍,确定有关镇江运河名称的关键词,如甘露港、京口港、九曲河、蒜山渡、西津渡、伊娄河、河、练湖、归水澳、长桥、清风桥(范公桥)、嘉定桥、千秋桥、绿水桥(高桥)、通济桥、程公桥、拖板桥、京口闸等。再通过镇江地方志等地方文献确定与镇江运河有关的历史遗迹、亭台楼阁等关键词,如京口转般仓、金山、北固山、焦山、蒜山、妙高台、海门、象山、京口闸、甘露寺、铁瓮城、狠石、浮玉、南徐、多景楼、瘗鹤等,对上述数据进行二次清洗。

以步骤1、2搜索出来的诗词为基础,通过手动排查,共得到与镇江运河有关诗词共718 首,其中唐代148 首,宋代226 首,元代97 首,明代100 首,清代147首。

2.2.2 数据分析

(1)诗词主题分析

利用R 语言将718首诗词进行主题分析,分析结果如图3所示,历代与镇江运河相关诗词涉及的地名主要包括京口、海门、西津、金山、扬州、江南等。除去地名后发现,诗人常用到万里、何处、江山、故人、青山等词汇,来抒发诗人在镇江段运河沿线的所见所感,围绕家国、人世、亲情、友情、爱情等主题,表达了作者们的思想感情,也反映了当时的社会状况。

图3 诗词主题分析图

(2)诗文情感分析

通过使用ROST 情感倾向分析工具将718 首诗词进行情感分析,分析结果显示,近40%的诗人在镇江运河上表达了积极的情绪,有对漕运开通带来繁荣的称赞,有对镇江运河繁荣景象的惊叹;有37%的作者表达了些许的消极情绪,或是对漕运开通耗费了大量人力、物力的悲叹,或是对自己际遇的不满。可以看出,大运河的开凿在一定程度上影响着诗词创作的主题,出现了很多对大运河开通运行的功过评判、反思的诗文,同时也出现了以大运河寄托情感和心绪的作品,在文人笔下将运河记忆展现得淋漓尽致。

2.2.3 可视化展示

西津古渡是国家级文物保护单位,自三国时期,西津渡就是当时镇江通往江北的唯一渡口,具有极其重要的战略地位,孙权的东吴水师曾驻守于此,唐代以后更是有兵丁守卫巡逻。宋熙宁元年(1068)春,王安石应召赴京,从西津渡启航北上,舟行至瓜洲,见景抒情,写下了千古绝句“京口瓜洲一水间,钟山只隔数重山。春风又绿江南岸,明月何时照我还。”笔者以该诗为例,根据运河文化遗产本体模型,文献—地点—人物关联实体如图4 所示。可以看出,文献实体“《泊船瓜洲》”、地点实体“西津渡”、人物实体“王安石”在一定程度上实现了互通互联。以此,根据图4的实例关系模型,利用DSpace系统进行构建,实现了相关实体的可视化展示,如图5 所示。通过对文献内容、地点和人物的资源整合,可使用户通过文献内容了解更多相关地点、人物信息;同理,也可通过地点或其他类关联到相关信息。

图4 《泊船瓜洲》关联实例

图5 《泊船瓜洲》可视化展示

本研究通过构建大运河文化遗产知识库,可以实现运河文化遗产的数字化保存,对运河文化遗产资源的地域情况、活动特征、文献内容、人物信息等进行多方面的深入挖掘与组织。通过对镇江段文化遗产资源进行组织、关联与展示,形成一个可以长期存储的数字化平台,并使得资源间可以进行深度关联和展示,从而满足运河文化遗产资源的存储、管理、共享等需求。本知识库仍存在如界面功能不够完善等许多不足,未来将加强对软件系统功能的深入开发,完善大运河文化遗产知识库,并将继续挖掘有关大运河的信息资源,以丰富平台的资源与内容,力求能够将所有运河沿线城市的资源进行相互关联整合,实现运河文化的全方位、多层次展示。

3 结语

随着大数据技术的发展,跨学科的研究显得越发重要。将文化与科技相融合是目前历史文化领域研究的大势所趋。应改变传统的文化传播、交流方式以及知识存储、组织、共享的模式,结合全新的数字技术促使大运河文化遗产资源从现实世界向数字空间迁移,实现文化遗产的活化。习近平总书记曾提到:“要古为今用,深入挖掘以大运河为核心的历史文化资源。保护大运河是运河沿线所有地区的共同责任[27]。”笔者以大运河镇江段文化遗产资源为例,通过采用本体和知识库技术,对镇江段大运河文化遗产资源进行知识组织,初步构建了镇江段运河文化遗产知识库。一方面有益于推进大运河文化遗产资源知识组织体系建设,为科研人员研究运河提供数据关联,另一方面也有助于向大众推广和普及运河文化,有利于大运河旅游资源的深度开发,提高地方文化软实力。

猜你喜欢
知识库镇江大运河
汉语近义词辨析知识库构建研究
大运河,行走山东
赛珍珠:我在镇江有个家
我的镇江寻根之旅
大运河:最后的绝唱
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
高速公路信息系统维护知识库的建立和应用
镇江是这样调价的
考古者眼中的隋唐大运河 湮没的辉煌
遇见“大运河”