数字人文视角下的大别山革命文物知识图谱构建

2024-06-17 16:43吴艳飞张强周树斌汪睿思周洪
知识管理论坛 2024年2期
关键词:革命文物数字人文知识图谱

吴艳飞 张强 周树斌 汪睿思 周洪

摘要:[目的/意义]革命文物承载着深厚的历史文化价值,对其进行知识组织研究有助于推动革命文物资源在数智时代的开发利用,为实现革命文物资源的知识关联与发现研究提供新路径。[方法/过程] 以大别山革命文物为研究对象,首先,通过构建本体模型实现对革命文物资源领域内概念的规范化描述;其次,在分析革命文物资源结构特征的基础上,对不同来源与结构的数据进行实体、属性和关系抽取,并利用知识融合技术解决歧义问题;最后,将数据存储到Neo4j图数据库中完成革命文物知识图谱的构建,以实现对革命文物资源的多维知识发现研究。[结果/结论]通过构建革命文物知识图谱,可以对革命文物资源进行深层次知识挖掘,实现对其知识单元的细粒度分析与知识关联,为革命文物资源的智能化应用奠定基础。

关键词:革命文物;知识图谱;数字人文;知识发现

分类号:G251.2

引用格式:吴艳飞, 张强, 周树斌, 等. 数字人文视角下的大别山革命文物知识图谱构建[J/OL]. 知识管理论坛, 2024, 9(2): 148-160 [引用日期]. http://www.kmf.ac.cn/p/384/. (Citation: Wu Yanfei, Zhang Qiang, Zhou Shubin, et al. Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities [J/OL]. Knowledge Management Forum, 2024, 9(2): 148-160 [cite date]. http://www.kmf.ac.cn/p/384/.)

革命文物是中国共产党领导人民群众在追求民族复兴的实践与奋斗过程中所保留下来的历史遗存物,承载中国革命的伟大历程与光荣历史,蕴涵丰富的革命文化与红色精神。当前党和政府从政策方面对革命文物资源的保护利用给予高度重视。2018年,中共中央办公厅、国务院办公厅颁布了《关于实施革命文物保护利用工程(2018—2022年)的意见》,对开展革命文物保护利用工程提出具体要求[1]。习近平总书记在2021年召开的全国革命文物工作会议中,明确了加强革命文物保护工作对红色文化的弘扬与传承具有重要作用[2]。革命文物是伟大革命斗争中历史事件的缩影,承担着赓续红色基因的责任[3]。实施革命文物资源的深度开发利用,不仅可以直观全面地挖掘文物中蕴含的历史知识,还可以集中彰显中国伟大革命历程的独特魅力,发挥革命文物以史鉴今、资政育人的重要作用。

现代信息技术发展的浪潮为人文学科研究提供了新思路与方法,拓宽了人文研究范畴,为文化遗产领域资源的传承与保护提供技术支撑。现阶段,我国的文化遗产领域资源建设侧重于应用现代技术进行数字化加工与存储,忽视了对资源的深度挖掘与规范化表示。为解决这一问题,需要利用语义网技术对资源进行细粒度分析及关联聚合,从而实现将研究重点从“藏”向“用”的转变。革命文物作为重要的文化遗产,数量多、种类丰富,隐含丰富的文化价值,但目前尚未实现资源的语义描述,也无法满足用户的可视化展示、语义检索的需求。因此,可以借助知识图谱所具有的强大数据表示与描述特性,打破革命文物资源的固化藩篱,以可视化的方式将资源及资源间的关系呈现出来,完成知识重组,再现革命历史场景。构建革命文物知识图谱是对革命文物资源的内涵进行深层挖掘的过程,不仅能够提升资源的利用广度与深度,也可以为用户开发利用资源提供切实的解决途径。

笔者立足数字人文视角,以大别山革命文物为研究对象,在分析资源结构特征的基础上,明确革命文物所涉及的相关概念与属性,进而构建革命文物本体模型。然后,以此为模式层构建革命文物知识图谱实现资源之间的知识关联,深层次挖掘资源背后隐含的语义知识,为探究革命文物资源的知识组织与知识发现提供了新的研究路径,改变革命文物资源的服务模式,实现从单一的信息浏览到语义化的智能服务的转变,有助于革命文化的传播与共享。

1  研究现状/Research status

1.1  革命文物资源研究

革命文物见证了中国革命艰辛历程,是中国共产党领导人民在革命、建设和改革的奋斗过程中遗留下的历史遗物与遗迹。其具体形态表现为革命遗址遗迹、名人故居、英烈纪念馆等不可移动文物,以及相关的档案、文献、史料、实物等可移动文物。革命文物作为红色文化的载体,相关研究主要集中于国内。革命文物的保护与利用研究随着数字技术的变革而发展,其发展历程可以分为3个方面:①革命文物资源的数字化研究,主要是通过OCR、数字影像等方式来实现对革命文物资源的数字化保存与整理。如彭庆红等[4]提出根据资源类型的不同设计相适应的开发利用路径,来推动红色档案资源的数字化建设。②革命文物资源的数据化利用,数据化的关键在于重构革命文物资源的数据颗粒形态,使用元数据、领域本体构建等方法实现革命文物资源标准化和有序化。如罗素洁等[5]以“余杭红色记忆”专题资源库为例,探索在基层公共图书馆建设红色文献数据库的实践路径。③革命文物资源的关联聚合研究,主要是对结构化数据进行开发利用,实现资源间的相互关联。如付靖宜等[6]分析红色文献资源特征,构建基于语义关联的红色文献资源知识聚合模型。关于革命文物资源的研究已不局限于数字化与信息化处理,目前的研究正在将视角集中在如何将革命文物资源进行语义描述,然而针对革命文物资源的语义组织研究相对比较匮乏,需要利用语义网来实现对革命文物资源的深度开发利用。

1.2  基于知识图谱的红色文化资源研究

现阶段,红色文化资源的定义尚未有统一的结论,可被表示为:中国共产党在领导人民实现中华民族伟大复兴道路上所形成的各种物质及精神载体的总和,如革命精神、红色遗迹等。目前,关于红色文化资源的研究主要是从数字化保护与利用、建设与服务等方面出发,立足数字人文视角深入研究红色文化资源的研究较少。数字人文为从大量的红色文化资源中挖掘隐含知识提供了可能性,为历史的演化发展研究提供了新路径。知识图谱技术是人文学者进行数字人文研究的关键技术,并凭借强大的语义组织与描述能力,成为对红色文化资源进行知识组织与可视化呈现的重要工具。通过梳理红色文化资源知识图谱构建研究,发现当前学者在研究内容上有所侧重,其研究主要有:刘竟等[7]以党史主题美术作品为着力点,构建相适用的元数据框架与本体模型,探究知识图谱在党史主题美术作品研究的可行性;徐晓娟等[8]以皖西红色文献为研究实例,构建皖西红色文献数据库,并利用知识图谱实现文献检索与知识发现服务;郭嘉欣[9]通过构建“红色记忆”知识图谱,对多源异构的红色文化资源进行深层次的关系挖掘;张云中等[10]以红色历史人物为对象,搭建基于知识图谱的知识问答服务架构,为用户提供知识交互服务。不难发现,有关红色文化资源知识图谱构建的相关研究已有了一定的成果,但其研究重点聚焦于宏观视角,极少有以红色文化资源的物质载体即革命文物资源为主体进行深入的研究,不过已有的研究方法与思路对笔者构建革命文物知识图谱提供了指导作用与借鉴经验。

纵观上述研究可以发现,针对革命文物资源的数字化保护的标准规范不够清晰,资源分散在各机构和地区,难以实现革命文物资源的共享,有碍于革命文化的传播与传承。虽然已有学者构建“红色记忆”知识图谱、红色历史人物知识图谱,但其关注点集中于非物质性的红色文化资源,在革命文物资源领域深入研究,对其知识结构进行知识关联与深层次的知识发现研究仍有待进一步展开。因此,笔者以大别山革命文物为研究对象,借助本体理论与方法从多源异构的数据中提取核心概念与属性,以此构建革命文物知识图谱,将分散的知识单元进行有序化组织与可视化展示,实现对革命文物知识内涵进行深度分析与挖掘,为红色文物资源的深度开发与利用提供可行的研究思路。

2  框架构建/ Building framework

革命文物资源数量大、形态多样、蕴含丰富的历史内涵,但现有革命文物资源建设还停留在粗粒度阶段,缺乏对其知识单元进行深度挖掘与知识关联。针对这些问题,急需利用知识图谱技术揭示革命文物资源中的知识元素与关系,实现对知识深层次的语义描述与组织。基于此,笔者提出构建革命文物知识图谱框架(见图1),该框架包括数据来源层、知识组织层、图谱构建层和知识应用层4个层次。

数据来源层是革命文物知识图谱框架的基础,主要是将大量离散的多源异构数据采集并整合起来。革命文物资源的存在形态多样,且在空间分布分散,大多属于非结构化数据与半结构化数据,需要采用网络爬虫与人工采集相结合的方式获取相关数据,同时利用领域内的相关数据资源对其进行完善与补充。在此基础上将经过整合处理后的数据存储到数据库中,为后续的研究提供数据支撑。

知识组织层是图谱构建的关键任务,是对领域内的知识进行逻辑化和体系化的过程,即构建革命文物本体。通过构建本体模型可以对革命文物资源进行知识建模,规范化描述资源中所涉及的概念及概念间的关系。分析革命文物资源的结构特征,界定革命文物本体的相关概念与属性,同时在考虑复用现有本体的基础上,结合自建本体实现革命文物本体模型的构建,以此完成知识图谱模式层的搭建。

图谱构建层是对获取到的原始数据集进行知识抽取、知识融合和知识存储。知识抽取是基于设计的本体模型,根据数据形式的差异采用不同的方法进行实体、属性与关系的抽取,并以“实体—关系—实体”及“实体—属性—属性值”两种模式表示数据。经过知识抽取环节获取到的新知识存在共指与冗余等问题,需要采用相应的知识融合方法对其进行整合处理。最后,将处理完成的结构化数据以RDF三元组形式存储到Neo4j图数据库中,完成革命文物知识图谱的构建。

知识应用层是指基于已构建的革命文物知识图谱,为用户提供便捷获取知识的服务,满足用户深层次开发利用革命文物资源的需求。革命文物知识图谱以图的方式将知识与知识间的关系呈现出来,实现知识间的语义关联。用户可以通过构建查询语句来检索所需的节点与关系,为用户从不同角度进行革命文物知识内容的深度挖掘与知识发现研究提供便利。

3  实证研究/Empirical research

3.1  数据来源

大别山革命老区是中国革命的重要策源地,其包含的革命文物资源具有规模大、分布广泛、类型多样、时间跨度大等突出特征。大别山革命文物资源作为支撑大别山精神的重要载体,承载宝贵的红色基因,以其作为实证对象进行研究对识别红色文化资源基因特质、发扬红色精神具有重要的现实价值。大别山革命根据地位于鄂豫皖三省交界处,其革命文物资源分布在该地区的博物馆、纪念馆与红色旅游景点等。根据实例分析,发现大别山革命文物资源的数据来源多样,笔者以鄂豫皖地区红色文化网页、党史建设平台、红色旅游网页及百度百科—数字博物馆为主要数据源,同时利用中国共产党创建史词典和百度百科资源进行补充,通过网页爬取与手工采集相结合的方式来获取所需的数据。

3.2  本体构建

本体作为一种抽象化的知识描述模型,可以清晰地定义和表示特定领域内的概念及概念间的关系,是共享概念模型的形式化规范说明[11]。本体源于哲学领域,具有约束和规范概念属性的作用,应用领域非常广泛。构建本体的过程较为复杂,其模型设计过程为了保证规范性,必须遵循明确性、客观性、可扩展性等原则。当前,关于本体构建方法已经较为成熟,如TOVE 法、METHONTOLOGY 法、骨架法和七步法等,笔者选择通用性较强的七步法来构建本体[12],并综合考虑革命文物资源自身的结构特点,参考借鉴社会网络人物本FOAF(Friend of a Friend)[13]、国际博物馆理事会开发的概念参考模型CIDOC CRM(CIDOC Conceptual Reference Model)[14]、DC(Dublin Core)[15]、Time、GeoNames以及上海图书馆本体SHL[16]等国内外通用本体模型,对本体模型中人物、时间、事件、地点等相关概念与属性进行复用,此外,由于当前可复用的本体词表无法充分满足对革命文物资源知识单元细粒度描述的需求。因此,笔者在调研已有本体词表的基础上,构建自定义词表革命文物资源RCRR(revolutionary cultural relics resources),对革命文物知识的概念与属性进行描述,进而完成革命文物资源本体模型构建。

3.2.1  定义核心类与层级

革命文物资源本体模型构建的关键在于明确定义领域内知识的核心概念。核心概念也称类,是本体建模的基础,是某领域相关对象实例的集合[17]。在充分剖析革命文物资源知识内涵的基础上,确定该领域内的核心元素,可以深层次地揭示革命文物资源间的相互关系。笔者结合革命文物资源特征,从中梳理提取出重要概念与术语,将革命文物资源顶层概念划分为革命文物、人物、机构、时间、地点、事件和资源7个核心类。此外,还需要关注核心概念之间的层级关系,对其进行细分,确定其所包含的类及子类的关系,实现对革命文物知识语义要素体系的完善。革命文物资源类及层次关系如表1所示:

革命文物类是本体构建的核心概念,与其余6大类即人物类、时间类、机构类、地点类、事件类、资源类相互关联,共同构成革命文物领域内语义层面的知识网络。为了确保对革命文物资源进行细粒度的描述,在分析已有文物分类标准的基础上,根据自身属性将革命文物资源划分成实物(rcrr:practicality)和建筑(rcrr:Architecture)两个子类,实物类包括战史材料、书籍、日记等各种文献资料,以及纪念品、旗帜等代表性实物,建筑类是指名人故居、革命旧址及纪念设施。

人物类是指与革命文物资源相关的个人与团体等实体,主要包含个人(foaf:Person)和团体(foaf:Group)两个子类。个人是指与革命文物资源密切相关的人物,如报纸、图书资料的撰写者、生活用品或武器装备的使用者。团体即与革命文物紧密关联的团体组织,如政府组织、运动工会组织、文学社团等,这些组织在革命事件中常作为关键出现,其数据属性包括团体类型和组织宗旨。

机构类是指革命文物资源的收藏机构,其与革命文物类、时间类与地点类相互联系,将馆藏机构作为革命文物资源的核心类目,从馆藏机构的角度实现资源组织。其数据属性主要有机构名和机构类型。

时间类是用来描述革命文物资源的时间特征,包括革命文物资源的创造时间、个人的出生时间与死亡时间及事件的发生时间等。革命文物产生的时间往往不是某一时间点,而是某一时间段,因此,需要根据时间的跨度将时间类划分成时间点和时间段两个子类。时间点可以通过年月日来表示精确的时间,时间段以2021年中共中央发布的《中共中央关于党的百年奋斗重大成就和历史经验的决议》中关于中国共产党百年奋斗历史的4个阶段为依据,分为新民主主义革命时期、社会主义革命时期、改革开放和社会主义现代化建设时期、中国特色社会主义新时代[18]。

地点类是涵盖了革命文物、人物、事件所涉及的空间信息,对于革命文物而言,尤其是建筑类,主要是指建筑当前的所在地;对于人物而言,是指个人的出生地与死亡地以及团体的创建地点;对于事件而言,主要涉及事件的发生地。地点类的数据属性包括地名、旧称、经度和纬度等信息。

事件类主要是指革命文物资源中所涉及的相关历史事件的集合,革命文物中蕴含丰富的革命事件,记载了艰苦奋斗的革命历程。事件类与革命文物类、人物类、时间类、地点类均存在对象属性关系,其具体数据属性有事件名、事件主题和描述等。

资源类是指与革命文物资源相关的资源类型,如文本、图谱、视频等。革命文物的数据来源多样决定知识呈现方式的多样性,由此可以从多维视角来表示革命文物资源。资源类的数据属性包括文本资源、图片资源和视频资源。

3.2.2  定义属性及关系

在完成革命文物资源本体模型的核心类的定义后,还需要进一步定义类的属性来详细描述资源结构特征。在本体构建中,属性可分为对象属性与数据属性,通过定义类的属性可以丰富革命文物资源关系和特征的语义描述。对象属性即关系属性,主要用于描述不同实体之间的关系,其定义域和值域均为类。对象属性在本研究中的作用是为了表述革命文物资源概念间的关联关系,以此实现革命文物资源的知识关联,帮助用户对革命文物知识图谱进行知识检索服务,具体对象属性设置见表2。数据属性是用于描述类的内在和外在属性,是对类自身信息的补充说明,其定义域为类,值域是某特定的数据类型,通过数据属性的设计可以帮助用户了解革命文物资源实例数据的详细特征,扩充实例的内涵,具体数据属性设置见表3。

基于上述所定义的类与属性,最终确定的革命文物资源本体模型(见图2)。革命文物资源本体模型揭示了类与类之间错综复杂的关系,为革命文物资源所蕴含的知识提供规范化描述,为后续的知识图谱构建与应用研究提供有效的顶层逻辑基础。

3.3  革命文物知识图谱构建

3.3.1  知识抽取

知识抽取是革命文物知识图谱构建的基础,其决定了后续进行知识融合与知识存储的质量。知识抽取的具体步骤是根据已构建的本体模型,从数据来源层形成的数据集中将所需的实体、关系及属性抽取出来,并转换成实体关系三元组。革命文物知识图谱以RDF(资源描述框架)数据模型对抽取出的知识进行表示,常表示为<实体,属性,属性值>或<实体,关系,实体>,使知识得到规范描述。通过分析革命文物资源的数据来源,需采用不同的知识抽取方法来抽取革命文物资源中的实体、对象属性和数据属性。笔者采用深度学习与人工相结合的方法来实现知识抽取,针对非结构化数据(如鄂豫皖苏区革命博物馆的资源),通过调用LTP(哈工大语言技术平台)[19],对采集到的语料进行分析、标注等处理,进而从文本中抽取所需的三元组关系。此外,为了完善领域内的相关数据,还需要利用Jiagu自然语言处理工具对百度百科资源中的半结构化数据进行实体关系抽取。例如,以“黄麻起义开始于1927年11月13日,地点位于红安、麻城”为示例,LTP知识抽取结果见图3。以“刘伯承,1892年12月4日出生于四川省开县”为示例,Jiagu抽取的结果见图4。

3.3.2  知识融合

知识融合是指在相同框架规范的基础上,对不同来源的知识进行异构数据整合。多源异构的革命文物资源的融合需要对概念的关系进行判断并整合,其知识融合包括概念层的本体融合以及数据层的实例、属性的融合,前者扩展了本体的通用性和共享性,后者消除了实体的歧义性和多样性[20]。在完成知识抽取任务后,得到由实体和关系组成的三元组数据集,但这些数据中仍存在一些冗余与歧义的问题,比如某些实体可能存在共指问题,即同一个实体有多个指称项,同一概念的实体指向交叉,需要对其进行整合处理以便消除歧义,进而为知识图谱的推理提供底层支撑。针对实体存在歧义问题,因其问题复杂且领域性较强,常规的算法无法对其融合,需要利用人工构建自定义词典的方式来完成实体融合。此外,针对关系存在的歧义问题,则采用哈工大同义词词林(扩展版)[21]与余弦相似度相结合的方式来消歧关系名的多样性。

3.3.3  知识存储

在完成知识融合任务后,需要选择合适的数据库来有效地表达和存储数据,当前知识图谱的存储方式主要有3种,分别是传统的关系型数据库、RDF数据库和图数据库。Neo4j图数据库与传统的关系型数据库相比,具有独特的优势,能够以图的方式可视化展示数据。因此,笔者选择Neo4j图数据库作为革命文物资源的存储工具,以实现革命文物知识图谱的构建。Neo4j图数据库主要有标签、节点、关系、属性4种组成元素,由于本体模型与图数据库的知识表现形式存在差异,需要通过RDF三元组这一数据形式实现本体模型到图数据库结构的互相映射,其映射规则是将本体中的类与实例映射为节点,对象属性映射为节点间的关系,数据属性映射为节点的属性。最终,形成包含357个实体节点和523个三元组关系的革命文物知识图谱,详细描述了革命文物资源中蕴含的丰富的历史内涵,为实现革命文物资源知识检索、知识发现等智能化服务提供支撑。

3.4  知识应用

3.4.1  知识关联

知识图谱具有强大的可视化功能,可以通过有向图的方式清晰地展示革命文物资源的整体知识特征,详细地描述节点与节点间关系的知识表示结构。知识图谱由节点和边构成,通过节点和关系将革命文物资源中蕴含的革命文物、人物、时间、地点、事件等知识单元关联起来,进而将平面、静态的零散知识单元转换成立体、动态的知识网络,为挖掘隐含的知识提供便利。笔者利用知识图谱实现革命文物资源的实例化展示,其整体的展示效果见图5,用户可以通过单击节点对节点的大小与颜色进行调节,同时也可以查看节点的属性信息,以便用户快速了解革命文物资源的知识关联,进而对资源有更加深入的认识,赋能知识发现研究。

3.4.2  知识检索

革命文物知识图谱提供知识检索服务,其存储方式的不同使得检索方式也存在差异。Neo4j图数据库运用Cypher查询语言进行知识检索,与传统关系型数据库使用结构化查询语言而言,具有简便快捷的优势。革命文物知识图谱的检索功能可以让用户根据自身需要构建合适的检索语言准确、快捷地获取所需的节点和关系,如以“黄麻起义”为例进行检索,构建Cypher查询语句:MATCH(n)-[r:相关事件]-(m:Event{eventName:黄麻起义}) RETURN n,m,将与之相关的节点与关系直接呈现出来,查询结果见图6。从图6中可以看出,与黄麻起义相关联的革命文物资源有5项,分别是黄麻起义和鄂豫皖苏区革命烈士陵园、黄麻起义使用的铜锣、麻城烈士陵园、1928年黄麻起义领导人吴焕先用过的罗盘和1927年11月程儒钿烈士参加黄麻起义时使用过的军号(残)。通过知识检索可以发现革命文物背后蕴含的革命历史事件,以便用户全面了解革命文物资源,此外,知识图谱还为用户的知识检索提供多维度的切入点,实现全方位、多视角地获取革命文物资源的相关信息,有助于红色文化的传播与发展。

3.4.3  知识发现

知识图谱最重要的价值是为用户提供知识发现服务,利用上述的知识关联与检索功能,可以快速检索革命文物的相关节点与关系,还可以从不同维度出发挖掘知识关联下的隐含知识,实现对革命文物资源的知识智慧发现,助力人文领域研究从数据、学术到创造整合方向发展[22]。革命文物资源承载了诸多英雄事迹和重要的历史事件,以革命文物为核心进行知识发现可以探寻文物背后所蕴含的历史事件,通过“文物—事件—时空”知识脉络实现对革命历史场景再现。如以“王大湾会议会址纪念馆”为核心,在图数据库进行多层路径查询,由于路径深度对检索结构与中心节点的关联效果具有较大的影响,因此,将路径深度设置为2—5的范围依次检索,发现路径深度为2—3的时候,关联效果最好,其结果见图7。

从图7中可以发现,刘邓大军在大别山地区的作战经历:1947年8月27日,以刘伯承、邓小平领导的晋冀鲁豫野战军到达大别山地区。抵达大别山地区后,为了增强部队斗志,克服,克服可能产生的右倾情绪,1947年9月27日至29日,刘伯承、邓小平同志组织召开了一次旅以上高级干部会议,会议分析了部队进入大别山后的艰巨任务,对后期的作战方向部署任务。在这次会议之后,同年10月份,刘邓大军先后取得了张家店战斗与高山铺大捷重大胜利。综上,以革命文物资源为线索进行知识发现,可以为相关学者进行革命事件历史溯源研究与红色记忆重构提供支撑与保证。

通过知识图谱可以将分散的数据进行有序化组织与关联,并以可视化的呈现方式清晰地呈现革命文物资源的知识结构特征,拓展了用户的知识检索范围,便于用户对革命文物资源进行深层次的多维知识发现研究。知识图谱具有知识查询和推理的特性,以节点与边相连接的方式展示资源间的关系,为知识重组和深入挖掘革命文物资源的潜在知识提供重要的研究思路。

4  结语/Conclusion

知识图谱以其所具有的语义理解与组织能力,可以深度揭示革命文物资源的实体信息及知识关联,正成为各领域进行大规模语义信息集成和提供智慧化服务的关键所在。因此,将知识图谱技术应用于革命文物资源的开发与利用研究,是推动革命文物资源建设向知识化乃至智能化发展的必然抉择。笔者以大别山革命文物为实例对象,在明确革命文物资源所包含的相关概念与关系后,完成知识建模,并以此为基础构建革命文物知识图谱,实现碎片化资源的知识重组,对革命文物资源的语义化组织进行了探索性研究,为革命文物资源的数字化传播与红色文化基因的传承提供了新的研究路径。通过构建革命文物知识图谱将多类型、多层次的革命文物资源中包含的知识与知识间的关系联系起来,且能够将分布在不同区域的零散碎片化的实物资源进行知识重组与集成,进而以更加直观、更加动态、更加关联的方式呈现给用户,为用户了解及学习革命文化提供智能化的信息服务。

本研究为革命文物资源提供了语义化组织方案,充分描述了资源中所蕴含的历史价值。但本研究仍存在一些不足:受到案例数据的限制,仅以大别山革命文物作为数据源进行研究,其数据量相对有限,未来会考虑添加更多的革命文物数据进行研究,扩大数据规模。此外,虽然本研究实现了对革命文物资源的知识检索与发现服务,但为了提升研究深度和广度,满足用户对革命文物资源的智慧化服务需求,需要进一步探讨智能问答、知识推荐等系统的实现。

参考文献/References:

[1] 中国政府网.中共中央办公厅 国务院办公厅印发《关于实施革命文物保护利用工程(2018-2022年)的意见》[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.(Chinese Government Website. General Office of the Central Committee of the Communist Party of China and General Office of the State Council issued “Opinions on the implementation of the project for the protection and utilization of revolutionary cultural relics (2018-2022)”[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.)

[2] 中国政府网.习近平对革命文物工作作出重要指示[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm. (Chinese Government Website. Xi Jinping gave important instructions on the work of revolutionary cultural relics[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm.)

[3] 田艳, 李帅. 革命文物保护与中华民族共有精神家园建设研究[J]. 中央民族大学学报(哲学社会科学版), 2023, 50(2): 13-23. (TIAN Y, LI S. Research on the protection of revolutionary cultural relics and the construction of the common spiritual home of the Chinese nation[J]. Journal of Minzu University of China (philosophy and social sciences edition), 2023, 50(2): 13-23.)

[4] 彭庆红, 孙晓丹. 红色档案资源数字化开发利用的路径与梯度[J]. 档案学通讯, 2022(4): 10-16. (PENG Q H, SUN X D. Paths and gradients of digital development and utilization of the red archives resources[J]. Archives science bulletin, 2022(4): 10-16.)

[5] 罗素洁. 基层公共图书馆红色文献数据库建设研究——以“余杭红色记忆”专题资源库为例[J]. 图书馆杂志, 2021, 40(7): 151-156. (LUO S J. Research on red literature database construction of grassroots public library: take Yuhang red memory thematic resource database as an example[J]. Library journal, 2021, 40(7): 151-156.)

[6] 付靖宜, 李姗姗, 项欣溢, 等. 新四军苏浙军区多模态红色文献资源知识聚合模式研究[J]. 档案学研究, 2022(4): 24-31. (FU J Y, LI S S, XIANG X Y, et al. Research on knowledge aggregation model of multimodal red literature resources of New Fourth Army in Jiangsu and Zhejiang military region[J]. Archives science study, 2022(4): 24-31.)

[7] 刘竟, 王萌, 刘桂锋, 等. 数字人文视角下红色文化资源知识图谱构建研究[J]. 图书馆杂志,2023, 42(7): 102-109, 125. (LIU J, WANG M, LIU G F, et al. Research on the construction of knowledge graph of red cultural resources from the perspective of digital humanities[J]. Library journal, 2023, 42(7): 102-109, 125.)

[8] 徐孝娟, 孙爱华, 史如菊, 等. 数字人文视角下皖西红色文献知识本体及其应用[J]. 图书馆论坛,2023, 43(10): 139-151. (XU X J, SUN A H, SHI R J, et al. Research on knowledge ontology and application of red documents in western Anhui from the perspective of digital humanities[J]. Library tribune, 2023, 43(10): 139-151.)

[9] 郭嘉欣.基于多源异构数据挖掘的“红色记忆”知识图谱构建[J]. 知识管理论坛, 2020, 5(1): 59-68. (GUO J X. Construction of “red memory” knowledge graph based on multi-source heterogeneous data mining[J]. Knowledge management forum, 2020, 5(1): 59-68.)

[10] 张云中, 郭冬, 王亚鸽, 等. 基于知识图谱的红色历史人物知识问答服务框架研究[J]. 图书情报工作, 2021, 65(16): 108-117. (ZHANG Y Z, GUO D, WANG Y G, et al. Framework of knowledge Q&A service for red historical figures based on knowledge graph[J]. Library and information service, 2021, 65(16): 108-117.)

[11] STUDER R, BENJAMINS V R, FENSEL D. Knowledge engineering: principles and methods[J]. Data & knowledge engineering, 1998, 25(1/2): 161-197.

[12] 岳丽欣, 刘文云. 国内外领域本体构建方法的比较研究[J]. 情报理论与实践, 2016, 39(8): 119-125. (YUE L X, LIU W Y. A comparative study of the construction method of domain ontology at home and abroad[J]. Information studies: theory & application, 2016, 39(8): 119-125.)

[13] FOAF[EB/OL]. [2024-03-10]. http://xmlns.com/foaf/.

[14] CIDOC CRM[EB/OL]. [2024-03-10]. https://cidoc-crm.org/.

[15] DCMI Schemas[EB/OL]. [2024-03-10]. https://www.dublincore.org/schemas/.

[16] 上海图书馆名人手稿[EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage. (Manuscripts of celebrities in the Shanghai Library [EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage.)

[17] 邓君, 王阮. 口述历史档案资源知识组织与关联分析[J]. 情报资料工作, 2021, 42(5): 58-67. (DENG J, WANG R. Analysis on the knowledge organization and relevance of oral history archives resources[J]. Information and documentation services, 2021, 42(5): 58-67.)

[18] 中国政府网. 中共中央关于党的百年奋斗重大成就和历史经验的决议[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.(Chinese Government Website. Resolution of the Central Committee of the Communist Party of China on the major achievements and historical experience of the party in the past century[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.)

[19] HanLP[EB/OL]. [2024-03-10]. https://www.hanlp.com/.

[20] 宋雪雁, 张伟民, 张祥青.基于档案文献的清代祭祀礼器知识图谱构建研究[J]. 图书情报工作, 2022, 66(3): 140-151. (SONG X Y, ZHANG W M, ZHANG X Q. Research on the construction of knowledge graph of sacrificial vessels in Qing Dynasty based on archival documents[J]. Library and information service, 2022, 66(3): 140-151.)

[21] LTP[EB/OL]. [2024-03-10]. http://ltp.ai/.

[22] 赵星, 乔利利, 叶鹰. 面向数据智能和知识发现的图书情报学跨界拓展——数据—学术—创造整合论[J]. 中国图书馆学报, 2020, 46(6): 16-25. (ZHAO X, QIAO L L, YE Y. An interdisciplinary extension of library and information science facing data intelligence and knowledge discovery: integration of data-academy-creativity[J]. Journal of library science in China, 2020, 46(6): 16-25.)

作者贡献说明/Author contributions:

吴艳飞:设计研究方案,撰写论文初稿;

张  强:提出研究思路,论文定稿;

周树斌:修改论文;

汪睿思:进行数据采集;

周  洪:修改论文。

Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities

Wu Yanfei1  Zhang Qiang1  Zhou Shubin1  Wang Sirui2  Zhou Hong3

1School of Information Management, Central China Normal University, Wuhan 430079

2School of Art, Chengdu Jincheng College, Chengdu 610097

3School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190

Abstract: [Purpose/Significance] Revolutionary cultural relics carry profound historical and cultural value, and the study of their knowledge organization will help promote the development and utilization of revolutionary cultural relics resources in the digital and intelligent era, and provide a new path for the knowledge association and discovery research of revolutionary cultural relics resources. [Method/Process] This study takes the revolutionary cultural relics of Dabie Mountain as the study object. Firstly, the concept of revolutionary cultural relics resources was standardized by constructing an ontology model. Secondly, based on analyzing the structural characteristics of revolutionary cultural relics resources, the entities, attributes, and relationships of data from different sources and structures were extracted, and the knowledge fusion technology was used to solve the existing ambiguity problem. Finally, the data was stored in the Neo4j graph database to complete the construction of the knowledge map of revolutionary cultural relics, and to realize the multi-dimensional knowledge discovery and research of revolutionary cultural relics resources. [Result/Conclusion] By constructing the knowledge map of revolutionary cultural relics, in-depth knowledge mining of revolutionary cultural relics resources can be carried out, fine-grained analysis and knowledge correlation of their knowledge units can be realized, and the foundation can be laid for the intelligent application of revolutionary cultural relics resources.

Keywords: revolutionary cultural relics    knowledge graph    digital humanities    knowledge discovery

Fund project(s): This work is supported by the Key Project of Philosophy and Social Science Research in Colleges and Universities in Anhui Province: “‘Positive up: Research on the Inheritance of Red Gene in Colleges and Universities from the Perspective of Digital Humanities” (Grant No. 2023AH050893)

Author(s): Wu Yanfei, master candidate; Zhang Qiang, doctoral candidate, corresponding author, E-mail: zhangqiang_dh@163.com; Zhou Shubin, master candidate; Wang Sirui, undergraduate; Zhou Hong, doctoral candidate.

Received: 2023-11-20    Published: 2024-04-08

猜你喜欢
革命文物数字人文知识图谱
数字学术与公众科学:数字图书馆新生态
发展红色旅游加强革命文物保护
发展红色旅游加强革命文物保护
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展