中华民族共同体专题档案资源库的建设构想★

2021-08-05 00:38赵生辉胡莹
山西档案 2021年3期
关键词:资源库共同体文献

赵生辉 胡莹

(1.西藏民族大学管理学院 咸阳 712082;2.云南大学历史与档案学院 昆明 650091)

1 问题提出

1.1 “铸牢中华民族共同体意识”国家战略的时代背景

中国是统一的多民族国家,由定居于我国境内的56个民族(Ethnic Groups)紧密联结而成的稳定的民族共同体通常被统称为“中华民族(Chinese Nation)”[1]。“中华民族”并不单纯的社会学术语,而是具有意识形态内涵的重要社会政治概念,是一种将国民凝聚起来实现整体性的组织方式、机制和形式[2]。作为一个自在的民族实体,“中华民族”源远流长,一部中华民族史,就是一部各民族互动交融、团结凝聚、共同奋进的历史;作为一个自觉的民族实体,“中华民族”的观念则是近百年来中国与西方列强的对抗中才开始出现的[3]。通常认为,“中华民族”一词最早由晚清学者梁启超于1902年提出,经过民主革命先驱孙中山“五族共和”理论的丰富与发展,在中国的抗日救亡运动和之后的反帝斗争中发挥了强大的凝聚人心作用,释放出难以估量的巨大能量,成为深植于亿万中国人内心深处,牢固不可动摇的政治观念[4]。新中国成立以来,除过文革时期走过的曲折道路之外,历届党和国家领导人都高度重视民族团结问题,针对民族团结问题提出过诸多经典论述,根据当时的社会实际制定了促进民族地区经济社会发展的政策措施,为各民族团结繁荣发展良好局面的形成奠定了坚实基础。1989年,已故著名社会学家、人类学家费孝通先生应邀在香港中文大学发表学术演讲,提出了著名的“中华民族多元一体格局”理论[3],为我国的民族理论研究和民族工作政策提供了富有创见的战略框架体系,对“中华民族共同体”理论的提出也产生了直接的影响。

党的十八大以来,习近平总书记提出“中华民族是具有多元一体特征的命运共同体”的观点,并将中华民族多元一体格局的关系描述为“一体包含多元,多元组成一体,一体离不开多元,多元也离不开一体,一体是主线和方向,多元是要素和动力,两者辩证统一”[5]。党的十九大将“铸牢中华民族共同体意识”写入党章,使这项工作正式上升为事关中国56个民族共同命运的国家战略[6]。2019年9月27日,在中央民族工作会议暨全国第六次民族团结进步表彰大会上,习近平总书记做出“以铸牢中华民族共同体意识为主线,将民族团结进步事业作为一项基础性事业抓紧抓好”的重要指示[7]。2019年10月,中共中央办公厅、国务院办公厅联合印发《关于深入持久开展民族团结进步创建工作,铸牢中华民族共同体意识的意见》[8]。“铸牢中华民族共同体意识”是新时期我国民族工作的主线,也是亟需进行深入研究的重大战略性学术课题。2019年底以来,国内多所高校先后成立了与铸牢中华民族共同体意识相关的研究机构,其中比较代表性的机构主要有中央民族大学“铸牢中华民族共同体意识研究院”[9]、中南民族大学“中华民族共同体研究院”[10]、西南民族大学“铸牢中华民族共同体意识研究中心”[11]、西北民族大学“铸牢中华民族共同体意识研究院”[12]、广西民族大学“中华民族共同体研究院”[13]、暨南大学“中华民族凝聚力研究院”[14]、华中科技大学“铸牢中华民族共同体意识国家研究基地”[15]、东南大学“中华民族视觉形象研究基地”[16]等,此外还有多所高校成立了中华民族共同体意识相关的科研团队、工作室等研究机构。伴随着众多研究机构的相继成立,为相关领域专家学者的学术研究提供基础档案文献支持,服务“铸牢中华民族共同体意识”国家战略,彰显档案工作在国家重大战略中的作用和价值,助力国家民族团结进步事业的成为新时期我国民族地区各级各类档案管理机构的重大政治任务,也对民族地区档案服务工作的模式提出了全新的挑战。

1.2 “中华民族共同体”理论与实践研究的档案需求

近年来,我国学者就档案与中华民族文化之间的关系发表了多篇研究成果。黄才源通过分析周朝的“石室金匮”、西汉的“石渠阁”、明朝的“黄册库”、明清两代的“皇史宬”等档案保管机构的演进,得出“重视保护档案是中华民族的优秀传统”的结论[17]。谭仁杰认为,“档案的重实精神,档案较强的政治性和权威性,档案的稳定性的统一性,在维护中国古代政治结构的稳定性、统一性,维护中华民族的统一和增强中华民族的凝聚力方面起着重要作用”[18],并据此得出“档案文化是中华民族传统文化的基石”的观点[19]。徐拥军认为,“中华民族自古就是一个重视历史记录、尊重传统文化、珍惜集体记忆的民族。集体记忆是维系中华民族的精神纽带,是实现中华民族伟大历史复兴的精神动力。档案记忆观理论的提出,为我国在技术经济飞速发展,社会、文化急剧变迁的当下中国,有效得传承和保护中华民族集体记忆提供了一种新的思路”[20]。杨毅、何瓦特认为,广义的“民族档案”可以分为“中华民族共同体档案”和“少数民族档案”两个不同的层次,要站在国家的高度对民族档案做一个基本的思想认识方向的思考,回应时代提出的构建中华民族共同体的要求,并以此为契机,倡导发挥民族档案独特的历史记录、集体记忆、文化积淀等功能,发挥中华民族共同体档案在凝聚共识,聚集国力,维护统一方面的强大支撑作用[21]。此外,杨毅认为,“中华民族档案”是56个民族的档案在国家化整合进程中的既定存在,与历史上众多族类群体的历史记录具有历史连续性的同时,还具有民族国家特定历史所赋予的整体性特征[22]。上述研究为“铸牢中华民族共同体意识”国家战略背景下,从国家整体视角进行的档案服务模式创新提供了理论基础。

“铸牢中华民族共同体意识”是一个视角极为宏大、内涵极其丰富的命题,要从“中华民族共同体”视角提供档案信息资源服务,就必须建立全局观、整体观,能够从宏观层面整合各类相关档案资源,实现微观层面档案服务所不能实现的服务能力,主要体现在以下方面:第一,“中华民族共同体”视角之下,档案的来源区域覆盖整个国家甚至会涉及部分境外区域。任何一个档案管理机构所收藏的档案文献都只是中华民族档案资源的组成部分,要从“共同体”的全局视角进行分析和研究,就必须实现跨地区、跨层级档案信息资源的整合共享。第二,“中华民族共同体”研究涉及的时间跨度长达数千年,要进行大时间尺度学术问题研究,就必须尽可能多地整合各个历史时期的档案资源,以便研究人员能够从长期历史演进的视角发现之前依靠直觉和主观判断难以发现的深层次规律;第三,“中华民族共同体”研究涉及的档案文献极为多样,其内容通常是各个民族对特定时间段、特定地区社会状况的真实记录,要进行整体性分析,就需要建立统一的时空坐标体系,对各民族文献当中的纪年数据、地名数据、人名数据、物名数据等基础资料进行归一化处理,在不同民族对同一时间、地点、人物的不同表述方式之间建立语义关联,减少学者在基础资料整理方面付出的重复性劳动,使其可以将精力集中于学术问题的创造性思考。第四,“中华民族共同体”研究涉及多种语言文字,而通常情况下特定研究人员所能熟悉和掌握的语言文字的数量是有限的,加之语言文字古今形式演变造成的差别,客观上对涉及多种语言文字的学术研究工作造成非常大的障碍。要从“中华民族共同体”视角提供档案信息服务,就必须减少语言文字差异性对研究人员所造成的各类制约,尽可能使学者能够以熟悉的语言文字为工具,概要了解其他语言文字档案文献的内容信息,获取对同一主题更为全面系统的认识。第五,“中华民族共同体”档案资源的载体形式呈现出高度多样化特征,在纸张和印刷术出现之前,档案的载体形式丰富多样,除了档案机构馆藏的纸质档案之外,金石、简牍、绢帛、碑刻、壁画等形式载体如果具有档案价值,也应该纳入资源采集的范畴。因此,在“中华民族共同体专题档案资源库”建设的视角下,档案管理机构需要与图书馆、博物馆、文史馆、古籍所等公共文化机构的开展协作,围绕同一主题共享档案信息资源。上述需求的出现,意味着以分散形式提供少量文献查阅服务的传统档案服务模式已经不能满足“铸牢中华民族共同体意识”国家战略背景下的档案信息服务需要,借助科学的理念和方法进行服务体系重组成已经为当前迫切需要研究的战略性问题。

1.3 “中华民族共同体专题档案资源库”建设的重大意义

“中华民族共同体专题档案资源库”是指围绕“多民族共创中华”这一宏大主题[23],以分散保存在我国各级各类档案管理机构及相关公共文化机构的多种来源、多种类型、多种载体、多种语言文字的档案文献为基础,参照统一的时空坐标体系和标准体系进行整体性逻辑整合与重组之后,可以为相关领域全景式、大时间尺度、大空间范围学术问题的研究提供基础史料证据服务的档案资源体系。“中华民族共同体专题档案资源库”建设是我国档案管理机构对接“铸牢中华民族共同体意识”国家战略,服务国家重大战略需求的重要举措,对“中华民族共同体”相关问题研究的支撑作用体现在以下方面:第一,打破时间、空间、语言的限制,使全国各地的研究人员可以足不出口访问到全国各地档案管理机构收藏和保存的相关主题的档案文献资源,并可以在相关工具的支持下完成多语种档案文献资源的查找和利用;第二,应用数字化方法进行大规模档案文献的内容信息融合,使得用户可以借助数字化工具快速完成部分长时间跨度、大地理空间和全方位等大尺度研究问题的研究和分析;第三,可以从“中华民族共同体”的整体视角建立统一的时空坐标体系,实现多民族档案文献的深度整合,使原本分散保存在各级各类档案管理机构当中的大量档案文献资源经过系统性整理与聚合之后,在数字化环境当中建立起“中华民族”的档案“镜像”,使之前只存在于大众观念当中的“中华民族”拥有相对更为具体的表现形式。“中华民族共同体专题档案资源库”可以满足国内“中华民族共同体”相关学术研究的档案需求,同时也可以为中华民族共同体意识教育、民族地区公共文化服务、民族地区影视文艺作品创作等领域提供基础资源支持,其本身也是多民族协作建设的结果,对我国民族团结进步事业的发展将会产生积极而深远的影响。

2 内涵解析

“中华民族共同体专题档案资源库”根据“铸牢中华民族共同体意识”国家战略的需要,以各级各类档案管理机构征集和保存的档案文献为基础,经过选择、抽取和整合,按照整体性逻辑重新组织起来的专题型档案信息资源服务体系,其内涵和本质的理解主要体现在以下方面。

2.1 “中华民族共同体专题档案资源库”的现实文献基础

档案是人类在社会实践中形成的原始记录,可以为研究人员推测特定历史时期社会活动原貌提供证据支持。在中国辽阔的疆域内和漫长的历史进程中,汉族和各少数民族在各自的社会实践中产生了反映其活动信息的大量记录性文献。凡是能够从中华民族整体视角出发,反映各民族交流融合、共创中华文明的记录文献都可以筛选为“中华民族档案资源”的组成部分。“中华民族共同体专题档案资源库”的主题通常涉及以下方面:第一,反映汉族和各少数民族族体上相互吸纳的档案文献;第二,反映汉族和各少数民族共同开拓祖国疆域的档案文献;第三,反映汉族和各少数民族物资和经济交流的档案文献;第四,反映历代中央王朝政权与少数民族地方政权政治联系的档案文献;第五,反映汉族和各少数民族进行文化艺术交流活动,共同丰富中华民族文化宝库的档案文献;第六,反映汉族和各少数民族反对外地侵略,维护中华民族利益的档案文献;第七,反映汉族和各少数民族参与中国的历次民主革命的档案文献;第八,反映汉族和各少数民族共同崇尚爱国主义,追求祖国统一的中华民族精神的档案文献;第九,反映汉族和各少数民族之间相互帮助、相互扶持,自强不息、奋发进取的档案文献。由此可见,“中华民族共同体专题档案资源库”并不能等同于中国56个民族档案的总和,而是从全局和整体的视角展示中华民族的演进过程,强调组成中华民族的56个民族在共建中华文明进程中的贡献,强调56个民族不可分割的历史联系。无论“中华民族共同体专题档案资源库”文献来源于哪个民族,反映了何种主题,都必须以现实存在的档案文献为依据,尤其是将大量档案文献内容整合为领域本体时,必须确保每一条录入本体的数据都有确切可靠的文献作为依据,确保用户从本体获取整体性的档案数据线索之后,可以通过回溯找到原始档案文献作为印证。

2.2 “中华民族共同体专题档案资源库”的专题建构特性

“中华民族共同体”是存在于国民观念当中的人群的集合,人们可以感知到这一共同体的存在,在现实中却找不到与这一概念完全对应的实体形式。这就意味着档案管理体系当中,按照“来源原则”进行中华民族共同体档案的整理与服务是不可行的。“中华民族共同体档案资源”通常是需要以某种具体民族档案的形式来体现的,例如“汉族档案”“藏族档案”“蒙古族档案”等。然而,即使是具体的某一民族的档案,其归档管理也不会时候以该民族为全宗为单元,而是通常依托某一现实当中的实体机构进行。例如,西藏自治区举办的雪顿节庆典活动的相关档案属于藏族档案,但是其归档管理必须依托西藏自治区民族宗教事务管理机构、旅游文化服务机构进行。因此,“中华民族共同体专题档案资源库”具有鲜明的“建构特性”,是按照一定的原则从大量现实档案文献当中选择出的部分档案并对其内容信息进行重新组织之后的结果。“中华民族共同体专题档案资源库”本质上属于专题档案资源,其建设并不以最大限度还原历史细节为目标,而是从专题的核心主题出发,追求档案文献资源对主题的支撑和印证作用。强调“中华民族共同体专题档案资源库”的建构特性,并不能否定其真实性,只要构成中华民族共同体专题档案资源库的来源文献本身是真实可靠的,整个专题档案资源就具有真实性。实际上,“建构特性”是所有档案管理机构都具有的特性,决定将那些类型的档案可以长期保存,哪些类型的档案不能归档,本身就是一种“建构”。此外,作为专题档案资源,通常不能将某份档案文献从原有的档案管理体系当中抽离,而是使用复制件或者经过光学扫描形成的数字化副本。这就意味着,尽管抽取到专题档案资源体系当中的档案文献并不是全集,却不能影响该文献在原有档案管理体系当中继续发挥作用,并没有破坏原有档案体系的完整性,只是通过专题形式对强调和凸显抽取出的部分文献与专题之间的关系进行而已。

2.3 “中华民族共同体专题档案资源库”的多元一体逻辑

“中华民族共同体专题档案资源”围绕“多民族共创中华”这一主题,尽最大可能搜集整理所有可能的档案文献资源,致力于构建在逻辑上具有“多元一体”特征的档案资源体系。“中华民族共同体专题档案资源库”对各种类型档案文献资源进行的整合主要体现在以下方面:第一,跨越地理位置、行政层级、机构类型对档案查找行为造成的制约,基于互联网实现同一主题档案文献资源的“一站式利用”。“中华民族共同体专题档案资源库”建设以主题为导向,所有相关档案管理机构围绕统一的数据平台进行档案文献上传和著录,尽最大可能减少研究人员为查找资料所付出的时间、精力和经济成本。为了提高专题档案资源的质量,必要时档案管理机构需要通过协作方式从图书馆、博物馆、纪念馆、美术馆、文史馆、古籍所等公共文化机构获得具有档案价值的藏品信息,并整合到统一的数据平台当中。第二,跨越档案存储介质的差异性,基于数字化的服务平台实现档案文献内容整合,使用户可以忽略档案存储介质的区别,专注于对档案内容分析和研究。第三,跨越语言文字的差异性对档案阅读造成的制约,以国家通用语言文字为中介语,实现多民族语言档案文献资源的信息共享体系。少数民族语言文字档案文献在向“中华民族共同体专题档案资源库”上传时,原则上要求以民汉双语方式进行元数据著录,并尽可能实现档案内容的汉语翻译并将双语版本上传。此外,系统可以通过各少数民族语言文字与国家通用语言文字机器翻译系统,实现各语种档案文献内容的快速机器翻译,为跨语言概要了解档案文献主题提供技术支持。第四,跨越各民族时空坐标体系的差异性,解决不同民族纪年与计时方案造成的时间表述方式额差异性、不同民族对同一地理位置的不同称呼、同一地理位置古今地名演进的差异性等因素,尽可能使“中华民族共同体专题档案资源库”当中关于同一实体的多种表述方式之间能够建立语义关联,为跨越符号系统差异性实现文化推理和计算奠定逻辑基础。总之,“中华民族共同体专题档案资源库”建设就是要尽可能通过信息技术减少时间、空间、语言、符号差异性对档案查询、阅读和利用行为的制约和影响,在形式上将原本高度多元的档案文献体系整合为统一的整体,实现专题档案文献的便捷获取和利用。

2.4 “中华民族共同体专题档案资源库”的数字人文特征

数字人文(Digital Humanities)是伴随着人类社会由“信息社会”进入“智能社会”,学术服务由“文献服务”转向“知识服务”,在全球人文社会科学出现的一种新的学术潮流。目前学界对数字人文的概念还没有完成达成共识,但是普遍认可数字人文是一种可以依托信息技术手段,完成传统人文研究模式难以完成的复杂性研究任务的新型研究范式。例如,由哈佛大学费正清东亚研究中心建设的“中国历代人物传记资料库(Chinese Biographical Database, CBDB)”系统收集中国历史相关史料,并将其内容描述为关系型数据进行关联保存,迄今已经收录超过422600人的传记资料数据,可以基于地理信息全景展示和挖掘各个朝代历史人物社会活动的深层次规律[24]。由瑞士洛桑理工学院Frederic Kaplan教授主持的“威尼斯时光机(Time Machine Project)”项目,从意大利威尼斯城市档案馆的海量档案中提取历史大数据,通过计算机模拟再现威尼斯整座城市在过去1000多年间的演化过程,支持社会大众对历史上各个阶段的细节事实进行知识检索[25]。在数字人文成为全球性潮流的背景下,“中华民族共同体专题档案资源库”建设应当超越传统的“文献服务”模式,建立与人工智能时代“知识服务”相适应的新型档案信息资源服务模式。数字人文理论与方法在“中华民族共同体专题档案资源库”当中的应用主要体现在以下方面:第一,通过构建“中华民族共同体领域本体”,实现各类档案文献资源内容信息的深度融合,使用户可以直接通过访问领域本体获取聚合态的档案内容信息,而不必一一查阅分散保存的档案文献,并且可以实现对特定实体“全景式”档案信息的一次性获取;第二,通过建立跨越古今的时间坐标体系,为部分基于大时间尺度的学术研究提供技术支持;第三,基于历史地理信息系统(Historical Geographic Information System, HGIS)实现实体对象分布的可视化呈现,为部分大空间尺度的学术研究提供技术支持。第四,基于大体量数据和可视化分析技术,发现依靠小规模文献和研究人员直觉判断难以发现的深层次规律和问题。总之,“中华民族共同体专题档案资源库”已经超越了档案文献库的范畴,演变为一种具有智能化特征的中华民族专题研究数字人文基础设施。

3 架构设计

基于上述对“中华民族共同体专题档案资源库”内涵所做分析,将其体系架构总体上分为技术架构、组织架构和管理架构三个组成部分。其中,技术架构是指“中华民族共同体专题档案资源库”技术运行体系,组织架构是指支撑“中华民族共同体专题档案资源库”运行的组织机制;“管理架构”是指为了向用户提供高质量档案文献服务和知识服务而对资源库进行整体性控制的管理措施。

3.1 “中华民族共同体专题档案资源库”的技术架构

图1所示的“中华民族共同体专题档案资源库”总体上分为“档案征集”“档案文献服务”“档案知识服务”“专题数字人文服务”“语言支持体系”等模块组成。“档案征集”模块是指从我国各级各类档案馆及图书馆、博物馆等公共文化机构征集“中华民族共同体”相关主题档案文献,由平台管理机构或者各档案来源机构将征集范围内档案文献的数字化扫描件通过平台上传到后台存储库,同时对文献进行元数据著录。“档案文献服务模块”是通过元数据向用户提供档案文献检索和阅读服务的体系,是以文献为基本管理和服务单元的传统档案信息服务模式;“档案知识服务模块”是指将专题档案文献存储库当中由全国各地征集而来的大量档案文献的内容信息进行知识抽取,并将其通过数据三元组形式融入到领域本体库当中,从而使用户可以通过检索本体库就获得档案文献的主要内容信息,而不再需要去阅读档案文献。同时,在知识推理等技术的支持下,系统可以为用户提供领域知识问答服务,由用户通过自然语言方式向系统提出问题,系统给出问题的精确答案,而不是提供一堆相关文献供用户选择。“领域数字人文服务”是指领域本体信息与地理信息系统相结合所构建的历史地理信息系统可以为用户的大时间尺度、大空间范围学术问题的研究和探索提供支持。“多民族语言支持体系”是指在实现“中华民族共同体专题档案资源库”的所有环节,为了减少语言文字差异性的制约,而对各类档案文献或者元数据进行的翻译工作。此处的翻译工作可以由人工方式完成,也可以有机器翻译系统低精度高速翻译,人工进行确认修正的方式完成。

图1 “中华民族共同体专题档案资源库”的技术架构

3.2 “中华民族共同体专题档案资源库”的组织架构

“中华民族共同体专题档案资源库”是需要多部门协同工作才能完成的任务,其组织架构设计是否合理,对于资源库建设各项目标能否顺利达成有着直接的影响。通常情况下,“中华民族共同体专题档案资源库”建设涉及以下几类主体机构:第一,国家民族事务管理机构。鉴于“中华民族共同体专题档案资源库”是贯彻落实“铸牢中华民族共同体意识”国家战略的重要举措,资源库建成以后也主要是为国家民族事务管理委员会、各民族自治地方以及各类民族理论研究机构提供基础文献和数字人文基础设施服务,国家民委事务委员会应该成为“中华民族共同体专题档案资源库”建设最主要的推动力量。第二,国家档案行政机关。国家档案行政机关和各级各类档案管理机构是“中华民族共同体专题档案资源库”建设当中的第二大责任主体。“中华民族共同体专题档案资源库”的基础档案资源来源于我国各级各类档案馆,尤其是民族地区各类档案馆,在档案征集环节需要国家档案局的协调,只有在国家档案行政机关以行政公文方式要求下属机关配合执行的情况下,专题档案资源征集工作的质量才能得到保障。第三,国家文化行政机关。“中华民族共同体专题档案资源库”的档案征集范围并不局限于档案管理机构,图书馆、博物馆、文化馆、古籍所等机构也涉及部分征集任务,需要国家文化与旅游部等行政机关的协调和沟通。第四,“中华民族共同体”领域各类相关研究机构。我国众多高校近年来成立的“铸牢中华民族共同体意识”研究机构是“中华民族共同体专题档案资源库”主要用户,需要在其建设过程中全程参与,尤其是在资源库服务体系设计环节需要将相关服务需求明确进行表达,以便将相关功能嵌入到系统当中。此外,在将档案文献内容抽取为语义三元组数据形式时,除了部分较为明确的关系可以由计算机自动抽取之外,大多数隐含的复杂语义关系需要借助领域专家人工抽取才能完成,在多份档案文献对同一事实记录数据不一致时,还需要由领域专家进行评议和确认。因此,中华民族共同体领域各类专家需要参与到“中华民族共同体专题档案资源库”建设的全过程,并对于本体库建设质量有着重要的影响。第五,少数民族语言文字研究机构。“中华民族共同体专题档案资源库”建设需要对完成多种语言文字档案文献的知识整合,因而需要语言文字工作机构和部分少数民族语言文字研究机构的参与,尤其是对部分古文字档案文献进行数据抽取时,必须依靠熟悉该文种的专业机构和专业人士的识读和理解才能完成。

3.3 “中华民族共同体专题档案资源库”的管理架构

“中华民族共同体专题档案资源库”的管理架构是指保障资源库建设和服务质量的各项管理措施。根据图1所示的技术架构,“中华民族共同体专题档案资源库”的管理架构主要涉及以下方面:第一,档案征集工作管理。档案征集工作需要在国家档案管理法规制度框架内,根据“中华民族共同体专题档案资源分类表”,从我国各级各类档案管理机构馆藏档案当中进行征集。在实践中,可以公布相关征集标准,由各级档案管理机构自行筛选和提交,也可以通过对各类档案馆馆藏目录的检索,确定明确的档案文献清单之后由相关档案管理机构按照要求提交。专题档案征集工作力求全面,应该尽最大的努力使所有符合征集范围的档案文献都纳入到专题资源库当中。与此同时,资源库建设机构应该对于元数据著录、档案文献数字化加工、少数民族语言文字档案翻译、少数民族语言文字档案双语元数据著录等问题做出明确规定,确保各地征集获得档案资源有统一的格式和质量。第二,档案数据抽取工作管理。数据抽取是将档案文献内容转化为领域本体的关键步骤,需要制定明确的工作流程和抽取规则,确保从文献当中抽取的数据能够真实反映作者原意,且尽最大可能增加数据抽取的数量,减少由文献向数据转换时的“语义消耗”。只有在数据抽取工作严格遵循相关规范时,档案文献所具有的真实性属性才能衍生和传递到档案领域本体数据集,领域本体才能具有被用户所信任的属性。在部分应用当中,用户可以只检索本体,并将以聚合态出现的档案数据集作为证据使用。第三,档案信息服务工作管理。“中华民族共同体专题档案资源库”按照数字人文理念进行资源组织,满足计算机自动推理和计算的需求,允许用户以自然语言方式获取领域相关问题的答案。为了达到上述目标,资源库建设方就需要以“中华民族共同体领域本体”建设为核心,推动领域本体的完善与进化,通过语义推理技术补全人工建模未能发现的隐含关系,根据用户常见问题倒推资源体系。如果发现用户需求比较明显的高频领域档案文献资源数量较少,覆盖范围有限,则应该主动通过各类途径反向征集该领域的档案资源,从而使资源体系可以满足绝大多数用户的利用需求。

4 研究结论

“中华民族共同体专题档案资源库”是指围绕“多民族共创中华”这一宏大主题,以分散保存在我国各级各类档案管理机构及相关公共文化机构的多种来源、多种类型、多种载体、多种语言文字的档案文献为基础,参照统一的时空坐标体系和标准体系进行整体性逻辑整合与重组之后,可以为相关领域全景式、大时间尺度、大空间范围学术问题的研究提供基础史料证据服务的档案资源体系。“中华民族共同体专题档案资源库”建设是我国档案管理机构对接“铸牢中华民族共同体意识”国家战略,服务国家重大战略需求的重要举措。“中华民族共同体专题档案资源库”具有鲜明的“建构特性”,是按照一定的原则从大量现实档案文献当中选择出的部分档案并对其内容信息进行重新组织之后的结果,其建设并不以最大限度还原历史细节为目标,而是从专题的核心主题出发,追求档案文献资源对主题的支撑和印证作用。“中华民族共同体专题档案资源库”建设应当超越传统的“文献服务”模式,建立与人工智能时代“知识服务”相适应的新型档案信息资源服务模式。“中华民族共同体专题档案资源库”总体上分为“档案征集”“档案文献服务”“档案知识服务”“专题数字人文服务”“语言支持体系”等模块组成。“中华民族共同体专题档案资源库”的建设应该由国家民族事务管理机构作为主要推动机构,通过与国家档案行政机关、国家文化行政机关、语言文字工作机构的协作完成资源库项目的申报、立项、实施和运行维护等工作,建设过程中需要各类中华民族共同体研究领域专业机构、少数民族语言文字专业研究机构的全程参与。“中华民族共同体专题档案资源库”建设需要强化对档案拯救、数据抽取和信息服务环节的管理,通过各类措施保障工作质量,确保进入资源库的档案文献能够覆盖绝大多数领域问题,能够满足用户的智能化服务需求。

猜你喜欢
资源库共同体文献
《觉醒》与《大地》中的共同体观照
我国唯一寒地作物种质资源库完成改扩建
爱的共同体
幼儿园课程资源库建设之浅见
Hostile takeovers in China and Japan
健身气功开放课程资源库建设研究
论《飞越大西洋》中的共同体书写
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
数控加工专业资源库建设中存在问题及对策
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges