数字人文视野下徽州文书档案开发利用研究

2022-03-27 10:38张蓓
档案管理 2022年2期
关键词:数字人文开发利用

张蓓

摘  要:数字人文的兴起为徽州文书档案开发利用提供了新的路径和方式。本文基于数字人文视野,分析了徽州文书档案开发利用的可行性,重点论述了文本挖掘技术、数据管理技术、GIS技术、VR技术等数字人文技术在徽州文书档案开发利用中的应用,并指出应通过建立数字仓储、搭建数字人文研究平台和项目委托开发来促进徽州文书档案开发利用转型升级的具体实现。

关键词:徽州文书档案;数字人文;开发利用

Abstract: The rise of Digital Humanities provides a new path and way for the development and utilization of Huizhou document archives. Based on the perspective of Digital Humanities, this paper analyzes the feasibility of the development and utilization of Huizhou document archives, focuses on the application of Digital Humanities technologies such as text mining technology, data management technology, GIS technology and VR technology in the development and utilization of Huizhou document archives, and points out that we should establish digital warehouse Build a Digital Humanities Research Platform and project entrusted development to promote the specific realization of the transformation and upgrading of Huizhou document archives development and utilization.

Keywords: Huizhou document archives; Digital humanities; Development and utilization

1 概念引入:數字人文与徽州文书档案的概况

1.1 数字人文概况。随着信息技术在人文社会科学领域的深入应用,数字技术与人文研究深度融合形成了数字人文这一交叉领域,并得到学界越来越多的关注,经过数十年的发展,数字人文已然发展成为一门显学。数字人文起源于20世纪50年代的“人文计算”,其发展大致经历了三个阶段。第一阶段是纸质文献的数字化;第二阶段是配合相应的平台、工具等,将已经数字化了的文献资料作更进一步的处理,如量化分析和可视化技术的运用;第三阶段则是人文学术与计算科学、数据科学的深度融合。这三个阶段分别对应典藏检索型数据库、量化分析型数据库和数字人文研究平台三大类型的数据库。

由于科技的高速发展,数字人文的内涵和外延正在迅速扩充与延伸,其概念仍处在不断演化中。目前学界对数字人文的概念尚未达成共识,对它的定义多达几十种,总结起来主要存在以下四种看法:一是一种学术研究和资源开发的模式;二是一门数字技术和人文社会科学深度融合的交叉学科;三是一种新型学术模式和组织;四是一个涵盖多种实践范式的“大帐篷”。笔者认为数字人文是一个将现代计算机与信息网络技术应用于传统人文研究而产生的新型跨学科领域,[1]它的根本目的是运用数字技术的手段和方法去解决人文领域的各种人文问题,为传统人文研究提供新的研究方法与范式。

以数字技术为支撑的人文研究正改变着传统的人文研究生态系统,应该说,数字技术应用丰富了人文学者研究的方法论体系,拓展了人文学者的研究视野,为转变研究范式提供了新思路。

1.2 徽州文书档案的概况。徽州文书档案是指宋元明清至民国约八百年间徽州“一府六县”(主要为今安徽歙县、休宁、祁门、黟县、绩溪和江西婺源六县区域范围内)人民在各项社会活动中直接形成的各种形式的具有保存价值的原始记录,[2]如契约、合同、账簿、谱牒、鱼鳞图册、政令公文、诉讼文案、乡规民约、信函书札、风水图册、唱本剧本、日用杂书、宗教科仪书等。[3]其载体形式以纸张为主,并有石刻碑文、缣帛竹木等,大致可以分为土地关系和财产文书、赋役文书、商业文书、宗族文书、官府文书、教育和科举文书、文化和艺术文书、会社文书和社会关系文书九大类。[4]内容涉及徽州的政治、经济、文化、社会生活、民间交往及习俗、信仰等各个方面,是记载徽州历史发展变迁的第一手档案资料,见证了相对完整的徽州史和中国封建社会后期基层社会发展史。

徽州文书档案的大规模发现始于20世纪50年代的屯溪,存世数量在一百万件(册)以上,被誉为继殷墟甲骨、居延汉简、敦煌经卷、明清档案之后20世纪中国历史文化“第五大发现”,更被学者们视为中国档案文献遗产的典范,其中的“明代徽州土地产权变动和管理文书”和“明代徽州江氏家族分家阄书”分别在首批和第二批成功入选“中国档案文献遗产名录”。徽州文书档案以其遗存数量巨大,内容丰富,时间跨度长、归户性强等特点,成为历史学、社会学、地理学、经济学、政治学、法学、宗教学、语言学等众多人文学科研究的重要文献来源。目前,档案文献汇编与典藏检索型数据库是徽州文书档案开发利用的两大主要形式。数字人文视野下人们对徽州文书档案数据库的组织形式、分析方式及展示方法的深层次、个性化、智能化需求,将助推徽州文书档案开发利用模式转型升级。[5]

2 基础支撑:数字人文视野下徽州文书档案开发利用的可行性

2.1 内在价值:徽州文书档案蕴含巨大价值。徽州文书档案的自身价值决定了其开发利用的可行性。其价值表现为:第一,徽州文书档案具有极高的史料价值与学术研究价值。徽州文书档案真实再现了徽州八百年间不同历史时期的社会风貌,是了解徽州进而透视中国封建社会后期社会生活实态的珍贵史料,蕴含重大研究价值。第二,徽州文书档案具有文化传承价值。徽州文书档案是徽州历史文化传承的重要载体之一,它的形成、代代相传、发现、收集、整理与开发利用这一系列流转过程本身就是徽州历史文化的传承,其中丰富广博的内容及蕴含着的徽文化底蕴更是能形成文化熏陶,增强人们对徽州的认知。第三,徽州文书档案有一定的艺术研究和鉴赏价值。[6]第四,徽州文书档案具有社会经济发展价值。徽州文书档案以其资源的独特性、丰富性、稀缺性在旅游业、文创产业和影视业等不同产业领域均存在很大的经济体量和产能。

2.2 外在需求:利用需求呈现多元化趋势。随着数字人文的兴起,用户在获取材料、发现事实、分析归纳及研究成果展示方面的新需求对徽州文书档案提供者、徽州文书档案资源的数据化程度、分析工具的配套性支撑及展示平台化建设均提出了更高要求。数字人文视野下徽州文书档案利用需求呈现多元化趋势,具体表现在个性化、普遍化、多样化和即时性等方面。用户档案需求的更新、提高和扩大必将形成强大驱动力助推徽州文书档案开发利用模式转型升级。

2.3 技术支撑:数字人文技术提供新路径。日趋完善的数字人文技术体系为徽州文书档案资源的开发利用提供了新路径:一是运用数字化技术有效地将大量徽州文书档案转换为量化的具有数据特征的产物;二是运用文本挖掘技术将粗粒度的档案信息转化为细粒度的知识单元[7];三是为徽州文书档案提供关联分析、知识发现、量化比较的支持,既有利于深挖档案资源深层内涵,还能厘清显性和隐性的关系。

3 技术运用:数字人文技术在徽州文书档案开发利用中的应用

3.1 运用文本挖掘技术挖掘徽州文书档案潜在价值。文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程。徽州文书档案数量庞大,脉络复杂,利用文本挖掘技术可以对海量徽州文书档案进行数据提取与组织分析,使徽州文书档案的信息粒度从文件级细化为数据级,从知识单元细化为知识节点,聚合潜在信息,挖掘潜在价值,实现档案资源的深度开发。具体说来,可以通过聚类分析,充分挖掘、抽取徽州文书档案中涉及的“人、事、时、地、物”等信息,并进行一定的聚类处理,对不同徽州文书档案之间的相同或相似属性进行关联,通过关联分析,形成知识关联,促进资源知识聚合,建立起数据之间的联系,串联起与事件有关的各个要素,形成相互连接的信息网络,从而揭示出文书背后隐藏的千丝万缕的联系。比如,对徽州宗族文书的文本内容进行文本数据挖掘可以厘清徽州各家族的发展脉络及与其他家族的关系,将不同徽州文书档案有机联系起来,找出更广泛的人物关系。[8]文本挖掘就是要将人力不能及和工程量浩大的工作,通过计算机技术更加节约资源的完成,并且收获更好、更系统、更精确的结果。

3.2 运用数据管理技术充分发挥徽州文书档案数据作用。数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程,包括文本编码、语义描述、本体建模、多媒体搜索、数据看护与服务等技术。其目的在于充分有效地发挥数据的作用,主要作用于语义和空间分析、可视化处理等方面。具体说来,就是通过对较大规模和数量的非结构化数字进行清理、过滤,实现档案的处理、分析、呈现等环节;同时为收集的有效性信息进行结构化和文本化处理提供技术支持,将相同信息资源整合并存储在同一单元内,提高信息资源的存储率和数字化开发的工作效率。数字人文视野下实现徽州文书档案数字化不再是简单依赖电子设备将数据存储在大容量的计算机内存中而是以数据管理技術等现代信息技术为依托,使原本独立、分散的徽州文书档案有机联系在一起,实现徽州文书档案资源的信息加工、传输和存储、科学归档和管理,最终构建系统全面、结构有序、便于查询利用的徽州文书档案数据库,从而达到长期安全保存和便捷高效利用的目的。

3.3 运用GIS技术绘制古徽州历史地理脉络。GIS技术(Geographic Information Systems,地理信息系统)是在计算机硬、软件系统支持下,对整个或部分地球表层(包括大气层)空间中有关地理分布的数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。徽州文书档案中包含有大量的历史地理信息,如清乾隆年间歙县岩镇 (今岩寺)《谢凤鸣家记事簿》中,就抄录了“徽州府至严州府水路程”、“杭州至苏州水路程”和“苏州府至扬州府水路程”等。此外,还有一些商编路程(图/表)记录了大量地名、里程与经商路线,如道光四年(1824年)黟县西乡郑圣扶抄《广东路程》抄本1册,记录了徽州祁门县由江西进广东的水陆路程,分为“祁门县至景(德)镇二百八十里”“景镇至饶州府一百八十里”等。[9]在GIS技术的支持下,徽州文书档案中的大量历史地理数据都将转换为地理图形显示,形成清晰的历史地理脉络,将用户带入“历史现场”,使用户能在“文书主人”的历史地理环境下解读文献,并对显示结果进行浏览,操作和分析。GIS技术为徽州文书档案的研究提供了一个新的逻辑视角,成为研究者探索地域经济发展、文化变迁规律的重要工具。[10]

3.4 运用VR技术提升徽州文书档案展示效果。VR技术是指利用计算机生成一种可对参与者直接施加视觉、听觉和触觉感受,并允许其交互地观察和操作的虚拟世界的技术。徽州文书档案是原始记录,较多的是不系统的知识片段,以传统开发方式既难以引起用户兴趣也不易给用户留下深刻印象,VR技术的应用可以弥补传统徽州文书档案展览内容静态多、动态少,展览方式单向多、互动少以及档案故事讲述线性化、平面化的不足,创造更为虚拟化、故事化的场景。例如,利用VR技术对徽州文书档案进行虚拟复原、色彩还原等,实现用户与“徽州文书档案”零距离接触,并通过模拟重现徽州祠堂、书院、古民居、古村落等场景与事件人物,使用户能以“亲历者”的身份感受曾经发生在徽州的历史事件,通过在虚拟世界中视觉、听觉、触觉等感官的真实性体验,直观感受在徽州各家族世代相传的各种用途、各种载体和各种文本形式的徽州文书档案,全面了解徽州文书档案的产生过程、遗存缘由、发现经过、流转与分布状况,增强对徽州文化的认同感和自豪感。

4 路径探索:数字人文视野下徽州文书档案开发利用的实施策略

4.1 建立数字仓储实现徽州文书档案资源整合与长期保存。徽州文书档案数字仓储是利用数字化技术和设备对徽州文书档案进行数据采集、3D虚拟呈现、数字印刷等实现对徽州文书档案的数字保存及还原修复,是徽州文书档案深度开发和可视化展示的基础。例如,对徽州文书档案全文进行无格式数字文本转换、基于标准化的档案元数据采集、档案原件和相关载体的高清图像扫描、利用VR技术进行计算机建模、以3D打印、测绘遥感等技术将徽州文书档案及其原始存放地内外形态精确扫描、修复还原并以数字形式保存等,以供文物保护、徽学研究和文化旅游。具体可以从以下几方面推进:对徽州文书档案资源数字仓储进行顶层设计,从宏观层面把控徽州文书档案资源建设;倡导并践行资源跨机构(个人)合作建设,逐步实现徽州文书档案资源整合;制定徽州文书档案数字仓储建设标准和制度,包括数字格式标准、元数据标准、主题资源分类标准等;规划徽州文书档案数字仓储建设流程,保证数字仓储建设的可信性和可用性。利用建立数字仓储实现档案资源整合和长期保存的方式,不仅有利于徽州文书档案的传承与保护,还为下一步徽州文书档案的深度开发奠定了坚实的基础。

4.2 搭建徽州文书档案数字人文研究平台助推转型升级。数字人文视野下,徽州文书档案开发利用必须搭建徽州文书档案数字人文研究平台,积极吸收和借鉴国内外的数字人文理论、技术、方法与经验,将文本挖掘、地理信息系统、关联技术、文本可视化等数字技术应用于徽州文书档案的开发利用中,探索运用大量文书进行人文研究的新方法,建立研究徽州地区社会、经济、文化、历史等的数字环境等。搭建徽州文书档案数字人文研究平台并非脱离现有的资源开发方式而另辟蹊径,而是徽州文书档案收藏机构主动迎合数字转型社会背景,积极融入国家信息化建设进程的体现。具体可以从以下几方面推进:首先需通过顶层设计完善发展规划,建立徽州文书档案数字人文财政资助体系。对徽州文书档案数字人文项目的开发主体、资源客体、应用技术、展示平台等进行“成本——效益”评估,形成与徽州文书档案数字人文项目配套的经费保障体系,使其有足够的资金支持;其次,借鉴和融合国内外先进的数字人文研究平台构建方式方法,结合徽州文书档案收藏机构自身工作实践,建立以徽州文书档案收藏机构为主体的数字人文研究平台。最后,将徽州文书档案开发与社会记忆构建相结合,融合多种徽州历史档案资源以构建数字记忆平台,实现徽州文书档案开发与社会记忆构建的共同发展,实现徽州文书档案数字人文资源开发成果的社会共享。社会公众、专家学者等均可通过这一开放的平台进行良性的知识互动与传播,达到丰富平台资源、优化徽州文书档案开发质量的目的。

4.3 以项目委托为主要形式进行徽州文书档案数字人文开发。徽州文书收藏机构应将徽州文书档案的数字人文开发工作以项目招标的形式委托给数字人文研究团队。数字人文研究团队则需整合多学科人才,根据委托方的利用与研究需求及徽州文书档案资源的年代、内容、归户性、类别等特征,有针对性的制定切实可行的开发规划,为徽州文书档案开发提供新思路、新方法。以项目委托为主要形式进行徽州文书档案数字人文开发是实现双赢的有效模式。一方面,徽州文书收藏机构将大部分徽州文书档案的开发工作委托给数字人文研究团队,不仅保证了开发成果的准确性和专业性,也节约了自身的人力物力成本,实现资源的优化配置,另外,在项目开发期间,机构工作人员在协助数字人文研究团队开发的同时还可以学习先进的数字人文技术、方法与经验,待条件成熟之际可自行开发一些价值重大或不宜向外委托的徽州文书档案。另一方面,数字人文研究团队通过承接徽州文书档案开发项目能够依托丰富的徽州文书档案资源获得高质量的数字人文开发实践机会,借以丰富团队开发经验,提高成员研发能力,并且在承接项目的时,团队不仅能获得徽州文书收藏机构方面的资金支持,还能凭借项目进行课题申报,争取到国家或相关部门设立的研究基金,使研究经费得到充分保障。

参考文献:

[1]韩宇,王蕾,叶湄.徽州文书数据库建设的现状与发展趋势[J].《高校图书馆工作》, 2019(6):54-68

[2][3]严桂夫,王国健.徽州文书档案的特点和价值[J].《档案学研究》,2001(1):20-24

[4]严桂夫,王国健.徽州文化全书之徽州文书档案[M].合肥:安徽人民出版社,2005:1-4.

[5][9]王振忠.徽州文书与明清以来的中国史研究[J].《安徽大学学报(哲学社会科学版)》,2018(1):1-11

[6][8]朱兰兰,薄田雅.数字人文视域下家谱档案资源多元化開发[J].《浙江档案》,2019(10):31-33

[7][10]王蕾.徽州文书、徽学研究与数字人文[J].《图书馆论坛》,2016(9):1-4

猜你喜欢
数字人文开发利用
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索
新时期高校足球课程资源开发利用研究
审计供给侧改革背景下的审计成果利用探析
天台县忍冬科野生观赏植物资源及开发利用
云南食用花卉开发利用浅析