“威尼斯时光机”项目档案资源开发模式研究与启示

2022-06-09 16:24张旭张斌
北京档案 2022年5期
关键词:数字人文

张旭 张斌

摘要:威尼斯时光机是各领域学者普遍关注的典型数字人文项目,为档案资源开发利用理论和技术框架的搭建提供了新范式。论文通过厘清威尼斯时光机项目起源及发展脉络,将其分为“协作与开放”和“挖掘与赋能”两个阶段,并以再现该项目档案资源开发流程的方式,阐述其对于档案学及各学科的现实意义。针对现阶段的开发困境进行归纳总结,发现该项目在数据可用性、资金可得性、研究可行性三大方面存在问题。以此为基础,针对这一项目案例对我国档案资源开发的启示进行简要探讨。

关键词:数字人文 数字人文项目 威尼斯时光机 时光机项目 档案资源开发

Abstract: Venice time machine is a typical digi? tal humanities project generally concerned by scholars in various fields, which provides a new paradigm for the construction of the theoretical and technical framework for the development and utilization of archival resources. By clarifying the or? igin and development context of Venice time ma? chine project, this paper divides it into two stages:"cooperation and opening" and "excavation and em? powerment", and expounds its practical signifi? cance for archival science and various disciplines by reproducing the development process of archi? val resources of the project. After summarizing the development difficulties at this stage, it is found that the project has problems in three aspects: da? ta availability, capital availability and research feasi? bility. On this basis, this paper briefly discusses the enlightenment of this project case to the devel? opment of archival resources in China.

Keywords: Digital humanities; Digital humani? ties project; Venice time machine; Time machine project; Development of archival resources

自意大利学者罗伯托·布萨(Roberto Busa)编制《托马斯·阿奎那索引》以来,人文社会科学数字化引起了学界的广泛关注,由此引发了从人文计算(Hu? manities Computing)到数字人文(Digital Humani? ties)的嬗变。历经了约七十年的发展,数字人文的内涵、外延依旧模糊,各界学者基于不同视角对数字人文有不同的价值理解。尽管如此,大多数学者秉持“数字人文是一种‘伞状’或‘帐篷式’的概念,以数字媒介和传统人文为骨架去研究人文科学”的观点。笔者认为,数字人文实践先于理论研究,尤其数字人文项目作为实践外在表现的主要方式,对数字人文理论及技术体系的确立具有一定的“反哺”作用。[1]本文以瑞士洛桑联邦理工学院(école Poly? technique Fédérale de Lausanne, EPFL)弗雷德里克·卡普兰(Frédéric Kaplan)主持的“时光机”项目为例,以期细致展现数字人文的方法论基础、理论架构、平台构建及其应用展示方式。

(一)项目概况

1.协作与开放:威尼斯时光机起源。始于2013年2月的威尼斯时光机项目(Venice Time Ma? chine)不仅是欧洲时光机项目的一部分,同时也是欧洲时光机的旗舰项目。威尼斯时光机的运营,为其他城市时光机提供了可资借鉴的蓝本。而威尼斯之所以能成为时光机项目的首选城市,一是由于其独特的人文地理景观,自中世纪就引起世界各国的普遍关注;二是由于其特殊的地理位置,位于亚欧大陆板块中部,是各国商人贸易往来的必经之地;三是由于其存在的现实难题,全球变暖导致冰川加速融化,海平面持续升高,威尼斯有消亡的可能;四是由于其优良的档案保存传统,威尼斯保存着该座城市一千多年连贯完整的档案文献,对于历史地理重构、文化遗产保护具有不可或缺的重要作用。

EPFL与意大利威尼斯大学(UniversitàCa’ Foscari Venezia, UNIVE)签订协议,建立跨学科联合培训计划,围绕威尼斯城市档案进行深入开发及技术创新,计划不仅包括EPFL和UNIVE的在校生,还包括欧美机构的其他研究人员。威尼斯国家档案馆的加入使得该项目呈现“三足鼎立”的局面,三方签署合作文件并构建合作框架,明确该项目的主要目的是将档案馆馆藏档案进行数字化并转换成一个在线的开放性信息系统[2],所有数字化档案资源均可免费访问,既可服务于相关领域的研究学者,也可使普罗大众从中受益。

2.挖掘与赋能:威尼斯时光机发展。(1)自举阶段:2012—2019年。自举(bootstrapping)[3]一词源于19世纪早期,原意是指在创立一家公司时,除了企业家的个人储蓄外,几乎没有其他资金来源和外部支持,比喻在没有外界援助的情况下取得成功。现这一概念引申至其他各种自启动过程,在计算科学领域意为计算机必须像人一样具备自举能力,进而将自己所有的元件激活,以此来加载操作系统并通过操作系统来完成那些原本难以完成的任务,它描述了在连续和相互依赖的阶段中创建复杂软件程序的过程。为此,在购置服务器、扫描仪、计算机以及必要软硬件设备的同时,经过各方的努力,组成了一支跨学科、跨地域、跨行业的威尼斯时光机团队。由此威尼斯时光机在一定程度上具备自举能力,能够通过以“机器学习为主,人工识别为辅”的特殊方式实现档案资源数字化及其价值内涵的深度挖掘。(2)深化阶段:2020—2028年。威尼斯时光机第二阶段将焦点放在开发“威尼斯镜世界”(The Venice Mirror World)的4D模型,即基于威尼斯过去数据信息而构建与城市历史原貌重合模型。[4]与3D模型相比,威尼斯4D镜世界模型增加了“时间”这一维度,各个时期整个城市的历史细节被捕捉在信息系统中,构建出密集信息框架,不仅可以通过增强现实(Augmented Reality,AR)技术使公众沉浸式体验威尼斯近千年的变迁,还可以记录威尼斯环境状况的细微变化。在《数字物质化时代的光环:在不确定的未来阴影下重新思考文化遗产保护》一书,弗雷德里克·卡普兰與伊莎贝拉·迪·莱纳尔多(Isabella di Lenardo)[5]合著的一篇文章中对威尼斯镜世界的前景及其意义进行了细致描述。他们认为威尼斯镜世界可能是国际互联网站点中的第一节点,并将逐渐强化为一个新的从根本上改变我们与过去和未来的关系的全球性信息平台。这恰恰是在全球信息化浪潮下,世界文化遗产数字化的核心价值体现。

(二)开发流程

1.实体图像化,分布式存储。传统的档案数字化是通过人工进行的,不仅速度慢,而且容易出现遗漏,效率极其低下。威尼斯时光机项目将威尼斯国家档案馆的手稿、书籍、地图册、卷轴、死亡登记簿、医疗记录、城市规划图等档案馆藏资源进行数字化,保存为可长期重复使用的高清图像,其时间跨度长达一千年。考虑到这些档案资源大多为极易破损的纸质材料,EPFL借鉴了医学领域的“断层扫描技术”,该技术无须打开档案文献即可进行数字化扫描,解决了档案数字化长期存在的“档案砖”[6]的疑难问题。

2.文本自动转录,构建信息网络。为了高效率对档案内容进行转录,区别于传统的光学字符识别(OCR)技术,威尼斯时光机团队开发了一套特殊算法,该算法通过机器学习可自动识别手写稿中晦涩难懂的文字碎片,并通过不断优化算法,达到与其他档案文献资料中相似手写体进行关联并建立信息网络[7],方便相关领域学者通过数字信息技术实现基于海量历史文献的专题分析。

3.数据3D建模,交叉比较分析。对通过数字化而获取的大量非结构化档案数据进行专题式处理[8],非结构化数据转换为结构化数据后,数据通过3D建模技术进行可视化分析,可动态展现出威尼斯城市群落各时期原始形态。值得一提的是,威尼斯时光机的数字化数据具有一定的关联性。通过交叉比较分析各个时期的文学绘画作品、历史文献古籍等材料,甚至可以还原某地某时的人物活动轨迹,这对于我们探索研究彼时当地人的生活习性、活动范围具有一定的参考意义。

(三)现实意义

就档案学而言,威尼斯时光机以海量数字化档案资源为研究基础,构建开放协作的信息系统,通过新兴信息技术充分展现档案的叙事功能,创新了档案叙事方式。传统的档案叙事具有一维性,而威尼斯时光机档案叙事方式是沉浸式、三维立体的,将碎片化的档案图像信息拼凑起来,给用户身临其境之感。此外,档案叙事主体更加多元化,不仅包括档案工作者,彼时彼地的威尼斯商人、公民等都可以成为威尼斯档案的叙事主体,这与加拿大档案学者特里·库克(Terry Cook)所提出的“档案工作第四范式”[9]不谋而合。此外,威尼斯时光机项目档案资源开发模式的影响已广泛渗透到历史学、语言学、建筑学、经济史学、流行病学等诸多学科领域,在复原真实历史细节、探究语言演化模式、模拟城区建筑形态、窥见经济行为动因、探索瘟疫传播规律等方面具有重要的理论与实践价值。

(一)数据可用性受到质疑

曾在2019年9月,威尼斯国家档案馆发表声明表示,时光机项目由于在原始协议中存在些许疏忽而被喊停,所谓的不妥之处即在对档案进行数字化后,其过程没有被完整记录。露西安娜·杜兰蒂(Luciana Duranti)主持的“电子系统中文件真实性永久保障国际合作项目”(InterPARES)相关成果中,对电子文件的格式和真实性做出了如下规定:“真实性意味着完整性,但完整性并不意味着真实性——人们可以保护伪造品的完整性,但这样做并不能使其成为真实的记录。因此,记录存在另一个特征,当与完整性结合时,允许验证其真实性:身份。一个数字记录的标识包含了所有的区别属性,这些属性共同唯一地描述了它的特征,并将它与其他记录区分开来。为了证明数字记录的真实性,必须建立其持续的身份并证明其完整性。”[10]显然,威尼斯时光机在进行档案数字化的过程中,其元数据并未完整、详细地的记录,由此导致通过技术手段所得的数据可用性受到质疑,项目也被短时间搁置。

(二)资金可得性受到牵制

时光机项目作为欧洲历史再复兴的希望项目,获得了社会各界的广泛支持。但作为“烧钱机器”,尽管威尼斯时光机项目也得到了威尼斯地方政府和其他第三方机构的资助,但是对于如此庞大的项目机构、如此繁杂的项目任务来说,项目团队依旧“囊中羞涩”。资金不足主要体现在:其一,技术研发费用。威尼斯时光机所采用的技术在全球独树一帜,设备物料的采购、技术专家的支持等对于技术创新起到了至关重要的影响,而这些无疑需要耗费大量的资金。其二,人力资源费用。无论是采取外包还是其他方式,对档案实体的数字化、内容的数据化需要基于一定的人力基础。此外,高端技术研究人员的聘请也需要耗费巨大成本。其三,研究后续费用。威尼斯时光机项目不仅仅局限于当前的研究领域,未来力图打造的“威尼斯镜世界”4D模型更是一个庞大的系统工程,后续的资金花费难以预见。

(三)研究可行性受到批判

威尼斯时光机为史学、语言学等人文学科研究提供了新的框架、范式,新技术、新方法的应用为传统人文学科提供了新途径,因此受到了较多研究者的关注,但部分人文专家学者对于这种研究方式持怀疑、甚至是反对的态度。[11]众所周知,人文学科研究长期处于“仁者见仁,智者见智”的氛围,学者们针对某一问题可以有不同解读,因此对同一事物的看法存在差异的现象在人文学界是普遍存在的。而威尼斯时光机所提供的研究方法是一种客观、定量的方法,数据的堆砌、关联、分析是一整套完整流程,这无疑对传统人文学者提出了挑战。机器研究是否可以代替传统的人文研究、其计算或者思考的结果与人的主观分析是否存在差异等问题,都是技术驱动背景下传统人文学者对威尼斯时光机研究内容所提出的质疑。

(一)创新档案开发方式,提高档案利用效率

档案是时光机项目的“原材料”,没有档案,该项目就无从谈起。威尼斯时光机档案开发方式的创新之处主要体现在以下几个方面:其一,档案开发主体的转变。传统档案开发利用以档案馆工作人员为主体,其他部门主要负责相应的辅助工作;而威尼斯时光机项目中档案开发主体不仅包括档案机构,还包括技术专家、各领域学者等,甚至于大众均可以参与到档案资源的开发进程中。其二,档案开发技术的创新。受到技术和传统观念的影响,档案开发技术长期局限于针对档案实体数字化,而针对档案信息内容的挖掘力度远远不够,因此技术层面没有得到实质的提升。针对这一痼疾,时光机项目组组织开发系统工具、优化系统算法,通过机器学习,对档案进行数字化、数据化后再进行整理、组织、关联,针对档案内容进行系统、深度、高效、精准地开发,将原先的粗放型档案开发模式向集约型、专业化档案开发模式转变。其三,档案开发目的多样。档案开发的最终目的是服务于利用的,然而就目前而言,国内档案开放的范围依旧存在很大的局限,由此导致档案利用率低下,因此檔案开发浮于表面、目的不明确、服务主体不精准等现象层出不穷。威尼斯时光机项目以“保留威尼斯城市记忆”为目的,以“创新世界文化遗产开发模式”为己任,具有长远的目的性和现实意义,对于国内的档案开发主体明确开发目的、重视档案背后的文化价值,进而精准提供档案服务树立了样本。

(二)扩展档案研究领域,丰富档案研究内容

数字人文作为近几年学界出现的热点话题,引起了各领域学者的广泛关注。尤其对于数字人文的学科概念及学科归属问题引发了激烈的讨论,大多数学者普遍认为数字人文的价值内涵其实是通过数字人文项目体现出来的,并且数字人文与档案有着天然的联系。威尼斯时光机作为以档案资源为基础的数字人文项目,对于档案学的研究方式、研究范畴起到了一定程度的扩展作用。针对这一观点,国内某些学者提出了“档案数字人文”[12]这一新兴概念,围绕这一主题的研究也在如火如荼地展开。与此同时,档案学长期作为小众学科,为少数人所熟知。在提倡“新文科建设”的政策背景下,毋庸置疑,数字人文与档案学的结合,将为档案学开拓新的疆土,在某种程度上解决传统档案学研究遭遇的困境与难题,提供档案学研究新方法、新范式,从而最终提高档案学在整个学科体系中的地位。

(三)构建档案叙事体系,实现档案深层价值

档案叙事是借助于叙事学理论,以档案为载体,可视化等技术为展示手段,将档案背后的文化价值深度挖掘,进而引发社会大众对于过去的思考、对未来的构想。威尼斯时光机项目对于档案叙事体系构建的启示在于:其一,叙事主题的多样化。档案中蕴含的内容涵盖各个学科,针对某一学科、某一主题进行跨越时空的再现,加之档案本身所具有的原始记录性属性,不同的档案资源可拥有不同的叙事主题,同一份材料也可以拥有多种多样的叙事主题。其二,叙事形式的多元化。传统的档案叙事以档案展览、档案讲座、档案推文等形式展现,具有一维性、单向性的特点;而威尼斯时光机在时间和空间两个维度创新了档案叙事方式,当历史场景被重塑、社会关系被重构,历史记忆得以重现[13],这对于构筑档案叙事理论体系,以及隐藏在档案背后深层含义的深度挖掘具有重要意义。界面展示可视化的同时,知识可视化得以实现。其三,叙事语言的交互性。对于单纯文本叙事语言,威尼斯时光机不仅通过图像复原、4D建模等技术使得叙事语言具有易读易记性,并且通过双向互动,大众可以与千年前的威尼斯进行某种程度上的互动联通。

(四)优化档案数据开发,增强档案治理能力

从档案数字化到档案数据化是一个难以跨越的鸿沟,跨越鸿沟的关键是技术的迭代更新。就现阶段而言,档案数据化工作仍处在停滞阶段,究其根本是档案本身内容的错综复杂導致最终获得的数据是非结构化,将其转换为结构化数据需要耗费大量的人力物力,并且目前的技术手段无法满足结构化数据的自动转换。威尼斯时光机为档案数据所开发的技术工具,涵盖了从档案实体收集、整理到档案数据挖掘、组织、利用全过程,在一定程度上打破了传统档案数据分散、无序的混乱状态,将破碎的档案数据进行整合、关联,满足档案数据利用需求。此外,有鉴于档案数据的真实性、完整性,基于协同的视角[14],优化后的档案数据可以解决传统治理模式下,档案部门参与的被动性,由被动参与变为主动参与,从而提高档案在社会治理中的话语权。

威尼斯时光机作为知名的数字人文项目,其影响力已经扩展到全球范围,以威尼斯时光机为案例,围绕档案资源开发的实践探索业已展开。跨学科协作、技术迭代升级、数据开放利用等为档案资源深度挖掘、细粒度关联提供了理论和技术支持,信息时代的档案资源开发利用在威尼斯时光机项目的影响下,将会呈现出新的生命力,而时光机项目的后续进展值得我们长期了解关注。

*本文系国家社科基金重大项目“大数据环境下政务信息资源归档和管理研究”(项目编号:17ZDA293)的研究成果之一。

注释及参考文献:

[1]张旭,王晓宇.数字人文学科归属及其与图情档关系初探[J].情报理论与实践,2022,45(2):29-34;42.

[2]EPFL.VeniceTimeMachine -EPFL[EB/OL].[2021-11-17].https: //www.epfl.ch /research /do? mains/venice-time-machine/.

[3]Investopedia.BootstrappingDefinition[EB/OL].[2021-11-17].https://www.investopedia.com/terms/b/ bootstrap.asp.

[4] AI for Sustainable Development Goals (AI4SDGs) Think Tank.Venice Time Machine | AI4SDGs[EB/OL].[2021-11-19].https://ai-for-sdgs.academy/case/9.

[5]FactumArte.the_aura_in_the_age_of_digi? tal_materiality_factum_foundation_2020_web.pdf[EB/OL].[2021-11-19].https://www.factum-arte. com/resources/files/ff/publications_PDF/the_au? ra_in_the_age_of_digital_materiality_factum_foun? dation_2020_web.pdf.

[6]龙家庆.数字人文项目中档案数据开发工具及应用研究:以“欧洲时光机”为例[J].北京档案,2021(3):10-15.

[7]北京大学数字人文研究中心.案例:通过数字人文来制造“威尼斯时光机”[EB/OL].[2021-11-19].http://nav.dhlab.pku.edu.cn/project/%E6%96%87%E5%8C% 96%E9%81%97%E4%BA%A74/.

[8]杨茜茜.数字人文视野下的历史档案资源整理与开发路径探析:兼论档案管理中的历史主义与逻辑主义思想[J].档案学通讯,2019(2):17-22.

[9]库克,李音.四个范式:欧洲档案学的观念和战略的变化:1840年以来西方档案观念与战略的变化[J].档案学研究,2011 (3):81-87.

[10] (PDF) Authenticity of digital records: An archi? val diplomatics framework for digital forensics[EB/OL].[2021- 11- 19]. https://www.researchgate.net/publica? tion/290042000_Authenticity_of_digital_records_An_ar? chival_diplomatics_framework_for_digital_forensics.

[11]张墨研.数字人文的本体论反思:以意识形态批判的批判为起点[J].理论月刊,2020(8):120-129.DOI: 10.14180/j.cnki.1004-0544.2020.08.013.

[12]左娜,张卫东.数字人文视角下的档案学研究[J].图书与情报,2019(6):94-100.

[13]张斌,王露露.档案参与历史记忆构建的空间叙事研究[J].档案与建设,2019(8):11-15;40.

[14]展倩慧.协同治理视域下档案数据开发模式探究[J].档案与建设,2020(4):33-37.

作者单位:中国人民大学信息资源管理学院

猜你喜欢
数字人文
图书馆未来的技术应用与发展
数据驱动下的高校图书馆数字人文服务研究
汉传佛教文化遗产数字化建设现状调查与特征分析
数字人文2011—2016年研究综述
数字人文时代公共图书馆经典阅读推广研究
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究