周文泓 文利君 赵婧羽 杨璐羽
摘要:从档案视角探讨将人工智能作为数字遗产进行保存,旨在明确档案机构保存人工智能的策略要点。通过分析《长期保存的数字遗产遴选指南》(第二版)中的相关内容,从遴选通用框架和人工智能专题两方面进行梳理,明确人工智能作为数字遗产的情景和保存要点。在此基础上,从职能、对象、管理框架、管理方案这四方面提出档案领域将人工智能作为数字遗产保存的策略。最后,对人工智能作为数字遗产保存的未来议题进行了讨论,涵盖人工智能作为文件的认知建构、人工智能档案化管理的理论与方法构想、人工智能作为数字遗产保存的路径设计。
关键词:数字遗产 人工智能 档案保存
Abstract: Discussing the preservation of artificial intelligence as digital heritage from the perspective of archives aims to clarify the strategy of archival management of artificial intelligence. By analyzing the relevant content of the Guidelines For the Selec? tion Of Digital Heritage For Long- Term Preserva? tion -2nd Edition,and sorting out the criteria for selec? tion and the chapter of artificial intelligence, the con? text and preservation points of artificial intelligence as digital heritage are clarified. On this basis, it is pro? posed that archival agencies can strengthen the func? tion of the protection of digital heritage, clarify the cognition of artificial intelligence as a document , con? firm the operational characteristics of artificial intelli? gence to build collaborative management framework, and clarify the management challenges to artificial in? telligence to improve management of artificial intelli? gence. Finally, the future issues of the preservation of artificial intelligence asdigital heritage are dis? cussed, covering the cognitive construction of artifi? cial intelligence as a document, the theoretical and methodological conception of archival management of artificial intelligence, and the path design of artifi? cial intelligence for digital heritage preservation.
Keywords: Digital heritage; Artificial intelligence; Archives preservation
從国家的战略布局到各行业的实践应用,人工智能已经在全球范围内得到了广泛覆盖,各领域均在探索人工智能在其中的应用场景和具体应用方案,档案馆在内的记忆机构也在积极开展相关探索。[1]人工智能作为人类世界数字转型的推进者与建设者,具有记忆与资产属性,面向人类文明,如何将人工智能作为数字遗产保存同样是呈现于档案领域的前沿议题。[2]联合国教科文组织(以下简称UNESCO)2021年发布的《长期保存的数字遗产遴选指南》(第二版)(以下简称《指南》)对此展开了一定讨论,体现了这一议题的高瞻性与前沿性。人工智能如何被视为档案化管理的对象、其特征与价值、管理的重点、管理主体、管理模式与要求等问题群有待梳理,面向实践亦亟待形成趋向数字遗产保存需求的及时可行的策略。
研究方面,档案领域对人工智能的认识侧重于如何在档案活动中强化人工智能的开发与应用,[3-4]直接针对人工智能作为数字遗产保存的探讨未有显性成果。一方面,有关数字遗产的研究可提供基本的方向与方法,涉及数字遗产的特征识别、实践挑战与策略等。[5-8]例如,行动建议涵盖政策优化、机构协作、资金投入等。[9]另一方面,以数字平台与工具为内容组成的数字系统、数字游戏等特定形态事物的档案化管理的研究,也可为人工智能的保存提供一定参考。[10-12]例如,有学者建议对游戏的保存应涵盖游戏的完整开发过程,包括源代码、各阶段的测试版本及相关文档资料。[13]因此,以人工智能为焦点对象的保存行动既需要明确数字遗产保护的方向,也需要进一步扩充档案视角的探索。
面对人工智能作为数字遗产进行保存这一尚待多方开拓的议题,关键是立足实践明确在当下可讨论的行动方向,并延伸至保存传承的长远未来,从理论层面确定档案视角下需要重点关注的议题框架。因此,本文对《指南》有关内容予以梳理与分析,并结合人工智能内涵与表现、相关理论探讨、有关的实践探索等,从档案视角出发,在理论与实践层面展开双重讨论。
UNESCO于2003年通过了《保存数字遗产宪章》,[14]倡导各方做好数字遗产保护工作。2012年,世界记忆工程大会提议搭建PERSIST平台(全球加强信息社会可持续发展平台)。该会议同时发布了《温哥华宣言》——“数字时代的世界记忆工程:数字化与保存”[15],呼吁立即采取行动保护世界数字遗产。为协助遗产保护机构完成这一重要任务,UNESCO和PERSIST项目在2016年发布了第一版《长期保存的数字遗产遴选指南》。[16]数字环境的变化呼唤指南内容的更新,因此在2021年UNESCO发布了第二版《指南》,[17]提出人工智能作为复杂构件的数字综合体,是数字遗产保存不可忽视的遴选对象。关于人工智能如何可以被视作数字遗产,它提供了两个层面的参考。
(一)遴选通用框架:确认人工智能能否作为数字遗产的基本方法
《指南》提供了通用的指导来帮助不同的遗产机构面向多元的数字信息确定哪些可以成为数字遗产并予以保护,这同样适用于人工智能。
1.各有侧重的机构定位。图书馆、博物馆和档案馆虽同样作为文献遗产保护机构,但在数字环境下各自面临的外部挑战和机构使命存在差异,这要求《指南》使用者首先要明确自身的机构定位,从而明晰各自在数字遗产保存工作中的遴选重点。如在收集对象上,图书馆选择的主要是数字出版物;博物馆所收集的主要包括原生数字藏品、数字化藏品;档案馆的选择对象则是数字形式的原始记录,如电子邮件、网页等。
2.制定选择原则。数字遗产保存机构在具体遴选前,需确定选择的原则,具体包括三个部分。一是评估数字遗产对机构与公众的重要性;二是评估其保存的可持续性,即机构对其进行保存以供长期使用的能力;三是评估数字遗产在异地保存的可能性以及最适宜的保存机构或社群团体。在具体实施遴选原则的过程中,需进一步考虑以下四项内容:一是职能,即数字遗产对机构发挥的作用;二是主题,即数字遗产所反映的内容;三是来源,即数字遗产的创建者或者出处;四是类型,即数字遗产内容存在的格式。
3.遴选的具体流程。(1)确定遴选情境。在着手选择数字遗产保存对象之前,应考察其背景环境。数字遗产的形成背景包括其形成者、形成的活动和形成系统以及它们之间的相互关系,认识并了解这些背景信息可以促进更具战略意义的决策。同样,在数字背景下,了解必要的背景信息可以为机构节省时间和资源,并大幅度地提高决策透明度。(2)识别遴选对象。一是需判断本机构对是否选择该对象的决策的完备程度。二是需要考虑以下三个方面的内容:其一,它的标题、创建者、出处、范围是什么;其二,机构是否有能力和权限获取、保存和提供所有数据、记录和信息;其三,是否可获知数字对象的元数据。(3)考虑法律问题。一是考虑机构的法定义务问题,包括根据所在国家或地区法律及政策规定,确定该机构数字遗产保存的义务及权责范围,以及根据该机构有关数字遗产保存和开发的政策要求,确定保存这份材料的必要性。二是考虑潜在的法律障碍,如知识产权或隐私限制的问题。此外国际和国家法律有关数字材料的获取、传播、复制和使用的规定之间的差异也需要纳入考虑。(4)应用遴选标准。在进一步遴选时,机构可以使用三个选择标准来进行评估。一是重要性。这项标准针对的是评估对象,从真实性、来源、对创造者的价值等因素中分析其对所存机构、对公众等是否具有价值,以及其在凭证、研究、艺术等方面是否具有价值及价值的高低。二是可持续性。这项标准面向的是机构本身,考虑其是否具有资源、能力、技术及预算来保存数字遗产。三是可用性。可用性主要需衡量这份材料在其他机构的保存情况,包括其他机构是否持有此份材料,这份材料是否更适合保存在其他机构以及是否需要考虑多份、异地、异质备份保存來保证长期可用性等问题。(5)形成遴选决策。根据机构的实际情况灵活运用各项选择标准,选择适用于本机构的评估标准及最有效的评估顺序,完成上述步骤并做出决定。同时,还需记录每一步骤的决定及理由,以备将来重新评估所需。此外,对决策及形成决策的过程要进行实时记录。在选择工作的每个步骤中,机构应确保每个环节透明且可追溯。实时记录对于治理和捕获重要信息以供未来机构对选择工作进行重新评估至关重要,遵循这种方法能帮助机构在选择长期保存的数字材料时做出更好的决策。
(二)针对人工智能的启示性讨论
人工智能在《指南》中也得到了专题性讨论,相关内容有以下几个方面。
1.人工智能应纳入数字遗产保护遴选范围的原因。其主要原因体现为以下几点。(1)人工智能在各类组织机构中广泛应用。(2)人工智能在应用过程中会使用和产出兼有非结构化数据和数据集的海量数据。(3)人工智能的应用包含了大量获得决策的过程。
2.人工智能在什么时候可以被视作文件。人工智能什么时候可以被视为文件且需要捕获应该从以下几个方面进行判定。(1)人工智能的产出是否对政策制定与政府政策的实施产生了影响?人工智能对政策制定与决策的影响是否会对公民产生作用,尤其是是否影响了公民确认和维护自身权利的能力?(2)人工智能的产出是否影响了组织机构的使命?(3)人工智能的使用是否影响了组织机构的关键项目,或者影响了组织机构的决策方式?(4)人工智能的使用是否对组织机构或政府的决策有里程碑式的重大影响?(5)是否有多样化的实体或组织机构参与人工智能的开发或训练?如果有,谁拥有代码?谁拥有训练数据?谁拥有产出的成果?他们是同一个实体吗?如果上述前四个问题的答案为“是”,那么这个人工智能就构成了具有长远历史价值的文件,应当为文献遗产机构所捕获。最后一个问题旨在明确多主体形成文件这一现象,因为这可能会对遴选产生影响。
3.人工智能作为文件的构件。人工智能文件不仅包括作为算法的产出,也包括产出算法的相关构件。(1)研究问题。这是为什么要开发和使用特定人工智能的起点,也是鉴定和遴选流程需要了解的基本信息。(2)用于开发和训练算法的不同类型的数据。这包含结构化和非结构化数据、社交媒体数据等,也包括记录有数据来源、内容、范围、样本集、算法训练和改进过程的日志。(3)清洗后的数据。这是对不同来源的数据聚合和清洗后的结果,清洗过程也要体现于日志中。(4)代码。代码是回应研究问题的计算与数学化的表现,代码的优化进程也要记录在日志中。(5)产出。这是算法应用于不同计算流程中的结果。
4.公私合作关系的影响。人工智能的开发与应用往往需要公共机构与私人公司进行合作,面向遴选与保存,围绕知识产权和版权,需要确认的事项有以下几个方面。(1)谁拥有代码或算法?如果为公司拥有,如何记录人工智能产出?(2)谁拥有训练数据集以及随后生成的数据?(3)谁拥有人工智能产出,比如数据或是可视化成果?此外,公共机构使用人工智能进行决策应是可问责的,因此,有关知识产权的事项要及早考虑,需要对决策过程中涉及可问责性、透明性、未来公共文件的伦理事项与工作环境的内容进行记录。
5.遗产机构的能力。能力事项(基础设施、资源、人力)很大程度指向遴选标准中的可持续标准,同时与面向数字遗产的收集、处理、保存以及深度的开发利用相关。
《指南》充分显示了人工智能是数字遗产保存不可忽视的遴选对象。针对这些应用日趋广泛、使用程度逐步深入、形态与内容更加丰富的人工智能,行动的及时性是重点。换言之,将人工智能作为数字遗产进行保存,目前仍存在许多未明确的内容,虽然短时间内难以构建完整的行动方案,但这不应成为推迟行动的理由,而是要开展有效行动及时做好可做的事情,以规避这类数字遗产失真失存的风险。通过参考《指南》,当下的行动策略主要有以下几个方面。
(一)充实数字遗产保护职能以明确保存人工智能的職责
在人类世界纷繁复杂的数字转型进程中,档案机构不仅需要在已有职能范围内针对常规管理对象完成工作方法与理念的变革,同时还需要应对时刻推陈出新的数字对象在工作量与能力跟进方面带来的挑战。在这样的背景下,作为文化遗产的传承基地,档案机构需要适时拓展数字遗产保护的职能,为人工智能的保存提供更多的资源支持。
具体来说,这样的职责扩充是业务内容由遗产的数字化保存扩展至凸显数字原生材料作为遗产的保存。换言之,档案机构作为人类文化遗产的保存基地需要在职能属性上进一步凸显“数字”。当下,档案机构的数字遗产保存项目更多的是着重于对已有文献、遗迹、建筑等更具实体形态的遗产的数字转换。因此,档案机构需要及时扩充思路,关注到数字原生材料同样是人类文明重要的记录,尤其是在数字孪生、元宇宙等技术推进的数字转型进程中,数字原生材料甚至可能成为主流形态的记录。因此,只有适时转变思路,才能对人工智能作为遗产的价值更加明确,从而促进档案机构在对人工智能作为保存对象的甄选与后续的保存投入更多关注。这不仅有助于对人工智能这一类数字遗产的及时保存,还有助于在复杂的数字空间中积极识别高价值的不同形态的数字材料,进一步促进档案机构职能的履行。
(二)明晰人工智能作为文件的认知以厘清管理对象
人工智能从数字治理、技术治理的角度也有相应的管理要求,比如伦理方面的注意事项、知识产权需要得到保障等。从数字遗产保护的角度来看,档案机构若要对其进行有效管理,如何认识人工智能的文件属性至关重要,以下方面在当下尤为关键。
一方面,需要对人工智能是否是具有价值的文件进行明确判定以确认有效的管理对象。人工智能凭借其工具属性逐步广泛应用于各类活动的各式场景,由此生成的人工智能同样各具形态,从遴选的角度确定合适的管理范围及其对象较具意义。在这方面,人工智能对所服务的业务活动的价值尤为关键,如人工智能是否促进了业务活动及其相关要素的变革,因为这既能服务于形成机构的业务优化,也是从历史维度对社会活动发展进程的记录。
另一方面,人工智能具有复杂构件的特质需要得到充分认识,从而确保管理对象的完整性。一是人工智能并非简单的应用、系统、软件、平台,而是在与其服务的社会活动的关联中才体现了人工智能作为文件而记录社会活动的特性,因而算法、算法由业务活动获取的数据、算法使用后的业务结果等,均是不可或缺的内容构件。二是人工智能的重要特征是动态升级的,它的发展过程同样是组成部分,因而从研究问题至算法,相关日志同样是内容构件。
(三)确认人工智能的运行特征以建立协作管理框架
人工智能的可持续应用乃至长期保存涉及复杂多元的利益相关者,对应的协作管理框架是必要的。
一方面,人工智能的开发者一定概率上并非人工智能的使用者,人工智能的使用者很可能并没有自主开发人工智能的能力,因而很可能是向企业或学术机构购买产品与服务的。如同当前很多组织机构购买商业化的云服务,这类人工智能相关的数据、日志、产出等文件构件,有着怎样的权责分配,需要在协作管理的框架下进行确认与落实。例如,企业合法保障商业权益中的保护技术秘密怎样同组织机构购买产品与服务应有的权利相平衡、日志与训练数据由谁保管等。
另一方面,于档案机构而言,做好人工智能的长久保存同样面临能力与资源方面的限制,同时也有协作管理方面的需求。一是档案机构若要获得有价值且高质量的人工智能,需要其开发者与使用者的配合及辅助。二是档案机构若要保证人工智能的真实可用性,需要强大的技术、平台与资源支持,来自其他遗产机构、社会第三方的助力同样重要,比如可贡献专业方法与资源支持的企业与学术机构等。
(四)明确人工智能的管理挑战以提升管理方案动态性
人工智能的长期保存会面临来自技术、社会、文化等复杂性集成的各式挑战,当前甚至相当长的一段时间内,难以形成相对完备的方案,这是开展针对人工智能的数字遗产保存的前提。
一方面,在当下进行可行的实践,以提升行动的及时性。这是为了符合遴选要求的人工智能得到当前最大程度的保存支持。这意味着,并非给予人工智能最优的方案,而是在现有条件下做到最大程度的保存。例如,当前可先联合其他遗产机构展开试点工作。
另一方面,保有管理的容错空间。在当前的文件管理、档案管理、遗产保护相关制度、方法、工具未能充分解答针对人工智能的每一相关问题的情况下,先以保护有价值的遗产为预设采取措施。例如,在无法判定价值的时候先将其设定为永久,在未能面向利用做好固化工作的情况下先将保存原始材料作为权宜之计等。
此外,無论是档案机构的能力还是人工智能的发展都是动态的,动态之中的管理方法与方案完善极为重要,及时发现可做与可优化之处,均应同步反馈于方法与方案之中。
人工智能作为数字遗产的保存既无显著的实践探索,也缺少充分的理论关注。针对实践中存在的方法和路径上的困惑,理论层面需要系统地构建起相关认知,以驱动档案机构和数字遗产保护领域实践的完善与创新。因此,围绕人工智能的应为空间,对应的是问题群,尚需形成面向长远未来的议题框架。
首先,人工智能作为文件的认知建构需要完备。尽管UNESCO从构件组合的角度明确了人工智能的基本的组成,但怎样的人工智能可被视作纳入档案管理范畴的文件需要进一步确认。一方面,人工智能作为文件需要进一步确认其具体要素的表现与特征。例如,怎样从系统、应用、过程记录、数据等角度综合理解人工智能的文件属性与形态,前文所述的构件中哪些应视作内容要素。另一方面,人工智能作为电子文件的四性如何细化表达。对人工智能这样需要持续训练与发展的文件,已有的要求如何落实于动态的进程中,数字遗产遴选提出的质量要求又如何同其相融合,这同样是需要深入研究的问题。
其次,人工智能予以档案化管理的理论与方法构想需进一步扩充。一方面,现有的理论与方法的适应性问题需要逐步验证,针对相冲突或空缺之处要进行归因分析,完成对已有理论与方法的调整及完善。另一方面,立足数字转型所处的百年未有之大变局,人工智能也许为档案领域在理论与方法上的创新建构提供了更深刻的机遇,有关文件、档案是什么的认识也可能有新的变化,并进一步影响管理方法与模式的变革。例如,不断更新迭代的人工智能何为可固化的形式与节点,人工智能治理如何将文件档案管理纳入,如何从技术视角拓展数据治理的思路以显示文件档案的方法要求等。
最后,人工智能作为数字遗产保存的路径设计需要进一步探索。这直接对接于如何为人工智能的长久保存确定可行有效的方案,这就需要落实全生命周期的文件管理及其相关的保障要素。例如,归档范围、方式怎么设定,如何同数字遗产遴选实现流程互通与方法融合;鉴定的依据与方法是什么;如何实现前端控制;多利益相关者如何共推人工智能的长久保存;档案机构如何同其他遗产机构在各有侧重分工的基础上协力保存人工智能等。
*本文系2022年度国家社会科学基金青年项目“计算档案学视角下的网络档案信息资源建设研究”(项目编号:22CTQ042)的阶段性研究成果。
注释及参考文献:
[1] BUNDY, A. Preparing for the future of Artificial Intelligence[J]. AI & SOCIETY. 2017(32):285–287.
[2] PLASTINO E, PURDY M. Game changing value from artificial intelligence: eight strategies[J].Strategy & Leadership, 2018,46(1):16-22.
[3]于英香,赵倩.人工智能嵌入档案管理的逻辑与特征[J].档案与建设,2020(1):4-8.
[4]陈会明,史爱丽,王宁,等.人工智能技术在档案工作中的应用与发展刍议[J].中国档案,2020(3):72-74.
[5] MACDONALD, L.Digital Heritage Applying Dig? ital Imaging to Cultural Heritage[M]. Oxford: Elsevier Ltd, 2006:461-463.
[6] DE LUSENET Y. Tending the garden or harvest? ing the fields: Digital preservation and the UNESCO char? ter on the preservation of the digital heritage[J].Library Trends, 2007, 56(1): 164-182.
[7] ANASTASIOS D,ELEANOR F,JOAO M,et al. Digital Heritage,Progress in Cultural Heritage: Documenta? tion, Preservation, and Protection[G].Limassol: Springer, 2014:1-16.
[8] BEC A, MOYLE B, TIMMS K, et al. Manage? ment of immersive heritage tourism experiences: A concep? tual model[J].Tourism Management, 2019, 72(6): 117-120.
[9]周毅.数字遗产保存的行动路线研究:公共信息机构的任务识别与策略选择[J].情报理论与实践,2012,35(4):15-20.
[10] NYLUND N, PRAX P, SOTAMAA O.Re? thinking game heritage–towards reflexivity in game preser? vation[J]. International Journal of Heritage Studies, 2021, 27(3): 268-280.
[11] GRAU O. Digital art through the looking glass: new strategies for archiving, collecting and preserving in digital humanities[M].Hamburg,Austrian National Library, 2019:5-22.
[12]张静文.国外数字游戏长期保存的研究进展[J].图书情报工作,2019,63(21):137-144.
[13] WINGET M A, SAMPSON W W. Game devel? opment documentation and institutional collection develop? ment policy[C]//Joint Conference on Digital Libraries.Pro? ceedings of the 11th annual international ACM/IEEE joint conference on Digital libraries.New York:Association for Computing Machinerym,2011: 29-38.
[14] UNESCO.Draft charter on the preservation of the digital heritage.[EB/OL].[2022- 10- 07].https://unes? doc.unesco.org/ark:/48223/pf0000131178.
[15] UNESCO.The Memory of the World in the Dig? ital Age: Digitization and Preservation.[EB/OL].[2022-10-07].https://unesdoc.unesco.org/ark:/48223/pf0000373728/ PDF/373728eng.pdf.multi.
[16] UNESCO.The UNESCO/PERSIST guidelines for the selection of digital heritage for long-term preserva? tion.[EB/OL].[2022- 10- 07] https://unesdoc.unesco.org/ ark:/48223/pf0000244280.
[17] IFLA. Guidelines For the Selection Of Digital Heritage For Long-Term Preservation–2nd Edition.[EB/OL].[2022 - 1007]https://repository.ifla.org/handle/ 123456789/1863.
作者單位:1.中国人民大学信息资源管理学院2.山东大学历史文化学院3.吉林大学商学与管理学院