元宇宙场域下档案数据研究:基本问题、管理框架及关键技术★

2023-02-05 09:37陈茜月
山西档案 2023年6期
关键词:数据管理场域宇宙

陈茜月

(郑州大学档案与校史馆 郑州 450000)

0 引言

元宇宙作为当下备受关注的技术新宠,已成为各领域的热点话题。元宇宙起源于上世纪末尼奥的科幻小说《雪崩》中构建的网络世界Metaverse,是基于互联网而生的、能与物理世界信息相通且平行存在的虚拟世界,因具备沉浸式体验的特点而被看作是3D 版的超大互联网平台[1]。作为一个虚拟生态体系,元宇宙空间(又称元宇宙、元宇宙场域,下文统一简称为元宇宙)具备的去中心化、超高计算能力、高度互联互通等特点可以为物理世界在信息处理、数据交互等方面的现存困境提供有效解决方案,为信息管理领域开拓研究思路。当前图情学科部分学者已开展对元宇宙的研究,主要涵盖图书馆管理[2-7]、信息管理[8-9]等方向。档案领域针对元宇宙的讨论也逐步升温,已有的研究成果集中在档案服务方面,包括档案展览[10]、档案文创[11]、民间艺术档案[12]、档案宣传[13]、服务模式[14]等,也有学者提出档案领域元宇宙的研究基础[15]、档案馆融入元宇宙的展望[16]、元宇宙视域档案空间构建[17]、元宇宙应用风险[18]等。

档案领域针对元宇宙的研究日渐丰富,但目前在元宇宙场域下档案数据方面的研究较为单一,针对基本问题的解析、管理方法的讨论、技术手段的运用相关研究并未见到,此类基础研究的空缺或在一定程度上制约元宇宙和档案学的深度融合。笔者认为针对元宇宙场域下档案数据的研究工作应始于对基本问题的明晰和核心概念的探究,这是后续研究工作的重要起点;在此基础上需对元宇宙场域下档案数据的管理框架开展研究,分别梳理元宇宙场域下档案数据的业务逻辑、构建元宇宙场域下档案数据管理模型,这是研究档案管理问题的脉络主线,是理清元宇宙如何对档案数据的产生、流转、存储、利用等关键问题的重要方式;实现元宇宙场域下档案数据的高效管理必须依靠技术手段保障,在梳理好基础问题和管理框架后,如何利用元宇宙技术做好档案数据的技术保障也是不容忽视的研究内容。

1 元宇宙场域下档案数据的基本问题

在对元宇宙场域下档案数据开展研究工作之前,应先明确研究对象的有关基本问题:一是研究对象的概念,即元宇宙场域下(为方便表述,本文后续将简称为场域下)档案数据的来源和组成;二是研究对象的构建过程,即场域下档案数据的构建过程中须经历三个阶段和两个过程;三是研究对象的数据形态,即场域下档案数据有何种存在形态及各自特点、依托载体。核心概念的明确能为后续研究提供边界清晰、来源明了、形态全面的研究对象,有助于构建健全有效的管理手段、选择方案最优的技术保障。

1.1 场域下档案数据的概念界定

物理世界中有关档案数据的定义最早见于国家档案局2019 年公布的《基于非关系型数据库的档案数据存储规范(征求意见稿)》指出“档案数据包括电子档案的内容数据、传统载体档案数字化副本的内容数据以及两者的元数据(含目录数据)”[20]。档案界有学者提出了广义层面档案数据的定义:所有系统中生成的具有档案属性的数据都应纳入档案数据管理范畴[21]。

元宇宙的发展始终围绕虚实融合与时空再构这两个核心命题[22],在其构建过程中需要经历三个阶段:数字孪生阶段、虚拟原生阶段和虚实共生阶段[23]。数字孪生阶段的主要目标是仿造,即对物理世界进行模拟、复制、虚构,此时物理世界和孪生世界是泾渭分明的;虚拟原生阶段是指孪生世界通过人工智能手段完成搭建并无需物理世界参与即可独立运转;虚实共生阶段能实现物理世界和虚拟世界的相互融合、相互作用、实现共生[24]。基于上述元宇宙构建三阶段理论,作为元宇宙档案资源的重要组成,档案数据也相应的需要经历孪生、原生和共生三个阶段,并分别产生孪生档案数据(twin archival data)、原生档案数据(original archival data)及共生档案数据(symbiotic archival data)。据此,参考物理世界对档案数据的概念界定[20],尝试将元宇宙场域下档案数据定义为物理世界档案数据的孪生备份、场域下原生出的电子档案的内容数据以及场域下与前两者相关的元数据(含目录数据)。

1.2 场域下档案数据的构建过程

研究场域下档案数据构建过程的目的是为了剖析研究对象,为后续构建管理框架和搭建关键技术提供准确支撑。由于元宇宙构建必经三过程——数字孪生、虚拟原生和虚实共生[23]据此来实现虚实结合和空间搭建,所有身处其中的档案数据也不例外的需要经历此三过程。本文根据提出元宇宙场域下档案数据的两个构建过程——由实构虚和由虚向实。

一是由实构虚的过程,即由物理世界的档案数据构建场域下档案数据的过程。“由实构虚”是虚拟世界对物理世界的模仿,是以物理世界的档案数据为原型构建数字孪生档案的过程,是数字孪生阶段到虚拟原生阶段的转变。由于场域下数据管理方式与物理空间的信息系统在底层逻辑、数据表示及业务逻辑上有较大差异,因此应当对包括档案库房、档案实体、档案电子资源在内的全部档案信息进行数字化重造(digital reconstruction),用于构建与物理世界平行的场域下档案数据虚拟空间。在由实构虚阶段产生的档案数据称为孪生档案数据(twin archival data),它是物理世界中的档案数据到虚拟世界的映射,是将物理世界中多形态的档案数据通过虚拟现实XR 技术等处理后转为元宇宙能理解的、数字形态的孪生档案数据,能满足虚拟世界中档案信息的展示、管理并传播需求。

二是由虚向实的过程,是元宇宙自我构建过程的一部分。“由虚向实”是对虚拟世界中各类档案主体和档案业务进行自我创造的过程,期间形成了独立于物理世界的档案数据体系,并通过平行执行的方式作用到物理世界以实现对物理世界的档案管理产生影响,即包含两个阶段——第一阶段元宇宙场域下档案数据自主体系建立及第二阶段虚实二世界之间相互作用。第一阶段产生的档案数据称为原生档案数据(original archival data),是独立于物理世界的档案数据,由虚拟世界的自我体系产生出来,是物理空间中不存在的、虚构的档案数据信息,例如元宇宙场域下虚拟人的出生信息、虚拟单位组件情况、虚拟学校的教学成绩单等均是基于虚拟世界自我创造的本体所产生的档案资源,与物理世界没有直接的对应关系。第二阶段虚拟空间与物理空间相互作用中产生的档案数据是共生档案数据(symbiotic archival data),它是在孪生档案数据及原生档案数据相互融合、相互作用、共同交互的过程中产生的。

1.3 场域下档案数据的形态解读畴

结合本文1.1 节阐述的元宇宙构建三阶段和场域下档案数据的孪生、原生、共生三阶段,可以解析出场域下档案数据存在孪生态、原生态、共生态三种数据形态。其中孪生态档案数据(twin archival data)是对物理世界的档案信息资源的模拟和复制,原生态档案数据(original archival data)是由元宇宙构建的、与物理世界没有直接关联的档案数据,共生态档案数据(symbiotic archival data)是在孪生档案数据及原生档案数据相互融合、相互作用、共同交互的过程中涉及到的档案数据。

表1 列出了场域下档案数据的三种形态,并对其信息载体、信号性质、保存介质和管理方法展开对比分析。就信息载体维度而言,孪生态档案数据是对物理世界的拟真复刻,构成了物理世界的孪生空间,故孪生态档案数据存在于孪生空间内;原生态档案数据是场域下档案数据虚拟空间产生的数据信息,其信息载体是元宇宙;共生态档案数据是产生于元宇宙并能与物理世界数据互通的数据信息,故同时存在于物理世界及元宇宙。从信号性质维度分析,孪生态是物理世界档案信息的复刻,因此是物理世界档案数据;原生态档案数据遵循元宇宙的基本数据格式要求,具备场域下数据的基本特征即连续的语义信号;共生态档案数据是最高形态的档案数据,能与上述多种形态数据交互通信。在保存截止和在数据管理维度上,在场域下数据不论何种存在形态都遵循元宇宙去中心化的构建理念即存储在云服务器中并采用基于区块链的分布式数据管理方法。

表1 元宇宙场域下档案数据存在形态

2 元宇宙场域下档案数据的管理框架

数据管理手段是数据运转的核心和规范,也是数据生命的起点和终点,明确档案数据在元宇宙的管理框架对研究档案资源和二者融合具有重要指导价值。在构建数据管理模型之前,应先明确场域下档案数据的业务逻辑,这是理清档案数据在元宇宙如何产生、流转、存储、利用等数据操作的重要基础。本节从档案业务和元宇宙自身特性着手,对场域下档案数据的业务逻辑和管理模型开展研究工作。首先从场域下档案数据业务逻辑入手,遵循产生、收集、归档、存储、利用五个关键业务节点和基础层、业务层和表示层的三层逻辑,构建了场域下档案数据业务逻辑架构;并基于此业务逻辑和元宇宙体系参考模型[25]提出了场域下档案数据管理参考模型。

2.1 场域下档案数据业务逻辑架构

物理世界的档案数据多以离散的、碎片化的结构方式出现,档案资源和应用场景以平面展示和功能实现为主,档案管理和业务部门间数据交互性差;相反,场域下信息和数据的组织方式更加直观、可视,语义信息和逻辑推理能力更高,应用和服务以更直观的体验为主,数据底层具备统一化标识。因此在语义和推理方面,元宇宙档案数据更利于理解和推演;在知识构建上,元宇宙更利于档案知识图谱构建;在应用服务上,元宇宙趋向更直观、场景融合的3D 孪生档案服务;在数据交互上,元宇宙支持多元叙事、复原历史、情感共鸣等开放融合功能。物理世界档案数据的处理逻辑包括产生、收集、归档、存储、利用五个主要环节。场域下档案数据仍考虑以此五环节为主,结合元宇宙去中心化、沉浸式体验等特性,勾勒出场域下档案数据的业务逻辑参考架构(见图1)。

图1 元宇宙场域下档案数据业务逻辑架构

图1 从基础层、业务层和表示层的五个环节构建元宇宙场域下档案数据业务逻辑。第一是基础层,包括数据的产生和收集阶段。档案数据的产生阶段包括档案孪生数据的产生和档案原生数据的产生,其中档案孪生数据是存在于物理世界中的档案实体、档案电子文件数据、档案元数据、档案声像数据、档案特殊格式数据资源等全部档案信息在数字化重造后形成的档案信息;档案原生数据是在元宇宙场域下产生的档案相关数据,包括元宇宙自身及各业务系统的元数据、档案条目数据、业务系统数据、电子档案数据、音视频数据等。在收集阶段中,物理世界的目录移交、数据加工处理、文字识别、信息提取、业务系统接口等流程将不再存在,场域下档案数据的收集工作更为简化,这是因为包括参与主体在内的档案资源均是电子数据,故只需对数据合规性包括数据格式、数据来源、数据可靠性等进行判定。这是元宇宙数据共享共治机制和平权原则的底层架构决定的。因此,物理世界中诸多割裂的独立的业务系统壁垒将被打破,实现数据一统。元宇宙的物理世界孪生应用可以相互连接,通过“平行执行”的反馈控制实现对物理世界档案数据的优化,构建档案数据虚拟空间的独立生态系统。第二是业务层,包括档案数据的归档和存储。档案数据的归档过程更为简洁,只需完成时间戳和签章的加载。在档案数据的存储方面,元宇宙的数据共享底层架构能完美解决物理世界数据冗余问题,文件数据不必多处产生副本。第三是表示层,主要涵盖档案数据利用环节。由于元宇宙信息自身具有去离散化和高度语义化的特点,故数据来源语义化程度更高,同时有人工智能等技术的加持,可知档案数据在知识构建、智慧编研、决策推理等方面将有新的突破。

2.2 场域下档案数据管理参考模型

北京信息产业协会发布的《2022 年中国元宇宙白皮书》[25]提出了元宇宙体系参考模型,明确了虚拟世界与物理世界通过拟真仿生、平行执行的方式进行交互。本文基于此参考模型[25],尝试构建元宇宙场域下档案数据管理参考模型(reference Model of Archival Data Management in Metaverse,MADMM)。元宇宙首先对物理世界存在的档案主体包括物理设施、管理角色及各种档案资源等进行数字化重造,同时构造出孪生档案数据并完成档案数据虚拟空间的搭建。本文以生存周期内对档案数据产生约束的管理对象为标准,将MADMM 抽象为底层逻辑、参与主体和应用服务三个模块。

底层逻辑是数据管理的基本准则[26],物理世界和元宇宙均需按照各自空间内的业务流程和档案法规进行管理。就参与主体来说,由物理世界的档案数据、人员主体、硬件设备转变为元宇宙的档案数据和虚拟人,其中物理世界的档案数据不仅包括物理世界中实体档案信息和电子档案信息,也包括档案馆舍等硬件设施,这是由档案数据虚拟空间是物理世界的完全拟真的本质特性决定的;人员主体由物理世界的档案管理员、业务部门档案员、查档者等全部档案参与者变更为虚拟人(即平行世界中对物理世界管理角色的模拟),由于管理角色在物理世界档案管理过程中起到了主导性地位,因此在场域下档案管理过程中仍需将管理角色——虚拟人(即人员主体)放置在主导位置;设施设备由物理世界的物理楼宇、硬件设施转变为元宇宙中的虚拟存储,这是由元宇宙提供的故不需要额外标注。档案数据管理的主要目标是为应用场景提供服务,所以在应用逻辑层面上的档案数据应当从纸片化的2D 信息转换为沉浸式体验的3D 格式且数据化知识化算法化智能化的档案数据信息。图2 是对元宇宙场域下档案数据管理参考模型MADMM 抽象后的形式化表达。

图2 元宇宙场域下档案数据管理参考模型

3 元宇宙场域下档案数据的关键技术

档案数据如何融入元宇宙、元宇宙如何处理好档案数据,这是档案和元宇宙融合应用应思考的问题。元宇宙是技术的集大成者,故在探讨场域下档案数据的管理问题时应根据数据特点选择相应技术做保障。场域下档案数据的有效管理不仅需要基础硬件层的支撑,也要核心技术做保障。本节结合元宇宙技术参考架构[27],对场域下档案数据管理的关键技术进行探究,并提出元宇宙场域下档案数据管理关键技术架构(见图3)。

图3 元宇宙场域下档案数据技术架构

3.1 网络与通信

档案数据虚拟空间的搭建离不开通信和网络技术做好基础保障,档案数据的利用服务等业务需要XR等交互设备的支撑以实现真正的沉浸感。这对通信和网络技术有更高的要求,以满足低延时、高渲染、强重构的需求。

通信设施能为元宇宙档案数据的管理提供底层支撑。5G 时代的大规模天线、新型多址、全频谱接入、现金调制编码等技术已投入使用,能实现用户体验速率达1Gbps,时延低至1ms,用户连接能力达100万连接/平方公里。6G 技术(第六代移动通信标准)正在研发中,其传输能力或比5G 提升100 倍,网络延迟可能从毫秒降到微秒级并支持泛在千兆、毫秒级时延,最大限度保证虚拟空间的通信设施水平和交互体验[28]。

网络传输技术主要实现网络节点的连接和通讯(又称点对点),是没有中心服务器、依靠用户群交换信息的互联网体系,在处理档案数据通信中具有“物流”的作用。不同于物理世界的中央网络,对等网络的每个用户端既是处理节点也扮演服务器的角色,其具有去中心化与健壮性的特点。每一个节点既接收档案数据也产生档案数据。节点之间通过维护一个共同的区块链来维持档案数据通信。区块链网络中的每一个节点都可以创造新的档案数据区块,在新区块被创造后会以广播的形式通知其他档案数据节点,其他节点会对这个区块进行验证,当全区块链网络中超过51%的用户验证通过后,这个新区块就可以被添加到主链上。

运算能力是档案数据流转中的重要一环,云计算能够提供包括服务器、存储数据库、网络、软件、分析和智能处理等计算服务。该技术使得档案数据不再需要像物理世界一样处理大量硬件设置、软件补丁等管理性事务,能以较低成本实现数据备份、灾难恢复,在云上冗余站点对数据进行镜像处理。由于云计算在工作效率、可靠性、安全性上的出色表现,可以用来处理安全性要求较高的档案数据问题。

3.2 数据存储

档案数据的存储对象是档案数据虚拟空间及场域下档案数据资源。前者可理解为元宇宙场域下的“档案馆”,其是由物理世界经拟真技术搭建出的空间结构、场景、主体等,本质层面的存在方式仍是数据。场域下档案数据类型复杂、处理方式多样,故无法用一种数据存储技术和标识技术完成[28]。但元宇宙的底层数据库在处理超大数据规模、多样化数据、多数据处理模式方面有极大优势。针对档案数据的两大来源和自身特点,考虑使用去中心化(区块链)、数字孪生、三维可视等技术完成数据存储和标识。

区块链技术贯穿于场域下档案数据管理的全流程中。在数据存储上,区块链展现的是分布式技术的核心思想——去中心化及“区块+链”的存储结构,同时元宇宙搭建的基础逻辑是不以某个主体的意志为转移,建立在去中心化的平权式共享机制和共治机制之上。因此档案数据虚拟空间是建立在去中心化的运行机制上的,故采用分布式数据管理方法是必然。一是分布式数据管理技术能满足档案数据体量持续增大的现实需求;二是能将档案数据交互和响应需求切分成分布式事务分配到参与节点,由数据片分布处理,以提高档案数据的效率。数字孪生可理解为物理世界在虚拟世界的映射,狭义的说即用物理实体孪生出档案数据,是物理世界数据信息和场域下数据信息相互提供档案数据存储的一种技术手段。三维可视化是使用三维模型数据库进行数据保存,输出格式包括MAX、FLT、OSG 等。

3.3 数据交互

场域下档案数据交互包括与物理世界的平行执行交互以及虚拟世界生态体系内的数据通信交互。平行执行交互是在人工构建的虚拟空间和物理世界之间搭建闭环反馈,实现两个世界的虚实互动和平行管理。不仅需要系统间的平行运转,也需要人(主体)、物、信息(数据)的平行交互。这即是前文阐述的“由虚向实”的数据流转过程。为保证物理世界与元宇宙之间的互联互通,需要使用物联网技术和交互技术做好保障。

物联网技术为物理世界接入元宇宙提供了可靠基础,交互技术为虚拟空间提供高沉浸感、高仿真虚拟的档案服务体验。分布式技术在处理场域下档案数据时是基于去中心化思想的。物理世界中的信息管理手段以中心模式为主,为保证档案数据库节点数据的一致性,各节点需并发的进行数据读写,此举不利于数据量增长且延长了数据交互的时间成本,限制了数据空间的扩展和性能提升。因此元宇宙选择分布式管理的区块链技术作为档案数据交互的基本技术手段,为场域下档案数据提供去中心化的存储和安全认证工作。同时在密码算法上利用数字签名、哈希函数和非对称加密技术[27]保证档案数据交互在去中心化的情况下能够安全的进行。场域下档案数据流转和交互遵循的是去中心化的平权方式,以此避免数据中心的产生,是区块链技术在档案数据交互中的一个体现。

感知交互技术为元宇宙提供了沉浸式虚拟现实体验,是输入端和输出端的深度融合,由软硬件元素共同组成。交互技术包括一或多个捕获档案主体输入的输入(Input)设备及一或多个显示档案主体反馈的输出(Output)设备。

3.4 数据安全和数据智能

存在于元宇宙中每个主体和事物都拥有自己的数据信息,因此数据安全和隐私保护是元宇宙数据管理的重点议题。场域下档案数据的安全性既包括档案数据的可用性,也包括数据不被篡改的可靠性可信性。档案数据虚拟空间中保障数据安全及隐私主要考虑使用区块链的非同质化通证,本质是区块链中具有唯一性的可信数字权益凭证[27],用来保障价值归属与流转,实现元宇由经济系统运行的稳定、高效、透明和确定性。

数据智能方面重点体现在档案数据的重要使命——利用和服务场景中。场域下档案数据在语义和推理方面具有特殊优势,被赋予了“智慧天赋”。人工智能算法正向类脑网络和强化学习等方向发展,包括计算机视觉智能语音、意图识别、自然语言处理、内容(物品、场景、情节)生成、分析预测等,为场域下档案数据智能化服务提供有力支撑。

4 结语

元宇宙是人工智能、区块链、5G 通信和数字孪生等技术的集大成者,是平行于现实世界的独立生态体系。元宇宙场域下档案数据将以何种方式产生、存在、推演,档案数据须遵循何种管理模型及业务逻辑,哪些技术能够在档案数据生命周期的全流程中提供可靠保障,这些是档案领域在面对元宇宙技术热潮时应思考的基础性问题。本文从基础问题入手展开研究工作,分别给出元宇宙场域下档案数据的概念、构建过程及存在形态,并从业务逻辑和管理模型两方面构建了元宇宙场域下档案数据的管理框架,最后提出了保障元宇宙场域下档案数据的关键技术手段和技术框架。研究内容立足基础理论、着眼管理手段、根植技术方法,为元宇宙和档案学进一步融合研究提供了支撑。

猜你喜欢
数据管理场域宇宙
基于“自主入园”的沉浸式场域教研
民主论辩场域中的法律修辞应用与反思
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
宇宙第一群
中国武术发展需要多维舆论场域
这宇宙
组织场域研究脉络梳理与未来展望