章燕华/浙江大学公共管理学院信息资源管理系、中国人民大学电子文件管理研究中心
数字技术发展加速数字化转型,数据成为驱动发展的关键要素,如何激活数据要素潜能服务发展目标成为全球关切的重要议题。在此背景下,档案实践引入数据理念与方法(“档案数据化”)已成为数字化转型和大数据背景下档案转型升级的重要路径和发展趋势,特别是在促使档案从“管起来”向“活起来”转变的档案资源组织、开发与利用服务中。然而,与此形成鲜明对比的是,数据实践是否需要以及如何引入档案理念、需求与方法(“数据档案化”)却鲜有被讨论和研究。
当前数据环境、需求和实践已然发生了巨变,数据脱离其形成系统(机构)逐步走向基于数据共享与业务协同的多跨场景应用、面向社会的数据开放和作为生产要素的数据市场化配置。随之带来了诸多新挑战。如真实性、可靠性等数据质量问题影响数据流通和再利用,数据治理缺位或碎片化影响数据共享、互操作和发现,数据独占导致平台垄断、服务歧视和数字鸿沟等新的不公,不同主体数据权利权益无法得到保障影响社会信任等[1]。另一方面,档案是国家治理的重要支柱和数据资产的重要构成,人类社会发展历程反映了国家治理对档案实践的普遍和内在需求——对凭证、信息和记忆的需要,并逐步形成了一整套的档案理论与方法体系——确保如上需求得以实现的举措及其制度化。相比于一般的信息管理,档案理论与实践在凭证性维护、群体性治理、集约化管理、社会化利用、集体性记忆构建、制度化体系建设等方面具有专长,可为数据实践应对上述挑战提供新鲜视角、有益思路与方法借鉴。
为此,本文提出了“数据档案化治理”的概念,即通过对悠久丰富的档案实践与理论的系统梳理和深入分析,抽象和总结出档案(工作)的核心理念、需求与方法,并将其融入数据治理的过程。未来“数据档案化”将与“档案数据化”一同成为档案工作转型升级的两大重要路径,数据档案化治理研究也将成为数据驱动发展时代档案学研究的新领域。探索数据档案化治理研究的全景图和路线图可为未来系统深入开展数据档案化治理研究提供一个可参考的分析框架,同时推动更多学者和从业者关注和研究档案理念、理论与实践在数据管理中的运用与创新。
关于“数据档案化”相关研究的总体状况,可以从近五年(2017—2021年)国家社科基金立项及中国知网收录期刊论文两个维度,以“档案数据化”相关研究作为参照物,进行粗略考察。国家社科基金已有“档案数据(化)”相关课题立项约20项,涉及档案数据的组织与知识发现、开发利用、安全、质量控制、标准体系、治理(体系)及管理理论重构等选题;而“数据档案化”相关课题为0项[2]。“档案数据”相关论文约262篇,“档案数据化”约53篇,涉及档案数据(化)的概念、价值与理念,实施路径,管理(治理)框架,组织、开放与利用服务,研究综述等;“数据档案化”相关论文仅为2篇,涉及政务服务中电子证照管理、档案化模式介入数据管理初步探索,而直接以“数据档案化”为选题的论文为0篇[3]。由此可见,“数据档案化”概念尚未被正式提出,“数据档案化”也没有作为独立议题被专门研究。
已有与“数据档案化”相关研究主要包括以下两方面:一是“档案化”基本概念与实践应用研究。何嘉荪等[4-7]在引介德里达档案化思想的基础上,指出“档案化”就是确保和证明文件真实性、完整性、有效性,使之有可能成为记录事件和历史的过程;“档案化管理”就是使文件档案化而采取的管理措施;应将“档案化”思想上升为对一切记录存储的信息或数据管理原则。赵红艳[8]指出,站在哲学层面认知和理解档案本质的关键是抓住档案产生的根源与发展机制,“档案”就是对过去式当前记忆的物质化;“档案化”就是档案从无到有的档案化以及对档案的档案化。詹逸珂等[9-10]指出,“档案化”关注社会普遍存在的信息沟通交流过程,它使传统归档范围和档案概念得到了扩充,标志着档案管理触角的延伸与档案管理职能的社会化;“档案化思维”还在方法论层面推动史学研究的多学科整合与研究手段的多样化。此外,学者们还从实践角度研究了“档案化”的应用问题,探究了“档案化”在方言、社会记忆、文化遗产等文化领域[11-13],电子文件、微博、抖音、政务信息等数字领域[14-17],以及政务、业务、科学数据领域[18-22]的应用,研究聚焦不同类别信息(内容)如何以档案的要求和方式加以管理,因而归档、长久保存两大环节依然是“档案化”应用关注的核心。二是数据管理借鉴档案实践与理论研究。朝乐门[23]提出用连续性概念指导数据保护和降低数据风险;周林兴、林腾虹[24]以文件连续体理论为指导,提出政务数据连续性治理理念与体系框架;蔡盈芳[25-26]提出数据与档案融合、协同管理思想;何思源、刘越男[27]研究了科学数据与科研档案协同管理框架并提出了实施路径。赵跃等[28]提出数据资源档案化的观点及档案化模式介入数据资源管理的思路,认为归档模式应向档案化模式转变,后者有助于数据时代提升档案学核心影响力和理论贡献力。
综上所述,前一主题的研究为“数据档案化”研究其提供了基础理论支撑,后一主题的研究则提供了有益的观点启示,但存在以下不足:一是在基础理论研究方面,仍停留在对“档案化”一般概念及理念的论述,缺乏针对“数据”这一特殊且日益重要的管理对象的档案化问题进行专门、深入研究,缺乏将档案实践与理论对数据管理全方位价值的系统研究。二是在应用研究方面,档案化解决方案仍然聚焦归档和长久保存两大环节,缺乏对数据其他环节(乃至整个生命周期)的关注,缺少基于数据及新技术特点的新的解决方案。三是缺乏对理论与实践相互关照的综合研究。
鉴于当前“数据档案化”尚未作为独立概念及命题被提出,本文将“数据档案化治理研究”作为一个新领域(议题),以“数据档案化治理研究的总体框架”为研究问题,融通档案与数据、理论与实践、国内与国外的双向视角,按照“提出问题、分析问题、解决问题”的研究思路,探索数据档案化治理研究的总体框架,包括研究的主要问题及思路、可采用的研究素材与方法、具体研究内容、研究关键点与难点等。
作为一个探索性研究,本文以文献研究为主要方法,辅以案头研究和调查研究。文献研究参考了档案学基础理论、数据管理知识体系以及两大领域最新进展的论著,为本研究提供了基础知识和基本架构。案头研究收集并分析档案与数据工作相关的战略规划、标准指南、调查评估报告等二手资料,重点了解国内外档案与数据管理最新进展和解决方案,为本研究提供了重要实例和思路启发。调查研究通过作者实地调研相关单位及与业界人员深入交流等方式获取关于档案数字化转型和数据管理的一手信息,为本研究提供了新鲜视角和重要洞察力。
根据研究设计,数据档案化治理的总体框架研究按照“为何对数据实施档案化治理(Why)”——“什么是数据档案化治理(What)”——“如何开展数据档案化治理(How)”三大步骤展开,具体包括需求分析、理论构建、实践考察、实施路径和顶层设计五大方面,各部分关系及主要内容概览如图1所示。
图1 数据档案化治理研究总体框架的简要示意
全面系统地分析数据档案化治理的真实需求,明确数据档案化治理的必要性、重要性及目标方向,是数据档案化治理研究首要解决的问题。
第一,研究思路与内容方面,可从政治经济社会大环境,国家重大战略及政策对数据和档案实践的法规遵从和最佳实践要求,当前数据与档案实践各自现状、挑战与趋势,档案与数据实践的关联与鸿沟等方面入手分析,研究数据档案化治理的驱动因素、利益相关者、收益与风险、目标与要求。第二,研究素材与方法方面,一是运用系统研究法,从整体和全局出发,从系统与要素、要素与要素、结构与功能、系统与环境等关系中全面考察数据档案化治理面临的机遇、挑战及要求;二是运用政策文本分析法,通过对相关政策收集、梳理、关联和分析得出数据档案化治理的法规遵从和最佳实践的要求;三是运用调查法,通过深入访谈、实地观察等方式获取关于数据与档案实践的挑战和需求的一手信息,确保需求分析的全面客观。第三,研究的关键和难点方面,一是如何将宏观复杂的外部环境和更广视阈下的各类政策(不限于档案、数据政策)转化为微观具体的数据档案化需求;二是如何从档案和数据供需双向视角(而非档案单一视角)分析数据实践与档案实践在目标、需求与挑战等方面的交集。
从应然角度回答“数据档案化治理是什么”“应当遵循什么基本原则和要求”的问题,旨在构建数据档案化治理的理论体系,为实施数据档案化治理提供方法论指导。理论构建是数据档案化治理研究创新的主要体现,是档案学理论、数据管理理论与其他相关理论融合创新的主要成果,也是整个研究中最具挑战性的部分。
第一,研究思路与内容方面,可根据“以数据生命周期为线索,档案核心理念、需求与方法(‘档案化’要求)为内容,其他新兴或相关理论成果为补充”的思路开展研究:首先,通过分析数据管理理论与其他相关理论(如治理理论、协同学、服务设计理论等),总结数字化转型与数据要素化背景下数据管理的基本流程与要求、技术与方法、挑战与不足、前沿与趋势等,建立适应新形势的数据管理整体框架。其次,梳理档案学经典理论(如档案概念与价值、文件生命周期理论、来源原则、档案鉴定理论等)、档案学新兴概念与理论(如后保管主义与档案范式、社群档案与参与式建档、数字连续体、文件信息学等),总结提炼档案工作的核心使命、基本要求与不适应性体现,以及档案理论的核心议题、成果精髓与短板不足。最后,在比较和融通以上两方面的基础上,围绕“哪些档案核心理念、需求和方法可为数据管理所借鉴并嵌入”问题,提出数据档案化治理的基本概念、理念原则、理论模型(核心活动及要求)和发展趋势。第二,研究素材与方法方面,一是运用文献研究,应遍历国内外对档案理论方法在数据实践中应用或价值阐释的研究成果;二是运用比较研究,分析新兴档案概念(或理论)与传统档案理论之间、档案理论与数据理论之间的差异及形成原因,作为构建新理论的基础和突破口;三是运用批评性话语分析,系统探索话语实践、事件和语篇与更广阔社会文化结构、关系和过程的因果关系,了解社会权力关系变化对档案、数据实践与理论的影响及趋势。第三,研究的关键与难点方面,一是如何合理选择、借鉴、批判、关联与整合已有的档案理论、数据管理理论与其他相关理论(“破”“融”);二是如何创新性地构建顺应社会发展新态势、适应数据特征及满足数据应用新要求的数据档案化治理理论体系(“立”)。理论构建既需要对档案理论与实践及其发展历程的深刻把握,对数据管理实践与理论最新进展的全面了解,还需具备对未来档案与数据实践与理论的发展态势具备一定的研判能力。
从实然角度回答“数据档案化治理是什么”“有哪些具体做法、经验与教训”等问题,旨在呈现数据档案化治理已有的相关实践探索和最新进展,为数据档案化治理提供实践方面的参考和启示。“实践考察”与“理论构建”共同构成理解“数据档案化治理是什么”的“两翼”。
第一,研究思路与内容方面,实践考察在对象选择上国内外侧重应有所不同,同时应尽可能考虑不同领域的典型案例。国内可侧重数字化转型下业务系统或统一平台数据管理与共享利用,互联网企业海量数据管理与创新应用,电子档案单套制管理,档案数据中心建设(档案大数据共建共享),档案智慧监管,档案数字便民服务,新兴技术在档案管理中的运用等。国外可侧重基于整体政府的档案现代化统一行动,数字化转型与数据连续体政策与实践,档案与数据协同(或一体化)管理的政策与实践,数据(集)档案管理,技术登记系统建设,数字档案永久保存与利用系统建设,档案可视化服务,档案众包管理与服务,文件档案、信息与数据能力建设,新兴技术在档案管理中的运用等。实践考察的具体问题包括(但不限于)有助于实施数据档案化治理的战略、治理结构与机制;嵌入数字业务架构的档案集成业务框架(或嵌入统一数据平台的档案模块);通用档案管理需求;统一数据模型;互操作框架;集约化采购解决方案;数据归档与长久保存;数据档案利用服务等。第二,研究素材与方法方面,一是国外实践以网站调研和案头研究为主,重视搜集和挖掘国外数据与档案工作战略规划、管理指南、解决方案、评估报告等材料中所蕴含的典型案例和最佳实践要求;二是国内实践以调查研究和文献研究为主,在文献研究基础上应选择不同行业领域进行实践调研,向专家和实际工作者深入了解数据档案化治理痛点和解决思路。第三,研究的关键与难点方面,由于数据档案化治理并没有明确、现成、整体或成熟的解决方案,如何发掘可能处于萌芽阶段、碎片化甚至弱相关的实践从而获得来自实践的启示,并尝试将零星实践的“点”串联成“线”,为数据档案化治理提供尽可能多的参考。
从微观层面回答“如何实现数据档案化治理”,旨在研究机构实施数据档案化治理的解决方案。
第一,研究思路与内容方面,一是结合管理层次、数据管理框架、治理要素三个维度,聚焦数据(档案)的资源、监管、服务、系统与技术五方面,构建数据档案化一体化/整体治理框架;二是选择不同类型的数据和应用场景(如政府数据/统一政务服务平台、公共数据/城市大脑平台或公共信用服务平台数据、科学数据/大型企业或科研单位研发数据等)研究数据档案化治理的具体落地方案。第二,研究方法和素材方面,一是运用案头研究法,充分挖掘已有相关(试点)实践的研究报告、解决方案等二手材料中所蕴含的丰富信息;二是与具有数据档案化治理需求的机构、档案或数据解决方案企业开展合作研究,使用案例法和基于场景的设计方法,探索科学可行的方案。第三,研究的关键和难点方面,一是如何整合数据档案化治理的需求分析、理论构建与实践考察三方面成果的基础上,提出科学可行的数据档案化治理实施路径;二是如何处理好数据档案化治理的一般性框架和差异化解决方案的关系。能否寻找到具有典型性的试点机构和具体应用场景、能否依托于特定系统和技术加以实现将影响研究结果。
从宏观层面回答“如何保障和赋能数据档案化治理的实施和可持续发展”,旨在从国家或行业角度研究如何为机构实施数据档案化治理扫清障碍和创造良好环境。
第一,研究思路与内容方面,可从微观实施中存在的共性问题或关键障碍、数据档案化治理需求出发,站在国家或行业高度谋划对策,重点可从法规政策完善、战略规划制定、体制机制优化、标准与最佳实践建立、能力建设等五方面入手。第二,研究方法和素材方面,一是比较和标杆研究,搜寻并分析国内外档案和数据工作顶层设计方面的典型实践;二是调查研究,获取档案和数据工作一线人员、专家学者和主管部门领导关于数据档案化治理顶层设计的看法和建议。第三,研究的关键和难点方面:一是目前数据、档案属于两个独立的工作领域,在战略与标准制定、机构设置与职责分配、具体工作开展等方面交集较少;二是数据档案化治理实践尚未系统或大规模实施,因而顶层设计缺乏现实的工作基础和驱动力,这对前瞻性思考和创新性研究提出了更高的要求。
作为档案学和数据管理研究的交叉和新兴领域,数据档案化治理研究兼具重要的学术和应用价值。
第一,学术价值体现在:一是通过深度挖掘并重新发现“档案化”对数据实践的重要和独特价值,构建面向数据的档案理论与方法体系,丰富和发展了档案学理论,增强档案学在数据时代的影响力和学科自信。二是丰富现有数据管理的视角和理论,特别是弥补现有数据管理理论在对脱离形成系统的数据治理和面向多跨场景、面向社会与面向未来的数据利用等方面的关注不够和研究不足。
第二,应用价值体现在:一是在融通数据、档案工作双向需求的基础上,将档案核心理念、需求与方法引入数据管理,可为应对数据、档案工作面临的挑战提供新思路和新方法。特别是在解决数据真实、完整与可信问题,促进数据跨部门流通、再利用与价值社会化,实现数据集约化管理和长久保存,增进数据利用公平与信任等方面。二是可为国家相关部门完善优化档案、数据工作的顶层设计提供决策参考,如加快推进数据态档案归档管理、加快数据与档案协同治理、促进数据要素流通的数据凭证管理等方面的制度完善和体制机制创新。
随着全球进入新兴技术和数据驱动的时代,当数据作为生产要素的特征及其社会需求日益凸显的同时,人类社会和国家治理对数据作为或构成证据、记忆、认同和社群的档案(化)需求并未弱化。数据如何实现要素价值与档案价值的有机统一将成为重要命题,数据档案化治理则提供了一种重要思路和实现路径。因此,数据档案化治理既是全面数字化转型和数据驱动时代数据、档案实践发展的客观要求,也是档案学和数据管理研究的重要领域和新增长点,主动融入数据浪潮与积极发出档案声音是档案工作者和档案学者的共同责任。