王喜凤,李佳男
(1.洛阳理工学院 档案馆,河南 洛阳 471023;2.中交第二航务工程勘察设计院,湖北 武汉 430070)
在数据时代和国家治理现代化背景下,档案数据治理成为国内近几年档案学术研究的热点问题之一。从2019 年开始相继有《大数据时代档案数据治理研究》《国家大数据战略背景下档案数据治理体系构建研究》《大数据环境下档案数据治理标准体系构建研究》等国家社科基金项目获得立项,在国家社科基金2021 年度选题指南中“档案数据管理体系构建研究”“数据科学与技术在图情档学科发展中的地位与作用”“国家档案治理体系建设与治理能力现代化研究”等选题被列入其中,反映了学界对这一研究话题的关注。《全国档案事业“十四五”发展规划》中提出要加大重点科研任务攻关力度,“着力开展新时代档案治理相关理论及政策研究”“重点开展新一代信息技术在档案管理中的应用、大数据环境中电子文件与电子档案一体化管理……档案数据治理……重大课题研究”。[1]档案数据治理研究成为政策话语的重点导向之一。实践中,“山东省数据大厅在山东省档案馆建成启用,强化了数据就是档案意识,开辟了档案工作与大数据融合发展的新思路”。[2]浙江省档案馆启动档案数据中心建设项目,“以省档案馆为基地,依靠大数据和区块链技术,利用各地数字档案馆建设成果,搭建全省档案数据总库和应用平台,建设的主要内容包括档案数据共享服务和档案业务智慧治理两方面。使全省档案馆对外开放、政务服务、便民服务和治理水平得到提升”。[3]可见档案数据治理话题在学术、政策、实践中受到重要关注。
但也有学者指出“对档案数据治理基础理论的研究广度及深度不够……未形成系统的档案数据治理理论”。[4]档案术语在档案学基础理论建设以及档案事业发展中具有重要作用,[5]对档案数据治理基础理论进行研究首先要将这一术语的概念明晰,档案数据治理作为一个新出现的档案学术语,亟需对它的概念进行梳理和阐释,以更好地推动理论研究和实践的深入开展。
档案数据治理是近几年国内提出的一个相对本土的学术话语。现今对档案数据治理概念的研究大体可划分为定义档案数据治理内涵、构建档案数据治理框架、档案数据治理子领域拓展、辨析档案数据治理相关概念关系等。
学者们从不同角度对档案数据治理概念进行了定义。常大伟等[6]、胡晓庆[7]、陈艳[4]从数据管理、数据治理的视角出发对档案数据治理重新定义,强调对数据治理理念的借鉴、大数据相关技术运用、数据管理方法的应用,实现档案数据激活、增值、共享、开放、服务等目标。赵跃等[8]从档案数据全生命周期的管理过程出发对档案数据治理进行定义,认为“档案数据治理主要是对不同生命周期的档案数据进行质量管控、组织管理、开发利用等活动”,与许多学者之前论述的档案数据管理概念相似。金波等[9]对档案数据治理的定义则综合考量了数据治理、档案治理、档案数据管理的内涵,强调多元主体的协同合作、理论与技术的充分利用、档案数据全生命周期的管理、档案数据价值的充分发挥以及实现档案数据善治的目标。
目前学界对档案数据治理的定义各有不同,但在对象上都强调档案数据及其生命周期,在方法上强调对治理工具和数据技术的应用,在目的上强调挖掘档案数据价值,提供服务和满足社会利用。单从定义看,现在对档案数据治理的定义更类似于利用新技术在(档案管理业务流程或生命周期)档案数据管理基础上融入了“多元共治”“协同治理”等主体治理理念。
在对档案数据治理框架构建这一问题上,胡晓庆[7]、陈艳[4]、金波等[9]在构建档案数据治理框架内容时都围绕档案数据为对象。胡晓庆从信息生命周期视角出发提出档案数据治理可以从档案数据形成、组织、存储、开发、利用展开。陈艳认为档案数据治理包括数据管理、安全治理和服务治理三个方面内容。金波等构建了由档案数据质量控制、档案数据整合集成、档案数据共享利用、档案数据安全保障、档案数据治理运行机制组成的档案数据治理体系。常大伟[6]、赵跃[8]等都从宏观和微观两个视角出发构建了档案数据治理的框架体系。常大伟从治理能力视角出发,认为档案数据治理应当包含档案数据流程管理和档案数据生态治理两方面能力要求,并从这两方面出发构建了档案数据治理能力结构体系。赵跃认为档案数据治理既要上升至顶层设计形成档案治理框架,也要对各类档案活动的应用场景设计规则。杨鹏认为“档案数据治理包含宏观生态层面的档案数据战略治理、组织治理、文化治理、生态治理、安全治理、权利治理等;中观机制层面的档案数据治理运行动力、机理、规律、模式、机制;微观资源层面的以档案数据初治、善治等治理周期和档案数据采集、处理、存储、利用、传播等数据生命周期为主线,双轨开展档案数据资源治理”。[9]
在对档案数据治理的框架构建研究中,不同的学者提出的框架也侧重于不同的层面,学者们所提出的宏观生态层面、中观机制层面、微观资源层面包含了学界现有研究成果的主要内容,整体分析更有层次,内涵更为丰富。但这样的档案数据治理框架内容范围或许已经超出了学者们之前对档案数据治理的定义,整体内涵受档案治理这一概念的影响程度加深。
展倩慧认为“档案数据是重要信息资源,档案数据开发能够挖掘档案数据价值,提高档案数据治理能力”。[10]周林兴等认为有效的档案数据安全治理是档案数据治理的重要部分,并构建了档案数据安全治理能力成熟度模型。[11]金波等在分析档案数据面临的安全问题基础上提出了应对这些风险的档案数据安全治理策略。[12]倪代川等分析了数字记忆与档案数据治理的内在逻辑和互动关系,希望通过提高档案数据治理能力,促进档案数字记忆共享。[13]杨茜茜在文化治理的框架下探讨了档案文化数据的整体性治理思路。[14]赵跃认为有必要从数据粒度对档案的证据价值保障进行系统规划,把技术部署技术方案嵌入相关信息系统,将司法认可的真实性保障技术嵌入档案数据治理流程中,实现“档案数据—电子证据”全链条治理。[8]谭必勇认为档案数据治理与电子证据保全是“共融共生”的关系,档案数据治理的质量控制研究与其关系密切,电子证据保全可以说是档案数据治理的一个目的。[15]
在子领域的研究中档案数据安全治理是目前最集中的研究方向,档案数据质量控制和档案数据服务治理也是其中重要领域,在对子领域拓展的研究中档案数据治理的概念得到进一步深化。
第一,学者们从概念包含与延伸角度讨论档案数据治理的概念归属。金波等认为“档案数据治理是数据治理与档案治理的交叉,档案数据治理是数据治理的重要子集,档案数据治理可以借鉴数据治理已有的经验、技术、工具以及方法,创建档案数据治理理论体系。档案数据治理是档案治理的重要构成部分”。[9]常大伟等认为“档案数据治理是档案治理的重要内容,也是档案工作数字转型的重要保障。这就要求从数据治理的视角审视档案治理问题,并通过数据治理工具和治理技术的应用、档案数据治理业务流程的优化以及档案数据治理生态的构建,实现对档案数据价值的激发,从而为档案管理范式转型以及档案数据治理功能强化提供理论参考”。[16]赵跃认为“档案数据治理与档案治理是被包含与包含的关系,即在档案事业的治理转型过程中,档案数据治理是档案治理的重要治理内容”“档案数据治理在某种程度上来说,是在继承档案治理核心理念的基础上,对档案数据领域的深化”。[8]金波等将档案数据治理体系研究纳入档案数据研究题域当中,认为档案数据治理将是档案数据研究未来应当深入拓展的研究领域。[17]刘越男在研究中总结,数据治理和数据管理关系存在三种观点:一是数据治理和数据管理是数据决策权分配和执行的关系;二是数据治理是数据管理的组成部分;三是数据管理是数据治理的子功能,[18]这种观点的划分在档案数据管理和档案数据治理概念辨析上具有借鉴意义。
第二,学者们从档案部门在实践中的角色参与讨论档案数据治理的概念。刘越男认为档案是一种数据,档案管理是数据管理的组成部分,数据治理包括对档案数据的治理,档案管理是数据治理需要控制和支撑的对象。[18]倪丽娟同样是以档案部门参与国家社会治理、数据治理的视角理解档案数据治理,她将档案数据治理能力归为档案外部治理能力的重点,“档案部门的主要责任在于将档案数据融入社会数据系统,实现档案数据的可获取性,而不是由档案部门独立、自主地进行档案数据治理,这是数据治理的本质所决定的”。[19]
第三,学者们从不同概念的差异与对比角度辨析档案数据治理的概念。陈艳认为档案数据管理与档案数据治理是两个侧重点完全不同的概念。档案数据管理偏重于技术层面,侧重于从具体的档案工作实务对档案数据流进行全流程管理。而档案数据治理侧重于档案工作理念,以服务为中心,旨在打破业务系统内档案数据的信息孤岛和数据烟囱,促进档案数据共享开放和利用服务。并且认为档案数据治理外延要大于档案数据管理。[4]何玲等认为目前档案数据管理与档案数据治理研究之间存在大量交叉,未来应关注档案数据管理向档案数据治理转变的问题。[20]赵跃认为档案治理与档案数据治理在治理理念、治理主体、治理目的上趋同,最大差异在于治理内容上,档案数据治理的对象是档案数据,档案治理则更加广泛,涉及与档案相关的一切事务。[8]档案数据治理概念在辨析过程中主要与档案数据管理、档案治理、档案数据、数据治理、数据管理等概念相关,都在强调几个概念之间的包含关系、交叉关系或者演化关系。
档案数据治理概念是数据时代转型和国家治理现代化语境下的产物,学者在对档案数据治理理解时,也都是把数据管理、数据治理、数据科学或者社会治理、国家治理、档案治理等作为背景或概念来源。关于档案数据治理有“对档案数据治理”和“用档案数据治理”的理解,即把档案数据理解为对象和手段,目前的研究中大都采用“对档案数据治理”的理解,但是在对档案数据治理的相关子领域研究中存在的档案数据服务治理、档案数据共享利用等研究的含义就侧重于“用档案数据治理”,只不过依据档案数据管理流程或信息生命周期理论内嵌在了现有“对档案数据治理”研究中。同样,早期对于档案部门参与国家或政府大数据治理的内容也部分内嵌在了现今多元共治、协同治理的治理理念当中。
于英香在早期对档案数据管理研究中曾将档案数据管理拆分为“档案+数据管理”“档案数据+管理”“档案数据+数据管理”。[21]同样档案数据治理概念也会存在不同的拆解,如“档案+数据治理”“档案数据+治理”,前者强调档案参与数据治理,借用数据治理理论,是总体数据治理的一部分,后者强调治理理念的引入以及治理对象的变革,是社会治理的组成部分。综合两种理解以及学者目前的研究成果,笔者认为“档案数据治理=档案数据+档案治理”,因为档案数据治理不再是档案学科术语+其他学科术语的简单组合,这两个概念都是档案术语与其他学科术语融合后的再融合与再交叉。之所以这样拆解是因为在现有研究中,学者主要将档案数据治理划为档案治理或档案数据的研究范畴,并且档案数据治理研究的侧重也反映了学者研究该话题的逻辑起点差异。
丁华东在研究中将档案学学术研究划分为人文取向、管理取向、技术取向三大取向,并分别对其历史演变和当下发展展开了论述,在论述管理取向的当下发展时认为“档案治理”的学术意义宏阔而深远,具有管理取向的新意蕴,在论述技术取向时主要从“大智物云移”等信息技术对当下带来的深刻变革和应用研究使得档案学技术研究进入了“新技术(主义)时代”。[22]档案数据治理概念的侧重差异是档案学研究取向当下发展造成的。笔者认为档案数据治理概念的形成与演进是档案学研究管理取向与技术取向双向建构的结果。
管理取向下的档案数据治理概念逻辑演进,突出“管理”在档案数据治理概念产生以及深入研究的重要性。政策话语变革催生了档案治理概念,以此为逻辑起点产生了档案治理主体、档案治理体系、档案治理能力等相关研究,在治理对象从档案信息转变到档案数据后,档案治理研究领域扩展到了档案数据治理。
国内学者进行档案治理研究时,常常会提到两个理论来源,一个是西方公共治理理论中治理概念的引入,一个是2013 年中共十八届三中全会通过的《中共中央关于全面深化改革若干重大问题的决定》中指出的“推进国家治理体系和治理能力现代化”。治理理论对档案治理概念的形成与发展产生了重要影响,除了早期的借鉴,后面还引入了“善治”[23]“元治理”[24]“协同治理”[25]等理念来完善和发展档案治理的内涵。“20 世纪90 年代以来,治理以惊人的速度流行起来,成了又一个风行的词汇”,[26]但很长时间以来并没有档案学者借用这套理论用于档案学研究。
对档案管理方式发生变革产生决定性影响的因素一定是政策话语变革的影响。从2013 年党的十八届三中全会提出“推进国家治理体系和治理能力现代化”的全面深化改革总目标开始,紧接着2014年国家档案局将推进档案治理体系和治理能力现代化作为年度工作重点,[23]之后在2016年《全国档案事业发展“十三五”规划纲要》提出要“加快完善档案治理体系、提升档案治理能力”,[27]到了2017年,晏秦发表了《论档案治理的内涵、特征和功能》一文,自此档案治理作为档案学研究的一个新的学术概念被正式提出。档案治理自此以后迅速成为档案学研究的热点话题之一。
档案治理概念自2017 年形成后,发文量逐年上涨,2020 年以档案治理为主题的论文数量高达68篇,也标志着学者们在档案治理领域研究的不断拓展。对于档案治理研究的主要内容包括档案治理的法制与法治、档案治理的理念解析、档案治理体系与治理能力、档案治理的模式与实现路径、治理视域下的档案工作拓展、全球档案治理、档案治理主体等领域。[28]
档案治理自从被引入以来一直是以一个其他学科术语与档案术语结合的角度被理解和论述的,因此学者们对其的论述常常是基于对象视域的变化,或对某一层面的专注研究,如吴雁平、刘东斌就分别从个人视角、机构视角、国家视角、国际视角对档案治理进行解析;[29]常大伟则在国家治理现代化背景下对档案事业管理转型的方向和路径做了探讨。直到金波等论述了一个宏观语境下的档案管理(即对档案事业内的所有对象的管理活动)到档案治理转变与实现路径,[30]才将档案管理与档案治理联系起来,将外来术语与档案管理理论联系起来,档案治理的内容与内涵除了从外部借鉴以外,也有了从档案学内部发展的理论动机。此后学者们对国家治理视域下的档案管理制度、档案行政管理、档案事业管理转变等多角度开展了档案治理研究。
档案治理研究不断深入开展,对象领域十分丰富,与此同时,档案数据作为独立的学术概念也很快被提出,档案治理在治理客体中的资源对象属性发生了变化,因此档案治理也要根据变化拓展研究,亟需开展对档案数据的治理。
张卫东等在对档案治理研究综述中对档案治理的内容进行识别,认为档案数据治理是档案治理的主要研究内容之一。他认为“档案数据是档案资源的核心部分,也是国家的战略性文化资源。档案数据的收集、管理、挖掘与利用是数字时代档案信息资源开发利用的基本前提,档案数据治理也是档案治理的基本内容”。[28]从此可看出,作为档案治理子领域的档案数据治理,仅仅作为档案治理中资源对象的治理,是只针对档案数据资源本身的治理,至于宏观的生态环境治理则并不包含在内,从档案治理的角度出发,宏观的生态环境治理以及中观的机制治理也是国家档案治理的重要研究领域,这与现有的档案数据治理内涵存在矛盾冲突。
技术取向下的档案数据治理概念逻辑演进,强调“技术”在概念产生和深入研究的重要性,在技术变迁下档案对象属性的变革催生了档案数据概念,以此为逻辑起点产生了档案数据化、档案数据管理等相关研究,理论和实践的发展使得档案数据管理需求产生变化,需要应用数据技术和治理工具应对风险和问题展开治理,档案数据研究题域因此拓展到档案数据治理。
关于档案数据概念的产生,许多学者进行了理论探讨。有学者在总结档案数据研究进展时将学界对档案数据产生背景的研究做了梳理,认为现今档案数据产生背景主要有五种观点构成,“一是档案数据是档案数字化的延续与强化;二是档案数据是档案管理对象的技术变迁;三是档案数据是大数据时代数据思维的转变;四是档案数据化是档案挖掘利用的客观要求;五是档案数据是多种因素共同作用的结果”。[17]并认为这些观点虽有差异,但都是在大数据浪潮影响下的结果。梳理其中主要观点其实不难发现,无论是“档案数字化的延续与强化”还是“大数据时代数据思维的转变”,都是技术变迁影响下直接或间接产生的结果。实际上以技术变迁作为研究视角,在媒介与传播学、社会学、政治学等学科很常见,技术变迁常常是推动其他要素产生变革的重要因素,技术哲学研究中就有学者提出“似乎还没有一种力量比技术更能影响我们的社会生活与社会进程了”。[31]因此笔者认为推动档案数据概念产生的诸多要素中,技术变迁是其中最核心的要素。
在大数据浪潮影响之前,于英香就从术语的演变分析了档案信息技术革命的三次浪潮,[32]分析了档案管理是如何在信息技术变迁下进行变革的,也反映出档案学研究在技术取向下的发展与变革趋势。在数据时代来临后,作者继续对档案与大数据的关系进行思考,并在档案数据管理缺乏基础理论论证的背景下,从数据与信息的演化关系重构了档案数据价值并阐述了大数据背景下档案数据的内涵,认为档案数据概念发展将促进档案数据管理转型。[33]钱毅基于技术变迁的视角提出了在学界产生广泛影响的“三态两化”理论。[34]在此基础上档案数据作为一个独立的学术概念得以存在与发展,后来学者才能继续在档案数据这一研究领域内进行拓展研究。
在档案数据概念成型后,围绕档案数据的研究大量开展,其中针对档案数据管理和档案数据化的研究成果很多,也开始有许多研究专注于如何将技术应用于档案数据化和档案数据管理过程。
在目前对于档案数据化的研究中,许多学者产生了不同的见解。赵生辉等基于档案数据化概念定义不清晰,使用语境混乱的背景下,将档案数据化的使用语境划分为基于数值型数据视角的“档案数据化”、基于二进制数据视角的“档案数据化”、基于原料型数据视角的“档案数据化”、基于结构化数据视角的“档案数据化”。[35]在我们现有的档案数据化概念较多使用的应该是后两种,如金波在对档案数据特征进行描述时就提出了档案数据应当具有易算性,“档案数据化后易于被现代算法技术所加工处理,进行信息分析、价值挖掘、知识发现”。[36]这一描述就是原料型数据视角的档案数据化。对于档案关联数据和语义组织的研究则侧重于基于结构化视角的档案数据化,在进行此类档案数据化的过程中则需要语义网、知识工程、人工智能等技术。[37]
于英香在大数据视域下档案数据管理研究的发展中,就曾论述“技术创新是大数据的核心要素,大数据视域下档案数据管理研究技术层面需要考虑诸多问题,这些问题主要有技术的引进、选优与推广”。在档案数据研究开展过程中,对于新兴技术的应用研究一直是研究热点,国家社科基金选题与档案局科研项目中人工智能、区块链、云计算、物联网等新兴技术名词屡见不鲜。例如,有学者对人工智能技术在档案数据化工作中的应用进行了问题分析和建议;[38]有学者研究了区块链技术在档案数据共享的策略。[39]但是在进行档案数据化的过程中和应用新兴技术进行档案数据管理的同时,产生了一系列新的问题,亟需开展档案数据治理。
在档案数据研究深入开展时,治理理论引入产生的档案治理也是同时期的学术研究热点之一,[40]有许多学术共同体在同时进行档案数据与档案治理领域的研究。同时,在实践中,由于档案数据化工作的深入开展以及新兴技术在档案数据管理中的应用,档案数据面临着新的挑战与风险,“数字化浪潮下档案数据‘不可知、不可控、不可取、不可联、不可用’等问题要求进行数据治理”,[9]档案数据治理研究也由此开展。
随着档案数据相关研究的开展,档案数据治理被纳入档案数据的研究范围之内。现有的档案数据治理研究,主要包含宏观生态治理、中观机制治理、微观资源治理。其实如果按现有定义的内涵来看,宏观生态治理对象已经不是学者们所指涉的以档案数据为对象的治理,它包含了对主体的治理和对制度的治理。金波在对档案数据治理内涵进行描述时,首先论述了档案数据治理的环境,其中包括数据环境、政策环境、社会环境、技术环境,[17]这几个环境因素既是推动档案数据治理开展的动因,也应当是档案数据治理的对象。
随着档案数据化工作的开展,对新兴技术的应用也在同时进行,由此也产生了一系列新的问题,但是纵观现有的档案数据治理的框架体系中,并没有提及对技术的治理。但较早开展档案数据研究的于英香在研究中发现人工智能应用于档案工作中会导致档案数据泄露等风险,会影响档案数据的保管和利用,需要从意识层面、管理层面、法规层面对算法技术进行治理。[41]陈艳在对国外档案数据治理研究现状总结时就将“档案数据技术治理研究”列为主要议题。[4]因此,随着档案数据治理的深入开展,档案数据治理体系和框架也应当把技术治理纳入其中。
档案数据治理作为档案学新兴的学术研究话题,其产生的过程是复杂的,从对档案数据治理研究进展的梳理中,比较容易发现档案数据治理存在着不同的侧重与倾向。档案数据治理概念产生和演进的过程是档案学研究中管理取向与技术取向双向建构的结果。从两个不同取向理解档案数据治理概念的演进逻辑发现,从管理取向发展而来的档案数据治理概念更倾向于狭义的档案数据治理,即对档案数据进行的治理。而从技术取向发展而来的档案数据治理则是更加广义的档案数据治理,是从档案数据产生发展带来深刻变化影响下的体系内涵更丰富的档案数据治理,换言之,这一取向发展中的档案数据治理是将档案数据作为档案的一种新形态来研究,其研究对象则是整个档案管理的对象,包含了从宏观环境到中观机制到微观资源的系统整体。
但是就目前的研究现状来看,档案数据治理研究忽略了档案数据治理环境中的技术因素。档案数据治理本身是档案学研究技术取向下发展演变的概念,档案数据治理过程中许多现代信息技术被当作进行档案数据治理的工具,这些工具的选取和使用过程中本身也会出现许多问题与风险。因此,档案数据治理也应将档案技术治理纳入重点研究题域。