易涛
摘 要:思考档案数据共享的价值问题,有助于探寻档案行业数据化转型的内在逻辑与价值意蕴。以档案双元价值论为指导,发现档案数据是工具价值与信息价值的双元价值结合体,共享是档案数据价值最大化实现的必然选择。对档案数据价值的认识偏颇,成为实践中档案数据不愿共享、不敢共享与不能共享的思想根源。遵循“双元并重”的价值理念,档案数据共享既要重视工具价值的“求真”,确保共享档案数据的真实性;也要关注信息价值的“促用”,提升档案数据共享的实效性。
关键词:档案数据共享;工具价值;信息价值;档案双元价值论
分类号:G270
Research on Archive Data Sharing from the Perspective of Archival Dualistic Value
Yi Tao
( Archives of Zhejiang Normal University, Jinhua, Zhejiang 321004 )
Abstract: Studying the value of archival data sharing is helpful to explore the internal logic and value implication of the digital transformation of the archival industry. Guided by the Archival Dualistic Value theory, it is found that archival data is a combination of instrumental value and information value, and sharing is an inevitable choice to maximize the value of archival data. The biased understanding of the value of archival data has become the ideological roots of not willing to share, not daring to share and not being able to share. Following the value concept of "dual emphasis", archival data sharing should pay attention to the "truth-seeking" orientation of instrumental value to ensure the authenticity of shared archival data. We should also pay attention to the “utilization promotion” of information value and improve the effectiveness of archival data sharing.
Keywords: Archival Data Sharing; Instrumental Value; Information Value; Archival Dualistic Value
数据时代,信息技术的发展推动档案形成环境由“模拟态”“数字态”向“数据态”[1]转变,也让档案数据的核心地位和核心价值日益凸显,并已成为重要的战略资源和无形资产。[2]在此背景下,数据科学的发展和数据密集型科学范式的出现,让包括档案学在内的信息资源管理学科更加关注这一领域的问题。[3]当前,有关“档案数据共享”的研究集中分布在两个方面:一是档案数据共享的策略研究,包括基于公众逻辑的档案数据共享“K2C”模型[4],企业档案数据共享的理论与框架[5],檔案远程服务的数据共享模型[6]等方面;二是档案数据共享的实践探索,相关成果集中在医院档案[7]、城建档案[8]以及政务档案[9]等领域。总体而言,已有相关研究成果侧重探寻档案数据共享的实际解决方案,但缺少基于档案学基础理论的分析思考。
以《双元价值观的视野:中国档案事业的传统与现代化》一书的出版为标志,档案双元价值论的提出已逾二十年。二十年来,在对兰克史学、经典管理理论和文献交流理论的分析研究中,这一学术观点的理论内涵得到不断丰富;在解析档案价值实现“椭圆现象”的基础上,档案双元价值立体模型[10]得以建构完善;在国内被认同赞许的同时,其核心思想也实现了域外传播[11],一系列的充实发展也让这一国内原创的档案学理论实现从“观念”到“理论”的转型蜕变。[12]因此,本文借助档案双元价值理论,尝试从价值意蕴与价值实现两个角度来探讨档案数据共享的内在逻辑与实现路径,希冀为这一问题的后续研究的拓展起到抛砖引玉作用。
1 档案数据价值的“双元”阐释
档案数据是指“数据化的档案信息及具备档案性质的数据记录”[13],具体包括“档案化的数据”与“数据态的档案”两种形式。二者具有过程层面的差异性与结果层面的一致性,通过归档程序最终实现基本含义的相通。[14]档案数据同时具有档案与数据的一般属性,着重强调档案的数据化形态,对传统档案概念的外延有较大扩展,包含那些未被档案部门纳入保管范围的数据,以及在档案管理过程中产生的数据。[15]结合共享的一般含义,档案数据共享可以理解为,将档案数据的使用权或知情权与其他主体进行合法分享,实现档案数据共同拥有的传播行为。与传统的档案共享概念相比,档案数据共享着重强调“数据态”档案的合法分享,共享程度更深入、共享手段更先进、共享效益更突出。
1.1 档案数据的工具价值
档案双元价值论认为,档案“作为一种行为方式,人类的初衷在于借助它的结构形式所赋予的功能,可称为‘工具价值”[16]。作为一种具有普遍意义的社会现象,档案的产生是社会发展到需要借助档案行为方式来实现社会治理目标的必然结果。结绳刻契、甲骨金文、绢帛纸张抑或数字档案,虽有载体形态的巨大差别,但其存在意义仍统一于自身的工具价值。古代档案管理中的文卷交结制、半印勘合制、文书档案连锁法、照刷磨勘文卷制等,都是在长期探索维护档案工具价值过程中逐步形成的制度规范。
档案数据承袭了档案的这一社会属性,作为一种“与社会的同构和对应关系”[17],档案数据从根本上而言是一种功能,表现为人们借以维护凭证信息的证据力,这也是档案数据区别于一般数字资源的本质属性的表现。近些年,在档案领域有两种代表性的观点:一是认为档案都属于大数据,大数据也都属于档案;二是认为以大数据管理局为代表的信息管理机构掌握了大量的数据资源,档案部门的存在价值将受到巨大挑战。这两种观点有着内在的逻辑一致性,因为忽视档案数据的工具价值导致对档案数据产生了泛化理解,将档案数据与一般数据等同,从而对数据时代档案机构的自身价值、应对能力与发展前途产生迷茫和质疑。
1.2 档案数据的信息价值
档案双元价值论认为,档案“作为记录或者文献归属的实体(或结构对象实体),其内容负载的价值,称之为‘信息价值”[18]。档案数据的信息价值一方面表现为参考价值,也即谢伦伯格所言的“情报价值”。“数据态”档案在情报价值上与“模拟态”档案和“数字态”档案并没有本质区别,但是具有更细的信息粒度、更全的检索途径、更强的展陈方式,从而更有利于档案数据信息价值的发挥。
档案数据的信息价值另一方面表现为档案知识价值,具体指档案满足主体扩展与丰富知识储备,提升个人技能需求的程度。[19]档案数据可以拆解为相互独立又密切关联的数据元素,依据一定的相互关系组合成多元数据网,从而实现基于逻辑关系的集群性信息价值。数据时代,“档案知识是档案数据规范化、关联化、语义化的结果”[20],新兴的技术和工具为实现档案数据知识价值提供了更多可能。
1.3 共享是档案数据价值实现的必然选择
档案价值实现是档案潜在价值(本体意义)向现实价值的转换过程。[21]从主客体关系的角度,档案价值实现可以理解为档案价值客体满足档案主体需要的过程。从信息资源管理的角度,资源的有限性和分布的不均衡性,使信息资源的有效利用必须最大限度地实现信息资源共享。[22]作为一种特殊的信息资源,共享成为档案数据价值实现的必然选择。
其一,共享有助于推动档案数据工具价值从钳制意义的控制走向科学管理意义的控制。在一元档案价值观时代,档案的工具价值表现为纯粹的钳制作用。档案成为皇权治国的统治利器,甚至连“九卿翰林部员有终身不得窥一字者”,就更遑论档案的共享与传播。然而,在档案价值从“一元”向“双元”的转变过程中,在社会转型变革、民主意识觉醒与传播手段丰富等因素的综合影响下,只注重档案工具价值的钳制意义将难以为继。
共享将档案数据的使用权或知情权予以分享,实现从钳制意义的“堵”向科学管理意义的“疏”转变。共享满足了更多社会主体对档案数据的知悉意愿和利用诉求,避免因为信息获取不畅而造成猜疑诽谤、决策失误等不利后果。合理的档案数据共享有助于形成稳定有序的社会环境,更科学地实现档案数据工具价值的社会控制目标。考察近代著名管理学家的档案思想也发现,他们在认为档案具有“管理的机器”“合于理性的工具”“以知识为依据来进行控制”等工具价值的同时,也强调要熟悉档案才能达到最理想状态,要将传统经验记录下来并加以运用[23],体现出对档案信息应用与档案工具价值实现的内在一致性认同。
其二,共享有助于档案数据信息价值的全面实现。首先,共享可以扩展档案数据信息价值的实现范围。从用户角度来说,共享让档案利用者能够获取更多的档案数据,扩大了可获取档案信息的范围;从档案机构角度来说,共享让其馆藏档案数据能满足更多的档案利用需求,拓展了档案机构的用户空间。这种双向放大效应将使档案数据的总体价值急剧增加,档案信息价值的覆盖范围实现量的扩展。
共享还可以节省档案数据信息价值的实现成本。一方面,共享意味着能更加合理地实现档案资源配置,避免在档案收集、存贮和管理等环节的重复浪费。共享还让一部分“沉睡”的档案数据在其他地方找到用武之地,提高了档案数据的共享产出效益。另一方面,共享意味着档案数据的建设主体增加,在提升档案数据总量的基础上,也分摊了档案数据共享的成本投入,降低了档案数据信息价值的实现成本。
2 阻碍档案数据共享的“双元”剖析
共享代表了档案界在数据时代的发展方向,但是通向这一目标的过程注定不会平坦。利用档案双元价值论进行分析发现,档案数据共享中的诸多问题,本质上源于对工具价值与信息价值的认识偏颇,导致二者在失衡状况下无法促成档案价值的“充分实现”。
2.1 不敢共享:档案数据工具价值的“异化谨慎”
档案产生的初衷是作为管理控制的工具,档案与“神秘”“封禁”有着与生俱来的紧密关联。过度强调档案的管控作用,对檔案数据秉承“异化谨慎”的心态,成为档案数据不敢共享的认识根源。
其一,档案数据工具价值优先的思维。我国档案机构虽已实现从古代“档房”向现代“档案馆”的转变,但是档案封闭思想却从未完全消散。在档案数据工具价值优先的思维影响下,认为“封闭”比“共享”更安全,“保密”比“公开”更重要也就在预料之中。
其二,档案数据安全隐患的担忧。以磁性介质为主的档案数据存储设备存在容易损坏的潜在风险,而技术更迭造成的数据不能读取情况也是不能忽视的安全问题。档案数据共享过程中遭受非法窃取、黑客入侵、病毒感染等情况,可能造成侵害国家安全、个人隐私、知识产权、商业秘密的严重后果。同时,共享档案数据被深度挖掘后所存在的潜在危险性[24],随着数据分析技术的发展也将日益凸显。
其三,容错保障机制的缺失。档案数据共享的相关法规,明显表现出工具为重的价值倾向。一方面,强调档案数据的工具效用,对于数据处理的不当行为设有明确的处罚条款;另一方面,对于数据共享中的过失行为缺乏有力的容错机制,缺失具体有效的司法救济。因此,在对共享后果“未知恐惧”的影响下,不敢共享的保守思维被进一步加强。
2.2 不愿共享:档案数据信息价值的“善财难舍”
我国当前权力配置以“事权”为中心,无法避免部门利益的存在,导致部门之间因缺乏数据共享的内在动力而不愿共享。档案数据价值的不断提升,反而进一步加剧了部门独占和规避监督的保守心态。
其一,不愿共享源于对档案数据信息价值的独占思维。数据时代,数据资源的重要性受到国内外广泛关注,数据治理能力是一个国家综合国力的重要体现。在这样的背景下,共享虽然有助于实现档案数据的信息价值,但是也让档案数据主体失去了资源独占的相对优势,档案数据的话语权和主体地位都受到削弱。因此,在数据独占思维的影响下,档案数据主体往往对共享缺乏真正的内心认同。
其二,不愿共享还源于对档案数据监督的主动回避。共享在带来利用便捷的同时,往往也意味着档案数据主体将被置于“阳光”之下,需要接受更大范围的公众监督。通过共享,更多的机构和个人能够发现档案数据中可能存在的数据造假、数据谎报、数据瞒报等问题,让档案数据主体的工作缺失增加了被曝光的可能。因此,在回避监督的驱动下,档案数据主体自然缺乏共享意愿。
2.3 不能共享:档案数据价值实现的“无米之炊”
档案双元价值论认为,档案的价值实现量与档案的价值本体量之间并不完全相等,呈现出动态、偶然与累加等特点。[25]这种差别与档案价值的实现条件有着密切关联,由于顶层设计、技术规范、协同机制等方面的要素缺失,档案数据共享往往表现出“无米之炊”的困扰。
其一,档案数据共享的技术准备不足。迄今为止,国家层面仍缺乏与档案数据共享密切相关的行业法规、数据标准与接口规范等顶层设计。这也导致在档案数据共享实践中需要对档案数据语义进行重复解释和多次翻译,降低了档案数据的使用体验。同时,异构的档案管理系统和非结构化的数据形式也导致档案数据的流通性差、共通性弱,客观上造成档案数据的封闭现象。
其二,档案数据共享的主体协同不够。我国现有的档案管理体系,既有依据行政层级建立的各级综合档案馆,也有依据行业领域建立的各种专门档案馆,还有大量企事业单位的内部档案机构。这种“条”“块”并存的复杂档案网络,无疑给档案数据主体之间的互助协作增加了难度,单纯依靠行政命令与专业自觉,显然无法取得理想的部门协同效果。
其三,档案数据共享的边界不清。一是共享内容边界,决定了可以对外分享的档案数据范围。已有法规对于共享内容的规定,过于原则而缺乏可操作性,导致实践中档案数据所有者的自由裁量权过大,档案数据共享内容边界模糊。二是共享程度边界,主要是指对档案数据访问控制权限的细分程度。档案领域在数据共享方面所采取的粗放赋权方法,一方面有可能扩大主体权限而增加数据泄漏风险;另一方面也可能因为谨慎赋权而导致共享内容被压缩,影响档案数据共享的实际成效。
3 实现档案数据共享的“双元”路径
档案双元价值论强调档案价值的“双元并重”,认为双元价值结合程度愈高,档案价值实现量就愈大,档案价值实现就愈接近档案价值本体。相反,偏颇工具价值与信息价值中的任何一方,都会导致档案价值实现程度变小。[26]因此,档案数据共享的实践理路,要以工具价值与信息价值的平衡为原则,以求档案数据价值得到最大化实现。
3.1 求真:以维护档案数据工具价值为共享前提
共享与开放相伴,档案数据开放共享表面上与其信息价值有着更直观的联系。现有的理论研究与实践探索也主要聚焦在档案数据共享的技术层面,关注共享档案数据“用”的效率,表现出明显的技术理性倾向。档案工具价值作为一种主导性价值,是档案存在的直接价值[27],但是已有研究却少有对共享档案数据“真”的思考,缺乏对其凭证价值与控制功能的关注。因此,推动档案数据共享走向深入,不能以放弃工具价值为代价来树立开放形象,反而要明明白白地强调档案的社会工具价值。[28]
其一,建立档案数据全程共享模式。所谓全程共享是指对档案数据采集、整理、保存、利用的整个生命周期实行全过程共享。采集阶段,通过内容划控与权限控制相结合的方式来确立共享权限,使档案数据采集呈现利于共享的“合目的性的逻辑结构”。整理阶段,因为档案数据的集合性程度愈高,档案“真”的程度就愈高,因此需要注意档案数据内容的连续性和完整性。总体而言,建立全程共享的理念和运行体系,实现对档案数据的可信性、可关联性、可追溯性的全程管理,有利于维护档案数据的凭证价值,确保共享的档案数据是可信的真实数据。
其二,建立档案数据安全共享体系。一是要利用法律来规范档案数据共享行为。以《中华人民共和国数据安全法》为基础法规,结合档案数据自身特点,建立档案数据安全风险评估、监测、预警、审查和应急处理机制,尽快出台《档案数据安全法》。二是要利用技术来增强档案数据共享能力。例如,通过智能合约、数字簽名、星际文件系统(IPFS)、公有链与联盟链结合等技术,实现对档案数据的保护、验证、恢复与共享。三是要提升利益相关方数据素养。数据素养是公民对海量数据进行采集、整理、分析和利用的综合能力,对于档案事业是一项全新却不可回避的重要工作。[29]总之,维护档案数据安全是档案数据“求真”的必然要求,也是开展档案数据共享的前提和基础。
3.2 促用:以实现档案数据信息价值为共享目标
在维护工具价值的同时,档案数据共享也需要关注信息价值的实现问题。推动档案数据共享,需要转变封闭保守的传统心态,树立档案数据是战略资源、公有产品与共享增值的理念。当然,作为一个极富挑战性的研究话题,这种共享环境的建立需要多种因素的综合作用。
其一,健全档案数据协同共享机制。首先,为了解决共享参与主体的后顾之忧,需要明确档案数据的所有权关系,界定档案数据共享参与各方的权利义务关系,明确各自的具体权利和职责。其次,建立档案数据共享的容错与监督机制。在不违背现有法规基本精神的基础上,对于档案数据共享中的过失行为给予相应的减责免责处理,形成鼓励共享的制度导向。最后,还应将数据质量、共享数量、使用行为等纳入考核评价体系,监督保障档案数据主体共享行为的积极性、准确性和规范性。
其二,加强档案数据共享技术保障。首先,应制定档案数据共享的关键技术标准。我国在某些关键的档案数据法规标准上仍欠缺很大[30],需要加强档案数据接口、数据格式、数据处理、数据著录、元数据结构等方面的标准规范建设。同时,应对已有档案数据进行标准化处理,将共享标准融入系统设计和数据采集过程,做到从源头规范。其次,须建立并完善一体化智能化档案数据平台。2022年7月,全国档案查询利用服务平台正式上線,为建立档案数据共享联动机制、实现全国档案数据利用“一网通办”奠定基础。此后,还须不断拓展平台功能,做好与省市级档案平台的有效对接,切实提高档案数据的共享水平。最后,还应加大区块链技术在档案数据共享中的研究及应用。区块链去中心化、加戳加密、多链配合、智能合约等核心技术与档案数据共享防篡改、安全可信、提升效能的目标有着高度一致性,需要档案界加强共识来开展集中攻关式研究。
其三,发挥共享档案数据的知识价值。数据时代,档案数据信息价值迎来了以参考价值为主向、以知识价值为主的提升契机。利用本体建模、数据挖掘、知识组织等信息技术,能够将离散的档案数据序化组织为系统的档案知识,从而更好地展现档案数据的知识价值。以档案编研为例,房小可等人[31]就利用引文分析、主题挖掘方法、可视化工具等完成了编研材料的资源搜集、信息加工与成果展示,实现智能化、精准化和快速化的工作目标。以档案数据的知识聚合为基础,还可以实现个性化的知识定制。根据用户个性化的知识需求,聚合相关的数据信息,并在档案数据知识库中建立以用户为识别标签的知识模块,从而为用户提供个性化的知识服务。
4 结 语
2020年《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》出台,数据作为继土地、劳动力、资本、技术之后的第五种新型生产要素被正式写入国家文件。2023年3月,国家数据局在新一轮国家机构改革中应运而生。这些都表明,数据已经成为“数字中国”建设中不可或缺的基础性资源和关键生产要素。在这样的时代背景下,档案工作正经历一个“从管档案实体到管档案数据”的变革过程,而档案数据共享无疑是实现这一转型的“接驳点”。可以预见的是,伴随这一变革过程,档案数据共享的内在价值、协作意义与实践效用将逐渐形成行业共识并赢得社会认同。档案双元价值论缘起于对传统“档房”向近代“档案馆”转型的理论思考,也将在档案行业数据化转型过程中不断丰富内涵。在档案双元价值观的观照下,档案数据共享既要重视工具价值的“求真”,也要关注信息价值的“促用”,才能在推动档案行业融入数据化浪潮的同时,彰显档案数据的个性特点和独特价值。
*本文系国家档案局科技项目“基于‘最多跑一次改革的数字档案资源整合共享机制研究”(项目编号:2019-X-18)阶段性研究成果。
注释与参考文献
[1]钱毅.从“数字化”到“数据化”——新技术环境下文件管理若干问题再认识[J].档案学通讯,2018(5):42-45.
[2]金波,周枫,杨鹏.档案数据研究进展与研究题域[J].情报科学,2021(11):187-193.
[3]朝乐门.信息资源管理理论的继承与创新:大数据与数据科学视角[J].中国图书馆学报,2019(2):26-42.
[4]聂云霞,钟福平,朱仁平.档案数据共享的公众逻辑——基于场景建构、知识服务、全媒传播的框架[J].档案学通讯,2022(5):4-9.
[5]李颖.数据时代面向知识共享的企业文件与档案管理研究[M].北京:人民出版社,2019.
[6]张林华.基于区域性远程服务实践的档案资源共享研究[M].武汉:武汉大学出版社,2021.
[7]黄富才.区域性开放背景下的医院档案数据共享研究[J].档案学研究,2021(5):145-148.
[8]袁绍晚.政务服务驱动下城建档案数据共享问题与策略[J].档案学研究,2021(5):85-89.
[9]郭立鑫,陈潞辉.联盟链视域下政务云档案数据共享利用模型研究[J].档案管理,2022(5):50-52.
[10][19][27]任越.档案双元价值理论及其实证研究[M].北京:科学出版社,2020.
[11]Qin Z , Qu C , HawkiNs a. The Three-Character Classic of archival work: a brief overview of Chinese archival history and practice[J]. archival science,2021(3):97-116.
[12]任越.从观念到理论——档案双元价值论的演变轨迹研究[J].档案学研究,2012(1):30-34.
[13][15]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.
[14]高晨翔,牛力.国内“档案数据”研究述评[J].档案学研究,2020(5):11-18.
[16][18][28]覃兆刿.双元价值观的视野:中国档案事业的传统与现代化[M].北京:中国档案出版社,2003.
[17]覃兆刿,付正刚.与社会的同构和对应关系:广义的来源联系——论“档案信息”的本质[J].档案与建设,2002(2):17-18.
[20]张斌,高晨翔,牛力.对象、结构与价值:档案知识工程的基础问题探究[J].档案学通讯,2021(3):18-26.
[21]张斌.档案价值论[M].北京:中央文献出版社,2000:47-48.
[22]程焕文,潘燕桃.信息资源共享[M].北京:高等教育出版社,2004:2.
[23]覃兆刿.析经典管理理论中的“档案”要素——兼及档案作为管理要素的“双元价值”分析[J].档案管理,2006(2):22-25.
[24]陈潭.政务大数据壁垒的生成与消解[J].求索,2016(12):14-18.
[25]覃兆刿.档案双元价值论谈[M].北京:科学出版社,2015:318.
[26]覃兆刿,范磊,付正刚,等.椭圆现象:关于档案价值实现的一个发现[J].档案学研究,2009(5):3-6.
[29]聂云霞,肖坤.数字人文视域下档案学专业学生数据素养培育探析[J].档案学通讯,2020(3):95-103.
[30]张健.电子文件信息安全管理研究[M].上海:上海世界图书出版公司,2012:141.
[31]房小可,谢永宪,王巧玲.基于数字人文的档案编研方法新探[J].档案学研究,2020(5):138-142.