国外档案数据管理流程研究述评

2019-01-09 22:26刘庆悦杨安莲国防大学政治学院
浙江档案 2019年11期
关键词:数据管理流程领域

刘庆悦 杨安莲/国防大学政治学院

档案数字化转型的深入使得档案管理的颗粒度逐步由文件尺度细化至数据尺度,档案数据管理的重要性日益凸显。国外较早开展档案数据服务与开放的探索,在档案数据管理流程方面具有相对丰富的成果和经验,可为我国档案数据管理研究提供一定借鉴。

在国外现有研究中,档案数据是一个笼统的范畴,没有确切的概念范围。本文中,笔者将档案数据概念界定为承载档案信息的数据,以及在档案管理和利用活动中产生的数据。具体来说,档案的具体内容、标题、保密期限、目录等,档案的操作日志、库房温湿度、统计数据等,档案利用者的姓名、年龄、利用时间、检索轨迹、利用评论等都包含于档案数据的概念范畴之中。档案数据管理是指利用数据管理等多种方法,控制档案数据及档案数据活动,以最大限度地实现档案数据价值、促进档案工作发展的活动。档案数据管理流程是指一系列连续的档案数据管理活动,旨在集中管理大量复杂的档案数据,在维护其真实性、完整性、可用性和安全性的同时,促进档案信息及相关知识的获取和提炼。与以手工管理思维主导的传统档案管理流程不同,档案数据管理流程更强调档案数据与技术的结合,强调服务于以用户为中心的深层次档案数据价值挖掘。

1 研究现状分析

基于以上概念,笔者对LISA数据库(Library and Information Science Abstracts Database)进行了检索,检索时间范围为1999至2019年,检索式为TI="archiv*data" OR TI="document data" OR TI="record data" OR TI="electronic record data" OR TI="digital file*data"。截至2019年9月,检索到文献451篇。经去重、降噪后,最终得到文献347篇。经初步分析发现,在时间上,近20年国外档案数据管理流程研究数量总体稳定,在2012年至2014年间具有一定的热度。主要原因是云计算、大数据等技术的兴起引发了国外学界对档案数据管理方法的探索。在内容上,有关档案数据共享、利用的成果类型十分丰富。主要原因在于国外档案数据公开度较高,公开获取、利用档案数据已成为较多学者的研究路径。在领域上,近85%的文献分布于医疗卫生领域,还有大量文献分布于天文、气象等领域。档案领域较少对档案数据管理流程进行专门研究。总体上,笔者认为国外档案数据管理流程研究可分为档案数据计划与采集、档案数据整合与存储、档案数据分析与挖掘、档案数据共享和档案数据利用五个部分。

1.1 档案数据计划与采集

档案数据计划与采集研究强调提高档案数据对未来研究的有用性。相关学者明确了档案数据计划的要素及档案数据的采集范围、采集方式和质量评价。对于档案数据计划的要素,Bishoff等人认为档案数据管理计划应包含管理目标、数据背景、备份保密、知识产权、责任认定、检测审查、数据质量、真实性保证等多方面规定[1]。对于档案数据的采集范围、采集方式和质量评价,Doods等人认为档案数据采集的范围不应无限扩大,要事先遴选形成档案核心数据清单[2]。Cars等人认为可以通过半自动化的方式采集档案数据,因为该方法在完整性和一致性上效果更优,可以兼顾档案数据采集的效率和质量[3]。Weiskopf和Weng设计了评估档案数据质量的维度和方法,确定了包括完整性、正确性、一致性、合理性和流通性在内的五个维度,以及七种数据质量评估方法,包括黄金标准比较法、数据元素协议法、数据源协议法、分布比较法、有效性检查法、日志审查法和元素存在检查法等[4]。

1.2 档案数据整合与存储

档案数据整合与存储研究具有较强的实用性。在档案数据整合方面,Fresa等人为档案数据标准开发了一组高模块化工具,以便档案馆统一档案数据进馆时的格式[5]。在档案数据存储方面,研究人员追求永久高效地存储大量不可变的档案数据,使其具有高可靠性和可访问性。相关研究方向可根据存储档案数据的软、硬件进行细分。档案数据存储硬件研究包含档案数据的存储载体和记录方法研究,如Holzner等人提出一种高密度多级录制档案数据的方案,以支持档案数据的超长期保存[6]。档案数据存储软件研究包含“怎样高效地压缩数据”“何种数据存储在何种数据库”“怎样从数据库中获取信息”等问题,如YOU等人研究了大型数据库中的档案数据压缩方法[7]。Freire等人比较研究了某种分布式非结构化数据库与传统结构化数据库在特定环境下的优劣等[8]。Marco-Ruiz等人描述了档案数据建模、转换、集成和标准化所需的技术和步骤[9]。

1.3 档案数据分析与挖掘

档案数据分析与挖掘研究注重与信息技术的结合。Gray指出了其原因,认为这是快速大量处理档案数据的时代要求决定的[10]。宏观上,学者运用数据分析方法辅助档案数据的管理利用,如Lemieux探讨了使用可视化分析方法支持档案管理的可能性,认为可视化和视觉分析法可作为档案工作者分析复杂任务(如描述档案)的认知辅助[11]。基于此,Choo等人设计了适用于大规模档案数据的交互式视觉信息检索和推荐系统,该系统能以散点图形式显示检索到的档案数据及其主题摘要[12]。微观上,学者有针对性地优化分析算法,使其在特定研究方向上更加精准,如Mathias等人优化了老年人预期寿命指数预测算法等[13]。

1.4 档案数据共享

档案数据共享研究的视角丰富多样,包含了档案数据共享意识、档案数据共享方法及档案数据共享保障等多个方面。在档案数据共享意识方面,Poole认为背景和年龄是最重要的影响因素,此外信任和动力等也会影响档案数据共享意识[14]。在档案数据共享方法方面,Xia等人基于区块链技术设计了档案数据共享的技术框架,解决了“云存储”中敏感数据共享的访问控制难题[15]。在档案数据共享保障方面,Ray和Smith认为档案数据共享需要通用的数据使用协议、权利信息、许可条款、教育材料、信用机制和执行实践等进行共同保障[16]。另外,网络基础设施、组织、规划和政策等也是保障的重要因素[17]。

1.5 档案数据利用

与档案数据分析与挖掘相比,档案数据利用更强调利用,而非数据分析方法。国外的档案数据利用研究范围广泛、方式多样,主要可依利用主体分为档案机构利用和用户利用两部分。对档案机构而言,档案数据可用于研究档案利用者、利用方式和利用率。如Adams将档案数据利用者分为两类,一类是事实信息寻找者,即利用档案数据探寻事实的人群;另一类是数据分析员,即利用档案数据进行分析研究的人群[18]。英国国家档案馆通过提取和可视化档案数据中的历史事件参考位置,不仅完善了其服务,而且提升了档案数据的利用率[19]。对用户而言,档案数据能助推部分专业特色领域的发展。有学者利用档案数据进行预测,有学者通过档案数据众包项目拓展研究能力,还有学者利用档案数据分析结果推动决策的制定。如Muhling等人根据档案数据预测了某海域蓝鳍金枪鱼幼虫事件的发生[20];Paneth-Pollak等人利用某类电子健康档案数据反映的规律,推动了纽约市公共卫生项目决策的制定等[21]。

2 研究特点

对文献进行深入研究后发现,国外档案数据管理流程研究总体呈现研究视角偏重具体环节,整体性研究较少;研究内容重视实践问题,理论研究较弱;注重新兴技术的利用,但范围影响有限;研究领域突出专业特色,但具有广泛适用性的共性研究不足等特点。

2.1 研究视角偏重具体环节,整体性研究较少

在视角上,档案数据管理流程研究偏重具体环节,切入点往往“小而深”。国外档案数据管理流程研究分工精细且角度多元,一般涉及一到多个流程环节,但包含档案数据管理流程全部环节的整体研究较少。这导致档案数据在某一流程环节内具有很好的可用性,但当其进入档案数据管理流程的其他环节后,可能出现通用性不高、互操作性不强等问题。

2.2 研究内容重视实践问题,理论研究较弱

在性质上,档案数据管理流程研究偏重实践,侧重解决具体的实际问题。一方面,这是因为国外研究普遍具有较强的实用性和问题导向性;另一方面,也因为以美国为代表的发达国家现有的档案数据管理流程较为通畅,可以支持现代化的档案数据管理利用。学者可以基于档案数据管理利用时暴露的问题,不断优化档案数据管理流程中的各环节。不过国外档案数据管理流程基础理论研究相对薄弱,大量经验和做法未经体系化和理论化,这影响了研究的整体性。

2.3 注重新兴技术的利用,但范围影响有限

在技术上,档案数据管理流程研究思维开阔,能够灵活地利用新兴技术提升档案数据管理的效率和效果。对于云计算和可视化等新兴技术在档案数据管理流程中的使用,国外研究显现出了积极性高、创造性强、应用性好等特点。新兴技术的引入、创新与融合不仅促进了国外学者对档案数据价值进行深层次、精细化挖掘,还推动了国外档案管理迈向智慧化和现代化。但不足之处在于,国外相关研究的实践范围较小、影响范围有限,规模化、系统化的应用模式尚未形成。

2.4 研究领域突出专业特色,但具有广泛适用性的共性研究不足

在领域上,某些专业特色领域的档案数据管理流程研究较为深入。如,由于医疗卫生领域迫切需要利用公民电子健康档案,因此相关学者已在档案数据计划、档案数据挖掘以及档案数据共享等多方面进行了较深入的探索。科研档案、天文档案及气象档案等专业特色领域也对相关领域内的档案数据管理流程进行了一定的研究。但与此同时,档案领域对档案数据管理流程的关注相对较少,导致相关共性研究不足,专业特色领域的研究与实践经验难以促进完善更多领域的档案数据管理流程。

3 对我国的启示

随着云计算、大数据等新兴技术对社会的影响愈发深入,档案数据的重要性将愈发突出。为适应变化、抓住机遇,笔者认为我国必须加快完善档案数据管理流程相关的理论,推动先进技术在档案数据管理流程中的应用与创新,并强化专业特色领域成功经验的借鉴推广。

3.1 档案数据管理流程相关理论的完善

国外的档案数据管理流程研究虽然丰富,但在理论性和系统性等方面仍有不足,较难为我国相关研究提供直接的参考。由于实行集中统一的档案管理体制,我国的档案数据管理范围庞大、情况复杂,因此必须先从理论上进行梳理,然后再借鉴国外的相关思想展开实践。首先,明确档案数据管理流程管什么。即研究档案数据的概念、分类及特征,界定档案数据管理的范围,深入了解和剖析档案数据管理对象。其次,分析档案数据管理流程是什么。从概念上厘清档案数据管理及档案数据管理流程的含义及目标,分清档案数据管理流程和传统的档案管理流程的区别。最后,梳理我国档案数据管理流程有什么。定义档案数据管理的环节,确定各环节的功能、作用、主要方法及要求,找到可能阻碍档案数据准确、高效传递的因素并进行优化。

3.2 新兴技术在档案数据管理流程中的应用与创新

国外对于云计算等新兴技术的灵活运用,在一定程度上推动了档案管理的转型和发展。因此,我国的档案数据管理流程研究需要进一步解放思想,加强新兴技术的引入、创新与融合,利用技术手段规范档案数据管理流程;并借鉴参考国外档案数据管理流程研究和实践的经验,基于我国实际对这些技术做出适应性改变。此外,我国还应发挥优势,不断跟踪新兴技术的试点,并在评估效果良好后进行推广。推广时,要从宏观上系统思考新兴技术应用后带来的影响,配套给出相应的制度等保障条件,使我国档案数据管理流程真正适应新时代中国特色社会主义发展的需要。

3.3 专业特色领域经验的借鉴与推广

首先,从医疗卫生领域到气象领域,国内外多个专业特色领域已形成或正研究适合该领域的档案数据管理流程。其次,图书馆学、计算机科学等领域也探索出了各类适用于特定情境的档案数据管理流程。再次,在长时间的实践研究中,我国文件档案管理领域也总结出了一系列管理流程和经验。因此,深入学习借鉴这些领域的研究成果,有助于提炼形成普遍的、公认的档案数据管理流程。与此同时,档案部门还要结合档案数据管理实践,不断充实、完善适于档案数据管理各环节的方法和应用,使档案数据管理流程切实发挥作用,推动我国档案事业发展。

猜你喜欢
数据管理流程领域
电子战领域的争锋
基于大数据管理的管道智慧检验系统的研发及应用
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
将现代科技应用于Hi-Fi领域 Perlisten S7tse
吃水果有套“清洗流程”
CTCS-2级报文数据管理需求分析和实现
2020 IT领域大事记
领域·对峙
违反流程 致命误判