王宁 李晶伟
[摘要]大数据作为一种新的信息常态和技术环境,对档案工作发展和档案学理论研究带来诸多新的机遇和挑战。论文在对相关研究进行总结和回顾的基础上,从实践需求环境的视角切入,探讨大数据对档案工作实践、档案学理论创新、人才选用的影响,提出大数据环境下我国档案学研究发展思路:催生档案数据学研究兴起,培育档案数据思维、数据素养,全面拓展档案数据管理能力。
[关键词]档案数据档案数据学数据管理数据素养
[分类号]G270.7
Research Progress of Archives Science in China under the Influence of Big Data
——Based on the Analysis of the Practice Requirements Environment
Wang Ning1Li Jingwei2(1. School of Information Resource Management of Renmin University of China, Beijing, 100872; 2. China Ship Research and Development Academy,Beijing,100101)
Abstract: As a new information normality and technical environment, big data brings many new opportunities and challenges to the development of archival work and the theoretical study of archival science. Based on the summary and review of relevant research and from the perspective of practical requirements environment,this paper discusses the impact of big data on archival work practice, archival theory innovation and talent selection, and proposes the research progress of archives science in China under the big data environment:promote the rise of archival data science research, cultivate archival data thinking and data literacy, comprehensively expand the capacity of archive data management.
Keywords: Archive Data; Archival Data Science; Data Management; Data Accomplishment
1引言
“大数据”是互联网信息技术高速发展的产物,其概念的提出者麦肯锡给出的定义是“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合”[1]。大数据具有规模海量、高速流转、类型多样和价值密度低四大主要特征,其影响力已经渗透到社会发展的各个领域,档案学也不例外。具有复杂关联关系的大数据集合以数据湖、数据球、数据大脑等形式呈现,用于智慧城市建构。智慧档案馆的大数据挖掘分析技术的日益发展,对当前和未来“档案”的管理提出不同以往的冲击性甚至颠覆性需求。笔者在相关调研的过程中,惊叹实践环境下大数据发展对档案学工作深刻影响的同时,也深刻认识到档案大数据理论研究在一定程度上面临着滞后于实践发展需求的尴尬困境。本文拟从实践需求环境的视角分析大数据对档案学发展的影响和要求,提出探讨性的发展思路。
2研究总结与回顾
大数据对档案学的学术理论研究和社会实践应用都产生了广泛而深刻的影响。2016年國家档案局印发《全国档案事业发展“十三五”规划纲要》,在“加快档案管理信息化进程”模块中明确指出,探索电子档案与大数据行动的融合,制定档案数据开放计划。笔者于2018年5月10日在中国知网文献数据库以“档案学”并含“大数据”进行“主题”模糊检索,经二次筛选共获得46篇有效文献。
通过内容分析后发现,学者们逐渐关注到大数据对现有档案理论的冲击与挑战,激发档案理论的变革,就“大数据是不是档案”[2][3“]大数据触发新的档案管理理论”[4][5]等问题进行深入探讨。此外,学者们更关注到大数据对档案工作管理实践带来的深刻影响,认识到大数据对档案数据资源的收集、整合、管理、开发利用带来重大机遇与挑战。大数据不仅影响档案数据资源建设的结构与内容,扩大档案收集范围,容纳多样性数据类型[6],而且推动档案数据资源整合与服务面临着新思维、新方式、新资源、新基础设施、新能力和新权力[7]。以数据质量管理、可视化分析、语义引擎、数据挖掘、趋势预测为代表的大数据分析方法与技术工具,可以帮助企业从档案数据中发现规律和问题,推动企业科学决策与技术创新[8]。同时,数据分析和数据挖掘等技术的使用,能够推动智慧档案馆的建设与应用,实现档案数据资源的全面感知、综合处置、业务协同、泛在服务[9]。此外,大数据极大地推动档案数据化,但如何保证档案数据资源的真实、可靠、完整、可用成为档案工作管理实践面临的重大挑战[10],更对档案工作者的素质与技能提出更高的要求。总之,大数据对于档案数据资源管理的理论与实践都形成巨大冲击,有学者甚至展望,未来我国档案大数据将朝着基于大数据观的档案管理理论形成、基于大数据技术的档案管理技术拓展、基于大数据思维的档案管理方法创新的方向发展[11]。本文认为,学者们在档案学与大数据领域交叉研究的成果已然构成“档案数据学”的研究表征,在档案数据管理思维、数据素养和档案数据管理能力方面的研究还需进一步深化。
3实践视角下大数据对档案学发展的影响
3.1大数据影响档案信息的组织和管理方式
受互联网、云计算、人工智能等新技术的影响,“许多行业的业务形态开始发生巨大变化,数据驱动、模型驱动的业务系统越来越多”[12],电子文件单轨制运行趋势日益加强。相比起将传统纸质档案数字化的成果而言,业务系统中生成的原生数字态信息,规模更加庞大而且不可阻挡,由此对文件、档案带来的最大的变化是档案信息的动态性、多样性空前增强,而高价值、低密度化日益显著。大量档案信息以结构化、半结构化和非结构化数据的形式存在于实时更新动态的业务系统中,通过数据库技术、云计算平台等紧密联结在一起,成为业务活动正常运行的“燃料库”和大数据中心信息资源库的数据来源。
档案信息组织方式发生巨大变化的同时,档案信息的管理方式也正悄然发生着深刻变革。尤其是“国家大数据发展战略和互联网+行动计划的推进,深刻影响了档案工作的理念、技术、方法及模式”[13]。传统载体环境中的档案管理通常以“收集、整理、鉴定、保管、编目与检索、编辑与研究、统计和利用服务”八大环节为主要内容,管理环节从文件办理完毕归档后才正式开始,管理的技术思路比较清晰。而数字环境中以单轨制运行的电子文件则是在动态的业务系统中生成,从系统设计开始到文件运转的整个过程都要考虑到文件管理的需求,文档管理需要尽可能地实现“前端控制”和“全程管理”。面对以数据为主要形式的电子文件的归档,要对分散于系统不同物理位置的数据信息以单项业务活动为核心重新组织和捕获,基于技术手段对文件的真实性、完整性、安全性和可用性进行检测,并建设安全可靠的电子文件长期保存系统对其进行长期保存和数据信息的分析开发利用。例如,浙江省档案局对浙江省统一政务云平台上形成的网上行政审批数据,采取电子化实时归档方案,以业务事项为核心,将相关的行政审批类数据打包成存档数据包进行归档。2017年10月,杭州市还成立了大数据资源管理局,负责对分散在各个机构不同业务系统中生成的数据进行集中管理和挖掘[14]。青岛市近年来发展“智慧档案馆”,对档案数据采取智慧管理和应用的方式[15],对档案数据利用控制中心、魔方适配器、主动捕获引擎、嵌入式工具集和资源池的数据魔方式等技术进行智慧收集,并采用OCR识别、知识管理等技术对档案内容进行智慧管理,在档案馆的智慧服务方面取得了较大成效。
由此可见,大数据影响下的档案信息以数据形式存在更加普遍,而管理方式上虽然尚缺乏统一的标准和模式,但是各实践部门也基于机构实际情况纷纷进行探索,在数据挖掘、知识管理、智能服务等方面取得显著成果。
3.2大数据影响档案事业发展的理论需求
大数据影响下的档案信息存在形式和管理方式发生变化的同时也带来新的理论需求,即对电子档案数据管理、档案数据信息助力政府治理以及档案社会化服务等方面体现了更高的理论需求。2015年8月,国务院印发《促进大数据发展行动纲要》,指出“大数据成为提升政府治理能力的新途径”[16],大数据因其在揭示数据之间复杂的关联关系、数据共用共享和数据资源整合以挖掘更深刻的数据价值等方面的特有优势,对于解决复杂社会问题具有较强应用性,“用數据说话、用数据决策、用数据管理、用数据创新”成为大数据时代政府治理的必然选择。而档案数据资源正是重要的政府数据信息的组成部分。国家档案局在2016年印发的《全国档案事业发展“十三五”规划纲要》也明确指出,要“探索电子档案与大数据行动的融合”,“加快提升电子档案管理水平”,“建立开放档案信息资源社会化共享服务平台,制定档案数据开放计划,落实数据开放与维护的责任”[17]。
大数据实践发展和国家政策的指引对于档案理论建设新变革的要求迫在眉睫,档案学界也已引起高度重视,这也是近几年“档案与大数据”研究热度不减的原因。近年来,受到后保管主义和文件连续体理论的影响,我国的档案学研究在电子文件管理层面已经取得较大进展,在电子文件管理系统ERMS建设、电子文件与电子档案管理规范、数字档案馆建设方面取得丰硕成果,并推进《电子文件管理系统通用功能要求》《电子文件管理系统建设指南》《数字档案馆建设指南》《电子文件归档与电子档案管理规范》等国家标准的制定。但是,大数据、云计算和互联网+的快速推进,又给档案学的研究提出了新的难题:大规模数据态的档案信息蜂拥而至,档案学研究者面临着如何收集和管理业务系统中高速运转的大量数据信息、如何长期保存单轨制形势下电子档案信息、如何开展档案数据信息开发、如何使档案数据更有效地助力政府治理和社会服务,这都是亟待进一步研究和解决的理论问题。
3.3大数据影响档案人才选用和储备
以数据为核心的档案信息管理不同于传统载体时代以载体为中心的管理方式,大数据、云计算等新技术环境下产生的数据态档案对象,“各系统的运转、接收、输入、中间办理等都是以数据交互方式进行,数据态管理空间的主要管理对象为数据、规则、模型与本体等类型”[18],这对于档案工作者的能力和素养就提出更高要求。新形势下,档案工作人员不仅仅要具备基本的档案管理理论知识和相对娴熟的计算机、网络操作技能,还须具备一定的档案数据思维和数据素养。只有系统掌握数据与档案之间的共通关系,掌握数据获取、分析、组织、保存和再利用的基本技能,理解大数据在当前社会环境下所发挥的重要作用,才能更好地胜任以数据为核心的档案工作。
与此同时,大数据环境下的档案学科研究人员,尤其是档案信息化和电子文件档案管理研究方向的研究人员,同样需储备一定的数据素养。如果对数据的形成过程、运行形式、获取方式、保存和利用方式、数据关联后产生的效应等缺乏深度的了解,便无法从数据生命周期管理角度去审视“档案”管理,也难以从数据角度去衡量“档案”价值,更难以提出可以指导实践的档案数据管理层面理论,也难以培养出具备数据素养的档案专业人才。档案越来越多地以“数据”形式汹涌而来,实践部门的步伐已经紧紧跟进大数据的发展速度,而档案专业人员无论是在实践还是研究层面,都受到一定的挑战,培养和储备适应大数据环境的档案专业复合型人才成为档案学发展的应有之义。
4大数据影响下的档案学发展趋势
4.1档案数据学应运而生
大数据以惊人的速度进入我们的生活,也进入到档案事业的方方面面。正如前文所述,在实践环境中档案正以“数据”的形式越来越普遍存在,关注档案的数据形式和管理思维的研究成果日益增多。学者们多立足于档案工作实践和档案事业发展的视角研究大数据,档案数据学应运而生。本文认为,“档案数据学”是大数据环境下以档案数据概念、数据形式、数据思维、数据管理、数据信息开发等为主要研究内容的档案学研究方向,一定程度上已建立雏形,在核心学者的引领下将继续发展和推进。已有的研究成果中,或从档案与数据的关系,探讨“档案数据”的概念[19];或从技术变迁对档案对象管理空间的角度,提出档案对象从数字态到数据态的变化趋势,提出档案“数据化”的理念[20];或从大数据政策背景下的电子文件归档角度引出“数据归档”的概念,探讨档案数据体认知、鉴定方法论、体制回应、系统和技术回应的方案[21];或从数据素养的培养角度探讨档案学专业教育的内容体系完善[22]。这些研究都体现了受到大数据实践环境影响下的学者们对档案学发展的认识与反思,体现“档案数据学”研究的多角度思维。
如今档案事业发展对档案理论的需求正在发生着日新月异的变化。对于大数据是否为“档案”的命题,笔者同意何嘉荪等学者的观点,认为存储于电脑网络云端的“数据”,只要具备原始记录性和不可逆的特征,能够反映业务活动的过程和痕迹,并且具有保存价值,就当属于“档案”的范畴,并且理应纳入档案数据学研究框架之内。大数据时代的档案学理论研究,需在传统基础理论研究框架之外,兼顾档案事业发展的新理论需求,关注大数据相关学科的成果、动向,加强研究者对实践领域的及时追踪,及时总结分析大数据对档案、档案工作、档案事业的影响,发现技术变革给管理带来的需求和问题,以及随之而生的各种社会现象。对“数据”本身的研究并不是目的,厘清“数据”与“档案”的关系,界定“档案数据”的边界,明确档案人员在“大数据信息管理”中的角色定位和工作能力要求,建设科学合理的档案数据“收”“管”“存”“用”理论和档案数据信息开发开放理论,探索依托档案数据的政府治理策略等议题,逐渐成为研究者关注内容,档案数据学的产生和发展正是适应这一形势的客观选择,档案数据学应运而生。
4.2建立培育档案数据思维与数据素养
为适应大数据对档案事业发展的实践影响,需尽快建立档案数据思维和培育数据素养。档案数据思维是从档案学的角度审视数据,建立对档案数据的认知和鉴别力;数据素养是涵盖数据态度、数据意识、数据知识、数据技能、数据文化、数据伦理等在内的综合素养[23]。档案数据思维和数据素养的建立和培育,应通过理论培养和实践操作相结合而实现。
一方面,需要通过相关数据科学的课程,培养档案专业学生的数据思维和数据素养,提高其对大数据技术和环境的认知。iSchool联盟的38所院校的图书情报和档案相关专业均开设相关的数据科学课程,部分院校还建立“数据科学”专业,课程内容主要涉及数据意识、数据能力和数据伦理几个层面。数据意识包括数据价值意识、数据安全意识、数据共享思维、数据批判思维;数据能力包括数据发现和获取、数据管理、数据描述与元数据、数据评估、数据分析、数据挖掘和数据再利用等能力;数据伦理包括数据隐私、数据交流规则、数据信任、合法合理使用数据等内容[24]。而从目前我国的档案学专业的课程设置来看,基本上尚未将“数据素养”课程纳入到教育体系中来,但是在研究中已经认识到数据素养对档案学教育的重要性。因此,在今后的档案学教育内容完善过程中,应将“数据素养”培养纳入教育内容体系中,基于档案和数据的关系开设相关课程,培养具备“数据素养”的专业性技术人才。另一方面,档案数据思维和数据素养的培育需要通过一定的实践性学习和操作,熟悉档案数据在实践部门如何产生、运转、收集、管理和挖掘,并且实际尝试参与档案数据信息管理和内容开发的工作,在实践中加强自身的数据素养和能力。
4.3全面拓展档案数据管理能力
大数据影响下的档案学研究内容重心从档案形式管理向档案内容信息管理和开发转向,档案数据的管理能力亟须不断增强。现阶段档案数据管理范畴主要是以档案馆的数字化成果作为档案数据管理和开发内容,将来档案数据管理范畴应不断拓展,譬如将更加关注對存储于机构内部和业务系统阶段中的“未来档案数据”的管理。为适应新形势,档案人才培养也要由传统的理论型和“档案保管员”培养模式向“技术+管理”复合型人才培养模式转向。
以数据驱动为动力的业务系统的大规模建设,带来的主要变化是信息以分散而复杂关联数据集合的状态在系统中大量存在。对与同一业务活动相关的档案信息,无法以传统“载体”收集和整合的方式而聚集管理,大量数据库的存在使得信息不再以传统概念“文件”的形式存在,而是更加分散化、复杂化,对其进行“档案化”管理需要更新理论和实践方案。在档案价值实现方面,依托大量业务活动“档案数据”信息内容,以“数据”为核心的档案集合,可以直接为大数据中心提供资源,作用于政府治理和相关活动中,杭州市数据资源局的大数据归集行动和数据大脑等对档案部门的实践工作具有新的启发和思考。浙江省档案局在将浙江省政务云平台上的网上行政审批类电子文件实时归档之后,通过数字档案馆系统直接向浙江省的大数据中心提供档案信息资源的共享,并服务于“台前”的行政审批服务工作。青岛市档案馆对档案内容进行智慧管理,采取数据模型分析、数据挖掘、数据检索、语义分析、聚类分类等技术,实现对档案内容的充分挖掘和整合利用。简而言之,大数据通过知识关联和数据挖掘等技术所呈现出的巨大价值和满足用户高层次、个性化需求的便捷程度令人惊叹,档案工作的实践也逐渐朝着数据化管理和信息开发的方向转化。与此同时,档案学人才培养在一定的程度上也需进行积极的调适与侧重,通过建立档案数据思维和培育数据素养,加强培养“懂技术”的管理型人才,以期更加专注档案信息的内容管理和开发能力,全面加强档案数据管理能力,适应新形势下档案工作的需要。
参考文献
[1]大数据时代要有大数据思维—热点—@大数据资讯[EB/OL].[2018-05-11].http://www.thebigdata.cn/html/c3/14416. html.
[2][10][19]于英香.檔案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.
[3]何嘉荪,张淑霞.大数据引发的思考——哲学界相关讨论的启示[J].浙江档案,2017(6):8-11.
[4]张芳霖,唐霜.大数据影响下档案学发展趋势的思考[J].北京档案,2014(9):9-13.
[5]于英香.大数据视域下档案数据管理研究的兴起:概念、缘由与发展[J].档案学研究,2018(1):44-48.
[6]叶茹雨.多学科视角下的档案学理论研究进展(之六)——信息技术视角[J].山西档案,2017(2):19-29.
[7]安小米,宋懿,等.大数据时代数字档案资源整台与服务的机遇与挑战[J].档案学通讯,2017(6):57-62.
[8]王毅,李晶伟.大数据分析方法在企业档案管理中的应用[J].档案管理,2017(1):57-59.
[9][15]王金玲.档案数据的智慧管理与应用研究[J].中国档案,2018(4):61-63.
[11]周耀林,常大伟.我国档案大数据研究的现状分析与趋势探讨[J].档案学研究,2017(3):34-40.
[12][18][20]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2):11-12.
[13][17]国家档案局印发《全国档案事业发展“十三五”规划纲要》[EB/OL].[2018- 05- 12].http://www.saac.gov.cn/news/ 2016-04/07/content_136280.htm.
[14]中国杭州市数据资源局.基本信息[EB/OL].[2018-05-12].http://www.hangzhou.gov.cn/col/col1390103/index.html.
[16]国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2018-05-12].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[21]刘越男.大数据政策背景下政务文件归档面临的挑战[J].档案学研究,2018(2):107.
[22][23]归吉官.基于档案学专业教育的数据素养教育内容体系建设[J].档案学通讯,2018(2):77,78.
[24]司莉,姚瑞妃.图书情报专业研究生数据素养课程设置及特征分析——基于iSchool联盟院校的调查[J].图书与情报, 2018(1):28-36.