文/武汉工程大学法商学院 彭明威
大数据时代档案管理工作研究
文/武汉工程大学法商学院 彭明威
随着大数据、移动互联网、云计算、物联网等技术的高速发展和广泛应用,人类社会已悄然从“IT时代”跨入“DT时代”。“数据”是“DT时代”的命脉,数据终极的意义在于预测未来,使档案工作深受大数据的洗礼,促进我国档案管理工作的改革与创新。
大数据;档案管理;档案工作;大数据时代
如今,大数据对经济、社会、文化等各个领域带来了巨大的挑战和前所未有的机遇,档案工作不可避免地因为大数据时代的来临而发生深刻的变化和发展。大数据时代档案管理是档案工作者面临的新课题,档案工作人员应顺势而为,借势而上,努力变革管理方法和创新管理理念,重新回到正轨上来。
(一)重构档案管理业务流程。我国档案界长期以来将档案管理业务分为“六个环节”或者“八个环节”,具体为收集、整理、鉴定、保管、登记和统计、利用。因为各个环节之间涉及不同的开发利用主体,客体的价值也在时间的演变过程中和社会不断进步中变化,无法主动、系统、全面、综合地对档案进行有效管理,档案本身处于相对静止、被动地位。不能对档案进行有效的管理。而且,目前来讲电子文件已经在档案份额中占较大比重,电子文件尤其是核心数据元数据在形成、整理、归档、移交和长期保存过程中产生的数据量接近EB级别。元数据及其结构、来源、内容描述、形式特征、权限管理、存储位置、电子属性、数字化属性、电子签名等在大数据时代下都能一一对应、一一展现、全程可追溯,全程可管理,全程可监控。档案全程管理才得以实现。
(二)实现档案知识管理模式。知识管理是档案管理的发展趋势和未来走向,随着时代的发展和社会的进步,同时档案用户信息素质的提高,传统意义上简单数据和文件的提供和推荐,已经不能满足当今知识经济时代需要。档案用户对显性知识的吸收更激发了对隐性知识的渴望和追求。因此,档案利用服务也应从提供粗浅、原始的数据或文件向提供精细、复杂的知识转变。早在1994年,特里·库克就提出,档案工作者应该从实体保管者向知识提供者过渡。然而,知识不是凭空产生的,也不是对原始数据的简单聚合,而是对档案数据的挖掘、清洗、创新才能有效展示。才能实现“以知识管理为导向的档案管理”与“以档案管理为基础的知识管理”的目标。
(三)开启智能档案服务时代。大数据和云计算的完美结合,使档案馆(室)建立统一的未来语义网成为可能,它不是一个众多网页的链接集合体,而是一个全球性档案数据库,全球档案数据将数数(开放数据)相连。这将会扩展传统档案数据的边界,填平以往存在的数字鸿沟,开创智能档案大服务时代。数据终极的意义在于预测未来,现代管理学之父德鲁克认为,预测未来最好的方法,就是去创造未来。在大数据时代,数据挖掘包括两个维度,描述性分析和预测性分析。描述性分析是针对档案原始数据,揭示普遍性的规律。这是档案服务精准化的前提和基础;预测性分析是面对用户未来需求,预测未来的趋势。这是智能档案大服务的根本和核心。通过大数据的整合、挖掘、创新、过滤,使档案“死”的数据变成“活”的知识;使档案馆(室)从纯粹获取档案信息资源的物理空间场所变成集成获得档案智能服务的知识文化中心;进而极大地满足档案用户的“档案权力”,使档案馆(室)档案服务更民主、更科学、更智能。
(一)数据安全缺乏有效保障。隐私不仅仅在观念和技术层面上,同时涉及法律问题。大数据平台的巨大开放性,给档案数据的完整性、有用性和系统性带来了挑战,传统的安全工具和技术不再像以前那么有用,对现行档案信息数据的安全保护存在很大的技术难度,档案信息安全面临着巨大威胁。在大数据时代,数据来源范围广,计算机内的每一个数据、每一片字节,都构成了档案单元信息的基本要素。大量数据汇集加大了信息泄露的风险,而且目前对敏感数据的使用权和所有权没有明确界定,很多基于大数据的分析都未考虑到保密和隐私的问题,档案在信息界独有的凭证价值作用,使得其安全保密要求更高。因此,对档案中的敏感信息进行分析时,特别需要解决如何做到对信息保密、如何防止数据被恶意使用等问题,但大数据环境的开放性,使拥有海量数据与潜在价值的大数据档案更加容易吸引攻击者的攻击。
(二)数据处理难以卓有成效。大数据时代下无论传统文献还是电子数据显著特点就是海量,并且其数据呈几何式泛滥,信息呈指数式增长,知识呈爆发式增加,因此存储数据将是数据管理的重大问题。大数据环境下,数据类型的复杂多样给档案管理工作带来巨大的挑战,占到数据总量80%以上的非结构化数据,数据格式不兼容,档案管理人员进行提取分析和
应用实践等都存在困难,其存储更是带来新的安全问题。因当前非结构化数据存储并不能够有效地沿用具有严格访问控制与隐私管理的结构化数据存储模式,而相适应的非结构化数据存储模式在技术上还不成熟,尽管从传统数据存储中非结构化数据软件能够获得经验,但非结构化数据服务软件没有内置足够的安全措施,而且使用的最新代码也不完善,所以非结构化数据存在着多种漏洞。因此,需要内建相关的安全因素在客户端应用程序中,可这样又反而导致身份验证和授权过程和输入验证等各种安全问题的产生。
(三)大数据档案人才匮乏。只有通过深度解析档案大数据,将繁杂、海量、沉睡的档案数据序化、激活,进而才能达到档案管理为基础的知识管理的目标。可以帮助档案馆(室)提供精确化服务、精准化运维,大大降低档案馆(室)运营成本,大数据的巨大作用开始凸显。现行的档案馆(室)的全流程的收集、整理、加工、优化、脱敏都基于大数据的精准分析,拥有档案专业知识、互联网技术、大数据理念的复合型人才能胜任。尽管数字化、电子化档案发展势头迅猛,但是大数据人才发展相对比较滞后。大数据档案人才是跨多个专业层次、多个学科领域的复合型跨界人才,既要了解计算机网络通信技术,又要掌握解构中英文的能力,还需要拥有建立多维度模型框架的能力,同时具有对档案数据趋势的敏感性和对用户档案需求的前瞻性。而且随着数据标准化工作日益完善,种类众多、类型多样、载体形态复杂的档案会大幅增加,知识型档案需求大量涌现都对档案管理人员的个人能力等提出了更高的要求。鉴于此,大数据档案人才在某种程度出现断档和缺乏。
(一)多层面保证数据安全。开发利用档案资源和保守档案机密,是党和国家赋予档案部门的两个不同方面的重要职能。
大数据技术与信息安全技术的对接。当今信息安全领域广泛应用的匿名技术。随着大数据预测技术的发展,要不断更新维护且研究更精确的计算方法完善匿名技术,才能解决大数据时代档案用户信息隐私问题(大数据技术要与信息安全技术实现无缝对接,利用大数据技术的优势发现各种信息系统中存在的信息风险与漏洞。尽早查杀恶意病毒软件,防止档案用户隐私信息因为系统安全问题遭到泄露。最后,政府应该加大对数字隐私权基础设施建设的投入。相应立法也应同步跟进,这样才能形成良好的信息环境。
大数据时代档案数据资源的保护仅仅依靠单纯的技术手段是不够的,唯有从多个层面协同起来保证数据安全,首先,应该发挥法律在保护档案数据和隐私的基础作用。其次,在日常的处理大数据的操作流程中,建立档案安全管理制度规范及安全管理培训机制。最后,也是重中之重,提升档案管理人员的安全意识和安全观念,加强档案管理人员数据安全处理能力。
(二)云计算与大数据深度融合。根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘),而这个数值还在以每两年翻一番的速度增长,预计到2020
年全球将总共拥有35ZB的数据量,增长近20倍。大数据时代已经到来,因此未来档案信息处理技术的发展也要充分结合大数据时代发展变化,传统文献的电子化数据及数字化档案文献必须脱离于实体存储设备,通过云计算技术的发展,形成云计算机网络,使大数据的信息处理不再依赖于硬件设备,通过上云端就可以实时处理。此外,在大数据时代下,计算机与网络的深度融合一体化将是一个必然的发展趋势,当计算机和档案信息网络融合成为一个整体的大数据网络平台时,对档案数据的处理也将不再是以零散、单个的方式进行,而是以规模化方式进行。未来将转变为以大数据云端为中心,这也将极大提高未来计算机信息处理技术的响应速度和处理精度,使计算机信息处理技术变得更加高效和精准,进而更有力地推动档案大数据的发展。(三)创新档案人才培养机制。以大数据时代、知识经济的社会需求为导向,以档案工作发展为依托,笔者认为,大数据档案人才的要义是以档案学专业为基础,以扩展档案人才知识结构为重点,以良好的综合能力为标准,构建大数据时代档案管理的复合型人才。国家应从顶层设计上把大数据档案人才培养纳入档案人力资源开发的整体规划中来,必须在战略层面对档案专业人才的架构进行创新性变革,在各大高校组织上统筹科学安排;高校应结合自身优势和特点来科学设定培养目标,创新档案人才培养方案,精选合作教育实践平台,开创多元化、特色化教授实践新格局;档案管理人才(高校档案专业学生和档案事业工作者)需要积极夯实理论基础,广泛涉猎多个学科(管理学、社会学、计算机科学、心理学)领域知识,努力培养创新思维模式,持续获取信息创新素质,建立档案管理核心竞争力。
大数据时代的洪流滚滚而来,档案工作也必须与时俱进,创变求新。大数据技术应用于档案工作,必将唤醒、激活档案大数据价值,实现档案管理从数据管理到知识管理的转变,开创档案工作知识管理时代。
[1]徐拥军.传统档案服务向知识服务过度研究[J]北京档案,2009(04):16-18.
[2]曹芳.近十年来我国电子文件研究论文的统计与分析[J].档案学研究,2003(04):45-49.
[3]李雄.新网络条件下的数据安全新问题[J].信息通信技术,2015(01):39-43.
[4]陆天波.基于互联网的匿名技术研究[J].计算机科学与探索,2009(3):1-17.
[5]2011年全球数据总量1.8ZB 当"大数据"来敲门[DB/OL].
h t t p://n e w s.x i n h u a n e t.c o m/t e c h/2 0 1 2-12/24/c_124136973.htm 2012-12.
[6]朱建邦.论高层次档案人才的培养与开发[J].北京档案,2014(01):21-22.