吴东婷
(中国航空发动机研究院,北京 101304)
随着科学技术的深入发展,大数据技术打开了时代的新篇章,得到了全世界研究人员的重视。大数据概念于2008年提出,研究人员还对大数据的相关技术进行了长时间的调查研究。大数据主要是收集数据和关联数据,最为显著的优点便在于量大、高速、多变,能够存储海量数据、分析海量数据。大数据技术的研制对我国社会、经济的发展都有着十分重要的影响,对各行各业的发展都是一场重大变革。
大数据技术的运用能够科学合理地解决人们的难题,为其提供新的思想方法,当前大数据的“预测”思想已经成为一种新型的社会现象,能够在潜移默化中对人们的思维方式和生活方式带来翻天覆地的变化。档案作为人们社会活动中形成的具备保存价值的原始记录,必然会呈现出大数据时代的新特点。
在大数据时代背景下,我国的档案数字资源建设可以将其分为两个部分,一种是增量档案电子化,另一种是存量档案电子化。根据国家档案局的资料调查显示,我国企事业单位、各级档案馆均有着丰富的馆藏档案资源,而在数字化时代下可以将档案资源转变为档案数字资源。电子档案数量大幅度增长,这是因为电子档案的储存包括了电子文件、声像、图标、数据库等,同时也涵盖了纸质档案时代的原始记录,例如浏览轨迹、日志等。众所周知,大数据技术的运用能够深入挖掘人们未能发现的潜在价值的档案信息,所以需要重新鉴定数据的档案属性,在档案领域中增添海量数据[1]。
在大数据时代背景下,人们对于各个领域的探索逐渐加深,对于探索中数据的保存能力也得到了增强,档案的来源也将愈加丰富,移动终端的运用更是展示了数据产生的多样化特点。由此可见,在大数据时代中所产生的档案数字资源将存放于不同的信息系统中,展示结构化信息、半结构化信息、非结构化信息相融合的发展趋势,产生大量的异构数据。
在大数据时代背景下,面对着大量的数据来源,信息的价值密度逐渐下降,人们对于外部世界的了解需要通过更加详细准确的信息数据来加深认知,从而进行合理的决策判断。而档案作为人们快速了解世界的重要工具,是人类社会极为重要的本源信息,在面对人们的需求时能够充分发挥自身的优势,也就是网络信息资源无法比拟的真实性、可靠性、权威性。因此,在大数据环境中,人们越来越重视档案的价值,以及档案在人类社会发挥的作用。
不管是数字形式的数字档案信息,还是由传统载体档案信息转变成的数字档案信息,其数字格式和检索工具都不一致。例如,文本格式有TXT、PDF、DOC,而检索工具也分为全文检索、目录检索、主体检索等[2]。所以不能够使用统一信息平台的管理系统来管理和利用数字档案信息。
大数据时代是一个信息化、知识化的时代,随着信息技术的创新升级,档案数字资源的来源结构也产生了巨大改变,使用传统的数据挖掘算法对于非结构化数据进行分析是存在很大的局限性的。在大量的档案数字资源中要想获得有价值的信息,就需要关注档案数字资源中的数据关系与语义表征,实现信息整合和知识整合。但是当前档案数字资源整合还只是在数据整合的阶段,只能够为用户提供信息检索的服务,还未能满足大数据时代的发展要求。
在大数据技术的创新发展中,数据信息已经呈现“爆炸”发展的形势,档案信息是以认真严谨的态度来保存国家和社会个人的发展和经历的真实的历史记录。档案数据信息与其他资源不同的是档案数字信息包含了大量的重要机密信息,同时还存储着每一个人的个人隐私、工作信息等资料,与国家民生的发展息息相关。在大数据时代背景下在,怎样更好地划分档案数据信息敏感资料的使用权和所有权?怎样的安全防护措施才可以满足数据信息非线性增长的需求?怎样的方法才可以科学有效的处理大数据信息资源分布式造成的隐私泄露风险?这些问题都是大数据时代档案数字资源整合的难点[3]。
在大数据时代背景下,档案数字资源管理不再是传统的管理模式,对于档案管理人员也有了更加严格的要求。档案管理人员需要全面掌握数字档案资源的分类存储和整理工作,通过科学合理的关联,进一步抓取有用的信息。因此,档案数字资源整合需要有具备档案管理专业知识和数据分析能力、处理能力的复合型人才来担任该项工作,目前档案管理部门正缺少这类复合型人才,也是制约档案数字资源整合的因素之一。
在大数据时代,由于档案数字资源具备数据量大、飞速增长、分布广泛、多源异构、真实可靠、价值重大等特征,这给档案管理人员开展档案数字资源整合工作带来了挑战。因此,档案管理人员需要针对档案数字资源整合难点,进行分析研究,积极探索找出科学合理的解决对策。
大数据技术正在飞速发展,同时也给档案数据信息给予了新的定义,要想整合档案数据信息资源,就需要保证档案数数字信息的质量和数量,需要创新档案管理工作人员的档案资源管理意识和理念。在大数据技术的引领下以正确的工作态度来增强档案管理人员的法律意识,创新发展观念。运用大数据技术来实现数据信息的集成服务,并根据数据信息挖掘等技术来进行档案信息资源的定向服务。此外,在档案数字资源整合管理中,需要按照用户的真实需求为其提供学术信息资料,有利于档案用户创设资源数据库列表以及个人数据信息电子列表等功能。对于档案数据信息的组成结构和存储模式进行重新审视,转变传统的存储模式,强化对档案信息资源潜在价值信息的关注。
从技术角度来考虑大数据时代档案数字资源整合,其重点在于通过云计算技术和大数据处理工具等手段建立档案数字资源分析系统。云计算能够满足大数据分布式的存储和大量数据处理的需求,促进档案信息资源实现服务化。同时云计算可以将业务逻辑、组织结构、表达方式进行统一,从而建立集成的档案数字资源管理平台,实现档案数字资源整合和知识开发[4]。此外,云计算能够整合档案应用,通过服务的方式向用户进行发布,还可以帮助用户通过移动终端设备来进行云服务。
现如今档案数据信息多元化已经成了现实,要有效地整合档案数字信息资源,就需要用户和管理者的共同努力,创设服务需求的大数据档案资源整合标准体系结构,实现不同模式信息的有效整合。此外,在档案数据信息的管理中需要建设档案数字资源整合安全保障体系,通过设置身份、访问管理系统,认证用户的身份信息,对其设置访问权限,以此达到使用人员安全集成的目标,在档案数字信息资源和大数据技术的结合中控制好安全风险。在安全保障体系的建设中还可以选择数据加密技术来提升档案数字资源的安全度,通过加密环节在数据库中的每一个位置节点加强保护。不仅如此,还需要根据大数据技术和安全信息防护方式,来管理和监督档案数据信息资源,通过行之有效的手段措施来保证档案数据信息资源的安全性,防止泄露风险。
档案管理工作的核心在于“人”,通过建设档案工作人员队伍,来增强档案工作人员的综合素质,打造一支既熟悉档案业务,又具备信息化技术技能复合型人才队伍,这样档案管理部门才能够快速适应大数据时代背景下数字化制造提出的严格要求。作为档案管理部门中档案管理的工作人员首先需要转变工作观念,提升自身档案数字信息管理的专业素养和业务技能,全面掌握数据整理和分析、计算机、网络等专业知识,强化数据管理的知识发现能力,在处理庞大的档案数字资源时,需要善于运用自身的专业知识来获得有用知识并将其通过科学的手段提供给用户,以此满足用户多样化、个性化的档案信息需求。档案管理部门可以通过开展专业培训,如档案业务研讨会、专题培训和专题调研等方式让档案管理人员尽快掌握专业能力。此外,还可以建立人才引进和管理制度,吸引更多的信息技术、网络技术等人才,通过设置考核机制和奖励机制来促进档案管理人员队伍多元化发展[5]。
总而言之,档案数字资源整合是大数据时代档案事业发展的重要的一项环节,同时也是档案部门转变管理模式、提升业务技能的一步。所以档案管理部门管理人员除了档案业务知识外,还需掌握云计算技术、大数据处理技术等先进信息技术,深入研究探索档案数字资源整合在其他领域的运用,从而探究大数据时代档案数字资源整合的理论体系和措施,促进档案服务理念的创新发展和服务方式的转变升级。