大数据技术与档案数据挖掘

2018-09-25 10:23姜冬梅
赢未来 2018年2期
关键词:数据挖掘大数据

摘 要: 在信息化大数据时代,人们习惯了运用便捷直观的方式处理信息,传统的纸质档案的信息检索方法与处理技术显得非常的耗时费力,难以能满足人们运用档案信息的技术需求。立足互联网信息技术优势,开发档案信息的数据库,实现查阅档案的新信息技术化手段,在档案信息挖掘和大数据的创新应用方面,取得显著成效。本文分析了档案信息的大型数据库挖掘技术可行性,提出了积极地建议,展示了广阔的应用前景。

关键词: 大数据;档案数据;数据挖掘

1 大数据技术的概念。

人们利用信息技术建立资源庞大的信息库,形成较为丰富的大数据,以网站、网页和相关软件的方式,高密度汇集各个领域的数据信息,形成人们共享的信息资源,由于该数据库是众多信息资源的整合与收集得来的,故称为“大数据”,其实,就是信息资源库的一个称谓。

1.1 大数据的时代背景。

随着互联网信息技术的广泛应用,计算机、智能手机的普及,人们的生产生活的各个方面,几乎离不开数据信息的应用。因此,大数据的开发应用势在必行。大数据的建立,方便了人们的快速了解各类信息,提高了人们知识面,扩大了人们的认知范围和空间。

1.2 、大数据的内容。

大数据的主要内容就是对模块数据信息的有机整合,建立规范的数学模型,对原始数据信息进行分析、处理,是互联网计算机技术支持条件下的新兴的智能技术的应用形式和手段,为人们提供快捷便的信息服务软件设备。

1.3 大数据技术具有的的基本特征

一是信息容量十分庞大。每一个数据库都会有很多的信息模块,每一个模块又包含门类齐全的各种信息;利用芯片对庞大的信息群体集中整理和归类收集。二是信息的多样化。不同的网站、不同的行业都有不同门类的数据库,信息资源共享程度较大,呈现不同方面、不同门类多样化的的信息。三是应用价值很高。各种信息资源的共享,方便了人们的生活、工作和学习,应用价值性极高。

2 档案数据信息的挖掘技术

2.1 基本概念。

纸质或实物档案再利用过程中,信息检索非常麻烦,要根据需要信息的门类、条款,逐一检索,耗时、费力,还往往出错,影响工作效率。互联网计算机技术的广泛应用,为档案信息数据技术的开发创造了条件。档案数据信息挖掘技术,就是利用信息技术构建档案检索体系具体实践。

2.2 该技术的内容特点

档案从纸质文字和实物信息开发为规范的数据信息,其技术特点一是工程量大;二是开掘过程十分复杂;三是能够利用相关软件优化模型;四是能够对相关信息进行分析和处理;五是由于信息量过于庞大,细微的错误在所难免。

2.3 该技术的实践应用

档案数据信息开掘技术的实践应用,表现了信息技术很多优势,对档案资料的开发应用提供了新的平台。一是该技术根据不同用户的相关的不同需求收集和处理大量的信息,完善充实档案数据库,确保档案数据信息的个性化处理;二是实现了信息共享,不同用户、不同信息模块之间相互关联,信息共享。所有的档案信息都可以进行全网搜索。三是软件系统能够自动把相似信息实施归类汇总,汇集于一个信息模块,以方便人们利用档案过程中,效率更高,查阅检索更方便。

3 大数据条件下档案数据信息挖掘系统和挖掘技术

3.1 大数据库中档案数据信息挖掘系统

3.1.1 关联规则用于档案数据挖掘

关联规则就是在大量的信息中,把关联密度较大信息,进行有效组合,利用信息技术归类整理,突出特别的效果。在档案数据信息挖掘过程中,利用关联规则,主要就是把不同用戶信息实施整合处理,通过这些信息分析和预测用户的生活和工作的特征、状况。有效的辅助档案的运行和管理。其显著的技术优势,就是能够挖掘相关联的信息,满足客户的延伸需求。

3.1.2 分类信息化技术用于档案数据挖掘

进行档案数据的开发挖掘处理,也可以按照一定的标准对用户人群实施分类,参照不同人群不同的信息处理方法以及不同的检索条件,使用户分类更为细致。凭借更细的分类结果,更方便对各种不同信息的了解,明确不同用户间的相互关系,并进行合理的分组整合,创建信息索引条目,以辅助档案的利用。

3.1.3 分层聚类方法用于档案数据挖掘

在档案数据信息开掘过程中,用聚类分割的方法比较不同的档案数据信息处理程序,进行优化处理,完善需要的分类表,突出科学、高效的特点,这种技术方法可以说是最简便、最优化的技术措施,用于档案数据信息的开掘较为适合。

3.2 大数据库视角下的档案数据信息挖掘技术

3.2.1 库存管理技术。

一般的库存管理技术,在信息的综合运用上,有独特的优势,该技术应用于档案的管理数据信息的开掘中,适应了档案数据信息的实际开掘需要,该技术信息存储量极大,而且门类分工规范,信息模块既分割又关联,能独立运用,又能资源共享。

3.2.2 空间档案信息挖掘技术

这种技术是新兴的数据信息技术,目前,理论体系和应用体系尚不健全,属于实验应用阶段,从实际发展的状况来看,该技术用于农业、军事的档案资料数据化构建,有着广阔的发展前景。空间档案信息挖掘技术的应用在广泛程度上,现阶段与库存管理技术没有可比性,但从长远发展进行比较,前者的优势远远强于后者,开发空间和开发利用潜力相当大。尤其适用于档案数据开掘的需要。

结 语

信息化时代,大数据技术的广泛应用,创新拓展了人们的生活、生产和学习的空间,档案数据开掘就是一个具体的实践,需要人们在不断地研究探索中,进一步开发新的形式,使各类服务更人性化。

参考文献

[1]魏巍.基于大数据的档案数据深度挖掘的探索[J].黑龙江档案,2017,(06):66.

[2]吴晓文,孙杰,杨帆.大数据背景下海洋档案数据挖掘研究[J].办公室业务,2017,(19):186-187.

[3]张伟.档案大数据挖掘流程与技术研究[J].兰台世界,2017,(17):35-38.

[4]王春英.大数据技术在档案管理中的应用研究[J].黑龙江档案,2016,(02):48.

作者简历

姜冬梅(1973.01),女,汉族,山东省烟台市人,烟台市莱山区政务服务管理办公室科长,馆员,大学本科,研究方向为档案管理。

猜你喜欢
数据挖掘大数据
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究