档案数据挖掘中数据采集与准备问题浅析

2012-04-29 00:44王静辛玉明高鸿雁
现代情报 2012年6期
关键词:数据预处理数字档案馆数据采集

王静 辛玉明 高鸿雁

〔摘 要〕数据挖掘技术可以帮助人们在海量的信息资源中提取隐含的、潜在的、有价值的信息,因此已经被引入到了处理爆炸式增长的档案信息资源中。而待挖掘的信息是否完整、规范直接关系到之后的挖掘质量。本文根据档案信息资源的现状以及档案数据的特性,在给出执行具体挖掘操作前的数据采集和数据预处理各个环节的概念描述的基础上,探讨各个环节的注意事项及具体实现方法。

〔关键词〕数字档案馆;数据挖掘;数据采集;数据预处理

DOI:10.3969/j.issn.1008-0821.2012.06.018

〔中图分类号〕G270保罚 〔文献标识码〕A 〔文章编号〕1008-0821(2012)06-0072-03

猜你喜欢
数据预处理数字档案馆数据采集
浅议企业数字档案馆建设
刍议电力系统规划设计在电力工程设计中的应用
台湾数位典藏计划对内地数字档案发展的启示
基于广播模式的数据实时采集与处理系统
通用Web表单数据采集系统的设计与实现
基于开源系统的综合业务数据采集系统的开发研究
慢性乙肝症状与生物信息相关性的数据挖掘研究
中医方剂数据库文本挖掘数据预处理的尝试
基于Enterprise Library的数字档案管理系统设计
国际数字档案馆元数据标准及其项目研究