张 伟
(吕梁教育学院,山西 吕梁 033000)
【教育管理】
高校档案管理中融入数据挖掘的实践研究
张 伟
(吕梁教育学院,山西 吕梁 033000)
高校档案管理工作涉及了学校中所有学生的基本信息,因此管理手段的选择与运用十分重要。传统的高校档案管理主要是人工管理,无法体现效率,为了真正体现高效管理工作的信息化,在档案管理工作中融合数据挖掘技术非常关键。文章中针对数据挖掘在高校档案管理中的应用与实践,提出了几点建议,希望能够对今后相关工作的开展提供支持。
高校;档案管理;数据挖掘;实践
近年来,信息技术在高校中逐渐得到应用,不管是教学部分还是管理部分,信息技术都发挥了非常重要的作用。然而对于高校档案管理工作而言,在网络信息数据库不断扩大的影响下,图书馆在既定时间内积攒了大量的数据,所以想要搜索指定信息就变得非常困难。为了快速获得有效信息,需要更加先进的信息数据检索方式,而数据挖掘的应用,便能够很好的实现这一目标,通过图书馆档案信息平台的建立,为师生提供多样化的档案信息。
这一功能是通过最为简单的语句以及语言描述指定对象的特点,其种类的划分是根据描述对象特点为前提实现[1]。定义主要是相同数据区的共有特征进行描述,然而分类的关键性主要体现在不同数据对象的划分。
这一点主要对不同信息变量中的潜在规律以及内部联系进行发现、处理,一般被划分为三个种类:时序关系、因果作用和简单关系。关系发现这一功能也被运用在购物篮、商务管理等层面,是诸多数据挖掘形式中最为常见的一种。
要实现信息数据的分类以及预估,需要在数据处理之前进行,构建合适的模型。分类则主要是针对散乱信息的估算而言,预估行为要对连续的信息进行估算。一般在分类时,所使用的方式比较多,其中最具代表性的有以下几种:贝叶斯公式、神经网络、遗传算法等,而预估技术使用最多的则是非线性回归以及线性回归技术。
高校中的档案管理工作最为基础的原则就是真实性,对于档案管理而言,所有材料必须要保证真实性,如此才能够切实反映图书馆的工作情况[2]。这也就需要对数据挖掘技术进行运用,从而提升档案管理的原始性,体现客观真实性。
对高校档案进行管理的过程,其本身体现了一定的系统性与完整性。建立信息管理平台,也需要从标引立卷、档案分类、文献加工等诸多环节体现完整性与系统性的基本原则。
在经济与科学技术逐渐发展的现在,高校档案管理中信息化技术的运用,难免会体现不安全性。但是通过数据挖掘技术,能够对用户权限审核、文档备份进行加密,以此为档案安全性提供保证,从而实现档案管理的稳定发展。
1.对设备档案进行分类
对设备档案进行分类,是将高校中所有固定资产以及低值易耗品相关档案进行分类,以横向为基准,各个种类的档案属性多有相似点,以纵向为基准,不同种类档案的属性也不尽相同[3]。通过数据挖掘技术的应用,能够使档案管理者快速找到需要的档案,并且对其进行分类。比如管理人员在运用数据挖掘技术时,可以将档案以属性类别为基础排序,以此提升档案管理者档案检索的效率。
2.档案搜集
首先,分析数据信息,根据已知数据集建模,针对所有需要测试的样本,通过已知以及预测分类进行对比,如果一个模型准确率已经得到认可,便可以使用这一模型分类未知对象。比如,档案管理人员统计高校所有在编教师对于计算机的应用情况,将数据统计结果输入数据库。在统计时,需要对姓名、性别、年龄、职称、所属学院、计算机领用时间与型号等。一旦教师的个人信息输入至数据库,那么该教师便会与其他新进教师档案进行匹配,从而实现所有新进教职工信息的分类。
3.档案保管
进行档案保管的核心是对档案进行保管的同时,避免档案流失。对于高校这一特殊主体,进行档案管理时,一些正常的手工纸质文件保管需要放置在通风好且干燥的环境进行保存,针对一些其他类型的档案,则需要在数据库内构建备份系统,并且为其提供网络保护支持,以免病毒入侵,对整个系统造成影响,使档案系统瘫痪。
4.与资产使用机构进行合作,提供良好的服务
档案信息主要服务人员是档案使用人员,单位不同,使用的人员对于档案的要求以及使用程度也就不尽相同,数据挖掘对于不同的人员有不同的档案要求,一般会为其设置针对性的属性以及分类,为其传递最为合适的搜索结果,同时也为资产管理机构服务提供保证[4]。比如两个机构同时搜索相同的设备信息,对设备的两个属性进行录入,这样一来所显示的结果则是两个机构所需的内容。
数据挖掘在实践过程中,主要包含以下几个步骤:抽取数据、数据储存及管理、数据体现等技术。
1.抽取数据
抽取数据是进入数据库的入口,因为数据仓库本身带有一定的独立性,所以需要利用抽取的方式在联机事务处理、脱机数据存储介质、外部数据源等多个媒介中将数据导入至数据库内。如果在技术方面分析,抽取数据主要与复制、互连、转换以及监控等多个方面相连接,以此对数据进行处理。对于数据抽取而言,今后相关行业发展过程中,需要集中于系统功能集成化这一层面,对数据库自身的数据源改变进行适应,为系统的管理与维护提供支持。
2.数据储存及管理
数据仓库管理在一定程度上决定了传统数据库的特点,同时也与外部数据表现模式有关。数据库管理中的相关数据量相较于以往事务处理,数据量非常大,并且在时间的推移下也不断进行累积。数据库中的数据储存与管理最关键的问题,便是对大量数据、并行大量数据的管理以及数据的优化查询等。当前阶段,一些数据库厂商所研制的技术方案与扩展关系型数据库相关功能有直接的联系,一般的关系数据库可以被改造为与数据仓库相适应的服务器。
3.数据体现
数据体现主要体现为以下几种模式:① 查询。进行预定义、动态以及智能等查询;② 报表。生成关系数据表、复杂表以及其他相关综合报表等;③ 智能可视化。通过简单易懂的易于理解的直方图、电线图以及网状图等可视化技术对一些繁琐的数据和各种数据之间的关系进行体现;④ 统计。对最大值、最小值、平均值以及排序等进行统计;⑤ 挖掘。通过数据挖掘等相关手段,在大量数据中获取与数据相关的模式信息。
综上所述,因为高校档案管理工作量比较大,所以为了提升档案信息检索的高效率,在其中运用数据挖掘技术十分重要。文章中主要以此为前提,从实践应用以及运用步骤两个方面,对二者的融合进行了分析,通过数据挖掘技术的运用,为今后高校档案管理工作提供了先进的技术参考,从而真正实现档案管理效率的提升。
[1]周催影.大数据时代高校档案资源管理若干问题的思考[J].铜陵学院学报,2016(6):76-79.
[2]杨似海,闫其春.大数据背景下的高校图书馆档案管理策略研究[J].四川图书馆学报,2016(4):35-38.
[3]张慧琴,郭璐.数据挖掘(DM)技术在教学档案管理中的应用研究[J].黑龙江教育(理论与实践),2016(Z1):91-92.
[4]郭佳.数据挖掘技术在高校学生就业信息管理系统中的应用研究[J].桂林师范高等专科学校学报,2015(3):148-150.
2017-08-23
张伟(1972-),男,山西临县人,吕梁教育学院助理档案馆员,研究方向:档案管理。
G27
A
1672-2086(2017)03-0075-02