尧有平 陈星豪
【摘 要】分析高校现行信息化系统的功能模型,指出其应用的局限性,提出一种基于数据挖掘的信息化系统模型。
【关键词】数据挖掘 信息化 系统模型
【中图分类号】 G 【文献标识码】A
【文章编号】0450-9889(2014)01C-0051-02
教育信息化是指在教育领域运用计算机多媒体和网络信息技术,促进教育的全面改革,使之适应信息化社会对教育发展的新要求。教育信息化的核心内容是教学信息化。为此各级教育部门,特别是各高校在过去投入了大量的财力,构建了各种信息化设施,以校园网络系统为平台,开发了教务信息系统,学生工作管理系统,招生就业系统,工资管理系统,学籍管理系统,这些系统简洁易懂、功能实用,大大地加强学校信息化管理水平,提高了工作效率。但由于历史原因,这些系统功能相对独立,扩展能力差,大多数的应用仍然限于查询、检索的简单应用上,效率低下。
经过多年的应用,每个学校的信息系统都积累了海量的数据,存储于系统中,而这些数据并没有得到充分的利用,因为大多数的信息化系统只执行了存储、查询、检索等基本功能。数据中隐藏的丰富的知识和规律并没有得到充分开发和利用,这些积累的数据就像埋藏在大山中的金矿,必须充分开发出来,为决策人员提供帮助,才能充分发挥其价值。因此通过技术手段,改进信息系统的结构和功能,使管理和应用人员能从大量的数据中挖掘出有用的知识和规律,并把这些知识用于管理决策、教学计划制定、招生就业决策、图书馆管理等。
建设信息化公共支撑环境,提升公共服务能力和水平,如何利用现有的数据,挖掘出有用的知识,为管理部门、决策人员、学生提供帮助,是信息系统的重要任务。通过充分利用数据挖掘技术处理高校信息化系统中的海量数据,挖掘出有价值的知识和规则,并将其反馈到教学和管理决策中,提升学校服务和管理能力。
本文将在分析现在信息系统的基础上,对其局限性进行分析,并提出一种基于数据挖掘的信息化模型,并分析其有效性。
一、高校信息化系统模型
(一)传统的高校信息化系统模型
当前教育信息化系统的结构如图1,包括系统硬件平台、数据存储模块、数据库或数据仓库模块、数据分析查询模块、图型用户接口五大部分,主要的功能是收集信息,通过转换,存储数据,把数据存储到数据库中,用户通过读写分析、查询模块进行操作,系统为用户提供信息的存储、共享和检索服务。随着数据的增长,信息系统存储了海量的数据,其中隐藏着大量的知识和规律,通过简单的检索是无法得到的。
图1 传统的高校信息化系统模型
(二)数据挖掘下的高校信息化系统模型
基于传统信息系统的不足,提出基于数据挖掘的信息系统改进模型,如图2所示,它是在传统模型的基础上,加入数据挖掘模块,通过它,可以从长期积累的数据中,挖掘出隐藏的知识和规律,为系统用户解决问题、管理决策提供支持,发挥信息系统的潜力。
图2 数据挖掘下的高校信息化系统模型
(三)数据挖掘模块及技术分析
数据挖掘的任务是从现有数据进行分析,通过分析,获取事先未知的知识和规律,如数据记录集合聚类分析,异常记录和赖关系(关联规则),数据挖掘的一般过程如图3所示。
图3 数据挖掘过程
数据模块中采用的几项典型技术如下:
1.聚类分析。聚类是把一组数据对象设计成一类,以便让同一类中的对象具有最高的相似性。而类间具有最大的差异性,这种方法被用于机器学习、模式确认、图象分析、信息检索等领域。
建立的每一个聚类可以看成是一类对象,通过它导出规则。聚类在教育中的应用能帮助机构组合学生个人相似的班,把学生分成类,以便使学生在一类中相互之间更相似,或者说水平更平均。
2.决策树。决策树是一种决策支持工具,它使用树型图显示可能的结果,包括概率事件结果和源的关系,成本和用途功用,它是一种方式显示一种算法。决策树常被用于行为研究特别是决策分析,去帮助识别一种策略,主要是要达到的目标;决策树作为一种描述性工具手段用于计算条件概率;决策树还可以用于分析一个机构的准入规则。同时它对小数据样也能给出好的结论。这种方法能适用于不同数量级的编目变量。
3.关联规则。反映一个事件和其他事件之间依赖或关联的知识,如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测,可以用关联规则的形式表示规则形式。
4.分类。找出描述或识别数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象。
5.回归。通过构造函数以符合数据变化的趋势,这样可以用一个变量预测另一个变量。
二、数据挖掘在高校信息化中的应用概述
在高校信息系统中进行数据挖掘称之为教育数据挖掘,教育数据挖掘的关键领域是挖掘学生的表现行为;另一个关键区域是挖掘录取入学数据;关键应用是预测学生表现和研究其学习状况,以便推出措施用于教育实践。主要应用如下:
(一)在教学评价方面的应用分析
高校信息化系统长期运行中产生了海量数据,学籍数据、考勤纪律、招生就业、奖惩等各方面的数据累积在信息系统中,通过使用数据挖掘技术可帮助教师、学生、学校管理决策者有效地利用这些数据,建设有效的评价系统。
(二)学生特征分析
根据系统中已有学生的基本信息、成绩信息、学习过程数据、偏好、知识结构等,利用数据挖掘功能分析学生特征,从获取的知识帮助学生修正自己的行为。教师利用挖掘到的知识帮助学生修正学习行为、提高学习能力。
(三)协助合理设置课程
通过对学校积累的数据使用数据挖掘技术,如关联规则,时间序列分析等相关技术,挖掘出有用的知识,寻找到影响学生成绩的相关因素,如教师因素,课程安排因素等,教学管理者可以设置合理的课程,合理安排教师组合。
(四)就业预测分析
通过对历史中毕业生的就业数据进行数据挖掘,对毕业生就业因素的相关性进行分析,如综合成绩,英语成绩,计算机成绩,是否学生干部等,对学生能否就业的影响因素进行挖掘,得出毕业生的就业预测模型,这样可以对学生未来是否能就业,对就业作出预测,对就业好的学生类型推广,对不易就业的学生类型,修改培养方案和模式。
(五)图书馆应用
图书馆是高校的信息服务机构,馆内具有大量的信息,经过多年的运行,这些信息以海量计,可以通过数据挖掘技术对数据进行处理,为师生提供更好的服务。
数据挖掘可以对读者类型、文献类型、借阅次数等方面的信息进行挖掘研究,提高检索速度,通过改进信息检索程序来提高信息检索的速度和有效性,为不同的读者提供定制服务,拓展服务方式,提高服务质量。
教育数据挖掘已经成为热门的研究领域,因此很多为数据挖掘开发的工具也不断出现。数据挖掘技术在学校中能帮助我们去发现学生的表现,学生的学习习惯,帮肋课程设置,激励学生,挖掘出学生分组的依据,帮助就业决策;同时也发现,现行的数据挖掘工具对教育工作者来说太复杂。如何开发一种简便的算法工具,使之能应用于不同的任务,并能设置自由参数,简化应用,使非专业人士可以应用是急需解决的问题。
【参考文献】
[1] 刘琼梅.浅谈数据挖掘在高等教育信息化中的应用研究与展望[J].福建电脑,2010(4)
[2]陈洁.校园信息化建设应用的数据挖掘研究[J].科技风,2012(9)
【基金项目】新世纪广西高等教育教学改革工程立项项目(2012JGA384)
【作者简介】尧有平(1964- ),男,广西电力职业技术学院副教授,研究方向:计算机技术、数据库技术、数据挖掘技术;陈星豪(1980- ),男,CCF会员,硕士,广西电力职业技术学院讲师,研究方向:计算机技术。
(责编 丁 梦)