◆房 坤
(青岛港湾职业技术学院 山东 266404)
数据挖掘技术在高职院校招生工作中的应用研究
◆房 坤
(青岛港湾职业技术学院 山东 266404)
当前信息爆炸式增长,我们开始利用数据挖掘技术来获取到我们所需要的相关信息。对于高职院校而言,招生工作十分重要,因此建立起以数据挖掘技术为基础的高校招生信息管理系统势在必行。本文以青岛港湾职业技术学院为例,分析数据挖掘技术在高职院校招生工作中的具体应用。
数据挖掘技术;高职院校;招生工作
高等职业教育自身具备了十分明显的职业针对性,所培养的人才都是高级技能型的。但是我国现在的高考观念依然把高等职业院校看成是“差生教育”,这种不正确的观念使高职院校的招生工作变得更加困难了[1]。为了改善青岛港湾职业技术学院的招生现状,可以建立起专门的高职院校招生信息管理系统,为招生工作的顺利开展提供决策支持。
1.1 高职院校招生信息管理系统的内容
当前高校的招生系统主要包含了两个方面的内容,分别是电脑化和自动化[2]。构建模型的主要目的就是要为相关人员提供及时有效的信息,以此来实现信息的共享。对于远程录取来说,能够及时的把报考考生的信息提供给录取工作人员,帮助录取人员对考生进行阅档和分档。录取对计划管理来说可以提供各个专业的计划信息、事业信息和来源信息等,对全校各个专业的计划进行系统化管理,对整个录取过程进行约束。高职院校的招生系统主要是根据高等职业院校的招生管理工作模式所开发的管理软件,这个系统对考生的信息进行导入、计划管理、考生图片信息导入、考生信息的管理、审核、考生信息查询、打印新生通知书以及招生信息的分析统计功能。通过高职院校的招生信息管理系统,招生工作人员可以及时的掌握招生的工作过程中所涉及到的考试信息以及招生统计信息。
1.2 高职院校招生信息管理系统的设计和实现
当前各大高校都面临着市场运行机制的挑战,各个学校之间的竞争比较大,对于高职院校来说由于传统高考观念的存在,对其还有一些偏见,因此其面临的招生压力更大,招生录取工作几乎是其生存和发展的生命线。以青岛港湾职业技术学院为例,可以对其历史的招生数据进行分析和处理,为今后的招生决策提供支持和借鉴。学院的招生决策支持系统工作流程图主要如图1所示:
图1 招生决策支持系统工作流程图
图1 中的招生决策支持系统是由四个部分组成的,从上到下依次是:数据分析和展现、多维数据集、数据仓库和数据集成。
2.1 数据挖掘技术和传统数据分析技术相比的优越性
传统的数据分析技术有查询、报表和网络联机等,数据挖掘技术与其相比最根本的区别就是数据挖掘技术是在没有明确的假设条件下进行的数据潜在信息、知识的挖掘和发现。另外数据挖掘所得到的信息具有先验性、有效性和实用性。数据挖掘技术能够发现那些违背直觉的潜在信息,预测根据以往的信息对未来的事情进行预测。所以数据挖掘通常会发觉一些出乎意料的并且有的信息,与之相比,传统的数据分析技术则只能够对已有的数据进行分析和归纳,借助于统计学的知识来对数据进行一些令人容易理解的描述和呈现。但是数据规模不断扩大,数据的类型也更加复杂,传统的数据分析技术无法符合人们越来越高的期望。
由于分析数据的需要,数据仓库中所蕴含的数据都是反映了客观世界的历史真实性,通常是一起进行载入和访问的,只能进行查询。数据挖掘技术需要根据数据仓库中的数据信息选择合适的分析工具,进而得出有用的分析信息。数据挖掘过程是一个反复循环的过程,每一个步骤如果没有达到预期的目标,都要回到前面的步骤,重新调整并执行,大大提高了数据挖掘和分析的安全性能。
2.2 高职院校招生信息数据挖掘系统内容
数据仓库最主要的目标是主题,而主题中涵盖了全面的信息[3]。之前所使用的数据库对于考生的信息一般只是侧重于某个方面。比如在招生信息的数据挖掘系统中,我们所涉及的“招生”主题,就需要综合多方面的内容,比如:考生的高考成绩、招生的年度信息、单招成绩、专业计划和专业的基本情况等。以数据仓库为基础的数据高职院校招生信息数据挖掘系统如图2所示:
图2 基于数据仓库的高职院校招生信息数据挖掘系统
如图2所示,高职院校的招生信息数据挖掘系统,主要是建立在方法库、知识库和数据仓库的基础上的,还需要充分的利用数据挖掘技术、联机分析处理和可视化的工具来对考生的相关信息进行分析。而内部和外部的数据源所包含的是对招生前景和招生状况的信息,形成了可视化的数据视图,从而为高职院校进行合理的招生提供重要的决策支持。联机则可以把在数据挖掘中所获取到的新知识进行处理。决策者对数据挖掘技术的实际操作和应用可以提炼出不少有用的信息,然后在招生决策提供服务,使得招生的可靠性和准确性大大的提升。通俗来说,这个数据挖掘就是要在众多的数据中寻找有用的隐藏信息,进而得到之前关心却没有得到的信息,并且把这些信息归纳成结构模式,来为招生管理提供实际的支持。
2.3 高职院校招生工作中对数据挖掘技术的具体应用
影响考生来校报考的因素有很多,为了更加科学的预测报考的人数,通过数据挖掘技术,采用ID3的决策树改进方法,对高职院校招生数据仓库中的数据实施了数据挖掘技术。因此用决策树分类算法来建立学生报到的分类模型,在今后的决策中按照分类模型对学校的报考比例进行分析,以便对未来的招生工作做好准备,该步骤为:
(1)确定业务对象 针对高职学生的报考情况,本文采用决策树方法。决策树分类模型的规则集生成是以报考率为基础的,以此对新生报报考率进行预测,这样很可能会得到报考的人数。
(2)对数据进行预处理 2016年青岛港湾职业技术学院一志愿报考的数据,是以Excel表格的形式存在的。
(3)数据挖掘 招生数据挖掘利用SPSS开发的商业版Clementine 8.1 中的C5.0算法,生成分析预测模型。
(4)模式评价 对本校学生的报到率分析和预测使用的分类模型,结果被解释为分类模式,这种模式可以使用以下的规则来进行描述:
表1 2016年青岛港湾职业技术学院学生一志愿报考率
(5)辅助决策 根据发现的模式,再结合我校的实际情况,和相关的专家进行了深入的沟通和交流,而且也听取了一部分学生的意见反馈,进行深入的分析,所得出的结论是:
首先,2016年我校一志愿的整体报考率达到了96.7%,在同等高职院校中,报考率比较高。这说明,我校从总体上和其他院校相比,具有比较强的竞争力和吸引力,也表明招生前期的宣传准备工作比较到位。
其次,报考率最高的是山东省夏季单招,已经达到137.0%。报考率最低的为省外普通高考,具体数值为76.8%,因此下一年需要适当的调整招生计划,扩大山东省夏季单招的计划招生人数,减少省外普通高考的计划招生人数。另外需要扩大省外的招生宣传投放力度,提高我校在省外的竞争力。
最后,根据报考率,可以对专业设置进行调整,以汽车营销与服务专业为例,本专业在五种高考类型中报考率都比较低;因此以后对本专业就可以进行适当调整。通过数据挖掘得到相关的数据,以数据为基础,对专业重新进行调整和设置,使我校的专业设置更加合理,从而为招生录取工作提供更加科学的支撑,使招生工作更加规范。
对高职院校的考生报到率进行统计和分析,可以做出科学的评价和预测,有利于学校及时发现招生工作和学院管理中所存在的问题,而且还可以针对具体的问题制定出相应的整改措施,对进一步提高一志愿报考率、报到率,稳定办学规模有重要的意义。
高职院校面临着巨大的生源竞争压力,想要实现招生效益的最大化,需要充分利用数据库的原理和数据仓储概念,结合高职院校所有的特点,设计高职院校招生信息管理系统数据仓库的中体框架,为以后的招生工作提供决策分析的数据基础。
[1]罗孟华.基于数据挖掘技术的高职院校招生决策研究[D].华东师范大学,2009.
[2]黄荣坚.数据挖掘在高职院校招生中的应用研究[D].中山大学,2014.
[3]张汝平.数据挖掘技术在招生报到系统中的应用[D].天津大学,2014.
图4 管理员管理平台
本文主要根据对校园网站的应用研究及具体实现方案进行了探讨。在应用研究方面,主要从校园网站信息化的目标出发,进行了系统的调研和分析、可行性分析,初步对系统结构进行研究,结合实际需要设计出便于管理操作的校园网站系统平台构架。
参考文献:
[1]沙巨山.基于B/S结构的高校科研管理系统设计以及实现[D].华东理工大学,2013.
[2]熊锦辉.基于B/S结构的学生信息管理系统的设计与实现[D].北京邮电大学,2013.
[3]冯兴利,锁志海,徐墨.基于PHP+MySQL的Web系统安全防范及全站静态化[J].现代电子技术,2012.
[4]李鑫.Web服务器性能优化研究与实现[D].哈尔滨工程大学,2011.
[5]刘进军.论PHP在网站系统建设中的应用[J].电脑知识与技术,2012.