陈康 王丹丹
摘 要:伴随日常教学管理的向前发展,各高校网络系统积累了大量的关于学生、教师、教学活动等方面的数据,这些数据存在很大的利用价值,可为高校进一步发展提供决策依据。然而,各高校网络系统当中的数据多用于进行简单的信息查询或是报表统计,而未对数据的深层信息进行挖掘,导致数据利用不充分,未发挥系统数据应有的作用。文章简单阐述了数据挖掘的基本概念及其方法,并就数据挖掘在高校管理中的应用展开了讨论。
关键词:数据挖掘;高校管理;应用
在实际工作当中,各行业数据库系统只是提供了部分极其简单的数据管理和处理功能。而随着社会的发展,人们渐渐意识到数据的重要性和作用,对于数据分析及处理的要求也越来越高。面对数据库中的海量数据,人们急需一种系统而科学的数据处理及分析技术,以深入开发并利用这些数据,为决策服務提供数据支持。
1 数据挖掘概述
1.1 数据挖掘的基本概念
数据挖掘就是指在大量的数据或是数据库当中将人们所需要或感兴趣的数据进行提取和分析的过程[ 1 ]。由数据挖掘的概念可知,数据挖掘是一个在大量未加工的数据系统当中发现有价值数据的过程。这些数据存在潜在的价值,可为决策服务提供信息支持,这类数据的存在形式包括概念、规则、规律、模式等。
数据挖掘是一门交叉性的综合学科,其集机器学习、统计分析及数据库技术于一体,将数据应用从简单的查询功能提升至数据当中挖掘有价值的信息,以为决策提供数据支持[2]。现数据挖掘已广泛应用于各领域,包括医药、农业、电信、金融、互联网、市场营销等,且在各领域发挥着非常重要的作用。
1.2 数据挖掘的方法
数据挖掘是将数据库技术与人工智能相互结合而产生的一种新型数据技术,数据挖掘的方法多数来源于机器,通过不断改进,很多机器学习、人工智能的常规技术都可成为数据挖掘的方法[ 3 ]。总体而言,数据挖掘的方法主要包括以下几类:
第一,粗糙集法。粗糙集理论是将集合论进行扩展而形成的,其主要用于对不确定性问题进行研究,包括各种研究未完全、信息描述不完整等数据,是近些年来逐步兴起的一种问题解决理论。利用粗糙集法可在数据先验知识不足的情况下,基于对数据分类能力进行考察而实现各种模糊或是具强不确定性的分析和处理。粗糙集法操作简单,现有很多数据挖掘工具都是在粗糙集法的基础上而建立的。
第二,聚类法。聚类法是指将所要分析的对象分成多个群体,每个群体当中的对象存在很大的相似性,而不同的群体之间其相似性则相对较小。通常来说,一个群体就一个类别,但相比于分类,聚类法有所不同。聚类的结果其所针对的数据是当前要进行处理的数据,在聚类之前是不知道数据的类目结构及对象的类别的。聚类是数据挖掘的第一个步骤,其将数据以群体方式进行了分类,以方便后期进行进一步分析。
第三,决策树法。决策树法主要用于解决分类问题。决策树法分为两个阶段:构造树和修剪树。构造树是指利用训练数据形成测试函数,依照取值的不同来建立分支,然后在每个分支下再建立下层分支,通过这样重复的不断建立从而形成一棵决策树。修剪树是指在构造树之后对其进行修剪,将决策树转化为一定的规则,并利用所得到的规则将新事例进行分类。相比于其他分类法,利用决策树法进行分类速度较快、规则形成简单容易且易于转化为数据库查询语言,特别是对维数高的问题进行分类可取得良好的结果。
第四,人工神经网络法。人工神经网络法是一种软计算方法,神经网络可以管理或是非管理模式进行学习。若采取管理模式,则需对已有的示例可能会产生的结果进行预测,比较预测结果及目标答案并通过错误实现学习的目标。神经网络的管理模式主要用于解决预测、分类及时间序列等问题。非管理模式的神经网络法多用于解决数据描述类问题,而不适应于结果预测类问题。神经网络在采取非管理模式时需建立其类描述、合法性验证及操作,其无关于数据模式。人工神经网络法需较长时间,其行为类似黑盒,因此其可能无法满足商业分析的相关要求。
第五,进化计算法。进化计算法主要是指对生物进化模式进行模仿的计算方法的总称,有遗传算法、遗传编程、进化策略、进化规划等方法。进化计算法是基于适应度函数约束而进行的智能化搜索,在不断的搜索当中逐步接近目标,从而将目标数据提取出来。进化计算法的操作具杂交性和变异性,其搜索范围非常广,因此利用进化计算法所得到的结果可以说是所有结果当中的最优解,同时因其为框架式结构,所以利用此方法一般只需要选择适应度函数并完成相关编码,其余操作则可由系统自动完成。
2 数据挖掘在高校管理中的应用
2.1 挖掘学生特征
根据系统当中现有的学生信息,如基本信息、学习历史、学习成绩、学习偏好及知识结构等,对学生的特征进行挖掘,以帮助学生及时改善学习行为。通过比较学生特征的分析结果和已制定的学生行为目标,教师可及时了解学生的学习状况及变化,帮助学生修正不良的学习行为,从而提高学生的学习能力,促进学生人格健全及全方面发展。
2.2 干预师生行为
高校教学数据库当中存有大量学生及教师的学习、教学、社会活动、奖惩情况等数据,利用数据挖掘当中的关联分析可找到学生与教师之间各种活动的内在联系,如“当A、B同时存在时可以得到C结论”等类似的规则,即若同时发生A和B行为,则可判断C行为的出现。将此理论应用于实际情境当中,即当发现学生或教师存在A和B行为时,则可立即分析C行为产生的可能性,并采取措施提前预防C行为的出现。
2.3 课程设置合理化
在教学过程当中,课程的设置都是循序渐进的,各课程之间相互联系且有一定的前后顺序。通常来说,高级课程的教学会安排在各种基础课程之后,若基础课程未很好地掌握,那么后续高级课程的学习必然受到影响。此外,因教师及班级文化存在差异,所以即使是同一年级、同一课程,不同班级的整体成绩也在存在很大差异。将学校数据库中历届学生的学习成绩数据提取出来,并利用数据挖掘中的关联分析及时间序列分析等功能,可从大量数据当中挖掘出价值相对较高的数据,通过对这些数据之间的相关性、回归性等进行分析就可获得很多有用的规则和信息,从而找到学生成绩的影响因素。了解原因之后,学校便可对课程设置进行调整,使课程设置更加合理、科学。
2.4 教学评价
教学评价包括学生的学习评价及教师的课堂教学评价。对学生学习行为进行评价既是激发学生学习动机的主要方式,也是检测课程设置、教学程序是否合理的重要手段。利用数据挖掘,通过分析学生的学习成绩、学习行为、奖惩情况等可获取学生评价结果,及时修正学生的学习行为。此外,这种方式还可有效克服教师主观方面评价存在的不公正和不客观等缺点。
课堂教学评价是高校进行教学管理的重要内容,在高校教学过程当中发挥着控制、指导等作用,也是评价教师教学工作效果的重要方式。利用数据挖掘可提取大量的课堂教学评价数据,分析教学效果与教师年龄、职称、教学方法等方面之间的联系,为教学部门制定教学评价体系提供了信息支持,使高校能更好地開展教学工作,提高课堂教学效率。
2.5 招生就业管理
招生方面:利用数据挖掘可了解和分析学生的高考成绩、个人资料、在校成绩等基本信息,在此基础上,各高校可建立高效、科学的招生管理系统。这样既简化了招生工作的流程,又提高了学校的生源素质,同时还可加强学校招生计划的科学性,为高校招生工作的各方面决策提供了信息支持。
就业方面:利用数据挖掘可对学生就业情况进行分析,了解就业与学生学历、专业、性别、生源地等因素之间的关联。通过分析结果,高校学生就业指导部门就可制定科学合理的人才培养方案,从而提高学生的就业能力及竞争实力。
2.6 建设智能化校园网络
利用数据挖掘发现Web数据中潜在的价值高的模式或信息,是当前数据挖掘的研究热点和重点,即Web数据挖掘[4]。Web数据挖掘可为高校校园网络建设提供指导,促进校园网络建设的个性化和智能化。首先,可根据用户的使用记录来建立用户模型,并通过分析用户的基本信息来了解用户的使用习惯、个人爱好等,从而为用户提供个性化服务。其次,利用Web数据挖掘可了解用户的行为记录及反馈情况,以此为基础,设计人员便可有针对性地改善站点,如页面的连接、页面的访问等,优化校园网络;再次,利用即Web数据挖掘可了解用户的拥塞记录,从而发现站点存在的不足之处,并提示点点管理人员及时进行改善,以提高校园网络的智能化。
3 结语
随着时间的不断推移,高校管理的系统数据会不断增加,数据量不断加大的同时数据复杂性也会不断增强。在这种情况下,利用数据挖掘可将大量数据当中的有用、价值高的数据提取出来并进行分析,以为高校管理决策提供良好的数据支持,提高高校的管理水平及管理层次,推动高校的进一步发展。为此,在平时的工作当中,各高校应特别重视数据的挖掘,根据学校的实际情况,采取切实可行的措施,深入挖掘校园网络系统当中的数据,将有价值的数据提取出来并将其转化为知识,从而提高高校的管理水平及教学质量,促进教育体制的改革及完善。
[参考文献]
[1]李霞,蒋盛益.数据挖掘在高校教学和管理中的应用研究[J].广东外语外贸大学学报,2012(14):88.
[2]江敏,徐艳.数据挖掘技术在高校教学管理中的应用[J].电脑知识与技术,2012(14):77-78.
[3]刘美玲,李熹.数据挖掘技术在高校教学与管理中的应用[J].计算机工程与设计,2010(14):88.
[4]阳馨.高校管理中应用数据挖掘技术的途径研究[J].数字技术与应用,2016(14):77-78.
Data Mining and Its Application in University Management
Chen Kang, Wang Dandan
(Zhengzhou Institute of Finance and Economics, Zhengzhou 450000, China)
Abstract: With the daily teaching management forward, the university network system has accumulated a large amount of data about aspects of students, teachers, teaching activities, the data there is great value in use, can provide scientific basis for the further development of university. However, now the university network system among the data used for simple statistical information query or report, without in-depth information on data mining, data utilization leading to insufficient data system did not play its due role. This paper briefly describes the basic concepts and methods of data mining, and on the application of data mining in University Management discussed.
Key words: data mining; university management; application