万阳洋
摘要:随着信息技术的广泛应用,高校中的各类管理信息系统积累了大量的数据,但是对这些数据的处理还只是停留在简单查询和统计报表等阶段,并没有采取有效的手段充分利用数据为教育管理工作提供有效的决策支持。在教学和管理工作中采用数据挖掘技术,能够充分利用这些数据,发现教育现象之间的相互关联和规则,指导校园信息化建设,从而可以更好地做出教育预测和实施教育决策。
关键词:大数据;信息技术;数据挖掘;信息化
中图分类号:TP391 文献标识码:A
随着高等教育招生规模的不断扩大,各高校的教学与管理均面临着前所未有的挑战,教育信息化建设自然而然被提上日程。目前绝大部分高校在学生成绩、学籍、教学、人事、图书档案、招生就业、教学科研等方面均已采用了先进的系统进行管理和维护。而在信息化建设取得业绩的同时,也存在一个不容忽视的现象,即在庞大的信息化建设数据量之后,往往隐藏着许多并没有被充分挖掘和利用的宝贵信息。
面对海量数据,教育部门迫切需要智能、高效的信息技术来处理数据,从而挖掘出对管理决策有价值的信息,数据挖掘技术的应用为此提供了解决方法。数据挖掘技术是指能从海量的信息中得到有用知识,用来辅助管理者制定一些战略决策,在其他行业,如金融、电信、商场销售等行业都取得了广泛的应用,因此,将数据挖掘技术应用到校园信息化建设中,进一步深入挖掘这些数据背后所隐藏的宝贵价值,实现数据的重新开发和利用,并使其转化为有用的知识,具有重要意义。利用数据挖掘技术构建教育领域的相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效的支持,进而实现提高高校教学质量及大学生的综合素质[1]。
1 数据挖掘及其相关算法介绍
数据挖掘也称为从数据中发现知识,具体来讲就是从大规模海量数据中抽取人们所感兴趣的、非平凡的、隐含的、事先未知的和具有潜在用途的模式或者知识。数据挖掘的过程包括以下几个主要步骤:第一,将存放在数据库中的数据经过数据清洗、数据抽取、数据转换、数据集成等预处理过程存入数据仓库中;第二,将清洗过的数据再次经数据抽取或者集成等过程,获得任务相关数据;第三,在此基础上进一步进行数据挖掘过程,获得潜在的有价值的模式或者规律;第四,进行模式评估,评估所获得知识的有效性,以此最终获得相关知识。以下列举利用数据挖掘技术可以实现的主要功能及算法。
1.1 相关性与关联规则
关联规则挖掘是数据挖掘领域中研究最为广泛也是最为活跃的方法之一。最初的研究动机是针对购物篮分析问题提出的,目的是为了解决发现交易数据库中不同商品之间的联系规则。关联规则挖掘一般可以划分为两个子问题,即发现频繁项目集和由频繁项集产生关联规则。最经典的频繁项集挖掘算法是Apriori算法。
1.2 分类和预测
数据挖掘相关的研究工作中常常还力图构建一个模型或者描述函数来刻画或者区分不同的类型与概念,以实现对于未来潜在的预测需求。分类和预测是两种数据分类形式,它们可以用于提取能够描述重要数据的集合或预测未来数据趋势的模型。分类用于预测数据对象的离散类别,预测则用于预测数据对象的连续取值。常用的分类方法有决策树分类(ID3、C4.5)、贝叶斯分类、神经网络、支持向量机等。
1.3 聚类分析
在具体的分类类型信息未知的情况下,往往会采用聚类方法对数据进行分类。聚类是通过一定的算法将原始数据划分为多个数据簇的过程。典型的聚类分析方法有基于分割的聚类(K-均值算法、K-中心点算法),基于层次的聚类,基于密度的聚类,基于网格的聚类等。
2 数据挖掘在校园信息化中的应用
为了提高高校校园信息化水平,充分使用学生在校行为数据创建智慧校园、数字校园,可通过网络平台收集高校学生和教师教学大数据,基于数据挖掘技术设计相关研究模型。
2.1 数据挖掘在成绩管理中的应用
随着教育理念的转变和当今信息技术的广泛应用,各高校都构建了各自的成绩管理系统,实现了学生信息、成绩等大量数据的存储、查询、报表和简单的统计功能,提高了教学管理的效率。但传统的学生学习成绩分析大多只是将学生的考试成绩做简单的排序和分析,以作为评判学生课業成绩、毕业评定的基础依据,没有将教育教学过程中的诸多因素与学生成绩数据的关系做深入的分析。缺乏综合分析和辅助决策能力,更不能对积存的数据进行归纳与深层次挖掘,使得管理人员在决策时缺少切实的数据支持,而数据仓库和数据挖掘技术的结合为学生成绩分析提供了必要的技术手段。
挖掘课程设置与课程成绩之间的关系,将改进的关联规则挖掘算法应用到学生成绩分析中,发现隐藏在课程与成绩之间的关系,进而对得出的有价值的知识进行分析,找出教学中各方面的成效得失及影响学生成绩的内在因素,能为学生选课和教师教学及教学管理工作等提供决策支持[2]。
课程关联规则挖掘,某些课程的掌握程度将会很大程度影响后续课程的学习,最终会对就业核心技能产生影响,挖掘课程之间的联系,将会指导专业对课程的授课学时、授课教师、授课方法等做出决策,挖掘课程与就业之间的关系,将会指导学生将精力投放到影响系数较大的课程上,使学生有的放矢,也能支持学生在前期学习成绩分析的基础上了解自身的学习情况。
增加引入课时维、教师职称维等,能比较出相同的学科在不同的课时安排下,学生掌握情况的好坏,如适当增加实验课时在某门课程中的比重,学生对某些知识点掌握得更好,这样,在以后制定课时安排的时候,就很有针对性,并考虑在不同的专业、不同的考试要求的情况下,适合分配给哪类职称的教师来讲授。
针对学生未来课程成绩预警的问题上,构建学生行为、个人属性及过往学习成绩的特征向量并根据不同课程的特点进行动态选取,结合支持向量机来学习得到不同课程的预警模型,可自动发现学习状态不佳的同学并给予警示,此方法可有效提高学业监督效率,对于提高学生的个性化管理水平具有推动作用。
对教学质量评价是教育管理过程中的重要环节。将决策树算法运用于教学评价之中,可以提高教学评价技术水平,使之更好地为教学服务。在建立评价体系的时候,应更多考虑以学生作为评价主体,在此基础上建立多元评价体系,以课堂教学评价为主体,辅以教师自评、教研室评价及学科组评价。在生成决策树后,可以方便地提取决策树描述的知识,从根节点到叶节点的每一条路径相应地对应一条决策规则,并用语句表示分类规则。
2.2 数据挖掘在网络教学平台个性化推荐中的应用
为了使学生在网络学习过程中充分使用碎片化时间,随时随地进行学习,大部分高校开始创建了自身数字化教学资源与网络教学平台。从技术层面上说,学习者在互联网等媒体上留下的任何数据痕迹,都可以进行分析,可以发现数据背后隐藏的学习者相关学习特征、兴趣爱好、行为倾向,与教育教学相关的状态信息都将一览无余。未来的教育发展方向就是应用数据挖掘等大数据技术去实现精准的个性化教育。
运用聚类算法结合协作推荐技术功能来分析学习者学习的课程内容数据,如登录课程次数、发帖次数、学习笔记、阅读课堂教材的次数、阅读试题库次数、提交作业、学习成绩、在线时长,研究数据分析中学生学习偏好、态度,预测学习过程中的问题。基于此数据,实现课程精准教学支持,实现学习任务及教学决策的优化,帮助目标学习者制定特色的学习计划。
通过改进的关联规则算法实现访问日志的挖掘,找出访问频度较高的知识点网页,确定学生的兴趣点及知识点中的难点。进一步挖掘出若干知识点之间的访问顺序,找出学生频繁查看的知识点序列,教学平台则可以根据这些规则进行网页内容调整,更好地为用户提供个性化服务。
2.3 数据挖掘在图书馆管理中的应用
如今网络信息、数字资源丰富,移动阅读等新型阅读模式的兴起改变着人们传统的阅读模式。导致馆藏资源受到冷落,图书馆作为知识载体及知识传播媒介的功能受到限制。运用数据挖掘相关技术对图书馆用户行为进行研究,有助于提高图书馆的使用率,降低图书馆的成本支出。因为服务是图书馆的根本,而服务的对象为用户,只有通过认清用户、分析用户行为、感知用户需求,才能够提供更好的服务以吸引用户。通过对图书管理系统采集到的数据进行分析,对用户数据、馆藏数据及用户行为数据等进行比较详细的研究。将用户在图书馆中发生的进馆、借还书等行为进行梳理,区分不同学科、专业学生在图书馆使用方面的不同习惯,以期对不同的用户制定不同的管理条例,满足个性化条件,增加图书馆的利用率;同时可采用K-means聚类模型对用户的现有价值和潜在价值进行分析,区别活跃用户、价值用户和潜在用户等;运用决策树模型对用户从进入图书馆的门禁系统到发生借书行为、再到具体所借书目等各个环节的联动分析,了解用户在进入图书馆后行为动向,区分各学院学生的借阅偏好,挖掘不同年级在用户行为流程中的差异,以期指导图书馆资源的优化配置等[3]。
另外,在高校学生工作中应用数据挖掘技术进行分析研究,可为学校科学决策提供参考、为学生全面发展提供指导。例如,通过分析学生食堂吃饭、宿舍洗澡、教学楼打水和进出图书館的行为数据,探求学生校园生活的规律性,预测学业表现、识别孤独人群;通过挖掘一卡通消费数据,识别经济困难学生,结合线下学生表现进行综合研判后,直接发放经济补助[4]。
总之,通过数据挖掘可以对教育数据进行从微观到宏观的统计、分析、综合和推理,加快校园信息化建设进程,指导教育教学实际问题的解决,发现教育现象之间的相互关联和规则,从而可以更好地做出教育预测和实施教育决策,促进教育教学的变革与创新,引领教育教学发展的新方向。
参考文献
[1] 徐华.数据挖掘:方法与应用[M].北京:清华大学出版社,2017.
[2] 刘科生,倪义坤.高校学生工作数据挖掘的研究和实践[J/OL].北京航空航天大学学报(社会科学版).(2019-01-04)[2019-06-05].https://doi.org/10.13766/j.bhsk.1008-2204.2019.0017.
[3] 王菲.数据挖掘在图书馆用户行为分析上的应用研究[D].上海:上海交通大学,2013.
[4] 刘阳.数据挖掘在高校学生管理系统中的应用[D].哈尔滨:哈尔滨工程大学,2013.