李芳
摘要:近些年来,我国越来越重视教育的发展趋势,也十分注重学生成绩的管理工作,其已经成为各类学校学生管理工作不可缺少的一部分。然而,目前我国诸多学校几乎使用人工管理处理学生的各项成绩,该类管理方法无法从众多的学生成绩中获取更多有效信息。因此,把数据挖掘技术合理地运用到学生成绩管理当中,能够通过杂乱、看似毫无瓜葛的数据顺利地找出数据内在的相关联系,从而总结出应有的规律,在某些程度上可以为各类学校改进教学方法提供充分的依据。
关键词:数据挖掘;成绩管理;应用及对策
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)23-0007-03
目前,随着我国各类学校的招生规模日益扩大,教学管理系统中的相关数据也逐渐增多,存在问题最多的是学生成绩的数据量如此繁多,且学校对成绩数据的处理仍然使用原始的数据备份、数据查询等单一的统计方法,怎样使用数据科学地分析教学过程中的成果、并找到影响学生成绩的主要原因已成为诸多教师共同关注的焦点。本文主要阐述数据挖掘的现状及研究意义,并对数据挖掘在学生成绩管理中进行应用,让学生可以保持更佳的学习状态, 进而为教师更好地实施教学工作提供基础, 以达到提升教学质量的目的。
1 研究现状
随着近些年各类学校学生人数的不断增加,学校的数据管理系统面临着数据过于庞大的难题。一般的数据管理系统在处理数据时,仅仅完成某些单一查询、统计、收藏及检索等功能,难以从大量数据中的有效获取一些有用的数据信息,从而导致数据不断堆积,这就大大降低了其利用率。怎样使用已有的数据,发掘事物的内在联系并归纳总结,可以为学校改进教学方法、提升教学质量提供坚实的基础。很多学校的考试题目很少采用科目相同的数据试题库进行测验,而甚多是由任课老师共同探讨出的考试题目,试卷中知识点的占有率,教学的难点及重点都没有体现出来,学生也没有对考完的试卷进行任何有效的反馈,教师也未对学生掌握知识点的情况列入出来,这样情况下的考试成绩无法达到提升教学质量和改进教学方法的目的。
2 研究意义
在现代社会,数据库技术的与人工智能功效得到较快发展,这就使得数据挖掘技术广泛地被运用到生活的各个领域。数据挖掘技术能够对原有的数据给予总结、分析、统计及推理,从而发掘事物之间的内部关系,再对事物的发展方向进行预测。在现代学生成绩管理系统中,数据挖掘技术的应用具有深刻的影响,其能够更加合理地分析学生成绩受何种因素的影响及他们之间存在的内在联系。例如:分析学生的考试成绩及其他有关的数据,数据挖掘技术能够回答“在教学中哪些教学内容在课时分配方面不合理,哪部分课程在设置程序上应该适当地调整,哪种教学方法更符合哪一门课程”等一系列问题,以上都是传统成绩管理系统做不到的。借助数据挖掘技术对学生的考试成绩进行适当的处理,能够及时有效地给予学生评价效果,还可以了解学生在各个方面的接受能力,以及学生适合的教学方法。良好的信息反馈可以帮助教师及时改进教学方式、调整教学内容,让学校管理人员在较好的教育制度下进行教学合理的改革。
3 数据挖掘技术在学生成绩管理系统的使用阐述
将数据挖掘技术科学地使用在学生成绩管理系统中,主要可以从以下几个方面来改进原有系统的缺陷。一是在成绩方面,学生考试分数的高低是衡量他们学习好坏最直观的方式,直接影响学生获得奖学金的等级及个人评价。合理准确地估测学生成绩可以充分提高学生学习的积极性。当前使用的成绩管理系统仅能简单地统计成绩,然后给出考试成绩纸上的数字信息,数据挖掘技术不仅能够计算出学生成绩在各个分数段的具体状况、及格率及优秀率等,还能够通过对学生整个学期的成绩、以往几次考试成绩及学生几个学期的日常成绩合理地分析、比较及挖掘,估测此学生今后学习状况的大概基本趋势、影响学生成绩的主要因素,这就可以更加科学地评定学生的个人综合成绩。二是在考试方面,考试是教育过程中非常重要的环节,目前使用的系统从考试中获取的仅有成绩,数据挖掘技术能够根据学生成绩及考试中知识点的分布状况,划出哪些内容在今后的教学中需增强练习,考试的难易度可以为教师改进教学方式提供基础依据。三是在教学评价方面,教学评价主要是对老师工作的一种评定,合理的评价能够更好地激发教师工作的兴趣。目前大多数学校的教师采取学生个人成绩、学生问卷调查相结合的方法,此类方法比较主观,会降低教师的工作的积极性,结合学生个人成绩、试卷难易度及个人平时成绩等多方面的信息,可以进一步挖掘出相关数据之间存在的内部联系。四是在课程设置方面,由于学生在学习时一直保持循序渐进的状态,所以课程之间当然存在内部联系及先后次序,基础课程学习的效果直接影响到日后的专业课程学习,各个学期内学生学习课程的多少也会影响学生的学习效果。利用管理系统中现有的学生成绩数据结合数据挖掘技术可以得出一些非常有价值的规则和信息,反映出影响学生成绩的部分因素,在此基础上,将课程设置做出更加合理的安排。
4 数据挖掘技术在学生成绩评测中的应用
4.1 数据挖掘系统的方法设置
高校教学管理系统的存储空间较大,覆盖了丰富的教学经验及管理信息, 涉及的范围也十分宽广, 以此为基准进行适当的数据挖掘, 会给我们提供各种各样的参考方向。系统主要具有以下功能:一是易操作性,简单而言就是简单的挖掘过程、通俗易懂的挖掘结构。二是数据处理能力方便、快捷, 整个数据的处理过程简易、高效。三是其具备与其他结构相集成的便捷方法。
4.2 数据采集
在各个学校对本学期进行总评时, 都希望通过学生的综合成绩发掘学生成绩与参加各种活动、公共课成绩存在的关系。由此选取一个这样类型的数据模型: 本项学生状况的数据
库中的数据超过200人, 其中包括学号、性别、公共课成绩、专业课程成绩、课程提前预习效果、日常成绩、排名、参与社会及文体活动状况等方面。学生的综合成绩主要是由两个或两个以上因素之间存在的函数关系。要得到学生的学习成绩, 必须了解多方面的数据。一是学生的基本信息。主要有学生编号、姓名、性别、出生地、所在院系、所学专业、班级等等。要得到以上信息都可以在学校的学生管理信息系统中获取。二是学生特点信息。其主要内容表现在:学生对所学专业及课程的熟悉程度、课前预习知识的掌握情况、课堂学习的作用和成效、学习方式、平日的学习状况等。三是成绩数据库。这方面的信息重点包含学生的日常作业成绩、各科课程的考试分数,此项数据库主要由教师在进行教学过程中而产生,因为不同专业开设的课程和教学各有所差异, 导致诸多专业课程不存在可比性及共同性, 在进行数据收集及处理过程中, 首先应处理好不同专业课程的成绩,再计算出专业课程的综合成绩, 最后让其和英语、计算机等公共课程的成绩进行具体的分析。
4.3 数据预处理
在对数据进行正式挖掘前,首当其冲应对相关的数据开始预处理,简单而言就是对存有 的数据进行清除和整理、变换、集成,对不够完整、含噪声的相关数据或者不相同的数据给予适当的处理。第一,数据转换,此项需要实施转换的数据,其一般包含学生基础数据表、智力数据表、学生学习主被动等各项数据表中的相关数据。考试期限持续,试题的满意率也有极大差异,另外,每年的录取分数线各有所差异,所以,要想综合、准确地评估学生的高考分数难度较大。但是可以选择同一年度学生的考试分数进行比较,在开始分析前,先要把考试成绩的分数转换为百分数,即以一百分作为总分,转换为所要分析学生对应的高考成绩。用字母m代表学生的高考分数,h表示最高分,M则表示置换分数,那么可以得出计算公式:M = [ m/h X 100 ],通过对学生智商的测试结果进行具体分析,可以得到很多学生的智商分数几乎在一百分左右波动。这样的差别不明显,在同样的情况下,把智商测试结果转换为百分数,再依照高考时处理分数的具体方式,将所有学生的智商测试分数转换成百分数,用I表示;对学生的学习态度及考察项目必须进行数字化处理,用K代表统计序数,g表示沉溺电脑游戏、与学习无关的次数,G表示得分,那么可以得到计算公式:G=(1-g/K)×100。第二,进行数据清理,倘若统计充分度计次数,g意味着不玩电脑游戏和非学习次数,G代表不得分,则可以得到计算公式:G= (1-g/K) X100。在进行数据清理时,假如统计充分度不够全面,那就需要一种同类样本的平均值提供主要依据,以便进行人工填补。结合原有的调查统计资料开始合理的地分析,选取和空缺值学生接触频繁、关系密切且表现类似的学生当做同类样本。第三,进行离散化处理,此方面一般针对百分数,以考试成绩分数的等级作为依据,通过百分数划分等级。
4.4 数据挖掘
第一,构建事务数据库。一般而言,事务主要是指数据库中事实表所记录的具体数据,在事务方面进行维度下钻,对全部的度量项实施事务代码分配。第二,完善关联规则。通过使用Apriori递推算法对一些数据进行具体分析,此项所统计的数据主要关涉到两个年级、四个专业,假设最小的支持度是0.1,最低的可信度是0. 5,生成较多项集与关联规则,以下只对少数关联规则开始进行分析。
4.5 构建数据仓库
4.5.1 学生基础数据表
高中是一个非常重要的阶段,能够为大学进行有效的学习提供坚实的基础。各大院校的教师通过观察学生的高考成绩,既可以深入认识和了解学生的能力,还能够从某些方面了解学生对学习的积极性及乐趣,总体来说,可以为教师对学生个人有个大概、全面的认知。学生的高考成绩通过一些整理方法后,逐渐被录进高考成绩的数据表中,再进行集成处理以后,就能够获取到有关学生编号、性别、年龄、高考分数等包含以上基本信息的学生基础表。
4.5.2 学生考试成绩表
通常情况下,学校的教学主管部门经常以一个学期为界限,按期分析并统计在校学生的整个学期的考试成绩,教学管理的主要部门对学生成绩进行统计后,可以为学生成绩数据表的建立提供有效、充足的数据。然而,由于考虑到各不相同性质的课程、分配不同的课时在一定程度上存在较大差别,因此,仍需对每个学期的学生成绩进行合理的处理与整合,通过此类方式方便获取简化后的学生个人成绩,再适当地清除一些次要的字段。除此之外,针对课程编号字段方面,也需要进行合理的构造,以便最后构建成学生考试成绩模型,其主要关涉到学生学号、课程编码、学生个人成绩等以上几方面的内容。
4.5.3 学生智商数据表
关于学生的智商数据表的建立,应对学生的智商进行细致的测试,再对所测试结果开始科学地统计,最终得到的数据可以为建立学生智商数据表提供重要基础,学生智商数据表模型一般关系到学生编号、测试、学生评估等三个方面的内容。通过使用高效的智商测试软件适当地测试学生的智商,其显示出来的分数代表学生的智商数据。在此,学校可以选取两类智商测试软件,在固定的时间段内进行测试,并让学生自身进行评定,这就能够有力地保证所获取的智商数据具有较强的说服力。
4.5.4 学生学习态度表
通过与其他方面相比较,量化学生的学习态度难度提升很多。然而,学习态度作为一项容易被捕捉的度量,结合学生在课程方面的出勤率、课堂的学习能力、课后作业的完成状况、拓展课外知识量等诸多方面,都能够为教师全面了解学生的学习态度提供现有的依据。在此,对学生的学习态度进行适当地统计必须在学生提前所不知的情况下所实施的。已构建成的学生学习态度模型一般包含以下几个方面:学生编号、课程编号、课堂出勤率、课后作业完成状况、课外活动安排、学期数等较多方面的内容。通过分析以前至今的教学经验,显示出学生课外表现能够从学生课外时间的设定方面反映出来,当然,最为主要的一个指标是课外玩电脑游戏所消耗的时间。所以,选取其作为一项评价学生学习态度的重要标准,按学期为基准,随机调查学生的学习状况,并仔细分析和统计调查结果。
5 结语
综上所述,将数据挖掘方法与学生成绩管理结合,并运用到实践教育中,这样教师能够全面地掌握学生大概的学习状况,方便学校制定各类奖励与惩罚制度,也为管理人员开设课程提供更加准确的信息资源。并且教师教学方式的改进可以为学生提供更多有效的学习方法,以上改进在一定程度上可以促进学校教学管理水平的提高,也有利于提升教学质量,对学校维护校内教学秩序,努力改善考风考纪、学习风气、教风,调整题库及课程设置等都具有重大作用。
参考文献:
[1] 刘美玲,李熹,李永胜. 数据挖掘技术在高校教学与管理中的应用[J].计算机工程与设计,2014, 11(5):1130-1133.
[2] 潘锋.浅谈数据挖掘技术在高校管理中的应用[J].重庆科技学院学报, 2013,11(4):100-101.
[3] 梁盾.数据挖掘算法与应用[J].北京:北京大学出版社, 2014:35-42.
[4] 高阳.中国数据挖掘研究进展[J].南京大学学报:自然科学版, 2015,14 (4):351-353.
[5] 汉德.数据挖掘原理[J].北京:机械工业出版社, 2013.
[6] 魏萍萍,王翠茹,王保义等.数据挖掘技术及其在高校教学系统中的应用[J].计算机工程, 2013, 27 (11):87-89.
[7] 张德新,崔巍,蒋天发.数据挖掘与人才素质评价[J].计算机工程与应用, 2013,19 (9):192-193.