贺路路 阮晓龙
摘 要: 分析学生成绩有利于优化课程设置,有利于提升教学质量。由于学生成绩具有多主体性和时序性等特征,大多数分析工具和展示方式均存在分析因子难以结合,异常数据分析缺乏针对性等现象。因此,本文提出从课程、学生和教师等任意主体出发,采用真实教学数据进行分析。即,设计分析模型并邀请教学人员对其进行修正,再利用可视化图表库ECharts对分析结果进行直观展示。通过对近五年的学生成绩进行分析与可视化展示,可直观地看到学生学习过程中以及教学过程中存在的优势与不足。
关键词: 成绩分析; 课程教学; 教学质量; ECharts; 教学数据
中图分类号:G642.1 文献标志码:A 文章编号:1006-8228(2019)09-50-03
Research on data analysis model and visualization of college students'examination achievements
He Lulu, Ruan Xiaolong
(College of Information Technology, Henan University of Traditional Chinese Medicine, Zhengzhou City, Henan Province, 450046)
Abstract: The analysis of students' scores is conducive to optimizing the curriculum and improving the quality of teaching. Due to the multi-subjectivity and time series of students' performance, most of the analysis tools and display methods are difficult to combine the analysis factors and lack of pertinence in the analysis of abnormal data. Therefore, starting from any subject such as curriculum, student and teacher, this paper uses real teaching data to analyze. That is, design the analysis model and inviting the teaching staff to revise it, and then display the analysis results intuitively with charting and visualization library ECharts. Through the analysis and visualization of students' achievements in the past five years, the advantages and disadvantages of students' learning process and teaching process can be seen intuitively.
Key words: score analysis; curriculum teaching; teaching quality; ECharts; teaching data
0 引言
高校畢业生出现与其能力、素质不匹配的问题日渐突出[1],对其成绩分析不足,挖掘不够的问题也大量存在。如何展现这些数据所蕴含的价值,是教学信息化的重要研究方向之一[2]。
对成绩的分析多采用Excel等简单工具,仅获得平均分、标准差、方差等内容,并未对学生成绩进行深入挖掘。结果简单,很难促进教学进步,指导进一步教学进程。因此,建立一套能够促进学生成长、促进素质提高的制度迫在眉睫,也已成为本科教学改革的重要任务。
结合我院实际情况,本文拟通过交叉分析模型来科学展示学生的成绩,期望能够帮助院系管理者发现学生成绩的特点,更全面地展示教学效果、促进我院学生综合素质得到进一步的发展。
1 数据可视化技术
1.1 什么是数据可视化
简单的说,数据可视化就是按照既定方式对数据进行挖掘处理,并按照一定的方式/方法将数据呈现出来,帮助管理者更好地发现问题、解决问题,体现数据的巨大价值。
1.2 数据可视化的优点
⑴ 高速信息传播
人脑接收视觉信息的速度通常比文字信息快10倍。相比那些纷繁复杂的报告、电子表格,使用图形化方式来总结、展示复杂数据中所蕴含的重要信息,可有效提升信息展示效果,直观查看数据的内在联系,可视化可以更快地帮助管理者理清事务本质,紧抓工作内涵。
⑵ 多维数据显示
数据地可视化,可以是二维,也可以是三维,对之进行排列、组合、分析、挖掘即可发现数据中隐含的规律及价值[3]。
⑶ 直观信息呈现
数据可视化,通常使用较少的图形来展示复杂的逻辑关系,甚至单个图形也可深入挖掘数据内涵。丰富且有意义的图形有助于教师了解学生状态,可更有针对性地帮助学生,同时也可减轻教师的工作量,使之管理效率得到提高。
2 数据预处理
本分析中的学生成绩来源于河南中医药大学信息技术学院近10年的积累,其中存在许多缺失数据、不规范数据、不标准数据[4],因此对数据进行预处理,特别是缺失值、异常值、冗余值等内容操作很有必要,这样的清洗过程,有利于保证成绩数据的真实性和可用性。
预处理操作如下,首先将学生成绩中标记“没写”、“缺考”、“入伍”、“休学”、“缓考”、“无理论成绩”等进行格式化,并清除无效数据。之后再对数据得含义进行解读,数据中的字段内容如表1所示。
基于河南中医药大学信息技术学院的学生成绩数据与数据含义创建数据存储模型,并将清洗后的数据存储至数据库中。
3 学生成绩的总体分析
本数据分析中参与学生1927名,参与专业8个,参与年级10个,参与班级39个,参与课程433个,共50万余条。本文从不同角度对学生成绩数据进行分析后,建立了多个角度、多个体系地分析模型,可全面呈现本院系的学生成绩。
3.1 學生成绩整体分析
⑴ 分析方式
学生成绩整体分析的目的是了解学生最终考试的整体情况。首先将成绩划分为0-59分,60-69分,70-79分,80-89分,90-100分五个区间,然后统计每个区间、每个人、每个课程成绩,得到学生成绩的最终区间分布。
⑵ 分析结果
整体分析的结果如图1所示,可以看出学生成绩呈正态分布,符合教学规律,多数处在70-79分和80-89分的区间内,80-89分区间内的学生最多,为32974人课,0-59分区间内学生最少,为2623人课。
3.2 各年级学生平均分分析
⑴ 分析方式
从各年级学生成绩平均分中,可看出每个年级的整体情况,与其他年级对比后,可查看院系各专业课程的教学情况。
⑵ 分析结果
学生成绩平均分历年变化不大,在78.68分上下,略有浮动;专科学生平均分历年变化较本科生来大,在76.07分上下,如图2所示。
3.3 各年级学生成绩分布分析
⑴ 分析方式
从各年级学生成绩,可获取优秀、良好、中等、及格、不及格人数的分布情况,有利于了解各年级学生的综合素质。
⑵ 分析结果
通过分析,可看出各年级学生成绩呈正态分布,集中在中等、良好部分。同时各年级的优秀率相对高于不及格率,如图3所示。
3.4 所有学生成绩分布分析
⑴ 分析方式
对所有学生的成绩进行分析汇总后,可利用散点图绘制出学生成绩的分布区间。
⑵ 分析结果
通过分析可看出,学生成绩多分布在75分-85分之间,绝大部分学生的成绩大于60分,在75分-85分之间,极少部分学生成绩小于60分,如图4所示。
4 学生成绩的专业分析
4.1 各专业学生成绩分布分析
⑴ 分析方式
从各专业学生成绩分布中,可看出每个专业的教学质量[5]。统计各专业的人数、总分、课程数,算出每个专业的优秀、良好、中等、及格、不及格人数,对展示各专业的学习效果来讲也很重要[6]。
⑵ 分析结果
可以看出,各专业学生成绩的分布类似,各专业相差不大,较多的学生分布在中等、良好部分,少数学生不及格,少数学生优秀,如图5所示。
4.2 各专业成绩优秀率分析
⑴ 分析方式
从各专业成绩优秀率分析当中,可看出各专业的优秀情况。先统计出各个专业的学生人数,再统计出优秀学生人数,就可进行简单计算。
⑵ 分析结果
通过分析可知,计算机网络技术专业成绩优秀率达0.27,其他专业优秀率都在0.13左右,计算机信息管理专业优秀率最低。如图6所示。
5 结束语
利用可视化技术,将数据挖掘分析的思想与信息技术学院实际情况相结合后,为教学工作提供了大量有用信息。所使用分析模型均根据信息技术学院的教学特点来设计,所呈现的分析结果具有较高的参考意义[7],这可为教学改革与教学质量提升提供了有力数据支撑。从分析结果可以看出,目前学院学生在学习过程中以及教师在教学过程中存在的优势与不足[8],这也是本次研究的重要意义所在。
参考文献(References):
[1] 方锦雯,姚壹壹,蔡军伟,巩学梅.学生成绩分析中最优试卷样本量确定的研究[J].宁波工程学院学报,2018.3:63-68
[2] 范双南,赵辉煌,肖四喜,邹祎.基于主成分分析的《计算机基础》课程学生平时成绩综合评价[J].轻工科技,2018.10:175-176
[3] 张濠天,张文卿,王元元,施月霞,曾南焱.关联规则挖掘在成绩分析中的应用[J].中国高新区,2018.10:47.
[4] 龚玉玲,徐晓栋.基于SAS的学生成绩混合正态分布的研究[J].江苏科技信息,2018.35(1):69-71
[5] 陈卓.基于SPSS的学生成绩影响因素分析[J].电子制作,2017.20:43-44,54.
[6] 闫波,赵德成,王璐环.哪些因素在影响中国学生学习成绩?——基于PISA2015中国四省(市)学生数据的多水平分析[J].中小学管理,2017.10:9-12
[7] 刘钟情.数据挖掘在体育院校计算机等级考试成绩分析中的应用研究[J].江汉大学学报(自然科学版),2016.44(4):377-381
[8] 张维国.基于数据挖掘的在线考试系统设计与实现[J].计算机时代,2015.12:41-44