【摘 要】随着高等教育的快速发展,高校的生存竞争越来越激烈。其核心竞争力是高校教学质量,优质的教学质量是高等院校的生命线,是高校进行动态管理的首要条件,也是实现科学管理的重要保证。在分析教学评估现状基础上,通过可视化数据挖掘工具Rattle,对教学评价数据进行清洗、转换,然后进行指标相关分析,和各个维度对评价的影响分析,从而通过可视化过程控制达到目标管理。使教务管理部门能够及时了解教学动态和师资情况,为教务老师提供相关决策支持,为职称评聘提供教学工作质量的科学依据。
【关键词】数据挖掘 教学质量 Rattle 可视化
【基金项目】国家社科基金项目“青少年科技创新能力的培养研究”(BCA150050)。
【中图分类号】G40-057 【文献标识码】A 【文章编号】2095-3089(2017)07-0079-02
ZHANG Donghui
Computing Center, Beijing Information Science & Technology University, Beijing 100192,China
【Abstract】With the rapid development of higher education, the Universities struggle for the existence has been becoming more and more intense.The core of the competition lies in the quality of the teaching.The high quality of teaching is the lifeline of the universities.It is one of the most important conditions for the dynamic management of the universities.It also guarantees the realization of the scientific management. In this paper, based on analyzing the present situation of teaching evaluation, through the visual data mining tools Rattle to cleaning, conversion of teaching evaluation data, then index correlation analysis, and to evaluate the effect of each dimension analysis, so as to achieve goals through the visualization process control management. This paper enable the administrative department to find out about teaching development and teachers' situation in time, offer relevant decision support to the teachers of educational administration, offer the scientific basis of teaching work quality for the thing that the professional title is commented and engaged .
【Key words】data mining; teaching quality; rattle; visualization
1.教師教学评估的现状
教师教学活动评价是一个复杂的过程,仅仅依靠一、两次的单项评价, 不可能真实反映教师教学的真实过程,无法修正评价过程中的晕轮效应、趋同效应等引起的各种偏差[1]。所以,对教师用动态的、发展的眼光进行系统的、全程的、较长时间的、循环往复的评价是未来的趋势。只有这样, 才能充分挖掘教师的潜能, 发挥教师的特长,进而实现主动创新。
对众多教师的多个环节的评价进行综合处理,是一项非常复杂的工作,因此一个好的教师评价系统会带来很大的方便。目前随着信息技术的发展,一些学者研究出了基于多元线性回归、偏最小二乘、支持向量机、神经网络等教学质量评价方法[2-4],还有学者提出层次分析法和神经网络相融合的教学质量评价模型[5]。这些教学评价是对调查得出的数据进行量化分析,然后得出结论,并由此做出判断,在形式与内容上显得比较单一。而且这样做并不能发现数据中深层次的内容,很难找出有关教学质量的一些规律。而数据挖掘作为一种深层次的数据分析方法和有效地解决这一问题的新技术,可以对教学的质量和水平与各因素之间隐藏的内在联系进行全面透彻的分析[6]。但由于现有数据挖掘方法存在操作繁琐、缺乏个性化教学质量评价,导致基于数据挖掘的教学评价系统实际使用率并不高[7]。本文基于可视化数据挖掘工具Rattle分析调查得到的教学评价数据,并对评价数据进行合理的处理,从中发现类似“可能对教师教学水平产生影响的因素”等问题,以及在什么条件下教师的教学质量和水平是“高的”或“不高的”,帮助教师改进教学的方法,进而提高教学的质量和水平。
2.可视数据挖掘工具rattle的认识
2.1 数据挖掘过程
在大数据时代下,生活的方方面面都脱离不了数据挖掘。大数据不仅仅是一个概念、一个话题,而且正在成为生活中的一部分:用大数据预测疾病,用大数据助力企业商业决策,用大数据分析客户心理。
所谓数据挖掘(Data Mining,DM)是指从大量不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有用的信息和知识的过程。其表现形式为概念、规则、模式等形式。
一个完整的数据挖掘过程包括以下几个步骤[8](图1):
3.基于Rattle的教学质量评价
3.1 数据准备
数据挖掘项目第一步就是收集所有必需的数据。在大数据时代,不缺乏数据,但缺乏可转换为信息、知识、智慧的数据。
每学期结束,笔者所在学校都会对任课教师的教学进行评价,本文选用了三年(2013-2015)6个学期10位教师的“计算机基础”课程的评价数据作为挖掘对象。先对数据进行预处理,删除异常数据后,提取各项评价数据见表1。
还需要学院信息表,学期信息表,课程信息表(略)。
数据准备主要进行如下一些工作:
(1)将“职称”属性进行泛化处理,把职称为教授、研究员等正高级职称的,泛化为正高,把职称为副教授、副研究员、高级工程师等副高级职称的,泛化为副高,把职称为讲师、实验师、工程师等中级职称的,泛化为中级,把职称为助教、助理工程师等初级职称的,泛化为初级。
(2)对“年龄”属性进行离散化处理,转换为年龄段区间。即将年龄分为:小于30、介于30至40之间、介于40至50之间、介于50至60之间、大于60等5个年龄段。
(3)对“分数”属性进行离散化处理,转换为分数区间等级。分数属性离散化结果如图3所示。
3.2 各维度因素对教学质量的影响分析
考虑样本数量及其代表性情况,对教师年龄、职称、学历、性别等主要属性进行分析,以期发现主要属性与教师评价结果之间的内在联系。
(1)教师维度与指标C1(教书育人,为人师表)分析(图4)
从图4左上角的得分分布和左下角的得分热力图情况可以看到,C1得分分布集中在9.3-9.7之间。从图4右上角可以看到每位教师C1得分分析,有4个离群值,可以通过追溯原始数据,分析这4个数据产生的原因。从每位教师的箱线图可看出最高分、最低分、平均分、分位数等信息,平均分最高的是lili老师,Wang-dh对指标C1不稳定,比较稳定的是lili和zhang-hui。从图4左下角可以看到C1得分集中的点(颜色越浅得分密度越大)。
同理,基于Rattle可以分析每位教师的其它指标(C2,..,C10)情况。
(2)性别维度对指标C2(精神饱满,富有激情)和C3(注重交流,师生互动)的影响(图5)
图5 性别维度对指标C2和C3的影响
图5的左上角和中间部分显示的是所有教师的C2指标和C3指标的得分分布情况,可以看到C2大部分得分分布在8.3~9.8分之间,C3大部分得分分布在7.6~10分之间,结合图5右边的箱线图,从得分分值的角度分析,看到C2的分数更集中一些,且集中于高分段,说明教师们上课时的精神饱满状态好于师生互动的投入。图5的左下角和中下部分显示的是男教师和女教师的C2和C3指标得分的对比情况,可以看到无论C2指标还是C3指标得分男教师的得分范围都大于女教师,说明男教师的个体差异大于女教师,在讲课时精神面貌和师生互动环节有欠缺的男教师比例大于女教师。
同理,基于Rattle可以分析职称维度对指标的影响,学历维度对指标的影响,学院维度对指标的影响,课程维度对指标的影响。
(3)指标相关分析(图6)
图6中,蓝色越深(圈越大)表明其正相关性越强,黄色越深(圈越大)负相关越强,我们在设计指标时,希望指标独立(负相关越大越好)。图说明指标C4(方法新颖,深入浅出)和指标C5(备课充分,内容充实)过于相关,最好重新设计这两个指标。
(4)教师维度与学期维度分析(图7)
图7显示了教师2013-2015年的6个学期的上课门数情况,可以清楚看到wang-dh老师的上课总门数最多,hu-xf老师最少。各个老师各学期承担的教学任务各不相同
(5)总的评价得分(分数)与学历维度之间的关系分析(图8)
图8 显示所有教师的不合格率为18% ,合格率为23%,中等为18%,良好为21%,优秀为20%。按教师的学历分层为拥有硕士或博士学历的教师和拥有博士学位的教师,前一层次的教师(硕博)中不合格为20% ,合格率为25%,中等为16%,良好为21%,优秀为18%,后一层次的教师(博士)中不合格为18% ,合格率为28%,中等为21%,良好为13%,优秀为21%。
本文中的合格率和优秀率的计算与传统方法不同,采用末位警告制,是分层次计算各个层次的不合格率和优秀率,是局部角度而不是全局角度,这样的统计更能准确评价与维度之间的关系。
4.结束语
随着网络技术与数据库技术的迅速发展,人们所积累的数据越来越多,需要挖掘出这些数据背后隐藏的许多有用的信息和知识,在教育领域也是一样。使用传统的评价方法,即不客观也不高效,已经满足不了现代教学发展的需要。人们希望能够对这些教学评价数据进行多角度、高层次的分析和处理,希望从中能发现更多、更有用的知识和信息,为提高教学质量提供更多的方法和措施。本文利用Rattle分析了教学质量评价数据。用户只需要选择相关菜单命令、对话框或者按钮就可以实现对教师教学质量的可视化评价。操作简单快捷,结果显示形象而直观。
参考文献:
[1]胡平波.高校教师教学质量评价指标体系维度结构及测量[J].江西财经大学学报,2010,69(3):111 -118.
[2]刘强,戴起勋.高等教育大众化条件下教学质量评价体系研究现状[J].江苏大学学报,2003,25(2):31-34.
[3]刘伟,孙林.基于支持向量机的课堂教学质量评价[J].合肥工业大学学报:自然科学版,2010,33(7):968-971.
[4]孙晓玲,王宁,梁艳.应用BP神经网络的教学评价模型及仿真[J].计算机仿真,2010,27(11):314-317.
[5]冯莹莹,于干,周红志.层次分析法和神经网络相融合的教学质量评价[J].计算机工程与应用,2013,49(17):235-238.
[6]羅美淑,刘世勇,夏春艳.数据挖掘技术在教学评价中的应用研究[J].教育探索,2013,2(260):81-83.
[7]陈青山.决策树算法在高校教学质量评价系统中的应用研究[D].成都: 西南交通大学硕士学位论文,2010.
[8]Yanchang Zhao(陈建,黄琰 译).R语言与数据挖掘——最佳实践和经典案例[M].北京:机械工业出版社,2015.
[9]Graham Williams.Data Mining with Rattle and R[M]. Springer Science+Business Media,2011.
作者简介:
张冬慧(1969-),女,博士, 计算机实验师,研究领域为计算机教育应用。