文孟飞,彭军,张晓勇,蒋富
(1.湖南省教育科学研究院,湖南长沙410005;2.中南大学信息科学与工程学院,湖南长沙410075)
基于马尔科夫模型的大学生创新训练活动成效评价
文孟飞1,2,彭军2,张晓勇2,蒋富2
(1.湖南省教育科学研究院,湖南长沙410005;2.中南大学信息科学与工程学院,湖南长沙410075)
摘 要:活动成效评价是网络交互教学中需要解决的重要问题。结合马尔科夫模型,运用转移概率矩阵对学生等级进行趋势分析,通过概率的方式推导出学生当前的掌握程度,并最终确定创新训练活动的成效,能及时发现学生的真实认知水平,减少不确定因素的干扰,对学生学习认知水平进行较为准确的评价。
关键词:创新训练平台;网络交互教学;马尔科夫模型
近年来,计算机网络技术与多媒体技术迅猛发展,网络教学也随之成为教育中必不可少的一部分。网络教学是一种以计算机网络为主要媒介的教学活动,教学中主要以网络交互为信息交流手段,通过反馈、交流和沟通,不断的交互,真正形成知识的构建[1]。随着网络技术、多媒体技术、计算机技术的不断发展,网络教育工作者开发了很多适合交互教学的网络平台、论坛、网络课程等,在网络虚拟空间中开展了各种形式、不同层次的交互教学。正因为如此,网络教学成效问题也一直受到社会各界的广泛关注,如何客观、正确地评价网络教学成效,就需要更多的学者进行探索和挖掘。
现阶段,网络交互教学在国内得到了快速的推广和普及,在网络教学过程中,教师与学生的互动质量对教学效果起着至关重要的作用[2]。然而与传统教学相比,其评价体系还有待完善。许多网络教学系统没有教学评价功能,或只运用比较简单的评价模型,维护性差且不具有通用性。随着社会对学生和教师综合素质的要求越来越多,传统教学成效评价方法也出现了越来越多的问题。
从目前网络教学平台的教学内容组织即资源组织的角度看,其不足之处主要有:网络教学系统的资源多以静态网页的形式呈现,简单实现了教材的电子化;教学内容千篇一律,缺少必要的交互,不能充分调动学生的学习主动性;网络教学系统缺少适应性和针对性,不能很好地实现个性化教学和因材施教的方针;网络教学个性化研究的重点放在教学这个环节上,对提高教学系统的交互性、个性化生成学习路径的研究也做了不少,但对教学资源的个性化组织的研究还不够[3]。
最近几年,我国也渐渐开始关注网络教学的交互问题,对网络教学互动模式、互动效果进行了一些探索,但对如何构建和利用良好的评价系统对网络交互教学质量进行评估还没有深入研究。针对网络教学成效评价问题,本文通过对学生能力进行划分,构建活动成效评价指标体系。首先确定出学生学习水平的基本状况,再借助马尔科夫模型[4-5],对教学成效分层次评价。以学生的进步情况作为评价标准,使得评价更加客观,避免了单从学生的某一次成绩就对学生学习状况加以限定,这种评价方法和标准不仅可以对学生进行评价,同时可以针对不同教师、不同教学方法来评价教学效果,从而改善了当前
交互教学成效评价现状。
2.1创新训练活动中学生能力分析
在创新训练活动中,我们将对学生进行全方位的评估,包括学习能力(活动执行进度以及完成情况)、表达能力(对问题的描述、解答的能力)、应用能力(对实际问题的解决能力)和创新能力(活动的创新点,包括观点、方法等)等,同时如果还需要考察学生其他方面的能力,也可以对活动成效评价指标进行相应的修改。通过这几个参数指标将学生的能力具体细分,并确定各能力之间的关系及比例,针对多个因素进行定量和综合评价,从而达到了对学生认知能力的客观了解,进一步确定学生在某项创新训练中学到了多少。
根据以上评价指标对创新训练活动成效进行测验,首先系统自动对学生能力进行测验,假定学生的某次测试验成绩如表1所示:
表1 学生某次测试成绩
如果需要重点考察学生的学习能力,则假设学习能力占40%,表达能力占15%,应用能力占25%,创新能力占20%。用向量X表示各能力所占比,则X=(0.4,0.15,0.25,0.2),对其进行线性变换如下:
由线性变换可以得出:在变换之前,按照一般情况下计算出的测试成绩为75分,即这几种能力的总和。但如果考虑到该项活动注重的能力,则让相对部分乘以各类能力的相应权值后,得到的测试成绩为67.5分。因此,该学生在创新活动成效测验中的综合能力评价为67.5。同时,由表1可以看出,学生的学习能力、表达能力、应用能力及创新能力得分分别为80,66.7,70,80。这种方法更符合学生的真实水平。
2.2马尔科夫模型的建立
在了解学生学习能力的基础上,如果需要对某一个班级的学生或者教师前后2次创新训练活动中的成效进行评价,则要将马尔科夫模型应用到评价模型中。假设某个班级有n个学生参加创新训练活动,首先,将这n个学生按能力划分为优(90~100分)、良(80~89分)、中(70~79分)、差(60~69)、不及格(60分以下)5个等级。其次,建立概率空间,并定义随机变量Xk(n),其取值范围即为所划分的等级,用I表示Xk(n)的值域:I={1,2,3,4,5},它表示编号为n的学生在第k次创新活动中所处的等级,其中k=1,2,……。
将第1次创新训练活动后各等级学生数占总人数比作为状态向量,则用M表示其状态向量为:M=(,,,,),其中n为学生总人数,n为成绩第i等级学生人数(其中优、良、中、差、不及格分别按顺i序为一等到五等)。
第2次创新训练活动测试后,用nij表示学生成绩由i等转移到j等的学生人数。应用马尔科夫模型,求出转移概率矩阵,用P表示:
经过一定时间创新训练后,学生成绩在各等级的状态概率的变化也会越来越小,最终状态概率也将趋于稳定,在此情况下,稳定分布π是一个对应于特征根为1的、该转移矩阵的特征向量,同时称为马尔科夫链的极限分布。根据遍历性可建立方程组,并得出π的极限分布。
从数据库中选出A班级在某次创新训练活动中的成绩作为样本,如表2所示,按照上述等级划分,列出有限个状态之间的转移频率以及各等级的总人数。分别计算出A班级两次测验成绩的转移概率矩阵,并用πa和πb表示第1次和第2次的特征向量。其中表3、表4表示A班级第1次和第2次测验成绩等级间转移频数。分别计算第1次测验和第2次测验的极限分布,并建立方程组:
由上式方程组解得πa=(0.13,0.4,0.27,0.2),同理πb=(0.24,0.35,0.24,0.176)。
表2 A班级创新训练测试成绩
表3 A班级第1次测验成绩等级之间转移频数
表4 A班级第2次测验成绩等级之间转移频数
从表2可以看出,A班级第1次测验平均成绩为78.06,第2次测验平均成绩为76.18,2次成绩差
别不大,第1次平均成绩略高。再由表3、表4可以得出,第1次测验后,各等级水平学生人数为n1、n2、n3、n4、n5;第2次测验后,原来成绩为优的学生中,仍有n11人成绩优等,n12个学生成绩下降为良,n13个学生下降为中,n14个学生下降为差,n15个学生下降为不及格。根据两次成绩间的转移频数可知,由良→优、中→良、不及格→中的学生人数有所增加。因此第2次学生成绩提升人数要比第1次有所增加。
为了更准确地评价该创新训练活动的成效,我们将2次测验成绩的5个等级中各选一个值进行量化处理,分别将优、良、中、差、不及格取值为90、80、70、60、50作为评价指标。用S1和S2表示2次测试的综合水平,计算得出S1=πa(90,80,70,60,50)T=74.6,同理可得S2=πb(90,80,70,60,50)T=7696。通过计算可以看到,虽然第1次平均成绩略高于第2次,但如果单以平均成绩判定2次测验的总体水平,不具有充分性。通过建立马尔科夫模型计算,2次测验的综合水平为S1<S2,在充分考虑了学生的基础情况以及学生的学习能力基础上,我们可以认为学生在原有基础上取得了进步。
在学生方面,传统的教学成效评价多是将平时的测验成绩作为最终考核;对于教师,除了所带班级的整体成绩外,一般以发放调查问卷的形式让学生对老师进行评分。这种评价方式不仅带有主观臆断性,而且学生的最终成绩成了主要参考标准,这种成效评价考核方式不仅会打消部分学生的学习积极性,也忽略了学生进步的大小。将马尔科夫链应用到教学成效评价中,有效地避免了这种状况的发生。马尔科夫模型考虑了学生的原始状态,并消除学生的基础差异,在同一标准下将学生最初成绩分成几个等级,确定出状态空间,并建立转移概率矩阵,最终给出较为科学的评价。在此基础上,对于学生和教师有了一个相同的评价标准,即全面考虑学生的基础掌握情况,根据学生进步状况以及最终成绩来作为评价的标准。这样更能体现出学生获取知识以及教师培养能力的强弱,也更具有说服力。
参考文献:
[1]王珠珠,张伟远.我国普通高校网上教学平台及网站建设的现状分析[J].中国远程教育,2005(2):6-7.
[2]褚冠鹏.网络教学平台应用成效影响因素与提升策略研究[D].广州:广州大学,2012.
[3]余胜泉.基于互联网络的远程教学评价模型[J].开放教育研究,2003(1):33-37.
[4]Norris J R.Markov Chains[M].Cambridge:Cambridge UniversityPress,1997.
[5]韩建玲.马尔科夫链在教学质量评价中的应用[J].中国科教创新导刊,2001(1):135-136.
(责任校对 晏小敏)
作者简介:文孟飞(1975-),男,湖南宁乡人,副教授,博士,主要从事智能控制、网络教学研究。
收稿日期:20150420
doi:10.13582/j.cnki.1674-5884.2015.11.050
中图分类号:G434
文献标志码:A
文章编号:1674-5884(2015)11-0156-04