学习状况整体和个体评价方法研究

2013-04-29 05:23:22祝勇仁

广西教育·C版 2013年8期

【摘要】为合理地评价学生的整体和个体学习状况，避免不同测试内容和难易造成的原始分的不可比和叠加性问题，采用标准分的方法进行数据的统计分析。对整体学习状况的评价根据成绩等级的转移情况，提出应用马尔可夫链进行定量评价的方法。对个体学习状况的评价考虑到了个体基础的差异，采用进步度得分和标准分相结合的复合评价的方法进行定量评价，与单纯的绝对分数评价相比更具合理性。

【关键词】整体个体学习状况标

准分马尔可夫链复合评价

【中图分类号】G【文献标识码】A

【文章编号】0450-9889（2013）08C-

0041-03

如何科学地评价学生的学习状况是教学评价的一项重要内容，通过学习状况的分析、评价，有助于提高和改进教学方法，甚至教学方式的根本改变，使教学质量得到提升，学生的学习效果得到强化提高，与素质教育的目标真正达成一致。

对学习状况的评价方法主要是基于学生的学习结果来进行评判的。从单纯绝对分数的数理统计分析到利用数据分析创建不同的评价模型来进行定性和定量的分析。这些方法包括采用平均分、平均学分积和因子分析模型等多元统计分析进行综合评价的方法，DEA法对学生学习状况的评价与预测，以及基于B-P神经网络的学习效果综合评价方法等各种方法。这些评价方法通过对原始绝对分数的统计、分析和建模来进行学习效果的评判，具有一定的局限性。由于测试的科目不同、教师不同以及每次测试题的难易和区分度不同使得原始分的评价效果失去了很多横向和纵向对比的可能，因此评价模型的适用性不强。本文提出一种建立在标准分基础上的评价方法，可对不同内容和难易的测试结果进行整体和个体学习状况评价。

学习状况的评价主要是激励优秀学生更加努力学习，同时也应考虑到学生个体的基础差异现实，鼓励基础相对薄弱的学生树立信心，不断进步。单纯地根据绝对分数评价学生的学习状况，忽视了学生个体基础差异的事实，只对基础条件较好的学生起到了促进作用，对基础条件较差的学生则很难起到鼓励作用。原始分评价存在的缺点主要是因为原始分缺少了个体在团体中的位置信息、原始分可比性差以及原始分的不可加性。例如，学生的两个科目测试结果分别是90和80分，虽然90>80，但不一定能说学生在90分的科目上考得比80分的好。因为有可能80分的科目在整体的排名比90分的高，这是由于不同科目测试的内容和难易不同导致的。即使是相同科目的不同测试结果由于测试的内容和难易不同，也不能直接比较。因此，根据原始分对学生的学习状况进行分析评判有相当大的局限性。

一、整体学习状况评价

（一）标准分的计算。用导出分数进行评判可以避免原始分评价的不足，标准分是较常见的导出分数。标准分是由平均数和标准差规定的相对地位量，它是以标准差为单位标定某一分数离开团体均数的距离。

标准分的计算公式如下：

其中，Z为标准分数；x为原始分数；为原始分数的平均数；S为原始分数的标准差。

标准分是以标准差为单位来衡量原始分高于或低于平均分的程度，揭示了每一个原始分在同一总体中的相对位置。如果原始分高于平均分，Z分数为正值，低于则Z为负。由于Z分数有正有负，不易理解，一般把它转换成易于了解的导出分数，表达式如下：

Z'=A+BZ 公式（2）

其中，Z'为导出分数；A为一般在学校教学评价中可设为70；B为Z分数的扩大倍数。

因为在Z分布中，正负3个标准差已经包括了总面积的99.7%，若标准分以百分制计，以10为宜，则导出分数计算公式如下：

Z'=70+10Z 公式（3）

从原始分到标准分的转换是线性，不改变分数在整体中的位置。但经过转换后使得不同科目的测试结果和同一科目不同次的测试结果具有了相同的分值单位，因此使得不同科目之间可以进行横向比较，相同科目不同次的测试也可以进行纵向比较。同时不同科目的测试成绩也具有了可加性。因此标准分克服了原始分在测试结果统计分析方面的局限性。利用标准分进行分析评判也使得对学生学习状况的评定更加科学合理。

（二）应用马尔可夫链的整体学习状况评价。在对学生整体学习状况进行评价时，为客观评价学生的学习状况或教师的教学效果，应排除每个学生个体的基础差异造成的影响。马尔可夫（Markov）链评价法是一种以概率论和随机过程理论为基础，运用随机数学模型来分析现实活动发展变化过程中的数量关系的一种统计方法。在学习状况整体评价过程中，可把群体学生测试成绩人数的百分比作为状态变量，用马尔可夫过程转移概率来反映学生的整体学习情况变化。考虑到每次测试的内容、难易以及教师的教学水平等差异，可按百分制的导出分数（百分制标准分）确定学生的成绩等级转移情况来确定转移概念矩阵P，这可有效避免上述因素对转移概率矩阵的影响。根据教学规律和学习效果的整体评价要求，本文只限于讨论齐次马尔可夫链在教学评估中的应用。具体步骤如下：

第一步：确定状态变量。

用向量形式表示如下：

ni为等级xi（t）的数量，R（t）为状态向量，xi（t）为状态分量。显然可以得到

第二步：确定转移概率矩阵P。

其中：，nij为状态i到状态j转移的数量。

第三步：求出转移概率矩阵P的极限向量。

从齐次马尔可夫链的遍历性可知，其极限分布x=（x1，x2，…，xn）是方程组

第四步：确定评价效果等级。

根据最大原则，可取max（x1，x2，…，xn）所在等级来表示评价效果的等级。

表1是某次20个学生经原始分按公式（3）转换成标准分的3次测试的成绩。

对成绩状态的转移分类方法，可以按标准九分将所有的排名从前到后按全体人数比例的4%、7%、12%、17%、20%、17%、 12%、7%、4%划分为9个状态，或以优、良、中、及、不及格五级分类法分成5个状态，即1：100～90，2：89～80，3：79～70，4：69～60，5：59～0，其中aij表示某学生从第i个状态转移到第j个状态，表1中i，j=1，2……5。由于从原始分到标准分的转换是线性的，这里仍以5级表示学生的成绩转移状态。

根据表1统计可得各个等级的状态转移情况，第二次相对于第一次的转移概率矩阵如下：

根据第三步有X=XP，即[I-P]X=0，I为单位向量，因此向量X=（x1，x2，x3，x4，x5）为转移概率矩阵P的转置矩阵P'的特征值为1的特征向量，解方程[I-P']X'=0，同时注意到，可得第二次相对于第一次有X21=（0.322，0.387，0.194，0.097，0），同理可求得第三次对第二次的X32=（0.263，0.302，0.220，0.120，0.095）假设对每个状态赋予一定的值，分别是：95，85，75，65，55，则两次加权后的平均成绩为：S21=84.34，S32=80.18，由于S21>S32，因此可以说第二次的学习效果提升比第三次的好，从评价教师的角度看，可以认为第二次的教学效果要好于第三次的教学效果。

二、个体学习状况评价

整体评价是一种对群体学习状况的评价，为了得到相对准确的评价结果，还必须对学生个体再进行具体分析。正确的个体评价有利于充分调动学生的学习积极性，也关系到采取的管理措施。对学生对个体评价不仅要考虑到其在整体中的排名，还要考虑到两次测试之间的进步度的排名。常见的进步度评分方法有美国测量学家hale研制出的指数评价法进行以及累进评分法等。不过这是一种关注能力变化的过程性评价，而非终结性评价，评价结果只反映了个体在某种能力变化过程中的努力程度大小。为了得到对学生个体的终结性评价还必须考虑学生对静态成绩。由于每次测试的区分度和难易是不完全相同，因此应根据标准分来进行分析统计才能比较完整的反应的个体学习状况。在下面的模型中给出了一种新的个体学习状况评价方法，这种评价方法在考虑到个体的进步度差异的同时还考虑了个体的静态学习成绩，可称之为复合评价方法。

假设学生的原始成绩换算后的标准分为a，与上次相比的进步分数为△t，那么在计算进步度得分H时，必须注意到H应该与△t成正相关，即△t越大H也应越大，a越大时取得进步分△t的难度越大，因此对不同等级分数应考虑取得相同进步分时的权重应有所区别，也就是说从60分进步到70分的进步度得分H应小于从70分到80分的进步度得分。给定a，假设本次最大进步分是tmax，考虑到原始静态分与进步分后，给出进步度得分计算公式如下：

在对学生个体学习情况进行评价时，应既考虑静态分数，同时也应考虑进步度得分的动态分数，才能形成比较合理的评价，因此在评价学生个体学习状况时，根据静态和动态分数的不同权重给出的复合评价公式如下：C=0.3×H+0.7×Z'，根据该公式，对上述20个学生计算后可得学生个体评价排名。鉴于篇幅，选择几个代表性的学生排名来进行诊断论述，如表2所示。

三、结束语

上述对学生学习情况的整体和个体评价模型都是在标准分的基础上进行评价的，这使得由不同难易度和区分度，教师执教能力差异造成的测试结果可以进行纵向和横向比较。而单纯的绝对分数对学生的学习状况评价忽视了基础条件差异，不能得到合理的评价。当然评价是基于学生以往的学习情况，但学生的学习情况并不是一个线性的过程，由于多种因素的影响，评价结果并不一定是评价对象的真实状态反映，在解释评价结果不应过分夸大学生的某些差异和变化，更不能给学生下“没有发展前途”、“缺乏学习动力”等之类的结论。对教学工作者而言，评价结果应能起到改变教学方法、方式，改进教学管理手段，真正实现因材施教，从而提高学生的学习效果。

【参考文献】

[1]刘琳，丁琨，张健，等.利用多元统计分析进行学生成绩综合评价[J].农业与技术，2012（4）

[2]王越，王兆国.学生学习状况评价与预测研究[J].价值工程，2010（12）

[3]蔡章利，陈小林，石为人.基于B-P神经网络的学习效果综合评价方法[J].重庆大学学报（自然科学版），2007（7）

[4]周红芬.如何看待标准分更真实反映学生的水平[J].湖北成人教育学院学报，2011（9）

[5]盛骤.概率论与数量统计[M].北京：高等教育出版社，2009：134-136

[6]高炳乾，子莲鹰.累进评分法在体育课田径技术教学考核中的应用[J].大理学院学报，2009（4）

【基金项目】2012年度浙江省高等学校国内访问工程师（B类）项目（浙教办高科〔2012〕152号）

【作者简介】祝勇仁（1976- ），男，浙江江山人，浙江机电职业技术学院机械工程学院讲师，硕士研究生，研究方向：化工过程机械，制造业信息化工程技术，教育管理。

（责编黎原）