改革考试方法的探讨与设想

2014-04-29 12:26石新华

数学学习与研究 2014年15期

石新华

【摘要】本文设想将学生考试试卷题型一律改为判断题、选择题，只需要学生完成涂题卡，再由机器读卡完成阅卷，即把人工阅卷改为机器阅卷，将老师从枯燥乏味的阅卷中解放出来.

【关键词】传统试题；0-1试题；期望分数；候选答案；及格分数比例

一、引言

考试是对学生学习的一种检验.广义地说，考试是教育单位进行资格水平认定的一种手段.阅卷是纸答考试的必要环节.然而阅卷工作的枯燥乏味是所有一线教师都有切身体会的.笔答考试的题型大致有填空、选择、判断、计算、证明、作图等等，那么枯燥乏味主要来自计算题，尤其证明题.但是长期以来人们始终认为填空、选择、判断不能取代计算题和证明题.本文拟将计算题分解成若干小题，并用选择题取而代之，作为一种尝试展开讨论，以辨明真伪.

二、设想和论证

我国大学四六级英语考试早已采取100%的选择题型，国际上的TOEFL、GRE等英语水平考试已经实现了标准化试题.并且实现了计算机阅卷，替代了人工阅卷，使阅卷人从枯燥、乏味的劳动中解放出来，避免了久坐导致对腰椎、颈椎和眼睛的伤害.

传统的数学试题题型有填空题、选择题（其中包括单选和多选）、判断题、计算题（包括少量的作图）、证明题.仅从阅卷的角度，前三种题型是简单而轻松的，尤其是选择题和判断题.

选择题与判断题的本质是一样的，单项选择题是给出的四个答案，其中只有一个是正确的，要求指出正确的答案；判断题是只给出一个答案，该答案可能正确，可能错误，要求指出正确的答案.

很难比较这两种题型本身的难易程度，即解决这两种题型的困难程度，并不取决于题目给出候选四个答案，还是给出候选的两个答案，而在于：（1）题中所给的错误答案与正确答案的相似程度；（2）考生对概念理解的透彻程度和计算的准确程度.

从这种意义上来说，这两种题型都是值得推崇的，并且考生所作出的结论的真伪性是确定的，而不是模糊的，传统题型的结论具有模糊性.例如.一题满分10分，那么考生可能得分0分或10分，也可能得2分、5分或8分等；而选择判断题型，考生得分只有两种情况0分或满分，不可能有第三种结果，我们暂且将选择判断题型称之为0-1题型，我们说它具有确定性，是指考生答题的结果属于真或不属于真，二者必居其一.若广义而言，答题的结果对于真的隶属程度为0或100%，不存在0，1之间的数字，对于这种0，1状态的事物的判断和处理，不仅计算机、电子技术可以大展拳脚，人脑处理起来亦得心应手.

我们可将传统题型和0-1题型作一比较和分析，以窥其利弊.

一个要求考生作出结论并完成计算过程的题目，考生在试卷上面的书写可能五花八门，恐怕远远超出A，B，C，D四种候选答案，由此带来阅卷的艰巨性.

有人说，考生可能会受到给出的A，B，C，D四种候选答案的诱导，因而较容易地选中正确答案.然而，实践告诉我们，在传统题型与0-1题型混杂的试卷中，选择题的得分率并不显著高于计算和证明，它应当取决于出题的技巧，取决于我们对考生会犯各种各样错误的估计、了解或推断，取决于我们对人的思维规律和认识规律的掌握.

我们不否认正确答案对学生的诱导作用，同时也应当看到那些似是而非的错误答案，迎合了部分学生的错误思维、错误理解的假答案，同样对考生有诱导作用，概念稍一模糊，计算存在漏洞，使学生难以防范，而坠入“陷阱”.

另一方面，仅就适合改成选择题的计算题而言，“制造”一道计算题一挥而就，而需要两个以上的选择题才能取代它，而每一个选择题都需要“编造”三个以上（一般为四个）候选答案，除去一个正确答案外，倘若那些错误答案确实反映了考生的错误概念、错误理解、错误思维，那么这就是一道好的选择题.假答案的错误性应当具有隐蔽性，即迎合了考生的错误，便是选择题的成功.

从组织考试的角度来看，（1）0-1型试题比传统试题的出题难度要大，而工作量的加大也是显而易见的.但出题的工作总可以远远先于考试日期进行，题库是一个非常好的模式.为保证试题内容的严密性，避免过早确定试题内容，可临时从题库中调题，组成试卷.（2）使用0-1型试卷，即使尚未实现计算机化而组织人工阅卷可较大地提高工作效率.因为阅卷人既不需要阅读考生根据不同的思路写出的证明过程，思考各种不同的证明方法，也不需要逐一阅读烦琐的计算过程，选中答案得分，未选中不得分，一目了然.（3）由于真伪界限分明，既可以避免由于阅卷人的疲劳、疏忽而产生的误差，也可以避免人为的误差，使卷面成绩臻于公正.我们不仅承认，而且认可，不同的阅卷人对于同一道计算题或证明题所给分数之间的1至2的误差，并且为此耗费了许多的时间和精力.

对此每一个做教师的人都有不同程度的体会，不论是高考阅卷，还是期末阅卷都足以使人烦腻.从这个角度看0-1试卷是值得推崇的.

三、试题举例

如何排除顾此失彼的忧虑呢？仅举一例，便可看出我们和读者的共同忧虑.我们知道计算题（暂且不说证明题）是用来测试学生的计算能力，那么0-1试题能否替代这种功能？

请看计算题：

四、分数的变化

约定：x为试卷总分，n为候选答案的个数，r为及格分数比例，A为及格分数.

一般来说，x的取值范围：100≤x∈ Z ；n的取值范围：2≤n∈ Z ；r的取值范围需要进一步讨论；A的表达式为A=A（r，n，x）.

让我们看一下0-1型试题卷面总分与及格分数的变化.

假设0-1型试题的候选答案是四个，对于一个什么都不懂的考生，答对一个题的概率是25%，而传统试题他得0分的概率几乎是100%，可以根据0-1型试题的这个特点，认为考生完成0-1型试题比完成传统试题容易达到及格，这是一种误解.鉴于这种原因，我们可以适当地提高0-1试题及格的标准，即满分是100分的试卷的及格分数要高于60分.

面对全部由候选答案是四个的单选题组成的试卷，既然一个最差的考生的期望分数都不低于25分，那么索性将25分视为0分，如果试卷满分仍然是100分的话，那么在25分和100分之间只剩下75分的距离，而75分的60%恰为45分，再加上那个被视为0分的25分，可得到70分.因此我们可以将70分定为及格分数，即

（100-25）×60%+25=70.

将70分定为及格的标准是根据考生应该完成而且能够完成的最高分数的60%的原理.当一个考生正确地完成了试卷规定的全部题目即可得到总分（满分），如果考生完成了这个总分的60%，我们就认定为及格.

一般地，设x为卷面总分，则及格分数应为

（x-0.25x）× 60%-0.25x =0.7x.

这是传统的及格分数的标准.其实及格分数在总分中占的比例也是人为规定的，“60”并不是神秘的数字，根据出题人的意图完全可以改变这个比例.譬如，在不扣除随机分数的情况下，设想将其定为65%或70%等等，具体数字分析见表（一）.