郭 鉴 刘淑红
成绩考查即人们所理解的考试,在近代“中华民国”成立之后,学校的成绩考查仍然受传统的科举论文式考试方法的影响,考试试卷题目较少,取样范围较窄,答案长而无客观的评判标准,考试的可靠性较低,学生所得分数往往不足以表现出其对某个科目知识体系的掌握程度,“查小学成绩考查法,现尚无一定标准,已成为目前办教育者一重要问题。”[1]至南京国民政府时期,中国的社会转型步伐加快,新式教育兴盛,刚刚出现在西方的教育测验、教育测量与统计等理论很快被引入中国,并呈现出多元化格局[2]。受教育测验理论与方法的影响,应用测验法的考试被称为新法考试,并很快应用到小学的各科考试中去。
“五四”运动前后,新式教育兴起,1922年新学制公布的小学课程分为国语、算术、卫生、公民、历史、地理、自然、园艺、工用园艺、形象园艺、音乐、体育十二门科目[3]。课程设置更加贴近学生生活,符合学生兴趣,丰富、完善了课程结构。但当时的教学理论和教学方法受旧教育影响甚深,以纸笔考试和策论式题型为主的传统考试方法深刻影响着学校教育。学校里考试密集,方式呆板,频繁的考试给学生带来了沉重的心理压力[4]。旧时以论文为主要方式的成绩考查方法已不能适应时代发展的需要,新的课程需要新的方法来考查。
南京国民政府时期,小学的成绩考查从内容到方法都焕然一新,小学考试的变革离不开以杜威为主要代表的美国实用主义教育思潮在中国的传播。杜威的教育思想和著作中都含有心理学思想,为教育测验在中国的传播与推广奠定了理论基础[5]。教育测验的出现与近代自然科学的勃兴息息相关,一些学者开始以自然科学的模式去从事教育研究,推进了教育学科科学化进程,用实验材料、统计数据向人们展示教育学科的客观性[6]。陈翊林在《近代中国教育总评》一文中概括了民国时期新教育的改造要求教育科学化:“一方面要求在教育中增高科学的地位,注重科学的研究;又一方面要求将教育的本身也构成一种科学,最近几年的科学教育和教育的科学研究——教育调查、教育测验、教育试验和教育研究的发达,便足证明这种趋势。”[7]
这一时期新文化运动的开展使学生思想获得很大解放,对于考试问题很多学生的观点是直接废止[8]。因为学校教育的目的原在谋学生心身方面的发展,能应用于实际生活,现在的考试达不到学校教育的目的,因此,“学校考试制度应当废止,就是但从他本身而论,已经同教育的目的根本违反,万无存在的余地了。”[9]“考试并不能达到吾人所希望的目的,既不能测验学生的成绩,复不能督促学生用功,结果只有牺牲学生的身心健康,阻碍社会的进步。”[10]“废考运动”的发生与五四时期学生的思想动态、社会风潮有很大的关系[11]。自从杜威博士来华讲演之后,学界里就有很多人——自然是被考的学生占大多数——发生了“废考”的狂热症,竭力从事于“废考运动”;也有一部分人认为学校的考试方法应当进行改良[12],因为“成绩是儿童学习的记载,儿童学习不留成绩,这学习便毫无意义”[13]。
教育测验作为一种新的科学理论被引入中国,由此引发的测验运动几乎与“废考运动”同步达到高潮,改革学校考试自然成为倡导测验运动学者们关注的对象[14]。时人认为西方教育科学的进步大都是应用测验的结果,现在各学校及各教育团体几乎无不利用测验来解决教育上的问题[15]。“以前学校里所用的考试制度是度量方法之一种,而其中方法的不精密,不科学,早已经暴露无遗。多少学者想种种方法来改造,测验法就是改造的考试法最适用的一种。”[16]民国时期有关测验法的研究显示出心理与教育测验能有并将有很大的进步,较之以前更为科学更为标准,更容易用数量化来处理,更足以表达儿童学习能力中的主要特征,更易于考查施行与成绩计分,因此测验是一种进步的考试,比旧法考要好得多[17]。
南京国民政府时期有关小学成绩考查试题编制的变革主要体现在以下几个方面:
编造考试题材之前需要搜集材料,确定考试范围。相关学者需要分析各种学科的教科书的共同教材、参考已有的相关测验、搜集与儿童实际生活有关的材料等,同时还需兼顾教育部颁发的课程标准[18]。在此过程中需要遵循的原则有:试题具有普遍代表性,合乎学生已有的学习程度,在日常生活中能够应用,能够为专家所公认,注重随机性等几个方面[19]。俞子夷在《考题的取材和代表性一文中》对试题的取样方法做了一定的说明。从需要考查儿童的三百个字里随机抽取三十个字作为考试题材有两种方法:一是把他们打乱顺序后随机抽拿三十个字;一是按照生字表每隔十个字抽取一个字。除了生字外,常识等材料也可以按照这个方法随机抽取作为考题。常识的抽取可以用课本的页数和行数,例如学期终的成绩考查规定要考课本全册,共有四十课,八十四页,预计出考题六十道,第一课第二行里抽取出一题,以此类推。也可以将每课要点整理出来编成序号,随机抽取序号,抽到后按照抽取数字所代表的学科要点出题[20]。
试题编制完成之后还需要注意题目的排列要先易后难,“测验之首题应易,测验之末应有数难题,排列方法是问题由易而渐难”[21];要依据问题的数量、内容、酌情规定一个答题时间;试卷的格式用横行,便于学生答题;考查时的手续应有说明和指导;学生的座位要适宜;同时也讨论了分发试卷的流程、注意事项,以及考试结束后试卷的校阅[22]。
小学里学业成绩的考查共分为平时考查、临时考查和定期考查三种。第一,平时考查,注重儿童平时的成绩,可在课内或课外用视察、问答、检查笔记、实地演习等方法随时评估儿童的成绩;第二,定期考查,是在一学期结束时举行的考试;第三,临时考查,每月末举行,一般是每学期至少举行三次,教师有审察利弊、自行决定的余地,临时考查较为灵活,教师拥有一定的主动权。
关于这三种成绩考查的时期,学者们对“临时考查”讨论颇多。有学者认为,临时试验最好在每一次教材单元学习完毕以后举行一次,各科教材的编排,最好都以五星期为一单元起讫,因为根据相关心理实验的报告,每隔五星期左右举行一次复习总结,时间距离很平均,可以把许多割裂的学习总汇起来,对知识作一次有系统有条理的整理,进而维持儿童努力学习的兴趣[23]。也有学者认为,临时考查以采用各学科巡回轮流举行的办法为最宜:教师在每学期开始的时候,把一切要举行临时考查的科目及其次数,统盘筹算,排定顺序,譬如每学期开学第三周起考查读书,第四周考查算术,第五周考查社会,第六周考查自然,第七周考查卫生,然后至第八周再考查读书,以后照此类推,周而复始。这种临时考查排列顺序的原则,凡每周教学课时较多的科目,应排在前面,每学期可有四次以上的考查;每周教学课时较少的科目,应排列在后面,每学期至少有两三次的考查[24]。
教师在实际考查学生成绩过程中要采其长处,依照各科教材的单元,配置适宜的巡回考试时期(间),进而收到考试的实效。
测验法,系别于旧式论文式考试方法而言,一般是指教育测验或新法考试的方法,包括通常应用的真伪法、填字法、选答法、类推法、订误法、指认法等。小学成绩考查能够应用的考试题型主要有以下几种[25]:
1.填充法示例:
鱼在……生活。下雪的……很冷。运动可以……身体。
2.是非法或正误测验示例:
牛是吃草的。对错
蝴蝶是鸟类的一种。对错
太阳出自南方。对错
读书要比游戏好。对错
船比飞机快。对错
3.选择法示例:
政权属于(1)政府(2)人民(3)党员
做史记的是(1)班固(2)刘向(3)杨雄(4)司马迁
为什么牛奶是很好的食品?因为
□它可以充饥。□它是很滋养的东西。
4.认识测验的示例:
夏天的天气是:(1)热(2)温和(3)冷(4)凉快………………()
中国最长的河流是:(1)珠江(2)黄河(3)闽江(4)扬子江…………()
5.对比测验的示例:
a. 中 国 ……………… 东 京() b. 美 国………………伦敦()
c. 日 本 ……………… 纽 约() d. 英 国………………北平()
根据以上的示例可以看出各种测验的做法很简便,效率颇高,在短时间内能考查学生更多的知识内容。例如正误测验,儿童回答各项问题,若认为对,则在“对”字下画一画,若认为错,则在“错”字下画一画。填字测验则将各题的空白逐一填写;认识测验,则将认为正确答案所代表的数字填在括号内;选择测验则是在认为正确答案前的方格内画一个十字;对比测验则将有关系的选项所代表的字母填写到括号内[26]。据南京国民政府时期相关的研究成果,在六十分钟的实验内,新式测验的内容的范围可以三倍于旧式考试[27]。
浙江省立中学附属小学整理小学成绩考查法报告要目中提到关于学业方面的成绩考查,往往是根据学科选择不同的考查方法与考试题型[28]:
整体上看,民国时期小学考查学生成绩方法依照科目性质分为三大类,并对每一类的科目所用的考题形式和成绩等级做出了相应的规定:第一类:国语,算术,社会,自然四科注重笔试、命题及测验法参酌行之。第二类:劳作,体育,美术三科,注重习作,以主试所指定之题材,使学生习作,由考试原二人以上评分平均结算。评分标准:劳作——使用工具合法占30%,习作顺序及方法占30%,结果精良占40%;体育——技能占50%,姿势占30%,精神占20%;美术——整洁占30%,顺序及方法占30%,结果占40%。第三类:卫生,公民训练,音乐三科,在考试过程中要知识与实践并重,关于这三科知识的考查,以测验法行之;而关于实践的考查,由二人以上考查员指定题材进行考试,其所得评分之平均数,与知识评分平均计算,其中知识与实践各占50%[29]。
表1 学科考查方法与考试题型
儿童的学业成绩与其升学、毕业、留级、退学息息相关,《教育部公布学生学业成绩考查规程令》中将学生成绩分为甲、乙、丙、丁四类:甲,八十分以上;乙,七十分以上;丙,六十分以上;丁,不满六十分。丙等及其以上为及格,丁为不及格;及格的学生毕业或升级,不及格的学生留级,留级两次仍不及格者,令其退学[30]。科学客观地记录学生的成绩就显得非常重要了,而记分法是用数字符号或简单的评语,显示成绩考查的结果和儿童真正成绩的一种方法,与成绩考查的关系至为密切。教育研究者应当根据客观的标准,运用科学的方法,订定一种足以代表儿童成绩全部意义的记分方法,使能表示考查的正确结果和儿童的真实成绩,以达到成绩考查的真正目的[31]。记分法的选择标准最主要的不外乎两点:精确地表示学生于一班中的比较地位和精确地表示学生已获得的真实成绩。除此之外,计算手续简单易行、易于表示及格的界限、便于报告家长也是选择记分方法的次要标准[32]。
普通学校的记分法主要有百分记分法、等第记分法、比较记分法、S 记分法四种[33]。应用标准较高的为麦柯尔设计的适用于标准测验的TBCF记分法:
“在未有标准测验以前,一般学校测量儿童成绩,种类多而漫无标准,主要应用主观色彩很浓的估量的记分法,均属教师臆断,甚或有以好恶而给分。自麦柯尔博士到华后,和国内专家的努力,对于弥补以往一切记分法缺憾的客观的精密的科学的各项测验,由各地很多数的十二岁儿童的测验统计,而制成TBCF 记分法的标准测验,便利我们去采用他来做考查成绩的依据。”[34]
钱希乃的《麦柯测验编造的TBCF 制》[35]和薛鸿志翻译的《TBCF 制之量尺制作法》[36]对TBCF 制的编制原理和使用方法做了详细介绍,其编制的手续较为复杂,需要对百名以上十二岁的儿童进行测验,不适用于平时的成绩考查[37]。但其应用的统计学原理以及客观、科学的态度体现在小学成绩考查常用的其他四种记分方法——百分记分法,均分记分法,常态记分法和S记分法[38]。
(1)百分记分法。以一百分为满分,六十分为及格线,零分为最低分,儿童答对一题就得到一题的分数。这种记分方法手续简单,使用便利,直到现今仍在沿用。但是,其中的缺点也是显而易见,百分记分法把学生的成绩规定在0-100分之间,这个0分是人为假定的起点,即使学生得了0 分,我们也不能说该生在本学期没有学到任何知识,或者说该生的知识水平为“零”。
(2)常态记分法,也称其为科学计分法或等数计分法,这种方法所依据的基本原则是“常态分布”的定律,凡是世界上一切事物,在统计方面所呈现的状态都是一种常态分布的情形[39]。即估定一个学生的某项成绩在某一团体中所占的地位,可以不记分数,儿童最终的成绩代表在一个团体里分配的地位[40]。把学生的成绩分成六等,即“超、上、中、下、末(及格)、不列”。这六等的评给有着一定的比例,一班一百个学生中,“中”当然最多,上和下次之,超、末、不列最少,各占百分之五。这种方法考查不出成绩好的学生好到什么程度和成绩差的学生差到什么程度,评价学生的成绩只是一个相对的标准,因此,无论它对一般学生有多大激励的作用,对根底差而一时还难以赶上的学生,总是个打击,无论他如何用功,总归是个“劣”,终究被淘汰[41]。
这种记分方法可以显示出儿童在全班中比较的地位,避免在成绩考查过程中受到试题难易、评分宽严等因素的影响。但其缺点也较为明显:儿童学业成绩的表示未免含混而不够精确,如果全班同学整体程度较好,也需要委屈几个人列入下等和劣等。这种百分比是由常态曲线求出来,是一个概算,任何班次中全班的学业成绩都会发现与常态分配不合。这是因为常态分配是从很大的数目中求来的,数目越大,则常态分配越显著。学校中每班学生多在四十人左右,常态分配状况是不显著的[42]。
(3)均分记分法。记分方法为:百分比=(100÷测验题数)×答对题数。均分记分法由徐则敏创制,简单易学,各单位间距离相等,可以表示出学生学业成绩的真正优劣。例如某测验共40 题,某生答对30题,则其均分为:(100÷40)×30=75%,查百分比与均分对照表(如图1 所示)得56.8。这种记分方法所依据的统计原理是根据一群随机选择的学生作业成绩制成常态曲线分配而得,例如小学四年级第一次国语月试为40 个测验题,倘使教师的出题全是根据客观考试法的原理,那么用这四十个测验题去考查两千多个各种性质的小学四年级学生第一个月的国语成绩,这两千多个任意选择来的儿童的国语成绩应当接近于常态曲线分配[45]。
图1 常态分布图[43]
(4)S 记分法,也称为应用标准差记分法。是应用统计学上测量差异的数量,以人数分配的差异为计算分数的标准。先求出学生所得的学业成绩在全年级中所占的百分数,再由此百分数所对应的标准差的数值,作为该生的成绩分数。S记分法应用统计原理,各儿童名次间的距离相等,显示出各个学生在全班中的比较地位,教师对于学生在全班的学习成绩可以有一个明确的观念[45]。
S记分法计算手续繁杂;只能表示出学生的比较地位,不能看出学生对知识掌握的真正优劣;不能求平均分;作文、美术、音乐等不能分成若干题目数的学科,不能用S 记分法。现在普通学校班级的人数不多而又未经过随机分配,在应用S 记分法时不合乎常态分布。S 记分法只能表示一级或一组学生成绩的比较地位,不能表示出两组或两班以上成绩比较的优劣和儿童学业成绩的真正水平。因此,S记分法所得到的成绩看不出来学生前后的差异,也就无法判断教师的教学效率,不能决定教学方法的取舍[46]。
这四种记分方法各有利弊,民国学者沈有乾曾
指出:“现在并没有一种完善的计分法,绝对制与相对制,各有利弊,应用记分法的,应斟酌实际情形而参用两制。”[49]应当依据所记分数是否真测量学生的学识、能力及技能或其他进步的情形来选择合适的记分法[50]。浙江省各级小学各科成绩考查暂行办法大纲中规定了不同的测验选用不同的记分方法:标准测验,用测验单位T,B,C,F 记分;自编测验,用S记分或均分法;普通的学业成绩考查,用常态分配记分法。同时也对学生升级毕业的成绩标准做出了如下规定:
表2 百分比与均分对照表[47]
表3 由百分比求S分对照表[48]
1.党义,体育,读书,作文,算学五科及格
2.社会,自然,工作三科仅一科不及格
3.音乐,写字,说话,美术四科仅一科不及格
学生修业期满,成绩不合上列条件的,须补习及格后,方准毕业。而及格的标准因记分方法的不同而另有规定:常态分配记分法以3 为及格;S 记分法以40分为及格[51]。
20 世纪20 年代的中国教育思潮此起彼伏,以杜威为代表的实用主义教育思潮反对僵化的传统教育及其形而上学,尊重儿童本性、本能与兴趣,强调以儿童为中心等新教育主张,以客观、科学、量化为主要特征的教育测验等,这些教育观念与当时中国蓬勃兴起的“新文化运动”和“五四运动”相契合,进而开展了形式多样的新教育学校的变革与探索[52]。南京国民政府时期小学考试受到教育测验的影响,“革除以往成绩考查的谬误,而开一适应儿童个性的需求的课程与教法的新途径,也可谓是近年中国在教育上的一个大变动。”[53]中国传统的旧式考试源于科举主观式论文考试,太过主观而逐渐被当时教育界所摒弃,客观科学的新法测验便被应用到大多数的小学中去[54]。时人指出,自教育测验发达以来,平时学校各学科成绩的考查法得到了相当的进步,渐渐由主观的考试法进至于客观的考试法[55],“自教育测验发明以后,对于一般普通考试是一种很大的改进,许多考试都已抛弃往日文章式的旧法考试,而采用测验式的新方法。”[56]许多教育界人士为完善小学成绩考查做出了不懈努力,有研究者主张教学过程中的考查应和教学后结果的考查、行为的考查和知识的考查、口头工作的考查与笔头工作的考查等同样重视[57];成绩考查之后的分数记录务求简单,并且宜守秘密,因为公布学生成绩容易养成儿童为分数而求学,并非真正为学问而求学的精神[58]。广大教育家的努力使小学成绩考查趋向于科学与规范。虽然成绩考查的内容和方法有所革新,但也存在一定的弊端,如考试的方法流于机械,在对测验结果的解释上忽略了学生学习行为的完整性、有机性和综合性,测验试题只限于对知识与技能的测量,胆识、理想、态度、兴趣等方面则得不到圆满地测量。变革后的小学考试不能完全测量学生的思想和理解能力,主观式的考查方法也就保留下来,所以旧式的考试倒也不可尽废,最好新旧两种考试方法能相互为用[59]。
总之,南京国民政府时期小学成绩考查的变革为学校教师提供了一种较为客观、公正、可靠的考试方法来测量学生的学业成绩,有利于促进教育者对教育目标进行定量分析,对儿童的知识技能和教材结构进行定量考查,有利于教师对学习过程的详细了解和对具体学业困难的诊断,树立教师客观评价学生学业成绩的态度[60]。