语言测试学在英语教学中的应用研究

2011-12-29 00:00:00李楠
考试周刊 2011年60期


  摘 要: 语言测试学主要研究语言测试的原因、目的、内容、方法及其与教学的关系。测试的目的是督促学生学习或检查教学效果,使教学工作者能够合理地安排下一步工作。作者将测试学应用于英语教学,旨在帮助教师提高教学效率。
  关键词: 语言测试学 英语教学 应用
  
  1.前言
  语言测试通常以所教的内容为基础,也有一些标准化语言测试,例如雅思、托福等考试主要用来检测学生的语言水平,通常不管如何教或如何学。因此,在一些统一考试之前,老师对学生进行针对性培训。可见,教学和测试的关系是密不可分的。但无论哪种考试,都不应该机械地测量学生对语言形式的掌握,而应测量其实际的语言交际能力。这样的测试才能够对教和学产生积极影响。
  2.测试的要素
  2.1测试信度。
  测试信度,即考分的一致性,如果一个考试信度很高,则无论什么时间、在什么情况下对同样的学生施考多少次,各次的成绩都是一致的。例如:
  例1.利用试卷1对同一组人不同时间的两次测试的成绩:
  我们能够清楚地看出,例1中的测试成绩,有部分学生两次成绩之间差距较大,大多数差距大于五分,名次排序也有较大差距。
  例2.利用试卷2对同一组人不同时间的两次测试的成绩:
  例2的表中可看出两次考试成绩的分数差距和名次差距都不是很大,而且部分学生的成绩和名次保持一致。
  通过对两份试卷的比较,我们能够发现后者的信度明显高于前者,后者更能真实地反映学生的水平,我们在选择试卷时更倾向于后者。那么,在教学和测试时我们该如何确定测试信度呢?通常有三种方法:重复测试法,即对同一组学生在不同时间连续使用同一份试卷进行测试来测定考试信度;平行卷测试法,即让学生做两套试卷,然后分析这两次考试的结果,考试信度由分数组之间的一致性决定;对半分析法是把一份试卷分成两部分,通过比较这两部分的成绩来测定考试信度,两部分成绩越一致,试卷的信度就越高。
  2.2测试效度。
  测试效度,即考试达到其预期测试意图的程度。考试效度分为表面效度、内容效度、结构效度和尺度关联效度。表面效度是指测试的表面可信度,如果一次考试表面上看着符合测试要求,例如测试写作时让学生写作文或测试口语时让学生说话,这些都具有表面效度,直接考试通常具有表面效度而间接考试缺少表面效度。内容效度则必须对测试目的或测试语言有较透彻的分析。因为考试所选材料要同所学内容一致,所选材料的覆盖面要广,要能够反映所学内容的特点,但又不能超出教学大纲或所学内容的范围。成就考试对于内容信度的要求较高。结构效度指语言能力理论中假设的基础能力或特征。如果我们说某次考试具有结构效度,这就意味着此次考试能够有效衡量某个语言技能与该语言技能的理论基础要求的一致程度,即能够有效衡量一名考生的成绩能否达到要求。尺度关联效度,取决于它同某个可靠的学生能力测量工具之间的关联程度,即取决于两次考试的比较。要衡量某次考试的尺度关联效度,我们可以把此次考试的结果与一次公认的、很可靠的考试的结果相比较,关联性大的、一致性高的效度就高。水平测试比较强调尺度关联效度。
  考试信度和效度都是必不可少的,有了信度,才可能有效度,不讲效度而只谈信度也是没有意义的。假设我们用一份可信度极高的口语试卷区测试写作能力,就没有丝毫效度可言,此次考试也没有什么实际意义了。因此,我们在选择试题时必须兼顾信度和效度两方面。
  3.实际教学中测试结果的反馈及成绩分析
  通常测试一结束,教师就要立即阅卷并公布考试结果,就是要将成绩反馈给考生,以使其认识到自己的不足并改进学习,本节介绍一些反馈成绩的形式,下面的分析都是基于我所教的一个自然班在一次期末考试中的成绩,该班成绩如下:
  总成绩=网络听力成绩×30%+期末卷面成绩×70%
  3.1分数的分布、集中量和差异量。
  本次考试考生成绩在80—89分之间有23人,70—79分之间有10人,60—69分之间有1人,60分以下有1人。分数多集中在80—89分之间,最高分和最低分相差39分。还可以将组距定得更小(比如每5分一个组),这样能更精确地分析成绩的频数分布。分数的集中量是代表一组数据典型水平或集中趋势的量,通常用算术平均数、中位数和众数来表示集中量。算术平均数很容易计算,此次考试的平均分是80.77,但是如果出现一个过高或过低的时,平均分就不能很好的代表这组分数的典型水平了。中位数是位于按大小顺序排列的一组数中间位置的数值,各有一般频数分布在它的上下。当分数出现过高或过低的现象时,大多采用中位数来代表成绩的典型水平。集中量只能代表分数的平均水平或典型趋势,却无法反映差异,因此出现了差异量以概念,即表达分数离散程度的量,差异量越大,表示分数的分布越不整齐;差异量越小,则分数分布越集中,变动范围越小。最简单的差异量表达是全距,即最高分与最低分之差,此次考试是39分,很明显,全距易受到两极分数的影响,不能很精确地反映分数差异。当需要比较两组或几组分数的离散度时,全距就不精确了,所以我们采用标准差(SD),SD=,其中∑表示总和,d表示离,即每个分数与平均分数之差,N表示总频数或总人数。一组分数的标准差值越大,说明离散度越大,反之亦然。那么标准差大比较好还是小比较好呢?这就要看考试的目的了,若像这次学期成绩,目的是要检查学生是否达到教学要求,则希望标准差小一些,这说明学生成绩比较集中;若是一些选拔性的考试,则希望标准差大一些,以便作出选择。
  3.2题目难易度和区分度。
  要合理地分析试卷并作出改进,就要分析试题的题目难易度和区分度。题目难易度FV=,R代表总人数中答对某题的比例,N代表总人数,这个数值一定是在0—1之间,可见,数值越大说明题目越容易;数值越小则题目越难。通过对本次考试各个题目的分析和计算得出:
  通常情况下,题目难易度过高过低都不利于区分考试水平,一般将难易度控制在0.3—0.7比较合适,可见此次考试的难易度适中。只看难易度还不能完全合理地评价学生的成绩,还要看能够表明试题区分高分和低分程度的区分度。区分度D=,RT表示高分组答对的人数,RB表示低分组答对的人数,NT高分组总人数,那么区分度就可能在-1—1之间,对于一个题目来说,如果高分组都答对了、低分组都答错了,则区分度为1,这是最理想的状态;如果两组答对的人数相同,则区分度没有,即该题目无法区分学生水平;如果高分组学生都答错了而低分组学生都答对了,则区分度为-1,这是最糟糕的状态,不合理。对于此次成绩,我们把学生分为三个组,高分组和低分组人数相等,经过计算得出:
  由上述两组数据我们可以总结出,本次考试具有较强的可信度。
  4.结语
  本文旨在研究语言测试学在英语教学中的应用,开篇介绍了测试学的相关要素,最后以作者所授班级的成绩为实例,利用测试学的相关原理分析了一次期末试题并作出评价,希望通过该分析能够改进以后的教学工作和选题工作,更加有效地帮助学生掌握所学知识并予以考查其真实水平。虽然该研究能够在一定程度上帮助师生解决教学中的问题,但在测试手段、评分标准,尤其是主观题的评分标准、及格标准上还有待广大测试学者和一线教师在实践中的研究予以补充、发展。
  
  参考文献:
  [1]Heaton,J.B.Writing English Language Tests,Foreign Language Teaching and Research Press,2000.
  [2]J.Charles Alderson,Caroline Clapham,Dianne Wall.Language Test Construction and Evaluation,Foreign Language Teaching and Research Press,2000.
  [3]邹申,杨任明.简明英语测试教程.高等教育出版社,2000.