英语测试中的效度、信度和真实性

2014-04-29 08:11陈莉燕王军
课程教育研究 2014年1期
关键词:效度真实性信度

陈莉燕 王军

【摘要】英语考试种类繁多,有国家四六级,AB级,还有面向社会的PETS考试出国人员的GRE\TOFEL等。本文从各种英语考试命题的角度出发,分析一份试卷的效度、信度和真实性,对一线的教学工作者而言知道如何确定试卷的质量,在以后的教学中会有很重要的应用价值。

【关键词】英语测试 效度 信度 真实性

【中图分类号】G718.5 【文献标识码】A 【文章编号】2095-3089(2014)01-0096-01

如何评判一份试卷的质量?如何测试各种语言技能和如何设计各种测试题目?我们知道一套试卷最终设计好了之后,我们更应该知道它的质量如何?也就是它是否符合语言测试的要求?所以,需要对试卷质量进行评估,评估的主要标准是什么?一般就是它的效度、信度和真实性。下面分别讨论之。

1.效度

效度,又称有效性。它是指一套测试卷所考的是否就是设计人所要考的内容,或者说,在多大程度上考了想要考的。所以,效度的高低是衡量一套语言测试卷最重要的指标,它是语言测试的出发点,是基点,因为一项效度很低的语言测试是没有实际意义的。例如,测试听力的考试中出现了写作,这种测试效度是很低的。例如,Is photography an art or science?这种题目效度很低,因它似乎是对有摄影知识的学生才起作用,对摄影一无所知的学生而言根本测不出他们的写作能力。所以,这个题目对后者而言效度很低,因为我们要测的是他们的写作能力而不是摄影知识能力。需要指出的是,语言测试的效度是一个相对概念。例如,把剑桥商务英语证书考试来测试非英语专业的学生英语水平效度就很低。

2.信度

信度是指考试结果的可靠性和稳定性,它通常以两次考试结果相关系数来表示,系数越高,信度也就越高。影响信度的因素很多,主要有外部环境和个人因素,同时试卷的量是否足够大,区分度是否高,难易度是否适中,评分是否客观等因素也影响着信度。

3.信度和效度的关系

信度和效度是衡量测试质量最重要的两个指标,他们之间是相互依从,相互排斥的关系。从方向而言它们是单方向的,即信度差则效度必然差,但效度差信度未必差[1]。现实常常是两者妥协的结果。例如,我们用一个已经证明具有很高信度的听力测试卷去检验学生的阅读能力,在这种情况下,考试的结果即使具有很高的稳定性(信度高)也没有用,因为试卷的误用无法使我们测量到所期望的能力。但一个考试具有效度的话,它首先是有信度的基础上。因为,其一是如果考试结果本身不可靠的话,我们怎么能说该考试就测试出了出题人所期望测定的学生的语言能力呢?其二是我们的效度确定需要以考试结果作为基本数据,不可靠的数据无法用来确定考试的效度[2]。所以,信度是保证效度的必备条件之一,只谈信度而忽视效度是没有实际意义的。

4.真实性是考试的另一重要评价指标

什么是英语测试的真实性?测试界对此有很多看法。Bacherman认为,真实性是指某一语言测试任务与实际语言运用任务在特征方面的对应程度 [3]。它们之间的关系可以用下图表示:

这里的 “任务特征对应”可以理解为“形式”和“性质”上两个方面的对应。

4.1情景真实性

所谓情景真实性指测试方法特征与将来某一特定目的语使用的情景特征相关的程度。刘润清认为:考试任务的特征和将来目的语的使用的情景特征相一致的时候,考试任务才具有情景真实性。具体到每个考试它的情景真实性是相对的,是随着考生情况而变化的。例如,参加商务英语证书(BEC)考试的考生在其工作中肯定会遇到与客户用英语就商务活动面对面交谈的情景,而该口试中就安排了考生之间面对面交谈这一活动,因此该口试具有很强的情景真實性。

4.2交际真实性

它指的是考生在完成某一测试任务时,其语言能力的哪些方面参与了完成该测试任务的活动, 参与的程度如何,与情景真实性真实性不同,交际真实性强调的是考生与测试任务之间的交际关系。

4.3如何提高语言测试交际真实性

一般来说,提高测试的情景真实性要容易些,而提高交际的真实性要难些。Bacherman提出用以提高语言测试交际真实性的四项措施[4]:在设计考题时可以具体说明考生只有使用何种策略才能完成任务。提供机会。即给考生提供充足的时间、必要的信息和工具等。考试任务要得当。任务太难会影响考生的策略的应用。考试任务要有趣味性。通过提高考试的情景真实性可以提高考试任务的趣味性。

4.4编写试题的真实性原则

语言的测试目的就是为教学服务的,要考察考生在实际的环境下使用语言的能力,所以试题的编写要遵循试题的真实性原则。例如,下面的例子中:

____, I would take an umbrella with me.

A. Had I been you B. I were you

C. Were I you D. I had been you

这道题从语法的角度来讲,答案应该是C。但现实的情况是人们很少这样用。在人们日常的交谈中,多半是直接说I would take an umbrella with me. 不会出现题目答案那样的倒装形式。就是说这样的题目虽然情景是真实的,但交际的真实性较差。总体上也就影响了这道题的真实性。那么,如何保证试题的真实性呢?我们建议题干最好来源于实际语言交流的自然篇章。这样的题干可以给考生提供一定的语境,出题也方便,同时也保证了试题的真实性。

5.结论

英语教学和英语测试是教学过程中密不可分的两个部分。英语测试直接服务于英语教学,对英语教学有一定的监督和反馈作用。因此要使测试真正起到应有的作用,并且达到预期的效果,就应该挑选适合我们教学目的和要求的测试形式,并知道如何从一套测试卷的效度、信度和真实性出发确定试卷的质量,这对于一线的教学工作有很重要的应用价值。

参考文献:

[1]刘润清、韩宝成编著.语言测试和它的方法[M].北京:外语教学与研究出版社,2000.

[2]Hughes, A. Testing for Language Teachers. 1989. Cambridge University Press.

[3]Bachman, L. Fundamental Considerations in Language Testing. 1990. Oxford University Press.

[4]邹申,杨任明.简明英语测试教程.高等教育出版社.2004.

猜你喜欢
效度真实性信度
《广东地区儿童中医体质辨识量表》的信度和效度研究
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
广告的真实性
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
被看重感指数在中国大学生中的构念效度
从悬疑报道谈新闻的真实性
坚持新闻的真实性
外语形成性评估的效度验证框架
中文版脑性瘫痪儿童生活质量问卷的信度