朱薇
(重庆师范大学涉外商贸学院,重庆 401520)
语言测试的信度效度
朱薇
(重庆师范大学涉外商贸学院,重庆 401520)
语言测试是检验学习者习得成果的重要手段,同时也是教学中的重要环节。信度和效度是语言测试中的基本概念。本文介简单介绍了信度和效度的定义,分析了他们的影响因素及相互关系,得出了良好的测试是信度和效度的合理平衡的结论。
测试;信度;效度;关系
(一)什么是信度
信度是指测试结果的可信程度,是衡量测验稳定性,可靠性的重要指标。语言测试信度主要衡量语言测试结果对语言受试者的真实的语言水平的反映程度,例如语言测试的成绩与语言受试者的真实语言水平如果保持一致,则此考试的信度最大,反之则最小。
(二)影响信度的因素
语言测试的每个环节都不可避免的会受到一些偶然因素的影响,这些偶然因素必然会对测试的信度有影响,影响越大,信度就越低。因此在组织与实施测试过程中,对全部的受试者都应该保持环境与条件的一致,以取得比较高的信度;在测试的评分环节中,同一项测试的评分标准应该客观,必须保持一致且稳定,这样才能保证取得较高信度;另外评分者同样是影响语言测试信度的重要因素,因为评分者会将自己的主观意愿移植到评分过程中。
除了已提到的因素之外,就试卷本身而言,影响信度的因素主要还有:1)抽取样本的大小,抽取的样本越大,就越具有广泛性,那么测试的信度当然也就越高,反之越低;2)试题的长度,就一份试卷而言,如果题量越大,则信度也会越大;3)试卷的同质性程度,试卷同质性程度越高,则信度也越高;4)试题的难度,试题的适宜度是否和受试者的水平匹配合适。
(一)什么是效度
测试效度是指语言测试的真实性和准确性,也就是此测验与旨在测量的目的相符合一致的程度。也就是说该测试是否有效度在于它是否真实地测试出它想要考察的内容。如果测试和测试内容的相关系数为0,表明测试内容是无效的;如果相关系数小于0.4,表明效度很低;相关系数在0.4~0.7区间,表明测试有效;换言之,相关系数越接近1,则说明考试的效度越高,反之则越低。
(二)影响效度的因素
所有对测试准确性和真实性构成偏差的因素都对效度有影响:1)试卷题目的要求不清楚,考生会因为不明确要求而降低了成绩;2)试卷题目的适宜度太差,没能在受试者的合适的水平上测试想要测试的内容;3)试卷选择项目含糊不清,同1)一样会使受试者因模棱两可的选择而降低成绩;4)测试内容与测试目的不符合或者没有足够的题目来代表测试内容;5)受试者的心理因素:例如测试题目一开始太难导致受试者因受挫而影响后面的发挥;6)测试选项不合理:如多想选择里,正确答案很容易被考生以某种技巧识别。
Bachman(1996)和Fiske都对语言测试信度和效度的关系做过相关的研究和阐述。Bachman认为信度和效度测试是影响测试分数的两个很重要的因素,此二者相互补充和限制。信度可以反映出测量随机误差在考试结果不一致的原因中所占的比重;而效度则是反映出测试结果与测试的参照标准之间的相关性。换一种说法就是,信度是考察考试结果的影响因素那些想考的内容以外的因素;而效度则是考察考试结果的差异哪些是由受试者语言能力所引起。
在语言测试中,信度和效度的关系是互为依却又互为排斥的;信度是效度的前提条件,一个效度高的考试必然有较高的信度;否则该考试就不是真实的反应了受试者的语言水平,当然也就没有达到测试目的;但是,同样的一份试卷却很难同时兼顾信度和效度两方面;测试信度的提高有可能导致测试效度的降低,反之亦如此;信度和效度在语言测试中似乎存在不可调和的矛盾;因此,现代语言测试以测试目的为最基本的出发点,在信度和效度之间努力寻找一个最佳平衡点,避免一味的将二者对立起来。例如托福考试是心理测量学-结构主义语言测试思想的重要产物,但托福的TSE考试设计却充分体现了交际语言测试思想,其考试评分标准通过考察考生能否有效而得体的使用规定语言完成规定的交际任务来进行定性的评判;现代语言测试在实践中不断的融合新旧两种体系的测试思想,试图在测试中尽量兼顾信度和效度两方面,达到一个合理的平衡。
效度和信度的测试是评定语言测试中必不可少的两个重要指标,它反映的是语言测试的本质性问题,对评定是否达到预期教学目的和指导教学具有重要的参考意义,但只有二者达到合理的平衡,相互补充,才能保证考试的可靠性和准确性,从而达到测试目的,提高测试质量。
[1]桂诗春.标准化考试——理论、原则与方法[M].广州:广东高等教育出版社,1986.
[2]刘朝杰.问卷的信度与效度评价[J].中国慢性病预防与控制,1997,5(4):174-177.
[3]杨惠中.大学英语四、六级考试效度研究[M].上海:上海外语教育出版社,1998.
G42:
A
1005-5312(2014)14-0246-01