英语测试试卷分析方法

2014-10-20 06:47田许匣
考试周刊 2014年71期

田许匣

摘 要: 科学正确的试卷分析能够为教学及学习提供有意义的反馈,并能在很大程度上提高教学质量。本文综合介绍了外语试卷信度、效度、难度、区分度四个维度的分析过程及学生考试成绩的分析方法,以期对英语教师的教学及测试工作起到指导作用。

关键词: 外语试卷 四维度分析过程 成绩分析方法

引言

语言教学是第一性的,测试为教学服务,在我国,语言教学已引起足够的重视,但对于语言测试分析,一些教师并没有给予足够的重视,试卷分析仅停留在表层、单一层面,不深刻不科学。本文主要从语言测试理论的发展,外语测试四维度分析过程及方法,以及学生成绩分析方法等方面,具体阐述了外语测试全方位分析方法。

1.语言测试理论发展

著名语言学家戴维斯(1968)曾说“好的测试就如同一个忠实的仆人”,这个比喻形象地说明了测试是为教学服务的,所以不同历史时期,会产生不同的语言观语言理论,相应的也会产生不同的语言测试。世界语言测试经历了四个阶段(薛荣,2008):(1)前科学语言测试,教学法是语法翻译法,语言是包括语法知识、词法知识、语音知识的知识体系。结果主要由教师主观判断,主观性极强,信度不高。题型:短文写作、翻译、语法分析。(2)心理测量-结构主义语言测试,语言是一套形式结构,可分成不同元素,语言学习就是刺激反应式,养成习惯,其教学法是听说法,主要采用分离式测试,每题只考一个语言点,主要题型有词汇填空、改错、判断。重标准化、客观性和结果,有一定信度,考查结构。(3)心理语言学-社会语言学语言测试,Chomsky区分语言能力和语言行为,Hymes提出交际能力的概念,认为使用语言不但要按照语法规则产出形式合格的句子,而且要具有在不同的语境中合理使用这些句子的能力,即语言使用涉及社会文化因素。Canale和Swain提出“四能力”说:语言能力、社会语言能力、交际策略能力、语篇能力。这一阶段测试主要是综合式测试,主要题型是完形和听写,要求被试综合掌握各种知识。(4)交际语言测试时期,对应现阶段英语教学方法——任务教学法,强调听说,加强口语测试,主要测试被试交际能力、解决问题能力。

2.外语测试四维度分析

随着语言测试理论的发展,评判语言测试的标准在不断完善。对于语言测试的分析,主要看测试本身和结果,通常从信度、效度、难度和区分度分析。

(1)信度

信度是指测试结果的稳定性或一致性,包括测试信度和评分人信度。信度通常用一对相关系数表示,相关系数越大,信度越高,通常对标准化测试的信度系数要求为0.9,课堂测试一般在0.7-0.8,当系数为1.00时,信度最高,0.00时信度最低,但这两个极端一般都不会达到,只在中间,我们通常用的计算公式是库德-查理逊21公式:

KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}

Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]

K=题目数 p=某一题作对人的比例 q=1-p s■=整体试卷方差

μ=测试平均分 si■=每一题得分方差

影响信度的因素:

A.与测试本身相关的因素:

题目数,测试内容,题目特点,分数多样性。

B.与被试相关的因素:

异质性,考生应试能力,考生动机。

C.与施考相关的因素:

时间限制,作弊机会。

(2)效度

效度是指测试测量了它声称测量东西的适应性,也就是说,是否考查了该考的东西,包括内容效度,准则相关性效度,结构效度,高考英语所测试的内容是否覆盖考试大纲或规定的所有内容?效度越高,就越能准确测量要测的内容。计算公式仍体现为相关系数,受信度影响rxy≤√rx√ry,rx为x的测试信度,ry为y的测试信度。

效度与信度关系为充分不必要条件,有高效度一定有高信度,但有高信度不一定有高效度。

(3)难度

难度是衡量试卷质量的一个重要指标,难度用D表示,D越大,题越简单,公式为:D=答对该题人数/总人数,试题难度指数一般在0.3-0.7最合适。

(4)区分度

区分度指不同的题把不同水平的考生真正地区分开来,区分度越高,不同水平的考生区别越大,试卷价值就越高,用区分度指数表示DI,区分度指数最高位1,最低位-1,DI>0.40区分度最好,在0.30-0.39之间此题较好,在0.20-0.29之间,试题需要修改DI<0.19,区分度不好,不能采用该试题,计算公式为点双列相关:

r(point biserial)=[(μ+-μx)/δx]√p/q

μ+=答对题目的平均分,μx=整组平均分,σx=整组标准差,p=题目难度q=1-p,题目难度过高或过低都不能很好地区分学生水平,难度适中区分度最好。

3.学生成绩分析

英语教师只有对学生成绩进行正确科学的分析,才能对学生水平作出更好的评价,才能为日后教学提供依据,从而进一步提升教学水平。学生成绩分析包括成绩描述和参数检验。

(1)成绩描述

成绩描述主要涉及的项目有:集中趋势(众数,中数,平均数),离散趋势(全距,方差,标准差),数据分布状态。

集中趋势是反映数据分布中数据趋向中心位置的统计量。众数指出现频率最多的数。中数指处于中间位置的数。离散趋势与集中趋势相反,指数据的离散变异情况。全距指一组数据中最大数与最小数之差。标准差、方差对数据离散程度描述更客观科学。

数据分布状态:在语言测试中,学生外语成绩是否呈正态分布,需要一个检验过程,正态分布呈钟形,两边对称在正态分布中众数、中数、平均数重合于一点,其图形为:

(2)参数检验

在我国英语教学中,一位英语老师经常会带几个平行班,这几个班学生学习成绩到底怎么样,只靠成绩描述数据是不够的,还需要考虑多方面因素,这就需要参数检查,主要有独立样本z检查、t检查和方差分析。

Z检查主要用于样本容量大于30的正态分布,可以比较样本平均分和总体平均分,或比较样本平均分。T检查的样本容量通常小于30的正态分布中,这两种检验可以用来检验两个班级成绩是否具有统计意义上的明显区别,方差分析可以用于三个或三个以上班级比较,也可以用于多因素分析中,SPSS计算软件可以帮助我们在较短的时间内完成大量的计算任务。

结语

作为出色的英语教师,备课上课不是我们唯一的任务,还应该特别注意学生的考试成绩及试卷分析,在这方面,教师往往会忽视或轻视,认为试卷分析就是纯粹地看看学生成绩高低,强调学生易犯错误的地方就行,即使作了分析,也是分析指标单一,分析过程粗糙,这样就不能深入了解学生学情。希望通过本文能够引起教师及测试员对试卷分析的重视,注意试卷的科学性、理据性,提高成绩测试质量,更好地体现公平公正原则,从而更好地促进外语教学及习得。

参考文献:

[1]刘润清,韩宝成.语言测试和它的方法.北京:外语教学与研究出版社,2004.

[2]李筱菊.语言测试科学与艺术.长沙:湖南教育出版社,1997.

[3]薛荣.当代语言测试:理论发展与未来趋势,外语与外语教学,2008(10):44-47.endprint

摘 要: 科学正确的试卷分析能够为教学及学习提供有意义的反馈,并能在很大程度上提高教学质量。本文综合介绍了外语试卷信度、效度、难度、区分度四个维度的分析过程及学生考试成绩的分析方法,以期对英语教师的教学及测试工作起到指导作用。

关键词: 外语试卷 四维度分析过程 成绩分析方法

引言

语言教学是第一性的,测试为教学服务,在我国,语言教学已引起足够的重视,但对于语言测试分析,一些教师并没有给予足够的重视,试卷分析仅停留在表层、单一层面,不深刻不科学。本文主要从语言测试理论的发展,外语测试四维度分析过程及方法,以及学生成绩分析方法等方面,具体阐述了外语测试全方位分析方法。

1.语言测试理论发展

著名语言学家戴维斯(1968)曾说“好的测试就如同一个忠实的仆人”,这个比喻形象地说明了测试是为教学服务的,所以不同历史时期,会产生不同的语言观语言理论,相应的也会产生不同的语言测试。世界语言测试经历了四个阶段(薛荣,2008):(1)前科学语言测试,教学法是语法翻译法,语言是包括语法知识、词法知识、语音知识的知识体系。结果主要由教师主观判断,主观性极强,信度不高。题型:短文写作、翻译、语法分析。(2)心理测量-结构主义语言测试,语言是一套形式结构,可分成不同元素,语言学习就是刺激反应式,养成习惯,其教学法是听说法,主要采用分离式测试,每题只考一个语言点,主要题型有词汇填空、改错、判断。重标准化、客观性和结果,有一定信度,考查结构。(3)心理语言学-社会语言学语言测试,Chomsky区分语言能力和语言行为,Hymes提出交际能力的概念,认为使用语言不但要按照语法规则产出形式合格的句子,而且要具有在不同的语境中合理使用这些句子的能力,即语言使用涉及社会文化因素。Canale和Swain提出“四能力”说:语言能力、社会语言能力、交际策略能力、语篇能力。这一阶段测试主要是综合式测试,主要题型是完形和听写,要求被试综合掌握各种知识。(4)交际语言测试时期,对应现阶段英语教学方法——任务教学法,强调听说,加强口语测试,主要测试被试交际能力、解决问题能力。

2.外语测试四维度分析

随着语言测试理论的发展,评判语言测试的标准在不断完善。对于语言测试的分析,主要看测试本身和结果,通常从信度、效度、难度和区分度分析。

(1)信度

信度是指测试结果的稳定性或一致性,包括测试信度和评分人信度。信度通常用一对相关系数表示,相关系数越大,信度越高,通常对标准化测试的信度系数要求为0.9,课堂测试一般在0.7-0.8,当系数为1.00时,信度最高,0.00时信度最低,但这两个极端一般都不会达到,只在中间,我们通常用的计算公式是库德-查理逊21公式:

KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}

Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]

K=题目数 p=某一题作对人的比例 q=1-p s■=整体试卷方差

μ=测试平均分 si■=每一题得分方差

影响信度的因素:

A.与测试本身相关的因素:

题目数,测试内容,题目特点,分数多样性。

B.与被试相关的因素:

异质性,考生应试能力,考生动机。

C.与施考相关的因素:

时间限制,作弊机会。

(2)效度

效度是指测试测量了它声称测量东西的适应性,也就是说,是否考查了该考的东西,包括内容效度,准则相关性效度,结构效度,高考英语所测试的内容是否覆盖考试大纲或规定的所有内容?效度越高,就越能准确测量要测的内容。计算公式仍体现为相关系数,受信度影响rxy≤√rx√ry,rx为x的测试信度,ry为y的测试信度。

效度与信度关系为充分不必要条件,有高效度一定有高信度,但有高信度不一定有高效度。

(3)难度

难度是衡量试卷质量的一个重要指标,难度用D表示,D越大,题越简单,公式为:D=答对该题人数/总人数,试题难度指数一般在0.3-0.7最合适。

(4)区分度

区分度指不同的题把不同水平的考生真正地区分开来,区分度越高,不同水平的考生区别越大,试卷价值就越高,用区分度指数表示DI,区分度指数最高位1,最低位-1,DI>0.40区分度最好,在0.30-0.39之间此题较好,在0.20-0.29之间,试题需要修改DI<0.19,区分度不好,不能采用该试题,计算公式为点双列相关:

r(point biserial)=[(μ+-μx)/δx]√p/q

μ+=答对题目的平均分,μx=整组平均分,σx=整组标准差,p=题目难度q=1-p,题目难度过高或过低都不能很好地区分学生水平,难度适中区分度最好。

3.学生成绩分析

英语教师只有对学生成绩进行正确科学的分析,才能对学生水平作出更好的评价,才能为日后教学提供依据,从而进一步提升教学水平。学生成绩分析包括成绩描述和参数检验。

(1)成绩描述

成绩描述主要涉及的项目有:集中趋势(众数,中数,平均数),离散趋势(全距,方差,标准差),数据分布状态。

集中趋势是反映数据分布中数据趋向中心位置的统计量。众数指出现频率最多的数。中数指处于中间位置的数。离散趋势与集中趋势相反,指数据的离散变异情况。全距指一组数据中最大数与最小数之差。标准差、方差对数据离散程度描述更客观科学。

数据分布状态:在语言测试中,学生外语成绩是否呈正态分布,需要一个检验过程,正态分布呈钟形,两边对称在正态分布中众数、中数、平均数重合于一点,其图形为:

(2)参数检验

在我国英语教学中,一位英语老师经常会带几个平行班,这几个班学生学习成绩到底怎么样,只靠成绩描述数据是不够的,还需要考虑多方面因素,这就需要参数检查,主要有独立样本z检查、t检查和方差分析。

Z检查主要用于样本容量大于30的正态分布,可以比较样本平均分和总体平均分,或比较样本平均分。T检查的样本容量通常小于30的正态分布中,这两种检验可以用来检验两个班级成绩是否具有统计意义上的明显区别,方差分析可以用于三个或三个以上班级比较,也可以用于多因素分析中,SPSS计算软件可以帮助我们在较短的时间内完成大量的计算任务。

结语

作为出色的英语教师,备课上课不是我们唯一的任务,还应该特别注意学生的考试成绩及试卷分析,在这方面,教师往往会忽视或轻视,认为试卷分析就是纯粹地看看学生成绩高低,强调学生易犯错误的地方就行,即使作了分析,也是分析指标单一,分析过程粗糙,这样就不能深入了解学生学情。希望通过本文能够引起教师及测试员对试卷分析的重视,注意试卷的科学性、理据性,提高成绩测试质量,更好地体现公平公正原则,从而更好地促进外语教学及习得。

参考文献:

[1]刘润清,韩宝成.语言测试和它的方法.北京:外语教学与研究出版社,2004.

[2]李筱菊.语言测试科学与艺术.长沙:湖南教育出版社,1997.

[3]薛荣.当代语言测试:理论发展与未来趋势,外语与外语教学,2008(10):44-47.endprint

摘 要: 科学正确的试卷分析能够为教学及学习提供有意义的反馈,并能在很大程度上提高教学质量。本文综合介绍了外语试卷信度、效度、难度、区分度四个维度的分析过程及学生考试成绩的分析方法,以期对英语教师的教学及测试工作起到指导作用。

关键词: 外语试卷 四维度分析过程 成绩分析方法

引言

语言教学是第一性的,测试为教学服务,在我国,语言教学已引起足够的重视,但对于语言测试分析,一些教师并没有给予足够的重视,试卷分析仅停留在表层、单一层面,不深刻不科学。本文主要从语言测试理论的发展,外语测试四维度分析过程及方法,以及学生成绩分析方法等方面,具体阐述了外语测试全方位分析方法。

1.语言测试理论发展

著名语言学家戴维斯(1968)曾说“好的测试就如同一个忠实的仆人”,这个比喻形象地说明了测试是为教学服务的,所以不同历史时期,会产生不同的语言观语言理论,相应的也会产生不同的语言测试。世界语言测试经历了四个阶段(薛荣,2008):(1)前科学语言测试,教学法是语法翻译法,语言是包括语法知识、词法知识、语音知识的知识体系。结果主要由教师主观判断,主观性极强,信度不高。题型:短文写作、翻译、语法分析。(2)心理测量-结构主义语言测试,语言是一套形式结构,可分成不同元素,语言学习就是刺激反应式,养成习惯,其教学法是听说法,主要采用分离式测试,每题只考一个语言点,主要题型有词汇填空、改错、判断。重标准化、客观性和结果,有一定信度,考查结构。(3)心理语言学-社会语言学语言测试,Chomsky区分语言能力和语言行为,Hymes提出交际能力的概念,认为使用语言不但要按照语法规则产出形式合格的句子,而且要具有在不同的语境中合理使用这些句子的能力,即语言使用涉及社会文化因素。Canale和Swain提出“四能力”说:语言能力、社会语言能力、交际策略能力、语篇能力。这一阶段测试主要是综合式测试,主要题型是完形和听写,要求被试综合掌握各种知识。(4)交际语言测试时期,对应现阶段英语教学方法——任务教学法,强调听说,加强口语测试,主要测试被试交际能力、解决问题能力。

2.外语测试四维度分析

随着语言测试理论的发展,评判语言测试的标准在不断完善。对于语言测试的分析,主要看测试本身和结果,通常从信度、效度、难度和区分度分析。

(1)信度

信度是指测试结果的稳定性或一致性,包括测试信度和评分人信度。信度通常用一对相关系数表示,相关系数越大,信度越高,通常对标准化测试的信度系数要求为0.9,课堂测试一般在0.7-0.8,当系数为1.00时,信度最高,0.00时信度最低,但这两个极端一般都不会达到,只在中间,我们通常用的计算公式是库德-查理逊21公式:

KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}

Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]

K=题目数 p=某一题作对人的比例 q=1-p s■=整体试卷方差

μ=测试平均分 si■=每一题得分方差

影响信度的因素:

A.与测试本身相关的因素:

题目数,测试内容,题目特点,分数多样性。

B.与被试相关的因素:

异质性,考生应试能力,考生动机。

C.与施考相关的因素:

时间限制,作弊机会。

(2)效度

效度是指测试测量了它声称测量东西的适应性,也就是说,是否考查了该考的东西,包括内容效度,准则相关性效度,结构效度,高考英语所测试的内容是否覆盖考试大纲或规定的所有内容?效度越高,就越能准确测量要测的内容。计算公式仍体现为相关系数,受信度影响rxy≤√rx√ry,rx为x的测试信度,ry为y的测试信度。

效度与信度关系为充分不必要条件,有高效度一定有高信度,但有高信度不一定有高效度。

(3)难度

难度是衡量试卷质量的一个重要指标,难度用D表示,D越大,题越简单,公式为:D=答对该题人数/总人数,试题难度指数一般在0.3-0.7最合适。

(4)区分度

区分度指不同的题把不同水平的考生真正地区分开来,区分度越高,不同水平的考生区别越大,试卷价值就越高,用区分度指数表示DI,区分度指数最高位1,最低位-1,DI>0.40区分度最好,在0.30-0.39之间此题较好,在0.20-0.29之间,试题需要修改DI<0.19,区分度不好,不能采用该试题,计算公式为点双列相关:

r(point biserial)=[(μ+-μx)/δx]√p/q

μ+=答对题目的平均分,μx=整组平均分,σx=整组标准差,p=题目难度q=1-p,题目难度过高或过低都不能很好地区分学生水平,难度适中区分度最好。

3.学生成绩分析

英语教师只有对学生成绩进行正确科学的分析,才能对学生水平作出更好的评价,才能为日后教学提供依据,从而进一步提升教学水平。学生成绩分析包括成绩描述和参数检验。

(1)成绩描述

成绩描述主要涉及的项目有:集中趋势(众数,中数,平均数),离散趋势(全距,方差,标准差),数据分布状态。

集中趋势是反映数据分布中数据趋向中心位置的统计量。众数指出现频率最多的数。中数指处于中间位置的数。离散趋势与集中趋势相反,指数据的离散变异情况。全距指一组数据中最大数与最小数之差。标准差、方差对数据离散程度描述更客观科学。

数据分布状态:在语言测试中,学生外语成绩是否呈正态分布,需要一个检验过程,正态分布呈钟形,两边对称在正态分布中众数、中数、平均数重合于一点,其图形为:

(2)参数检验

在我国英语教学中,一位英语老师经常会带几个平行班,这几个班学生学习成绩到底怎么样,只靠成绩描述数据是不够的,还需要考虑多方面因素,这就需要参数检查,主要有独立样本z检查、t检查和方差分析。

Z检查主要用于样本容量大于30的正态分布,可以比较样本平均分和总体平均分,或比较样本平均分。T检查的样本容量通常小于30的正态分布中,这两种检验可以用来检验两个班级成绩是否具有统计意义上的明显区别,方差分析可以用于三个或三个以上班级比较,也可以用于多因素分析中,SPSS计算软件可以帮助我们在较短的时间内完成大量的计算任务。

结语

作为出色的英语教师,备课上课不是我们唯一的任务,还应该特别注意学生的考试成绩及试卷分析,在这方面,教师往往会忽视或轻视,认为试卷分析就是纯粹地看看学生成绩高低,强调学生易犯错误的地方就行,即使作了分析,也是分析指标单一,分析过程粗糙,这样就不能深入了解学生学情。希望通过本文能够引起教师及测试员对试卷分析的重视,注意试卷的科学性、理据性,提高成绩测试质量,更好地体现公平公正原则,从而更好地促进外语教学及习得。

参考文献:

[1]刘润清,韩宝成.语言测试和它的方法.北京:外语教学与研究出版社,2004.

[2]李筱菊.语言测试科学与艺术.长沙:湖南教育出版社,1997.

[3]薛荣.当代语言测试:理论发展与未来趋势,外语与外语教学,2008(10):44-47.endprint