李玉
(上海理工大学外语学院)
大学英语入学分级考试量化分析
——以上海理工大学2012年试卷为例
李玉
(上海理工大学外语学院)
教育部2007年修订的《大学英语课程教学要求》明确指出大学英语教学应贯彻分类指导、因材施教的原则,以适应个性化教学的实际需要。由于我国幅员辽阔,各地教育教学发展状况不一,学生英语水平也参差不齐,个性差异巨大,因而许多高校都实施了大学英语分级教学,并按照不同方式进行分班教学。然而针对分级试题质量方面的研究寥寥无几,本文拟以上海理工大学2012年大学英语入学分级考试为例,对大学英语入学分级考试进行量化分析。
大学英语 分级考试 量化分析
近年来,大学英语教学的质量备受关注。学生的英语水平不一,差别较大,一直以来是很多人比较苦恼的问题。根据《大学英语课程教学要求》提出的“分类指导、因材施教”原则,很多大学纷纷根据学生的英语水平实行分层教学。然而在分级试题质量方面的研究寥寥无几,本文以上海理工大学2012年大学英语分级考试试卷为例,对大学英语入学分级考试的试卷质量进行量化分析,旨在对试卷进行客观、准确、定量的分析和评价,使考试能更有效地检验学生的学习水平,使分级更加科学合理,为建立分级试题库做铺垫。
就分级考试研究现状来说,国外针对英语作为外语或第二语言学习者(EFL,ESL)的分级考试的研究起步较早,硕果累累。Wall等人(1994)研究了用于判断学术英语环境中受试语言能力弱点的大学英语分班考试并指出效度研究中较大的难题就是进行同期效度检验。也有学者(Fulcher 1997)对英语分级考试信度和效度进行了校验。除此之外,还有学者 (如Green&Weir)基于项目反应理论和因子分析法,研究了英语分级考试,并质疑了语法测试对教学的反拨作用。国内学者对分级考试的研究起步较晚,而且研究方法主要以理论综述和试卷结构描述分析为主(如:王瑞,2006;彭家海,2007;刘立,2009),并没有对分级考试试题的质量进行定量化分析。
(一)描述性统计
通过数据统计,试卷的平均分为39.6092,说明整体得分较低;标准差为18.63556,说明分级试卷分数上下分值波动非常大。另外,倾斜度为0.065,大于0,呈正偏态,这个数值表明很多分数都低于平均值,因此分级试卷难度较大。除此之外,峰值为-1.256,小于0,说明曲线比较平坦,从另一角度说明分数上下差异很大,符合分级考试的目的,挑选优差生,可以根据考生的实际英语水平把他们编入不同班级学习。由于倾斜度和峰值在-2至+2之间,表明本次分级考试分数呈正态分布,可以进行下一步数据分析。
(二)信度分析
信度是对整个测量优劣的评价指标,它揭示测量值与真值的相差程度,反映样本与总体的接近程度,从理论上讲,信度越高,测量结果越可信。Lado(1961)认为,若一个测试既包括主观题又包括客观题,它的信度系数应高于0.7。根据SPSS信度检验,该试卷信度系数(Cronbach ɑ)为0.825,表明该试卷得分可信。
(三)效度分析
效度(胡中锋,李方,2000)指测量结果的准确性和有效性的程度,亦即测量是否达到预期的目的。效度的估计有多种方法,常分为三大类:内容效度、效标关联效度和构念效度。由于本论文是关于分级考试试题的定量分析,笔者重点分析了构念效度。
1.各部分之间的相关
Alderson等(1995)认为,测试中之所以设计不同项目是因为他们能够考核不同的能力,因此我们预期的相关也比较低,可能在0.3-0.5之间。从数据分析看出,听力、写作、阅读理解、词汇、完型、阅读和试卷总体的相关度分别是 0.935、0.750、0.687、0.874、0.842和0.860(在0.01水平上相关)。除了完型和听力、翻译与听力、完型与翻译的相关度在0.7左右之外,试题其他各个部分的相关度均在0.5左右(在0.01水平上相关),在合理的范围内。因此,此次分级测试的效度整体上是可以保证的。
2.各部分与总分相关
通过数据分析可知,每一部分与总分的相关都在0.01水平上显著。“根据经典测量理论,子项目与总分的相关可能被期望达到0.7或者更高,因为总分是对语言能力的综合测量”(Alderson等,1995:184)。根据这个标准,每一部分与总分的相关度都符合理论要求,其中听力与总体相关度最高,高达(0.934)。
3.难度与区分度分析
难度是指试题的难易程度,试题的难度决定了整份试卷的难度及考试分数的分布。在常模考试中,大多数试题的难度应控制在0.3~0.7之间 (胡中锋,李方,2000)。区分度指测验对考生实际水平的区分程度,用D表示(胡中锋,李方,2000)。如果试题的区分度高,他就能科学地反映学生的水平。难度与区分度是衡量试卷质量的两个重要指标。难度数值越大,分级试卷试题就越容易;然而区分度系数越高,分级试题质量就越好。数据显示每个部分的难度都在0.3和0.5之间,且试卷整体的难度是0.4。对于难度而言,理想的范围是在0.3和0.7之间(Brown,2006)。据数据分析,听力部分的难度最小,也就是说在试卷的所有题型中难度最大。因此我们推断这次分级考试试题难度略为偏大。根据区分度系数值,除了词汇略低,其他部分的区分度基本达到0.4的理论要求(Alderson等,1995)。并且听力、阅读和构词部分的区分度都在0.55附近;完型和翻译部分的区分度甚至更高,分别是0.83和0.64。区分度系数这一数据可以从一定程度上显示一个项目从总体上区分出优差生(Brown,2006)。一般而言,区分度的理想范围应该高于0.35(越高越好)。因此,我们可以得出此次分级考试试卷质量很高,能够区分不同水平的学生。
本研究以上海理工大学2012年试卷为例,对大学英语分级考试进行了量化分析。研究结果表明,该试卷在信度、效度、难度和区分度四个方面都基本达到理论要求。但在该试卷的开发和设计中也存在一定的问题。例如:从分级试题的难度与区分度分析得出,虽然试题的总体质量很高,有些题目尚需改进;完形填空与翻译的相关度超出了0.3~0.5的理想范围,在完形填空和翻译试题项目的设计上可能存在问题。
受限于研究条件,本文只分析了上海理工大学2012年大学英语入学分级考试的一部分受试样本。虽在一定程度上体现该试卷的总体质量,但是鉴于分级考试是大学英语分级教学实施的重要基础,对教学产生巨大的反拨作用,笔者将在未来研究中扩大研究样本,并进行历时研究,以对该项考试进一步修正,提出更全面的建议。
[1]Fulcher,Glenn.An English language placement test:issues in reliability and validity[J].Language Testing,1997(14):113-139.
[2]Lado,Robert.Language Testing:The Construction and Use of Foreign Language Tests—A Teacher’s Book[M].London:Longman,1961.
[3]Lee,Y.&Greene,J.The Predictive Validity of an ESL Placement Test:A Mixed Methods Approach[J].Mixed Methods Research,2007(4):366-389.
[4]胡中锋,李方.教育测量与评价[M].广州:广东高等教育出版社,2000:31-58.
本文为上海市研究生创新基金项目“建构主义视角下中国理工科大学生自主学习能力研究”(JWCXSL1302)、2013年度上海市教委重点课程建设项目“理工类学术英语读写”和上海理工大学人文重点项目“交互式大学英语自主学习模式构建及应用研究”(12XSZ04)之阶段性研究成果