高等学校英语应用能力B级阅读理解内容效度分析

2015-03-17 20:13于盛鹃
湖北科技学院学报 2015年4期
关键词:内容效度大纲效度

于盛鹃

(阜阳职业技术学院 外语系,安徽 阜阳 236031)

高等学校英语应用能力B级阅读理解内容效度分析

于盛鹃

(阜阳职业技术学院 外语系,安徽 阜阳 236031)

阅读理解是高等学校英语应用能力B级考试的主要组成部分,阅读文本的内容效度是衡量试题效度的重要指标之一。本文以2009年12月至2011年12月的PRETCO B 真题为例进行内容效度分析,发现阅读题总体上符合基本要求和考试大纲规定,但也存在单词量不足、易读度系数偏高、阅读技能考核不均衡等问题,命题人员可进一步加大试题难度、扩大题材多样性、涵盖更广的阅读技能考察等来提升文本的内容效度。

PRETCO B;阅读理解;内容效度

高等学校英语应用能力考试(PRETCO)作为检测高等学校专科层次(高等专科教育、高等职业技术教育、成人高等教育)修完英语课程的在校生英语应用能力标准化英语水平考试在全国推行。Hughes说“只有测试能准确地测试出它要测试的内容,这个测试才是有效的”[1]。那么作为全国性考试,该考试是否测试了应测的内容呢?由于阅读部分以35%的比例占据试卷最大比例,因此阅读理解的效度极大地影响着整个测试的效度。本文根据Bachman 和 Palmer的考试任务特点框架,对2009年至2011年PRETCO (B)阅读理解试题从语篇输入和预期应答两大方面做内容效度分析,以检测阅读理解的测试内容是否符合基本要求和考试大纲。笔者期望能为高职院校英语教学改革找到一些启发。

一、信度、内容效度

信度和效度是语言测试的永恒主题。信度是指测试结果的可靠程度,效度表明测试与测试结果的关联程度,即考试是否检测了它要检测的东西,是否达到了它所预定的目的。 一般认为效度有五种,即表面效度、结构效度、内容效度、共时效度和预示效度。

内容效度是测试内容与测试之间的相关性,即测试中所涉及的内容是否准确、全面而充分地体现了要测试的内容。“语言测试的效度,亦指有效性,指测试所考的是否就是所要考的,或者说,在多大程度上,是考了目的所要考的”[2]。PRETCO是依据基本要求和考试大纲设计的考试,因此内容效度分析自2009年至2011年五份试卷中阅读理解试题是否符合基本要求和考试大纲。

二、内容效度分析研究设计

本文以2009年12月真题到2011年12月真题共五份试卷中选取的20篇阅读理解文章(共计100道试题)为研究对象,从语篇输入和预期应答两大方面出发,将高教司颁布的基本要求和考试大纲与语篇输入和预期应答两方面逐一比对分析,来探索PRETCO(B)阅读理解试题是否符合基本要求和考试大纲。

三、研究发现与讨论

1.语篇输入:长度

李筱菊教授认为:不同的阅读测试对于输入材料的长度有不同的要求[2]。这里的长度是指文中出现的单词数量,不包括文中对于生词的中文夹注。借助Microsoft Office 2003,从2009年12月试题至2011年12 月试题中阅读篇章单词总量汇总来看,单词总量从最少的680个单词到最多的744个单词不等,单词总量变化不大。根据考试大纲,阅读理解单词总量要求达到800个左右,由此可见这五套试题阅读理解单词总量基本是符合大纲要求的。但是,由单词总量最大值方达到744个来看,试题中阅读理解部分单词的总输入量仍有提升空间。

2.语篇输入:生词量

B级考试大纲“词汇表”包含2 500个单词。不在词汇表中的单词均为生词。一般来说,生词是考生阅读理解解题的大障碍,但鉴于命题者要采用原版真实材料,不能随意修改或简化,因此很难将试题中所有词汇限定在词汇表的范围之内。但是,生词应该被控制在一定的范围。Nuttall认为:阅读材料中的生词控制在3%是适当的难度[3],而考试大纲亦规定阅读理解部分生词量不能超过3%。从2009年12月至2011年12月试题中阅读篇章含生词所占比例汇总来看,所含生词量从9到11不等,占词汇总量的比例从最高的1.56%到最低的1.21%,均远低于考试大纲中规定的3%。这表明这五套试题中阅读理解试题生词量不足,因此文章整体阅读难度不够。

3.语篇输入:易读度

根据《朗文语言教学及应用语言学词典》,文本易读度是指书面材料的难易程度,是评估阅读材料难度的标尺。Richards认为有很多因素与文本的易读度有关,如句子长度、生词数量、语法的复杂程度等。目前学术界也有很多测量文本易读度的方法,本研究采用的是Flesh 公式。借助Microsoft Office 2003,研究中涉及到的五套试题阅读理解部分的文本(不含阅读试题4)易读度平均值经统计分别为61.28,58.65,53.90,63.88和61.83。文本难易程度的判断是将该平均值与Flesh易读度参考量表进行比对。Flesh易读度参考量表最初是为母语为英语的本族语者设计,虽然不够全面客观,但仍不失是一个测量阅读文本难易程度的很好的参考。分值越高,文本越容易。以上统计数据显示阅读文本难易程度的均值始终徘徊在50与70之间,对应Flesh易读度参考量表中的“相当困难”和“标准”。基本要求和考试大纲的要求是要求学生能够读懂篇幅短小的文章和中等难度的阅读材料,“中等难度”与50至70的区间恰好相符,因此可以推断研究中涉及的五套试卷中阅读理解的难易程度符合基本要求和考试大纲的要求。

4.语篇输入:阅读速度

基本要求规定考生的阅读速度要达到每分钟50词以上,考试大纲亦为阅读理解部分设定了40分钟的阅读时间。考生应试时不仅需要阅读,还需要答题。根据杨惠中和 Weir的观点,应试者阅读和答题时间的比例应该为1∶0.75,阅读理解部分被设定了40分钟的应试时间,根据这个比例,即考生需要花费23分钟阅读,17分钟答题。基于这种分析,研究中对所涉及的五套试题阅读理解部分的阅读速度进行了测算,测算结果显示五套试题中阅读理解部分阅读速度最高为32.25单词量每分钟,最低为29.57单词量每分钟。基本要求规定每分钟的单词阅读量要达到50单词。由此可见,研究中所涉及的试题的阅读速度远低于要求。或许命题者刻意选取篇幅短小的文章来迎合高职院校学生较薄弱的英语水平,抑或是应试者在试题3和试题5中花费了过多的时间来填写答案,从而影响了整体的阅读速度。

5.语篇输入:题材覆盖率

Benchman认为,一段论述的主题通常被理解为“关于什么”,它是话语的主题。面对有着不同的专业背景和知识的应试者,试题中阅读文本题材的选取应该公正,因为对文章背景知识的熟悉程度会直接影响答题正确率。考试大纲规定阅读理解题材选取应涉及科普、文化、社会、常识、经贸、人物等。借鉴韦艳梅硕士论文《高等学校英语应用能力考试B级阅读理解内容效度研究》中题材的分类方法,经对研究所涉及的五套试题中阅读文本的题材分布统计得知,五套试卷中阅读理解部分文本题材涵盖范围较广。社会生活类题材是学生最熟悉的题材,以35%的比例位居最高。常识类题材紧随其后。由于基本要求规定学生能读懂经济贸易领域简单的书信,因此经济贸易类题材也占据了一定的比例,但是比例偏小,或许此种控制是为避免给有经济学知识背景的考生带来优势从而引发应试不公。语言文化紧密相连,因此文化类题材亦占15%的比例。科普类题材对于学生来说最为困难,因此所占比例最小。总之,五套试题中阅读理解部分文本题材分布与基本要求和考试大纲基本相符。

6.预期回答

预期回答主要指在阅读理解中考核学生对于阅读技能的掌握程度。根据基本要求和考试大纲,学生应该掌握如下阅读技巧和策略:(1)了解语篇和段落的主旨和大意;(2)掌握语篇中的事实和主要情节;(3)理解语篇上下文的逻辑关系;(4)了解作者的目的、态度和观点;(5)根据上下文正确理解生词的意思;(6)了解语篇的结论;(7)进行信息转换。笔者统计了五套试题中阅读理解试题考核到的阅读策略和技巧的分布,发现:除去“了解语篇结论”,试题基本涵盖了基本要求和考试大纲中的阅读技能,但各项技能所占比例不同。“事实和主要情节”的技能考察以46.4%的比例列于首位,显示了命题者更多地考察学生基本技能的目的。“信息转换”和“生词词意理解”是试题3和试题4的特点,分别位列第二、第三。而五套试题却丝毫没有涉及到“了解语篇结论”。由此可见,研究中所涉及的五套试题阅读理解技能考核分布不均,命题者过度重视基本技能的考核,却忽略了考核的全面性,在一定程度上破坏了试题的内容效度。作为一项全国性考试,命题者应该在基本要求和考试大纲规定的诸多阅读技能考核中保持一定的平衡,提高试题考核的科学性、客观性和全面性。

除了阅读技能覆盖度,预期回答还包括问题类型。研究中涉及的试题不仅有选择题,而且有填空题、匹配题和回答问题,题目形式多样,主观题与客观题相互搭配,能多角度地考核学生的阅读技能。

四、结论

基于Bachman 和Palmer的评价框架,本文从语篇输入和预期应答两大方面,对2009年12月至2011年12月共五套高等学校英语应用能力考试B级(PRETCO B)真题中阅读理解部分做了内容效度分析。通过分析,发现:(1)或许命题者过多关注高职院校学生较薄弱的英语语言能力,从而导致试题中词汇输入量及生词比例和阅读速度都远低于大纲要求。(2)文本易读度和题材分布基本符合大纲要求。(3)在阅读技能的覆盖方面有一定的测试偏颇,这在一定程度上会给教与学带来负面反驳作用。为此,针对研究中发现的不足之处,笔者建议,作为全国范围的在高职院校广泛推行的标准参照考试,命题者应紧紧围绕基本要求和考试大纲,以提高命题的科学性,打造系统规范的高职英语类考试。

当然,该研究亦存在很大的局限性,如所选研究对象过于狭窄,仅限于五套试题;数据分析仅简单借助于Microsoft Office 2003,而没有使用SPSS,从而导致分析不够科学准确等。在以后的研究中,除内容效度分析外,还可以从结构效度、校标效度等其他角度做更深入广泛的研究,以为高职院校中的英语教、学及教学改革提供有益的帮助。

[1]Hughes,A.Testing for Language Teachers[M].Cambridge:Cambridge University Press,1989.13~26.

[2]李筱菊.语言测试与艺术[M].长沙:湖南教育出版社,2001.277.

[3]Nuttall,C.Teaching Reading Skills in a Foreign Language[M].Shanghai:Shanghai Foreign Language Education Press,2002.

2095-4654(2015)04-0134-03

2015-01-28

H310.4

A

猜你喜欢
内容效度大纲效度
50个重要的知识点 一份“学习大纲”帮您梳理党的二十大报告
COSMIN方法介绍:评价患者报告结局测量工具内容效度的评分系统
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
英语专八阅读理解部分内容效度的历时对比研究(2009—2017年)
紧贴实战落实《大纲》要求推进航空体育训练创新发展
被看重感指数在中国大学生中的构念效度
大学英语新四级阅读理解内容效度研究
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度
人民军队第一部政治工作大纲
我军最早的政治工作大纲——党代表工作大纲