对教育专家来说写作评价一直被认为是有问题的领域,Speck&Jones(说“问题多在答案、阅卷员之间的可靠性、一个阅卷员的一致、分配给阅卷员的职责。”由于把英语作为第二语言(ESL)学生的语言和文化背景的差异,对他们的英语写作评价比对母语学生的写作评价问题更多。一方面,许多因素影响ESL学生的写作,包括他们英语能力、母语、国家文化及书面交流方式。另一方面,阅卷员在评价ESL学生的作文时可能从不同角度考虑这些因素。实证研究发现评价ESL学生作文的阅卷员行为不同,他们的背景、母语、经验、参加培训的次数及写作的类型和难度都影响对ESL学生作文的评价。这些因素的影响导致对ESL学生写作评分的准确、精确和得分的公平等。
公平是教育评估领域的重点问题,教育组织、学校和专家都应该对不同民族、性别和种族背景的应试学生尽可能地公平。由于在过去的20年里到北美学校的ESL学生数量激增,对于他们的写作评价的公平问题越来越重要。ESL学生不得不参加和母语学生一样的考试,并希望他们能成功地展示他们的写作技能或完成高风险的写作考试。
一、写作评分的信度与效度
阅卷员之间或阅卷员自身的信度、一致性在ESL学生写作评分中尤其重要,因为在评分员当中和阅卷员自身的易变,所以,分数中可能存在不需要的易变。不同的阅卷员常常给同一份作文不同的分数,同一名阅卷员可能在不同的时间给同一篇作文不同的分数。这两个变量引起的问题不同程度地影响学生得分的信度和效度。
1.信度
根据传统的测试理论,考试者的实得分数由“真实分数”和“错误分数”构成。在传统的测试理论框架中,每个人之间的实得分数变量等于参加考试者的真实分数和错误分数的变量总和。如果变量里没有预言性,阅卷员之间和他们自身的易变构成了随机测量错误,多种错误的来源有助于错误分数的变化。Spearman把信度解释为真实分数变量和全部分数变化的比率。所以,如果错误分数变化小,那么信度就高,接近1.0。相反,如果错误分数变化大,那么信度就低。假设阅卷员之间和评他们自身的随机变化有助于错误分数的变化,这个随机变量促成了较低的信度。结果,降低阅卷员之间和他们自身的信度并试图减少不必要的变化来源。确保高水平的评卷员的信度也是至关重要的,因为它表明对ESL学生写作评分的精确度。
2.效度
效度也是学生写作评价的一个重点。Messick把效度描述为对等级的综合评价,对此用实验性证据和基本理论证明了基于测试分数的推理和行为的充分性和适当性。从这个意义上说,在写作测试中得分高的学生被认为是能力强的作者,得分低的学生被认为是能力低的作者。
重要的是如果存在系统测量误差的来源,就会混淆对一个写作分数的解释。如果系统误差的性质提高了实得分数,那么实得分数就会对真实分数评价过高。另一种方案是如果系统误差的性质降低了实得分数,那么真实分数就会被低估。由于系统资源的变化降低了对实得分数解释的效度,这与相应的真实分数的评价一样。
许多因素都有助于造成阅卷员对写作评分的误差。就ESL写作来说,这些因素包括阅卷员的语言和学科背景、阅卷员的严厉、对错误的容忍、阅卷员的培训、写作任务的类型和难度。
效度研究和信度研究一样重要,它表明在写作评分中是否存在偏见。同样,效度和公平密切相关。Cole和Moss证明公平是效度的一个方面,一个无效的作文分数会对学生不公平并且产生多种后果。所以,确保对学生作文的有效评分至关重要。
信度和效度与公平密切相关,需要把公平放在首位。在讨论语言评分的信度、效度和公平方面,Kunnan证明“如果一次测试不公平,其中信度和效度,甚至真实的互动就没有什么价值。”
二、影响ESL写作评分的因素
以北美学校为研究对象,考察影响ESL写作评价的准确度、信度和效度的多种因素,如写作任务的种类、ESL和NE(母语)学生的比例数、阅卷员的数量、阅卷员的职称等级、培训和评定法。此因素可以分成两类:与阅卷员相关的因素包括评分方法、评分标准、阅卷员的学科、职业经验、语言背景对错误的容忍、感知和期望以及对阅卷员的培训;与任务相关的因素包括写作任务的类型和难度。下面就这些因素进行探讨。
1.评分方法
整体性和分析性评分在写作评估实践中获得广泛接受。在整体性评分中,每个阅卷员根据一个评分标准对总的写作能力进行评估。然而,在分析性评估中,写作成绩可以分成可确认的组成部分,如结构和内容,每部分按照一个评分标准分别评分。
这两种方法各有其优点和缺点HjLAhR5kVpCVkxQDFUQIiC7+XG6eAmEj3JUo5RVp30Q=。既然综合写作能力是评估的概念,那么整体性评分具有最高的结构效度,是精通和研究测试的工具,但它“对信度有威胁”。它极其主观是由于“偏见、疲倦、阅卷员自身缺少信度、学生原有的知识以及从一份试卷到另一份试卷的变化。”分析性评估允许学生看见他们在每部分的得分,提供诊断信息。尽管分析性评估比整体性评估产生的信度高,但是太耗费时间。
实证研究发现两种评分方法都可能影响ESL作文评估的信度和效度。英语专业教师给的整体分数和ESL教师给的整体分数之间有明显的差异,因为英语专业教师给出作文较高的分数,他们使用分析方法批阅作文时更注重写作范文的整体内容和修辞特征的质量。
2.评分标准
评分标准是对参加考试学生的书面答卷的具体评分标准。总的来说,运用语言的技能(文章结构、风格、会话性质),语言(语法结构、句法和词汇),内容(学科知识、论点展开、主题相关、事实论证),被认为是评价ESL和NE作文的三个主要的标准。
阅卷员在评ESL和NE学生作文时对标准重视不同。阅卷员(正在高中教英语和有资格在高中、大学教英语的教师,或者是研究生助教)按照下面三个不同的标准评估ESL和NE学让的作文:“内容的展开和结构”、“句子”、“词汇。”例如,句子错误对ESL学生作文分数的负面影响极大。阅卷员可能会不公平地关注评卷指南里的一两个标准,或者使用他们自己的内化标准来批阅ESL的作文。当阅卷员从整体角度评ESL学生作文时,他们只重视语言的使用,这恰恰是ESL学生的弱点。然而,同样的阅卷员用分析方法评阅同一些ESL的作文时,他们会惊奇地发现这些作文的内容和结构是非常有说服力的。
最后,在不同类型和质量的ESL作文评估中,不同的阅卷员可能使用不同的标准。Weigleetal发现不同学科的教授往往使用不同的标准评价ESL作文。例如,ESL和英语系的阅卷员经常认为语法是话题作文和基于阅读材料的作文不及格的最重要因素。这个研究结果表明ESL学生可能因为在话题作文里较差的语言能力而得低分。相反,心理学专业的阅卷员认为内容是话题作文和基于文本题材的作文评价的主要因素。同样,Sweedler-Brown发现没有受培训的阅卷员强调作文的语言特征胜过作文的修辞特征。
综上所述,文章的风格、语言的运用、内容、词汇和句法能力都是阅卷员评分时关注的要点。当然阅卷员的语言背景,学科、观念和期望、职业经验、对错误的容忍和阅卷员的培训、写作任务的类型和难度、阅卷员和任务之间的互动也影响ESL写作的评价,由于这些因素使得ESL作文在某种程度上没有公平地得到应得的分数。
通过分析影响ESL作文评分的准确性、信度和效度等因素,笔者认为ESL学生应该从中汲取经验,更多地了解写作评价标准和阅卷员的评分特点,按照合适的写作标准提高自己的写作能力。教师应该懂得如何教授英文写作课程,使学生在写作中懂得如何使用语言(语法结构、句法和词汇);让学生了解北美教师在写作评分时的关注点所在,即是重视运用充足的事实、例证、数据和理由对论点展开合理的论述,只有这样才能在写作中获得高分,尤其是正在北美读书的中国学生和即将出国读书的学生更应该懂得西方文化背景下的ESL教师对华人学生的写作期待什么。随着ESL人数在北美学校里不断增加,探讨对学生写作评价有影响的这些因素,确保对他们写作评分的公平是十分重要的。
参考文献
[1] Bachman,L.(2000).Modem language testingat the tum of the century:Assuring that what we countcounm.Language Testing,17(1),1-42.
[2] Cumming,A.(1990a).Application of contrastlve rhetoric in advanced ESL。thwriting.Paper presented at the 24 Annual TESOL Conference,San Francisco,CA.
(责任编辑刘永庆)