医学生英语学习的多元评价实证研究

2014-09-21 06:50金茹花

成都中医药大学学报(教育科学版) 2014年2期

金茹花

（郑州澍青医学高等专科学校，河南郑州 450064）

一、引言

目前，多元评价还没有明确的定义（陈诚，2012;曾晓红，2006），它并非一种理论或流派，而是一种方法，是针对传统的一元评价（以测试为主）提出的。多元评价是以加德纳的多元智能理论为理据，并结合布鲁姆对评价的分类形成的。“多元”体现在评价主体、内容及方法的多样性上（曾晓红，2006）。本研究以高职英语为例，其多元评价是指形成性评价与终结性评价在内的，考查听、说、读、写、译，采用师生共评，量化与质性描述相结合的评价体系。虽然国外学者对评价的方式及内容研究得较多（如Martin et al.，2005;Hwang＆ Chang，2011;Castellanos-Nieves et al.，2011;Adsanatham，2012），但有关多元评价的研究相对较少（除Lutz et al.（2002）、Schepers et al.（2008）的多元心理评价及Liu et al.（2011）对学习网站的多元评价标准外）。多元评价在国内则集中在理论依据与实施框架的讨论上（谢利民，2009;邵红万，2009;张丹，2011;王婷，2011;丁福兴，2012），实证研究（陈小近，2009;刘宁，2009;刘红梅，2010;陈秀丽，2011，陈诚，2012）较少。

国外没有与英语教学相关的多元评价研究，多元评价研究在国内起步晚（始于1993年），发展快，但多停留在理论及框架探讨层面，应用、检验该评价的实证研究相对较少。在实施多元评价的研究中，多数院校以期终笔试成绩为主（占60%-80%），平时表现为辅，改革的力度不够;有些院校忽视听说的考查，评价标准不具体，缺乏定性评价。本研究克服了以上不足，将期末笔试的比重降至50%，考查听说，评价解释依据细化，加入质性评价。为此，调整后多元评价的效果如何就成为本实验的研究问题。本文先介绍研究方法及实验设计，再分析实验结果，最后讨论结论与不足。

二、研究方法

1.研究假设及方法

该研究假设是多元评价的实施能够敦促学生学习，从而有助于学生提高其英语成绩。

本研究采用了文献法、多元评价下的教改实验、访谈法及问卷调查法（陈向明，2000）。文献法用于梳理目前国内外有关多元评价的研究，发现其不足;实验法则对两个实验组进行一个学期的多元评价试点，并与各自的对照组比较学习结果，考查该评价的效果;访谈的对象包括师生，通过学生了解该评价的效果。教师访谈是掌握教师对该评价实施一学期后的看法，提出改进建议;问卷调查的对象为实验组的学生，旨在整体上把握学生对该评价的态度、原因、在实施过程中遇到的问题及对策，同时与实验结果及访谈进行相关检验。

2.受试者

本研究选取了本校11级临床专业的两个实验组（对口班与统招班）及各自的对照组，每个班的人数在47-50之间，男女比例约为2:3。其中在实验班实施一学期的多元评价，对照班则按传统的学期测试评价方式进行。在实验前后分别对各班进行实验前测与实验后测，实验前测显示两个实验组与各自的对照组班级在平均分无显著差异（对口班P=0.006，统招班P=0.904），而实验后测以期末笔试进行。在实验组与对照组学生学习结果的比较中剔除无效数据（作弊、缺考、休学），对其期末笔试成绩予以分析。

3.多元评价的设计及实施

本研究立足于多元评价的理论基础，根据本校英语教学的实际情况及前人的研究，设计出该多元评价体系（见图1、表2），纳入听说，兼顾读写译。整个学期54个学时，共18周。在英语教学过程中，按照表2中各项目执行，共学习8个单元。每个单元涵盖听、说、读、写、译的练习，并以单元为单位，每个单元进行一次各项技能的任务训练。同时教师做好日常登记工作，在学期末进行听力测试、口试及期末考试，最终将形成性成绩与终结性成绩按各自比例折算，计算出学生的总成绩，并给予质性评价。

图1 多元评价的构成

表2 多元评价中各评价项目及其权重

三、结果与讨论

1.教改实验及结果

（1）对口班

通过对对口班学生期末笔试成绩的统计分析（表3），实验组的成绩优于对照组，但没有较大差异。实验组的均值（58.68）高于对照组（55.35），其标准差（19.27）及不及格率（46.8%）略低后者（19.99，53.1%）。两个组在最高分（95，95）与最低分（18，17）上持平。若将以上变量值与总体比较，实验班的均值高于总体（55.70），标准差及不及格率也低于总体水平（20.20，52.9%）。在最低分上，实验组优于总体（13），而在最高分上次于后者（97）。在实验组与对照组期末笔试成绩的独立样本t检验中，p=0.408，说明二者的笔试成绩并无显著差异。

表3 对口实验组的期末笔试成绩略优于其对照组及总体

以上成绩各变量的比较说明对口班实验组的成绩在平均分上略优于对照组及总体，同时其成绩的离散性较小，不及格率也低于对照组与总体;实验组在最低分和最高分方面，较之对照组及总体并无优势;在平均分上，实验组与对照组的差异并不显著。总体而言，对口实验组的学习结果优于对照组与总体，但这种差异并不显著。

（2）统招班

在统招组期末成绩的描述性统计结果（表4）中，实验组的不及格率（35.4%）比对照组（38.5%）低，最高分（99）与最低分（22）都高于后者（96，11），均值（63.65）也高于对照组（62.40），其标准差（21.72）略低于后者（22.50）。与总体相比，实验组除了最高分与总体（99）持平，标准差高于总体（21.35）之外，其平均分与不及格率均优于总体（62.49，41.3%）。而在实验组与对照组期末笔试成绩的独立样本t检验中，二者的差异并不显著，p值明显大于0.05。

表4 统招实验组的期末笔试成绩略优于其对照组及总体

统招班各组期末成绩的描述性统计分析显示，实验组的成绩整体上优于对照组及总体，其不及格率较低，最低分与最高分都较高;实验组成绩的离散性与总体持平，其平均分与对照组的差别并不显著，略高于总体平均分。

综上，对口实验组与统招实验组的期末成绩均高于对照组及总体水平。相比之下，除了在不及格率上的差别较大之外，其它方面的差异并不明显。

2.访谈及结果

访谈分两类，一类是以实验组学生为受访对象，一类是以教师为受访对象，都采用焦点团体访谈。学生的访谈在学期的期中进行，共30分钟，每个实验班按层次随机抽5-10名学生，实到6人。为了了解多元评价的实际效果，对教师的访谈则推迟在下一学期初进行，受访教师不少于12个，教师访谈不少于30分钟。

（1）对学生的访谈

在访谈中，每个学生就实施的多元评价发表了各自的看法及改进建议。总体而言，英语基础好的学生较认可该评价方式，并表示希望继续实施;而基础薄弱的学生表示对其意义不大，如某一学生表示“你怎么弄都行，我底子就那样。”关于对该评价的改进方面，部分学生提出要减少两极分化，多关照基础薄弱的同学。

（2）对教师的访谈

教师们在听取了多元评价实施的具体情况后，表达了各自的意见。大部分认为加入平时成绩，如作业等，有助于提高学生的积极性，引导学生（不得不）学习。也有教师指出多元评价的缺点，评价项目过多，评分在操作上繁琐，同时教师要顾及多班教学，会加大教师的工作量。

访谈揭示了更多多元评价的深层次信息。学生的访谈显示了该评价在实施过程中出现的两极性，对于基础良好的学生，这种评价方式对他们来讲不是问题，而对基础薄弱的学生，该评价意义有限。教师访谈说明了多元评价的优缺点同在，就如何减少其弊端是多元评价需要改进的地方。

3.问卷调查及结果

为了掌握学生对多元评价态度的整体情况，在学期末抽取对口实验组进行问卷调查，发放问卷43份，全部回收并有效。问卷的问题涉及学生对该评价方式的态度并给予解释、对多元评价方式的评价、改进建议及补充说明。

问卷的分析结果显示绝大多数学生（93%）认可该评价方式。对于该评价的看法与原因，40位学生（93%）认为该评价方式对其学习有影响，主要体现在提高学习的积极性与氛围（N=11，27.5%）、知道自己的长短处（N=4，10%）、提供动力（N=5，12.5%）三方面。有3位学生认为该评价方式对其学习没有影响;对于多元评价方式的评价，问卷反馈显示多元评价方式相比单独的期末考试更公平（N=6，15%）、全面考察学生的能力（N=13，32.5%）;关于该评价的改进方面，学生也为下一步的评价实施提出了各方面的改进措施。如，某同学提到“……我如果是老师，我就会想办法逼着学生对自己严格。我认为很多时候，成功是逼出来的。学生自己不知道强迫自己，那么，这个“坏人”的角色由我来当吧。将来的一天学生会明白的。”

由此，多数学生肯定多元评价并从中受到有益的影响，但多元评价对学生的帮助作用更多体现在认知方面，使学生能准确地定位自己。同时给学生提供了外部动力，从而督促其学习。这发挥了评价的反馈与导向功能，符合最初实验的初衷。

四、结论与不足

通过多角度对多元评价实施结果的分析，研究显示以高职英语为例，多元评价具有敦促学生学习，从而改善其学习结果的功效，这与研究假设是一致的。多元评价对学生学习的促进是间接实现的，并不与成绩存在直接联系。多元评价只是从外部给学生提供一种学习动机，这种外部动机需内化为学生的认知，进而外化为学习行为，才有可能发挥作用。多数学生表示该评价改善了其学习状态，说明该评价的反馈与导向作用敦促了学生学习行为与过程的调整。但多元评价方式对学生学习结果的促进并不显著，学习结果受学习行为、学习方法、学习态度等多种因素的影响，并非单纯改变评价方式就能改变的。同时多元评价也存在不足，需要不断地改进。

在英语教学实施多元评价的过程中，并结合调查，笔者也发现了一些不足:这种评价并不是对每个学生都有效，它只是提供外在的刺激与动机，敦促学生学习。它有赖于师生的配合，共同参与和行动，才能达到其较好的效果。如果只是一方努力，或者双方留于形式，都会影响到评价的效果;一些学生对多元评价并不重视，平时的任务不认真对待，导致其形成性成绩不理想，致使多元评价并没有发挥其有效性;多元评价虽然全面，但实施起来较繁琐，加大教师的工作量;同时学生的自评或互评占用部分学时，影响教学进度，有时教师很难处理教学深度与进度的矛盾;在评价项目的安排上，忽视平时口语的训练，单独的口试达不到改进学生口语的目标。

在进一步的实施中，多元评价需做以下改进:在平时的课堂表现上，教师要介入其中，多给基础薄弱的学生表现的机会，减少两极分化;与学校其它部门协调好，使多元评价具有效力，不能让学生感觉这种做法停留在表面，使学生意识到其重要性;评价项目上需再完善、精简，在能力训练上要更有针对性，操作简便，减轻教师的工作量。

［1］Adsanatham，C.（2012）.Integrating Assessment and Instruction:Using Student-Generated Criteria to Evaluate Multimodal Digital Projects Grading.Computers and Composition，29，152-174.

［2］Castellanos-Nieves，D.，Fernández-Breis，J.T.，＆ Valencia-García，R.et al.（2011）.Semantic Web Technologies for Supporting Learning Assessment.Information Sciences，181，1517-1537.

［3］Hwang Gwo-Jen，Chang Hsun-Fang.（2011）.A Formative Assessment-based Mobile Learning Approach to Improving the Learning Attitudes and Achievements of Students，Computers ＆Education，56，1023-1031.

［4］Liu Gi-Zen，Liu Zih-Hui，＆ Hwang Gwo-Jen.（2011）.Developing Multi-Dimensional Evaluation Criteria for English Learning Websites with University Students and Professors.Computers＆ Education，56，65-79.

［5］Lutz，M.N.，Fantuzzo，J.，＆ McDermott，P.（2002）.Multidimensional Assessment of Emotional and Behavioral Adjustment Problems of Low-Income Preschool Children:Development and Initial Validation.Early Childhood Research Quarterly，17，338-355.

［6］Martin，J.R.，White，P.R.R.（2005）.The Language of E-valuation:Appraisal in English.New York:Palgrave Macmillan，34-40.

［7］Schepers，J.，De Jong，A.，＆ Wetzels，M.et al.（2008）.Psychological Safety and Social Support in Groupware Adoption:A Multi-Level Assessment in Education.Computers＆ Education，51，757-775.

［8］陈诚.高职英语多元评价系统的构建［J］.继续教育研究，2012（3）:155-157.

［9］陈向明.质的研究方法与社会科学研究［M］.北京:教育科学出版社，2000.

［10］陈小近，等.服务于专业的高职英语评价体系改革［J］.武汉船舶职业技术学院学报，2009（1）:131-134.

［11］陈秀丽.高职英语教学多元评价体系构建研究［J］.山西财经大学学报，2011，33（2）:83-84.

［12］丁福兴.高校教师教学质量多元评价体系的构建:理据与框架［J］.现代教育科学，2012（1）:146-149.

［13］刘宁.多元评价在中职英语任务学习中的运用［J］.当代教育科学，2009（23）:59-60.

［14］刘红梅.大学英语评价体系的构建与实践［J］.黑龙江教育（高教研究与评估），2010（7）:23-24.

［15］邵红万.构建形成性评价与终结性评价相结合的高职英语多元评价体系［J］.西南农业大学学报（社会科学版），2009，7（6）:229-230.

［16］王婷，文慧.构建大学英语课程多元评价模式——山西省高校英语课程现行评价体系的调查研究［J］.中北大学学报（社会科学版），2011，27（2）:112-115.

［17］谢利民，等.多元评价体系中制定评价标准的思考［J］.全球教育展望，2009，38（2）:22-27.

［18］曾晓红.基于博客的多元评价应用探索［D］.上海:华东师范大学，2006.

［19］张丹.基于多元评价模型的高校教师教学评价系统设计与实现［D］.石家庄:河北科技大学，2011.