促进学习的评价:从报告分数到建立反馈机制*

2016-08-31 09:37
当代教育科学 2016年4期
关键词:反馈分数

●刘 辉

促进学习的评价:从报告分数到建立反馈机制*

●刘辉

摘要:充分利用考试促进每个学生的进步是提高教育效能和改进学业质量评价体系的必然诉求。传统评价结果反馈的核心是提供分数和排名。单一的分数报告不能很好地促进学生的学习,促进学习的反馈机制要从静态的分数报告转向动态的整合分析:建立信息化平台,实现更及时、便于查询、多层次、多类型、多版本、多维度、多数据源的精细化学业质量分析;建立反馈机制,实现一班一报告、一师一报告、一校一报告的呈现方式;建立长效改进机制,发挥教学诊断和学习诊断的功能,通过反馈分析,制定跟进措施,改变工作方式,最终促进学业质量提升。

关键词:促进学习;学业质量评价;分数;反馈

学业质量评价就像悬挂在学校、教师、学生和家长头上的“达摩克利斯之剑”。为学而评,还是为评而学?在促进学习的评价范式中,评价作为教学的一部分是用来帮助学生学习,而不是仅仅作为测量学生掌握知识情况的工具。“评价是从多种不同来源搜集信息并进行讨论的过程,目的是深入认识学生学到、理解的知识,并检查作为教育经验的结果,看他们是否会运用这些知识。评估的最高成效,是能用来改善以后的学习[1]。”“促进学习的评价将学生作为评价的主体和评价信息的重要用户,不仅让教师了解学生的学习,而且让学生也了解自己的学习。促进学习的评价强调运用多种评价方法来收集关于学生学习的信息,持续地向学生、教师和家长提供学生在掌握学习标准上进步的证据[2]。”评价就是收集决策依据的重要手段,这种评价就像全球定位系统,提供给我们当前所处位置的信息。“就其本性来说,学习评价是评判性的而非测量性的[3]”。评价需要完善的专业判断,而不仅仅是客观的量化测量。用图1来表示评价视域下评价与教学、学习之间的关系,对两者的关系会有更清晰的了解。[4]

这一模型解释了教学、学习与评价之间的关系:学习目标就是对学生成就的期望,要界定清楚,根据学习目标确定评价目的和信息需求。教师需要收集大量的关于学生理解与表现的信息,需要多样的学习证据来诊断、监控过程、评估教与学的过程,就要利用各种正式或非正式的评价方法来收集这些证据。得到评价结果之后,要为学生提供关于他们学习进步的描述性反馈,同时对学生学得怎样做出恰当的推论。评价结果的报告与反馈要将收集到的反映学生学习、教师教学的信息数据与评价指标进行比较,得到有关学生学习和教师教学的有用信息;检测学生完成预定学习任务的程度,诊断教学问题所在,供教师开展个别化、有针对性的教学和辅导;以“测试依靠技术、结论源自证据、解读产生行动”为指导思想,从而形成“学习→测试→诊断→改进”的良性循环。

图1 评价循环圈:一种教、学与评的模型

综上所述,建立促进学习的评价结果反馈机制应该遵循一定的逻辑程序,即 “分析——判断——诊断——教学反馈意见”的过程。分析,是指发现和解读考试数据图表的数量特征,数据之间的关系,以及所表达的问题。判断,是指与考试标准进行对比,在各个不同的方面进行总体与总体、整体与部分学生群体进行比较,发现考试的结果的差异性,结合实际教学情况对考试现象做出判断。诊断,是指根据考试现象,明确学生学业成就的优势与不足,结合具体的考试内容及其要求,联系教学与学生实际,对问题的原因提出诊断的意见。分析诊断的目的是为了今后改善教学,通过对考试结果的分析和发现问题所在,提出教学改进的意见,对学生发展提出有针对性的指导建议。

一、反馈内容:基于多数据源的多维度、多指标测评结果

学业质量评价要将多种数据源、多维度、多指标的信息进行整合分析。借鉴这一思路,将学生的学业成绩与问卷调查数据进行关联分析,可以获得对学业质量及其影响因素更加生动、丰富和有深度的洞察。注重对学业考试与背景因素潜在规律的挖掘,探索学业成绩的变化趋势与规律,挖掘非学业因素与学业水平之间的关联性。因而可以动态扩展数据挖掘模型和结果呈现,将学业质量影响因素的评价结果,用于对学生学业诊断、学习环境、学习素养的跟踪监测。

为了更深度地探寻影响学业质量的因素,对学生的学习动力、学业负担、学习方式、教师教学方式、师生关系、教师专业素养、校园学习文化等进行测评,对这些信息的分析,可以很有效地帮助解释成绩,解释学生之间形成差异的原因。例如关注学生在学习准备状态、兴趣和个人学习风格方面的差异,才可以相对准确和全面解释学生的评价结果,挖掘到评价结果产生的原因和主要的影响因素。这样才可以具体地分析“学生的学习动力是怎样的?”“学生的学习方式是怎样的?”例如通过问卷调查来了解学生的学习自信,例如“遇到难题,我不会轻易放弃。我觉得多动动脑子,一定能解决的”;了解学生的学习兴趣,例如“在寻找解题方法的时候感觉自己就像侦探一样,带着好奇心进行仔细地分析。”了解学生的学习方式,例如“如果我有不理解的知识,会运用计算机、网络来寻找信息来帮助自己学习”。通过将学生学业考试成绩与问卷调查生成的数据进行决策树关联分析、回归分析,对影响学生学业成绩的因素进行归因和解释,评估学生的学习进展,预测未来的表现,并发现潜在的问题。教师要根据对评价结果的分析,得到学生学习优劣势的信息,据此帮助学生识别和判断如何在现有的学习程度上提高其学习能力,如何加强学生的学习兴趣、信心和能力的提升,以及为学生的后续学习发展提供建议。根据决策树分析,作业时间在1小时以下的初二学生数学平均分是57.3分、外语平均分是50.4分;作业时间在1-3小时的学生数学平均分是68.1分、外语平均分是62.8分。由此可见,适当的数学、外语作业时间有助于学生巩固所学内容,作业时间太少可能会不利于学生消化理解所学内容。也就是说,要提高学业成绩落后学生对作业的积极态度、主动性,可以为其布置适当的作业量,通过增加有效的作业练习来提高学习成绩。

二、反馈分析技术:基于认知诊断评估的精细化分析

为什么要用考试分数来表达学生的学业水平高低,或者考试分数在多大程度上能够表达学生的真实水平呢?如何从考试中发现学生学习后形成的学科心智特质的倾向性?这一连串的追问,都涉及到考试分析的技术。考试成绩的卷面总分是学生在完成各个考试项目(试题)所表现出能力水平测量得分的合计结果。在将每小题得分合计、形成卷面总分的过程中,同时也模糊了学生在每道试题上的差异表现。如果我们在分析考试或者运用考试结果时,不利用项目具体反应得分所表达的学科能力内在因素去客观分析学生学业心理特质和能力倾向,不运用测量数据所反映的数量关系去合理解释考试结果的真实含义,只是一味比较考试成绩的高低,只看考试总分、漠视测量所反映的学生学科能力结构内在的差异性,就抹煞了考试的教学诊断和学习诊断的功能。在进行心理学研究时,经常是通过人的外显行为来推断他的内部特征。如果要了解学生的数学能力水平,可以看他在数学试卷上的作答反应情况进行推断,或者通过他日常解决数学问题时的表现进行推断。学生的认知结构、学习策略、加工技能、知识状态是有差异的,通过考试试图发现这些差异,以便有针对性地帮助学生进一步发展。考试以特殊的方式、量化的形式,试图对人的学习心理特质给出描述,通过学生解答学科问题的显性行为,以推测其相应的心理特征。学生在考试中对题目的具体反应,更接近学生心智特质的真实水平,比卷面总分更重要。

认知诊断评估在评价被试心理特质方面,提供了比经典测量理论更精细的评估方法和更细致的评估结果。如果考试只提供一个笼统的考试分数或能力分数,就无法解释分数相同的学生可能具有不同的知识状态、认知结构,相同分数的个体间差异无法区分;是什么因素导致学生试题做错,考试者掌握了什么知识、未掌握什么知识等信息无法获取。报告一个简单的考试分数已经不能够满足教与学的需求。充分挖掘和利用考试信息,提供诊断信息、报告学生的认知结构或知识状态,即学生掌握了哪些知识点、哪些知识点未掌握而需要补救,学生在学科能力上有哪些倾向和特征,这就是教育考试中的认知诊断。卷面得分相同的学生,其认知结构、学科能力可能是相差极大的。运用项目反应理论模型对初二学生的数学成绩进行数据挖掘后,抽取出卷面成绩同是“B”等级的6个学生,查看其数学潜能评分却是“A”“B”“C”“D”“E”“E+”等6种不同结果。考试不能仅报告学生的一个总分,更须报告学生认知优势及劣势,真正实现考试的认知诊断功能。“诊断结果报告可以分为个体报告和团体报告。个体报告要报告学生在测验中表现出的能力水平、对测验中各认知属性的掌握情况。对于团体报告,需要给出团体的总体水平及对测验认知属性的掌握情况。”[5]在诊断结果报告的基础上,应针对不同学生对认知属性的掌握情况提出有针对性的补救措施。学生根据诊断结果,可以有针对性地开展学习,避免了“题海战术”,真正做到减轻学生负担;老师也可以根据学生的诊断结果,找到自己教学中存在的不足,同时能为开展因材施教提供依据;对于更为宏观的教育机构而言,可以根据学生的诊断报告,了解当前教育状况,为制定教育规划及教育决策提供依据。

三、反馈报告方式:不同层面、不同类型、不同版本

促进学习的学业质量反馈方式是:从静态的分数结果报告转向动态的整合分析,建设更及时、便于查询、多层次、多类型、多版本、多维度、多数据源的信息化分析平台。在不同层面(区域、校、年级、班)有报告,有不同类型、不同版本的报告,例如学科学业成绩分析报告、学业相关因素发展报告、学业质量综合报告、纵向对比报告、典型问题分析报告;实现一班一报告、一教师一报告、一校一报告,只要输入相关变量,就可以直接获得相应的报告;报告对全体、抽样、特征群体的学生进行分类分析,并按照试卷分析、考试质量分析、背景因素分析及关联关系进行呈现,形成综合的质量分析报告。包括教师教学质量报告,对教师任教的所有班级进行综合质量分析与报告;学校学业质量综合报告,对学校的学业水平、背景因素水平和学科发展水平进行综合质量分析与报告;区级学业质量综合报告,对区内各学段的学业水平、背景因素和学科发展水平进行综合质量分析与报告。

区域学业质量检测中心负责采集学生学业质量评价数据、绿色指标调研数据、教育质量综合调研数据、督导和教学视导数据,对这些数据进行汇总和分析,并整合其他相关考察材料,形成区域学业质量报告,呈送教育行政部门;同时区域学业质量检测中心会为各学校形成学校学业质量报告,对学校的学业质量提供诊断和建议;通过积累大量的数据建立区常模,运用常模对学生学业质量进行对比,通过学习诊断对学生学习和发展提供更针对性的建议,对教师教学和学校管理提供更有效的指导和服务。考试质量分析要发挥促进教师反思、检测教学目标达成、检验试题质量、指导教学改进的重要功能,要遵循一定的分析框架,形成考试质量分析规范。

表1 中小学学科测试质量分析框架

四、反馈的跟进措施:针对性指导和改进

建立反馈机制,制定跟进措施,改变工作方式,最终促进学生学业质量提升。对评价结果的反馈要注重数据的使用,但不能仅依靠数据,要采用质性分析的手段,将定量分析和定性分析相结合;重在发现问题,合理解释考试现象,总结经验方法,指导教学过程,改进教学方法,不能以考评教师学生的目的去进行考试质量分析和反馈。

在评价结果反馈之后,需要有一系列的跟进措施,包括:区域业务部门根据学业质量评价结果组织校长、教导主任的主题培训和工作会议,反馈学校的教学质量、挖掘其问题,帮助学校分析原因、寻找对策、提供业务支持。例如某高中的教学质量只是与全区高中的均值持平,但是在学业相关因素评价中,学习投入度、学习自信、学习动机、学习兴趣、相互尊重、公正平等、学校教学秩序等7个方面都是全区最好的,通过帮助学校挖掘其深层次原因,总结其在学校管理、教师发展、教学实践等方面的实践智慧,寻找提升学校教育品质的突破点,也为其他学校的改进提供参考建议。学科教研员根据学业质量评价结果为教师改进教学提供帮助与指导,利用评价结果分析学情,基于证据改进教学;要基于学业质量评价数据进行针对性教研和教师培训。例如,对初二学生数学能力层次的分析发现,识记能力的得分率是最高的,在80%以上;理解能力的学校差距比较大,得分率从90%至50%;运用能力的得分率在23%-67%之间;综合能力的得分率在56%和16%之间,其差异是非常显著的。教研员要根据学科发展水平报告中的学生学科能力发展状态,注重帮助教师提升学科能力相关的教学策略与方法。例如,将初二学生的语文、数学、英语总得分率与评价指标进行回归分析,从全体学生的成绩来分析,数学和外语成绩都和学习动机、情境教学、自主学习有较强的相关性;另外,外语成绩还和学习兴趣、学习投入度、教师学科专业素养、教师工作责任心有较强的相关性;从各子群体的学生成绩来分析,学习动力、学习方式和教师专业素养与中等生的学生成绩有一定的相关性,与较好、较差的学生成绩基本没有相关性。学业相关因素例如学习动力、教学方式、学习方式、师生关系都会对学业水平产生影响,但是学生学习成绩高低不是受单一因素影响的,是多种因素起作用而导致的结果。如果要提高学习成绩必须将影响学业成绩的因素进行综合考虑。某些学业相关因素之间可能具有很强的关联性,可以互相促进,提高其中一个指标可以带动另一个指标的改进。而且每个因素对学业水平的影响也不一定是直接作用的,例如教师教学方式可能会影响师生关系,师生关系也会影响学生对教师教学的满意度;学生学习动力会促进学生学习积极性、主动性,也会促进学生运用的自主、合作和探究的学习方式;学生在自主、合作、探究学习中也能够激发学习兴趣、深化学习动力、增强学习自信,促进学生学习动力的提升。

从静态的分数报告转向建立指向改进的反馈机制,基于认知诊断的模型和数据分析的技术,依托信息化平台,形成可供灵活调用、更及时、便于查询、多层次、多类型、多版本、多维度的反馈方式,实现一班一报告、一师一报告、一校一报告,建立长效改进机制,发挥教学诊断和学习诊断的功能,通过反馈分析,制定跟进措施,改变工作方式。这是对评价结果进行分析诊断和用于指导改进的有效路径。通过建立反馈机制,提供更精细化的分析诊断结果,形成学习——评价——分析——决策——改进的价值链,对于改进教学、促进学习具有更适切的意义。

参考文献:

[1]Huba,Freed.(2000).Learner-centered assessment on college campuses[M].Boston:Allyn and Bacon,8.

[2]Stiggins,Richard J.From Formative Assessment to Assessment for Learning:A Path to Success in Standards-based School[J].Phi Delta Kappan,2005(10).

[3]Chappuis,S.,Chappuis,J.(2008).Informative Assessment:The Best Value in Formative Assessment[J].Educational Leadership,65 (4),14-19.

[4]此处参考了科布(Cobb,C.T.)等人开发的“评价循环圈,引用时有些修改。Cobb,C.T.,Joyner,J.M.,&Williamson,J.L. (1999).Assessmentliteracyforeducators:Linkinginstructionand assessment[J].ERS Spectrum,Spring,3-11.

[5]罗照盛著.项目反应理论基础[M].北京:北京师范大学出版社,2012.139.

(责任编辑:刘君玲)

刘辉/上海市闵行区教育学院教研中心学业质量检测教研员

*本文系全国教育科学规划课题《基于学习分析技术的中小学学业质量评价研究》(立项编号BHA140111)和上海市闵行区教育科研重点项目 《区域学业质量综合评价指标构建的探索性研究》(立项编号QZ2015027)的研究成果之一。

猜你喜欢
反馈分数
分数的由来
无限循环小数化为分数的反思
可怕的分数
15. 唉,分数
算分数
高中数学教学方法浅议
多媒体时代的受众反馈
对“未来教室”的初步探索
媒介融合背景下的分众传播与受众反馈
图像压缩感知在分数阶Fourier域、分数阶余弦域的性能比较