刘娟 鲁玮峰 黎天扬
基金项目:2020年重庆市高等教育教学改革研究项目“高校课程考核创新机制研究”(项目编号:203279)。
作者简介:刘娟(1976—),女,西南政法大学新闻传播学院副教授,研究方向为科学传播、高等教育;鲁玮峰(1999—),男,西南政法大学新闻传播学院硕士研究生,研究方向为科学传播、高等教育;黎天扬(1995—),男,牛津大学数学研究所硕士研究生,研究方向为统计分析和高维数据处理。
摘 要:考试制度改革是近年来我国高等教育改革的重要环节。当前,国内高校存在課程考试形式单一、缺乏科学的成绩评定标准和评价方法,不符合终身学习的教育理念等问题。本研究采取实验研究法,在西南某部市共建高校课程期中考试中,将北美广泛采用的“二级考试法”结合中国国情实施在地化探索。通过描述性分析、配对t检验及线性模型方程等统计方法分析实验数据,结合学生反馈,研究发现二级考试法适用于中国国情,有助于优化课程考核机制,激发学生学习热情。
关键词:大学课程考核;二级考试法;比较研究;量化研究
中图分类号:G416 文献标识码:A 文章编号:1673-7164(2023)33-0126-04
习近平总书记强调要改革教育评价体制,“健全立德树人落实机制,扭转不科学的教育评价导向”“构建符合中国实际、具有世界水平的评价体系”。现有国内高校课程考核大部分还停留在传统考试模式,形式较为单一、缺乏科学的成绩评定标准和评价方法。
一、文献梳理
(一)高校考试改革
我国高校考试制度改革呈现出宏观政策引领、微观实践探索的格局。宏观研究主要响应政策调整,关注高校考试制度改革、讨论我国教育评价文化范式等议题。微观上则从实践与操作的层面,倡导以更科学的教育理念指导考核与考评,强调过程性考核[1]与混合成绩评定[2],尝试更适应学科特色的考评方案[3]。有学者针对现有考评机制,如课程考试成绩正态分布是否合理等议题,提出了质疑与批评[4]。大量海外访学归来的学者开展了不同学科国内外考试实践的比较研究[5]。宏观层面多采用政策讨论、文化研究等质性研究方法,微观层面则通过问卷分析、评价指标设定等计量手段开展研究。总体而言,现有研究大多围绕考试本身展开,缺乏实验性设计和学生反馈,中外对比研究则缺乏本土化实践探索。
(二)二级考试法
二级考试法(two-stage exam)是一种课程测试方式,因其划分为个人测试(individual test)和小组测试(group test)两个阶段而得名。二级考试法的核心理念在于“考试也是学习过程”。在二级考试中,学生需要将同一套试题(或者近似的试题)完成两次。第一次个人独立完成,第二次以3—5人的小组形式集体讨论、达成共识完成。二级考试适用于较多客观题的测试,同时第二阶段因为加入集体讨论,所以相同时间内题量相对第一阶段有所减少。学生最终成绩以两个测试阶段的不同比例合成。
现有二级考试相关研究支撑考试场景下集体学习的重要性[6]和及时反馈的显著效果[7]。文献主要集中在三个问题的讨论上:学生表现、知识唤起和学生焦虑。学生在两次测试中的群体性讨论,可以帮助他们实现同伴学习。现有文献同时讨论了学生是否愿意在考试中合作,以及这样的合作是否能让个体表现优异和个体表现落后的学生同时受益等问题[8]。
二、研究方法
(一)实验设计
项目组进行了二级考试法的在地化实验设计。考试分两部分共三轮,第一部分分个人测试1和小组测试,考察二级考试法在中国高校课堂的适用性及效果。第一轮为个人闭卷测试,即个人测试1。分实验组(A班)和对照组(B班)进行。题量为单选题20个,多选题10个,考试时间40分钟;第二轮为小组测试,将考生分成小组、每组4人,小组成员通过组内讨论共同完成测试,共享成绩。题量缩减为单选题15个、多选题8个,考试时间40分钟。仍分为AB班。第一二轮测试在同一天两个相连自然课时完成,中间休息5分钟;第三轮测试为个人测试2,题量缩减到单选题10个、多选题5个,考试时间调整为10分钟。A班在第一二轮测试后第七天进行,B班在第一二轮测试后第二天进行,以此考察不同的记忆周期对学生学习效果的影响。研究显示,大部分中国学生在课堂学习行为上有沉默、安静、不愿发言的保守倾向,缺乏批判性思维[9]。结合中国学生的文化特点,小组在北美二级考试法的基础上增加了第二轮考试,即个人测试2,并在AB班设置了第一轮考试(个人测试1)结束后公布正确答案和不公布正确答案两种做法,考察小组学习及自主学习对学生的影响。
(二)试点时间、课程及班级
项目组在2021—2022学年秋季学期大一年级开设的“传播学概论”课程班级期中考试实施了考试试点。第一轮个人测试1和第二轮小组测试的完成时间为A班2021年11月15日,B班2021年11月18日;按正常教学安排,A班的第三轮测试在第一二轮测试后第七天(2021年11月22日)进行,B班在第一二轮测试后第二天(2020年11月19日)进行。
三、实验数据分析
(一)考试整体情况
第一轮个人测试的题目单选和多选两部分,题目中识记层级占50%、理解层级占35%、应用层级占15%。A班个人测试1平均成绩67.6分,B班个人测试1平均成绩58.5分。A班最高分90.0分,最低分37.5分;B班最高分82.5分、最低分37.0分(表1)。在考试内容识记层级占50%的情况下,学生分数偏低,说明基础知识掌握情况不理想。
个人测试1结束后,AB班大部分同学自评答题效果不好。经学生同意,第二节课开始时,要求学生按平时课堂作业的形式分组围坐,又发了第二份试卷。告知学生小组集体作答,如果有不同意见必须达成共识,小组成员共享同一分数。
(二)小组讨论对成绩的影响分析
实验设计中加入了个人测试2环节,并结合实际设置了与现有文献不同的两个变量,一是在实验组第一轮测试结束后公布了正确答案,要求学生交换试卷辅助老师完成试卷评阅,在对照组则没有公布正确答案,以此检验“公布正确答案”这一行为是否会加深学生记忆。二是实验组第二轮考试的时间为第二周同一时间(间隔七天),对照组则是第一轮考试后第二天(间隔一天),以此检验遗忘曲线在学生掌握知识中的作用。表2显示,实验组有4题(题号2、5、13、14)的统计数据出现了显著差异,对照组有2题(题号5、13)。此外实验组有1题(题号7)、对照组有7题(题号1-4、7-8、12)出现了“标准差为0,无法计算t”的情况。说明相较于第一次个人测试,A班学生的答题正确率提升更明显。按照艾宾浩斯遗忘曲线,人类第二周的记忆要弱于第二天,但由于实验班公布了正确答案且有“判卷”这一自主行为代入,加深了学生的印象。所以个人测试2的答题情况A班仍然好于B班。
(三)单题得分配对检验
将个人测试1与个人测试2的答题表单进行了数据清理,在个人测试1的表单中剔除了个人测试2删减的题目,将A、B班答卷按“个人测试1vs.个人测试2”的配对方式进行了配对t检验(表3)。题目设置上,根据个人测试1的答题情况,剔除了部分识记层级的题目,提高了多选题应用层级的占比,使得个人测试2的整体难度较个人测试1有所提升。数据分析结果表明A班(实验班)与B班(对照班)学生在个人测试1与个人测试2的答题情况,有9题(占总题量2/3)综合均值均存在显著统计差异(见表3)。可以解释为,小组讨论共同学习这一考试形式,有利于学生对知识的理解与掌握、从而提升了答题正确率。
(四)教学方法对成绩的影响分析
通过小组测试与个人测试1的成绩比对,讨论不同的教学方法(A班与B班)是否会影响学生对知识的掌握。根据题目难度设计,将识记层级(占50%,记为A类)、理解层级(占35%,记为B类)、应用层级(占15%,记为C类)进行难度分类。利用线性模型对总成绩、A类题目成绩、B类题目成绩与C类题目成绩进行不同教学方法的比对,检验不同教学方法与成绩之间是否存在差异。建立简单的线性模型:y=βx+C+ε。其中y是第一次个人成绩;x是班级分类,若学生来自实验组班级,则x=1,若学生来自对照组班级,则x=0;β是班级变量对应的系数;C是模型常数;ε是不可观测误差。在拟合线性模型前,先利用柯尔莫哥洛夫—斯米尔诺夫检验对第一次个人成绩的分布进行正态性检验。如果第一次个人成绩分布具有正态性,则拟合的线性模型可以提供稳健可靠的解释,反之不然。利用数据对模型进行拟合,以检验现有问题。分析结果见表4。
由上表可知,实验组班级比对照组班级的总成绩要好。教学方法对于学生的成绩有着至关重要的影响,不仅体现在总成绩上,在识记与应用层面也有极大影响。
四、结论与讨论
(一)考试效果
回应课题实验目标一,从考试结果来看(表1),小组测试的平均分较第一轮个人测试有明显提升,A班从67.6分提升至90.2分,B班从58.5分提升至84.5分;答题正确率A班从72.1%提升至88.3%,B班从62.4%提升至88.8%。本文第二部分数据分析中,不管是单题比对统计、还是实验组与对照组两个教学平行班的比对分析,都验证了现有文献对“二级考试法”的描述,即这一考试方法有助于提升学生学习效果。
(二)二级考试法在中国的适用性
课题实验目标二为“测试二级考试法在中国课堂和中国学生中的适用性”。通过“个人测试1vs.小组测试”和“个人测试1vs.个人测试2”的两组答题状况配对t检验分析,统计数据显示整体答题效果提升显著。主要反馈分三方面。一是评价考试形式。认为小组测试“可以集思广益,得到更精确的答案,知识得到更清晰的解释”。二是评价团队合作。第三种反馈认为“二级考试法”是一种新的学习方式。统计数据和学生反馈均显示“二级考试法”在中国课堂的适用性。
(三)教学手段对学习效果的正向影响
本次考试实验数据显示,进行教学改革的A班,比实施传统教学模式的B班,在二级考试法中得分更高。在个人测试2中,A、B、C三类题目的成绩比对A班都好于B班。在C类题目的成绩比对中,小组之间还产生了一定的差异,说明在应用层面小组与小组之间可能会产生不一样的看法,导致第二次个人成绩受其影响,产生差别。以上数据分析结果说明,不只是教学方法,讨论方法(分组方法)也对学生的成绩有着至关重要的影响,不仅体现在总成绩上,对于识记、理解与应用层面的知识掌握也有较大影响。教师应当让学生真正地参与到课堂之中,在互动中提升总体成绩水平。
参考文献:
[1] 周建新,郝静怡. 过程性考核下的“英语诗歌选读”课程教学与创新思维训练——基于华南理工大学2014-2015年第1学期的课程教学试验分析[J]. 教育与教学研究,2016,30(03):93-101.
[2] 李华,李寒梅,孙福财. 基于“雨课堂”的高校课程混合式学习成绩评定研究[J]. 湖北体育科技, 2022,41(04):373-376.
[3] 冒小瓂,程宝荣,张振琴,等. 高校本科教学评估背景下医用化学考试体系改革與实践[J]. 基础医学教育,2019,21(01):26-28.
[4] 李廉,张万红. 高校课程考试成绩正态分布辨析[J]. 中国考试,2021(04):86-93.
[5] 赵振宇,姚昱晨. 美中两国大学先修课程物理考试力学部分的比较研究[J]. 物理与工程, 2020,30(05):107-112.
[6] Herrmann J K. The impact of cooperative learning on student engagement: Results from an intervention[J]. Active Learning in Higher Education,2013,14(3):175-187.
[7] Bransford J,Brown A,Cocking R. How people learn: brain,mind,experience, and school[J]. Washington,DC: National Academies Press, 2004.
[8] Dan L, Theodore S, Mae K. Two-stage examinations: Can examinations be more formative experiences?[J]. Active Learning in Higher Education,2018,24(2):146978741880166-146978741880166.
[9] 吕林海,张红霞,李婉芹. 中国学生的保守课堂学习行为及其与中庸思维、批判性思维等的关系[J]. 远程教育杂志, 2015(05):54-63.
(责任编辑:陈华康)