崔晓燕,宋 磊,钱 玲
(1.河北大学 教育学院,河北 保定 071000;2.石家庄装备制造学校, 河北 石家庄 050000)
美国在线课程近年来发展迅速,形成了较为成熟的在线课程设计思路和方法,尤其是在在线课程的评价方面,取得了许多新进展。美国在线课程设计注重评价,并将评价与学习目标直接关联。作为检验学习者学习结果的重要环节,评价活动已成为在线课程设计的核心。笔者通过阐述美国在线课程中评价设计的最新功能与分类,分析主流的两类评价和支持工具,介绍提高在线评价质量和信度的最新发展的远程监考支持软件,以期为我国教育工作者提供参考。
课程评价活动设计旨在评估学生是否达成了学习目标。根据布鲁姆的教育目标分类,学习目标既可以是概念的理解和记忆,也可以是技能的运用,还可以是综合应用和评价。[1]课程评价既可以在课程学习中进行,对阶段性学习目标进行评估,也可以在课程学习末期进行,对学生的学习结果进行总结性评价。在通常的教学设计中,评价活动主要分为过程性评价和总结性评价。这种分类方式有助于教师根据学习进程对评价活动进行分类,但对在线学习过程中“以学生为中心”这一理念的关注度不够。
基于此,近年来,美国在线课程的评价活动更加关注两个功能。第一,关注学生在线学习过程中的困难和及时的反馈。由于在线课程中教师的教与学生的学处于时空分离的状况,因此如何及时了解学生的学习进展,获得实时反馈,并帮助学生最终实现学习目标的达成,成为在线课程评价活动设计的核心之一。第二,关注学生课程学习后的整体评价。这种评价帮助教师和课程设计者了解学生是否达成了课程要求,是否能够获得相应学分。因此,美国在线课程评价活动设计的一个新趋势为将评价活动分为低风险评价和高风险评价,从而直接支持学生学习的发生。
低风险评价活动指被用来衡量学生学习效果,找出学习问题,从而进行调整的学习评价活动。[2]这种评价主要是在教学过程中进行的,其目的是了解学生的学习进程,发现学生现阶段存在的问题,并及时对这些问题进行纠正解决,以改进教学过程,促进学生学习。通过评价,教师也可对自己的教学工作进行反思检查,及时根据学生的学习进程调整教学进度、策略、方式方法等,以期能获得教学的连续性反馈,使教育教学得到最优化发展。因此,这种评价在总成绩中占比不是很高,主要起督促和改进的作用。
在线课程评价活动设计中,低风险评价活动往往在总成绩中占比较小,因此,一两次失误不会对学生的总成绩产生决定性影响。同时,低风险评价活动在设计时给予学生多次试错机会,例如,在低风险评价活动设计时,会对学生进行多次评价,选最好成绩计入最终成绩。这样,学生在评价过程中学习压力较小,能够更好地关注是否全面掌握学习内容。
高风险评价是指用于对学生作出重要决定的评价活动,例如,决定学生是否能够获得学分的重要考试,占有课程评价较大比例的评价活动。高风险评价在整个在线课程评价中所起的作用与总结性评价相类似,但功能更为全面,内涵更为丰富。这种评价在整个课程中占比较高,往往在一门课程结束时或重要节点进行。高风险评价通常注重学习结果,其目的主要是检验学生的学业水平是否达到了课程要求,评价结果用于确定学生是否能够进入下一阶段的学习或是否有资格获得文凭。
在线课程评价活动设计中,高风险评价通常在课程总成绩中占比较大。因此,学生需要投入较多时间和精力进行准备。同时,这类评价活动只给学习者一次机会,例如,期末考试。因此,高风险评价活动给予学生的评价压力也较大。
高风险评价活动与低风险评价活动可以有多种不同的形式,但其最本质区别是对学生最终学业成绩的影响因子不同。例如,若一项评价活动能够确定学生是否获得所学课程的全部学分,那么无论是多项选择考试、小组报告,还是作文考试,这项评价活动都将被视为高风险评价活动。 而低风险评价活动通常不会带来重大后果,即评价结果不会对学生造成重大影响。表1列出了高风险评价活动和低风险评价活动的特点比较。
表1 高风险评价活动和低风险评价活动特点比较
在美国最新的在线课程评价活动设计中,教师通常将这两类评价活动结合起来使用,这样不仅提高了考试形式的灵活性,也使评价具有科学性和合理性。在高风险评价和低风险评价中,教师又给予了学生一定的弹性,如若同一类型的测验进行多次时,教师允许去掉一个最低成绩,取剩下的较好成绩计入总分,这也使得在线课程的评价更具人文精神。表2为2020年卡内基·梅隆大学在线课程《信息系统》的评价活动设计。课程的评价活动由低风险评价活动和高风险评价活动组成。其中,出勤、家庭作业、课堂表现、案例研究和项目开发所占总体成绩比例相对较低,并且学生有多次尝试机会,因此,属于低风险评价活动。即使学生在某一项评价活动中表现较差,只要能及时调整,对其最后总成绩影响较小。小组合作和期末考试则为高风险评价活动。学生如果在这两项评价活动中,尤其是期末考试中表现较差,则很有可能导致整门课程得分较低,最终导致不及格。为此,学生将在这两项测验上花费更多的时间和精力来取得一个较好的成绩,否则将会给整门课程带来失败的高风险,因此这两个评价项目属于高风险评价活动。
表2 卡内基·梅隆大学在线课程《信息系统》评价活动设计[3]
再如表3波士顿大学在线课程《计算机科学》的评价设计活动。其中,考勤问答在总成绩中占比仅为10%,即使学生在这项评价中表现不佳,其对学生课程总成绩影响也较小,因此本项评价属于低风险评价活动。而家庭作业这项评价在总成绩中占比30%,占比较高。但由于这项评价有多次尝试机会,学生只需保证大部分的家庭作业完成质量较高就可以在这项评价中获得较高成绩,因此本项评价也属于低风险评价活动。在此项评价活动中,并不是每一次的家庭作业成绩都是平均划分的,较难、内容较多的家庭作业占成绩比重较大,因此,这也需要学生对每一次家庭作业的比重进行权衡。学生通常在家庭作业与考勤问答这两项评价中花费的时间、精力较少。而期中考试和期末考试这两项评价活动则属于高风险评价活动。原因在于期中考试和期末考试这两项评价在总成绩占比中分别占20%和40%,占比较高,且考试机会只有一次,若学生在这两项评价活动中表现不佳,则很有可能导致学生整门课程成绩不佳,甚至不合格。因此,学生需要对这两项测验精心准备,花费较多的时间和精力以求取得较好的成绩。
表3 波士顿大学在线课程《计算机科学》评价活动设计[4]
美国在线课程评价的整体发展已相对成熟,其支持工具多种多样,其中常用的学习管理系统(Learning Management System,以下简称为LMS)有Canvas、Blackboard等。哈佛大学、斯坦福大学、普林斯顿大学、杜克大学、华盛顿大学、卡内基·梅隆大学、波士顿大学、威斯康辛大学麦迪逊分校等美国知名高校都在使用Canvas、Blackboard等LMS进行在线教学与评价活动。不同的学习管理系统虽各有其特点,但就功能来说大致相同。一般包括学生名册管理、课程作业布置、在线评价(测前调试、创建试题、发布任务、测后管理)等在线教学必备功能,是传统教学与在线教学的深度融合。[5]因此,本文在介绍高低风险评价活动的支持工具时将不再做具体平台区分,而是统一使用LMS进行介绍。
美国在线课程评价活动多种多样,其中经常使用的类型有论坛、课堂参与、班级测试、问题与案例、项目任务、小论文、家庭作业、期中测评、期末考试。一般来说,家庭作业、课堂表现、出勤、案例项目、随堂测验属于低风险评价,而期中、期末考试则常被归为高风险评价。评价活动具体如何归类受课程性质、课程内容、课程目标等条件的制约。笔者将以表2卡内基·梅隆大学在线课程《信息系统》为例,对低风险评价活动及其支持工具进行阐述。以表3波士顿大学在线课程《计算机科学》为例,对高风险评价活动及其支持工具进行分析。
1. 作业。作业通常被归为低风险评价,且其形式多种多样,并不拘泥于某一固定形式,如项目作业和音视频作业等。如卡内基·梅隆大学《信息系统》课程中家庭作业、案例研究作业和项目开发作业在总成绩中占比分别为5%、10%和20%,这三项作业占比较小,且由多次同类型评价组成,因此属于低风险评价活动。项目作业通常是以文档的形式进行提交,而音视频作业的形式更为丰富,如视频、音频、图片等。
学习管理系统中“课程”板块的“作业”功能能够对学生作业完成度进行很好地评价。教师在“作业”模块中发布项目作业、音视频作业等,并要求学生在规定时间内提交。教师通过学习者作业的完成情况来了解学习者对课程内容的掌握程度,并及时对作业进行批改打分以及有针对性的线上讲解与点评,给予学生及时的反馈。学生可根据反馈情况了解自身对知识掌握和学习态度等方面存在的问题,并且做出相应的调整。
作业这一评价活动的抄袭问题一直以来深受各方关注。由于视频作业具有直观、灵活、可视性强等特性,教师可直接对学生作业完成情况进行评定,因此学生在视频作业中作弊几率很小。那么如何排除学生在项目作业中提交的文档作业的抄袭嫌疑,卡内基·梅隆大学使用Turnitin这一工具对学生提交的文档作业进行检查。其原理是学生在提交作业时,文本内容会被自动录入到Turnitin中,Turnitin将对学生作业和其文库中的资料进行对比查重,若重复率超过作业要求中的规定,则该学生的作业将被视为作弊。[6]由于Turnitin这一工具的使用,学生在作业中特别注意避免抄袭,因此,文档重复率大大降低。
2.考勤与课堂表现。考勤与课堂表现在美国在线课程评价中是一种十分常见的评价活动,如在卡内基·梅隆大学《信息系统》课程中出勤和课堂表现共占总成绩的10%。一般来说,考勤与课堂表现这一评价形式在课程总成绩中占比较低,主要起到督促激励作用,不以评定学生为目的,因此其属于低风险评价。由于考勤与课堂表现这一评价活动较易观察与记录,因此其应用工具种类较多, 常用的学习管理系统都可实现,且这几种工具均设有数据记录功能,直观性强也易于统计,如考勤功能,辅助教师记录学生出勤情况。
随堂测验这一评价活动通常与课堂表现直接挂钩,因此随堂测验成绩是衡量学生课堂表现情况的一个重要指标。随堂测验能很好地激活专业理论课堂教学的手段与环节。在课堂中进行随堂测试,巧妙地设计一些与课程联系紧密的、灵活的、学生感兴趣的且完成时间不长的题目,能够提高学生的学习兴趣,对学生的学习起直接促进作用。一般情况下,随堂测验在总课程评价中占比不高,其作用往往是当堂检测学生是否掌握课上所讲内容,给予教师和学生以反馈,根据反馈结果进行相应改进。因此,随堂测验一般属于低风险评价,并不强调分数的重要性。
随堂测验亦可通过学习管理系统中的“作业”模块进行展开,教师只需提前编写好试题,并将其上传到此模块当中,规定好答题时间后要求学生作答即可。在学生提交测验后,教师可对学生作答内容进行问题标注和成绩评定,并给予学生及时反馈。
3.论坛讨论。由于论坛的功能也是强调对学生学习的促进以及对教学过程的改进,因此论坛通常也属于低风险评价。论坛具体分为两种,即“观点论坛”与“问题论坛”。“观点论坛”指教师开设一个论坛并提出一个问题,学生就此问题发表自己的想法见解等。教师通过查看学生的观点记录来判断学生是否掌握了教学内容,是否达到了学习目标,并对每一个学生进行评分,且录入到学生的课程总分数当中。“问题论坛”如字面意思所示,指学生在论坛中提问学习过程中的疑难问题,教师对问题进行答疑解惑。论坛中的问题对教师和其他学生同样可见,因此若其他学生有同样的问题,可一次性得到解答,从而有效地避免了同一问题提问和解答的重复性。
学习管理系统中“讨论”模块为论坛的开展提供了很好的平台。教师可以就长期的、中期的、短期的学习规划、重难点问题或者容易引起学生困惑的地方来设置一个讨论,这个讨论可以是全体学生共同参与的,也可以是小组之间的。学生在“讨论”模块中表达自己的所感所想,教师则可以根据学习者之间的交流、答疑,对学习者知识掌握程度及学习效果差异进行在线评价,从而进行有针对性的指导。
1. 评价活动及主流平台的工具支持。 高风险评价类型并不局限在具体的评价活动中,高风险评价主要以其是否对学生的总成绩占决定性影响来进行划分。例如,考试、作业、项目等都可以作为高风险评价活动。高风险评价活动往往发生在学期末或者学期中等重要节点,期中考试和期末考试可以被看做高风险评价。期中考试的性质是诊断性考试,作用包括两个方面,即诊断学习和诊断教学。诊断学习指根据期中考试成绩落实学生现阶段学习情况及困难所在,并及时给予学生支持,以促进学生后续发展; 而诊断教学的目的在于经过诊断总结经验和教训,促使教与学相互沟通,最终达到优化教育教学效果的目的。而期末考试在很大程度上决定了学生本学期的学习是否达到课程要求以及是否有资格进入下一阶段的学习,重要性不言而喻。因此,期中考试和期末考试通常在课程评价中占比较高,如波士顿大学《计算机科学》课程期中考试和期末考试分别占课程总成绩的20%和40%,且分别只有一次考试机会。学生需要付出较多的时间和精力进行两项考试的准备,以获得一个较好的成绩。美国在线课程中期中、期末考试这两项评价活动通常由学习管理系统中的“在线考试”这一工具进行组织,考试流程包括测前调试、创建试题、发布任务、测后管理四大步骤。
2.保持诚信的监测工具。诚信考试一直是美国教育活动中学生必须严格遵守的一项准则,这不仅关乎着学校、教师教育教学工作质量的评定,更是关乎学生为学为人的态度。那么如何保证学生对于这些工具的使用合乎规范,如何规避学生在在线课程评价的过程中的不诚信考试行为,这就需要保持诚信的监测工具发挥重要作用。美国在线课程评价中保持诚信的监测工具有Respondus、Proctorio等,它们功能强大,着重强调监考的安全性、透明性和有效性,且与Canvas、Blackboard、Brightspace、Moodle等学习管理系统有效整合在一起。若高校或者其他教育机构使用了多个LMS,或者当一个教师使用了不同的LMS时,监测工具也能很容易地将考试在不同的LMS之间进行转换。其操作仅需在选用的监测工具中“检索”原始考试,然后将其“发布”到新系统即可。监测工具主要包括锁定浏览器和音视频实时监考两个主要功能。
第一, 锁定浏览器工具(Lock Down Browser)。Lock Down Browser可以对学习管理系统中的在线评价环境进行锁定,用于确保在线评价活动在封闭的环境中进行,从而使在线评价顺利完成。Lock Down Browser可对学生的计算机或平板电脑等考试设备进行浏览器锁定,使学生无法在在线考试期间使用虚拟机、远程桌面、屏幕共享、即时通信、屏幕记录等数百种常见和先进的数字作弊手段。一旦监测到学生考试设备出现上述情况,Lock Down Browser的警报就会自动启动,并对学生的作弊行为进行记录。
Lock Down Browser在当前美国在线课程评价中发挥了极为重要的作用,主要有8个功能。一是显示全屏,不能最小化。在线评价的过程中,学生的计算机或平板电脑将被锁定为全屏模式,不可以进行最小化和锁屏操作。二是删除菜单和工具栏选项。在线评价的过程中,Lock Down Browser仅保留了浏览器中“下一步”“上一步”“刷新”和“停止”这几个工具栏选项,菜单及其他选项均被删除,这也在一定程度上防止学生考试作弊。三是禁止访问其他程序。Lock Down Browser在在线评价期间将学生的计算机或笔记本电脑锁定在特定的浏览器上,其他程序的访问操作都是不被允许的。四是禁用打印和截屏功能。此项功能明确显示了学生在考试时将无法将考试信息以打印和截屏形式传送、泄露给其他人,从而降低了学生作弊概率。五是禁止复制粘贴。也就是说,考生既无法将在线评价界面上的考试信息复制粘贴到其他界面,也无法将其他界面的与考试有关的信息复制粘贴到在线评价的界面中进行作答。六是右键菜单选项、功能键、键盘快捷键和任务切换键被禁止使用。七是在学生提交作答试卷以进行评分之前,学生不能退出考试界面。这项功能很好地避免了学生退出考试界面,查阅考试相关资料后重新进入考试界面继续作答这一作弊行为。八是禁止访问其他浏览器。用于在线评价的浏览器一旦被锁定,Lock Down Browser将会禁止考生访问其他浏览器,从而有效防止考生作弊。[7]
第二,音视频实时监考(Monitor)。如果说Lock Down Browser仅仅是对考生的计算机或笔记本电脑等考试设备进行了监控和限制,而考生本人的其他行为依然游离在在线评价监考的视线之外,那么音视频实时监考就是在Lock Down Browser的基础上,利用考生设备的摄像头和行业领先的视频分析技术来防止学生在考试期间作弊。这就是监测工具的第二个功能,在锁定浏览器的基础上进行音视频实时监考。
音视频实时监控功能主要作用于三个时段:一是考前。监考系统页面会弹出“启动序列”按钮,按钮包括了教师提前设置好的要求,学生需按照按钮指示,如人脸识别验证考生信息、打开设备摄像头并向教师展示考场环境等,而拍摄记录只有教师能够进行查看监测;二是考中。考中实时监控包括三个层面。第一层是AI识别,包括面部检测、动作记录和明暗测定的高级算法,以分析学生和考试环境。例如,一个画面中是否同时出现了考生和其他与考试无关人员,考试过程中是否出现更换考生,即替考现象等。第二层是通过对学生考试设备数据(键盘活动、鼠标移动、硬件更改等) 的识别来判断学生是否存在考试作弊行为以及其他异常情况。第三层是机器学习算法,利用眼动追踪和监视背景噪音来自动标记任何可疑行为,且能实时扫描作弊行为,并为每个学生自动生成一个风险评估报告;三是考后。监考系统实时监控考生考试行为后,将监控视频进行保存,并将具有作弊嫌疑的监控视频进行标记,以备考试相关工作人员进行查看确认。
评价活动一直是教学活动的核心,它直接指向学生学习结果和学习目标是否达成,尤其是在在线课程情境下,许多学习活动是在异步学习环境下发生,教师不能如在传统课堂中关注学生学习的全过程,因此,如何有效评价学生的学习则更为关键。
与传统的在线课程评价活动相比,美国在线课程中评价活动的新分类和工具应用体现出美国在线课程设计的实用主义和人文主义。形成性评价与总结性评价被低风险评价和高风险评价代替。评价的重点从关注评价过程转变为关注学生的学习过程。学生是否掌握了阶段性学习目标,是否需要对内容进行重新学习,由低风险评价活动评价。学生是否达到了掌握本课程的学习目标,是否能够获得学分则由高风险评价活动来决定。在线课程的灵活性、对学生需求的人文关怀,则由低风险评价的多次评价、多次试错体现。美国在线课程的评价活动并非完美,可以看到美国在线教育工作者和研究者依然在尝试和摸索。
近年来,我国在线教育也在快速发展。国家相关政策的扶持、教育技术的更新与应用、教育工作者理念的前瞻性趋势、适合于在线教育发展的大环境作用等都是推进在线课程不断进步的内在动力。与此同时,根据国家相关教育文件精神,我国教育评价越来越关注对学生综合素质的评价。核心素养体系的构建与发展,要求教育对学生的培养不单单要关注学生知识与技能的掌握情况,更要关注学生内在需求、全面性素质与创新能力等方面的发展。目前,美国相对成熟的在线课程评价实践与进展能够给予一定启示。但是,在此基础上,如何将国家教育教学评价的新理念与我国在线课程快速发展的时机相契合,探索适合我国教育实践的在线课程评价活动体系值得我国教育工作者关注与思考。