关 佳, 倪 晨, 王 琦, 李渔迎, 方 恺
(同济大学a.物理科学与工程学院;b.教育技术与计算中心,上海 200092)
随着人工智能、大数据、互联网等现代信息技术对教育教学的强力赋能,高等教育迎来了高质量发展的时代机遇[1]。加之新冠疫情的影响,以线上教学和移动教学为主的网络化教学迅速发展成熟[2-3]。混合教学模式是教育数字化转型背景下的一种新的教学模式[4-8],它将传统课堂教学和线上教学优势有机融合,不仅包括学习环境的融合,而且包括教学资源、学习方式和教学方式等的融合[9-11]。这种教学模式强调了学生的主体地位,有利于满足学生个性化、信息化和定制化的学习需求,也有利于激发学生的探究兴趣,增强学生的实践动手能力、创新能力和综合能力,符合新时代党和国家对高等教育“四新建设”的时代要求。
在混合教学模式下如何建立与学生及时且深入的教学交流与学习反馈,如何准确了解学生多元化的需求并予以满足,给任课教师和教学管理人员带来了巨大的挑战[12-13]。当前,关于混合教学模式的相关研究中教学交互的主要途径有利用论坛、留言板、网站、邮件以及微信、QQ 等社交工具构建多渠道的交流互动平台来增加师生交互,创设提问交流和经验分享的空间社区解决学生的问题[14-17]。对学生提问回答的方式主要是教师解答、学生互答、统一公告发布等。这种交互方式一方面难以保证互动的及时性和解决方案的针对性,另一方面大量重复性的提问增加了教师的工作量,不符合智能化、精细化以及科学化教育的需求。
混合教学模式下多渠道的交流平台中产生了大量的交互文本数据,其中包含学生学习过程的信息,能反映学生学习需求、学习体验、学习习惯以及学习态度等特征,这些文本数据是研究互动学习行为的主要数据来源[18-19]。利用文本分析技术可以深度挖掘出交互文本下潜藏的学生学习特征,帮助教师实现对学生学习行为的学情分析和教学干预,及时解决学生遇到的问题。目前,关于互动文本数据的研究主要用于探究学生学习行为以及情感态度[20-23],鲜少有研究成果用于智能交互系统的构建。然而,大数据、虚拟现实、人工智能等智能技术在教育领域的深度融合已引发师生交互的全方位变革。利用智能教育技术可以超越师生交互的时空局限,改变师生交互的方式,重塑师生交互的内容,还为师生交互体验的丰富与提升提供了保障[24-25]。
本文提出利用文本分析方法对物理实验课程中采集到的交互文本数据从词频、聚类以及情感分析的角度进行智能化分析,优化智能问答系统,建立预警反馈机制,并进一步实现教学资源智能推送以及教学通知智能发布等智能交互。其中,预警反馈能在情感维度上弥补智能问答缺少情感交流的缺陷。智能交互系统对于具有教学课时有限、课程内容多而拓展资源有限、学生人数多、学习监控性不强和师生互动不足等问题的高校综合实验和实践类课程具有借鉴意义。本研究以期基于此应用案例更好地服务混合式教学,助力个性化、智能化、泛在化的混合实验教学新模式改革,进而形成开放共享、教学效果良好的信息化实验教学新体系。
我校“大学物理实验(上、下)课程”为面向理工科各专业本科生开设的公共基础课,每学期上课学生人数约为3000 人。课程总学时数为51 学时,教学分为两个学期进行,上、下学期的课程设置不同,体现由易到难,由基础到综合的特点。课程教学内容结合大学物理课程,涵盖力学、热学、光学、电磁学和近代物理等领域的验证性、综合性、设计性和研究性的物理实验项目。实验内容涉及误差理论、基本物理仪器使用、基本实验技能训练以及科学素养的养成等。大学物理实验是高等学校理工科大学生进行科学实验训练的一门基础课程,是后续专业实验课程的基础,是大学生从事科学实验工作的入门向导。
根据建构主义的基本理论,立足以学生为主体、教师为主导的理念,致力于满足学生对于高质量教学的需求以及顺畅及时的师生交互的需求,物理实验中心设计了多平台、精细化的线上、线下混合教学模式(见图1)。其中,在线网络教学平台是由Canvas 平台、物理实验中心网站、“同济物理实验中心”微信公众号和虚拟仿真实验教学系统等构成,各平台同步开设,优势互补。可用于发布通知、共享教学资源以及交流互动的平台有Canvas、微信公众号和物理实验中心网站。多平台多渠道可以更好地保证与学生的紧密联系,确保通知发布和资源共享的有效性和覆盖性。物理实验中心网站和微信公众号可以实现信息同步和交互,还具有选课、退课、学生学习过程记录、成绩查询、微课程学习、自测题自测、智能问答等功能。同济大学的智能问答系统利用了微信公众号平台提供的API接口可以实现学生对实验的知识原理和操作实践相关提问的智能回复,学生打开公众号并绑定身份,向其发送相关实验的关键字,系统可以自动回复与该实验相关的问题答案,帮助学生答疑。同时,该系统还可收集学生的提问,由教师审核并给出答案后加入智能问答库[26]。虚拟仿真实验教学系统中包含力学、热学、电学、电磁学、光学、近代物理以及自选实验7 类共34 个实验项目,部分实验项目与线下必做或选做实验内容一致,因此可以作为线下实验的预习或者复习资源使用,同时也可作为拓展实验。线下课程则涵盖绪论课、理论课、必做实验课程、自选实验课程以及物理竞赛创新拓展训练。本混合教学模式包括有实验预习环节、实验操作环节、实验分析与总结、拓展训练环节以及教学评价与反馈,涉及学生、教师以及在线网络教学平台3 个主要对象。在任何教学环节中学生都能与教师通过线上平台进行交流,对交流互动中产生的大量互动文本进行数据挖掘,可进一步优化智能问答系统,建立预警反馈,实现通知发布、教学资源推送和交互的智能化,从而增进五大教学环节中师生互动的紧密性,提升学生的体验感以及教学管理的精细化和科学化,有效提高教育教学质量。
图1 物理实验课程混合教学模式模型
智能交互系统是以在线网络教学平台为基础并结合文本分析技术而构建,其框架如图2 所示,主要包括智能问答、预警反馈、教学通知智能发布以及教学资源智能推送等功能。其中,预警反馈的实现是由系统提取学生提问文本数据进行词频分析和情感分析,动态设置词频以及情感值的阈值发布预警,教师及管理员收到预警信息后查看是否存在突发问题或者对学生的提问从情感维度去解决和疏导,增加人文关怀,提升学生的体验感。教学通知智能发布需要利用词频分析、聚类分析以及情感分析方法对交互文本进行挖掘处理,从而细化通知内容实现学生热点问题的全覆盖。结合学生提问和情感变化的时间规律,及时发布通知也可以实现学生问题的提前干预。智能问答系统的升级优化主要借助于词频分析和聚类分析的结果,可以避免教师大量回复重复性的问题,提高工作效率。在智能问答系统中还可以将通知内容以及线上教学资源作为学生提问的参考答案智能推送给学生,在提高和保证回复信息质量的同时,促进个性化教学。
课前预习是实验教学中至关重要的一环,当学生对于实验原理、实验仪器、实验基本操作过程、数据处理方法等有初步了解,才能在有限的线下实验学习中有的放矢,更好地理解实验内容,反思实验过程,启发创新思维。在本文的混合教学模式中,教师不仅需要制定课程安排,制作并上传教学资源,还需要在线下的绪论课和理论课中为学生介绍课程、实验原理以及安全教育知识。学生通过教材和在线平台中的电子课件、微课程等线上教学资源学习相关实验内容,或者利用虚拟仿真实验预习,然后参加线下的绪论以及理论课程,并完成教材配套的练习题以及微信公众号中的自测题。学习过程中学生遇到问题可以随时通过在线网络教学平台中的微信公众号或者Canvas 系统等向老师提问。
通过多渠道的实验预习准备,学生可以更快融入实验课堂中,也更能发挥自己的主体地位。在线下课堂中,每个实验操作台上均有该项目对应的微课程二维码,扫码即可观看实验教学视频。此外,部分实验项目中的测量仪器已连入局域网中,教师可以通过实验教学软件实时查看学生的测量数据,了解教学进展,及时发现问题并答疑解惑。有了线上资源以及数据监察系统的辅助,在课堂中教师可以留更多时间给学生做实践练习,通过检查学生的预习作业,可针对性地进行适时引导,讲解重、难点,组织学生交流讨论,使之透彻地理解实验内容,激发学生能动性和创造性。
实验课堂结束后,学生需要整理实验数据,撰写实验报告,并对实验的过程展开反思和总结,对学习的过程进行自我评价。如有知识遗忘,可以通过微信公众号或其他渠道留言提问,寻找线上资源或者虚拟仿真实验进行复习。实验报告的提交方式多样,不仅可以在线下提交,还可以直接通过物理实验网站上传给教师批阅,教师批改后可将评语、评分返回给学生。
为了更好地培养学生的创新能力以及解决问题的能力,本混合教学模式设置了多层次的拓展训练。包括线下自选实验、虚拟仿真实验以及与物理类竞赛相关的创新拓展训练。自选实验包含2 学时的理论讲座以及4 学时的实验操作,每位同学可自主选择一个实验项目完成。虚拟仿真实验的开展主要是为了弥补教学资源的限制,让学生尝试一些无法在实验室内完成的新项目,在每学期均会开设,学生需在给定范围内自主选择实验项目完成,一般第一学期学生只需完成1个项目,第二学期完成3 个项目。除此以外,教师还会组织并指导学生参加每年的大学生物理实验竞赛、大学生物理学术竞赛以及光电竞赛等。
教学评价是检验教学效果、学生对知识掌握程度的重要手段,以往通过实验报告为主要考核依据的方法较为单一和片面。在本混合教学模式下,成绩评定机制更客观、全面,体现过程性评价和多元化评价。成绩评定要素包括有每个必做实验的成绩、自选实验的成绩、虚拟实验的成绩、自测题成绩以及竞赛获奖加分。必做实验和自选实验的成绩由预习、操作以及实验报告的成绩构成。此外,在线教学平台记录有学生的在线学生情况,包括微课程视频观看数量和时长、课程讲义下载和观看次数、自测题和虚拟实验完成情况等数据,并自动生成综合评价雷达图。
互动文本作为学习者与教师之间最直接的交流载体和内在心理加工过程的外显表现形式,能更真实地反映学习者的学习动机、认知发展、情感态度以及学习体验,是研究互动学习行为的主要数据来源[18-19]。对互动文本数据进行深度挖掘与分析,可以直观真实地了解学生的学习状态和需求,帮助教师对学生的整体行为进行干预、推理和矫正,更有助于教学理论和方法的创新,同时对激发群体学习兴趣及智慧具有重要的理论指导意义[27-29]。互动文本作为一种非结构化数据,对其分析的方法属于文本分析[30-31],也称为文本挖掘,其常见的步骤包括有:数据收集、数据预处理、文本数据分析以及文本数据可视化等。此外,文本分析方法从不同角度细分还有情感分析[20,32-33]、社会网络分析[34-35]、主题挖掘[36-37]、聚类分析[38-42]以及词频分析[43-44]等。本研究主要用到的分析方法包括:词频分析、聚类分析以及情感分析。
为了准确挖掘出学生的交互学习行为,从而促进混合教学模式中交互的智能化,本研究设计了针对师生交互文本数据的分析流程,如图3 所示,包括数据收集、数据预处理与文本分析方法、分析结果可视化呈现及应用3 个模块。
图3 大学物理实验混合教学模式互动文本分析流程
学习行为数据的采集是智能化分析得以顺利开展的必要前提和实施依据[45]。本研究以我校大学物理实验课程中上下两个学期学生在微信公众号平台的提问留言为分析样本,该数据的收集流程见图3 中的数据收集部分学生关注同济物理实验中心微信公众号就可以直接在对话框中留言提问。教师端有两种途径查看和回复学生提问,一种是利用微信公众号的“消息管理”功能,这种方式下可以给学生共享一些图片资料,但弊端是回复时间有限制而且相关数据无法保留;另一种是利用针对学生提问专门设计开发的微信管理系统,这一系统的管理后台整合在物理实验中心网站的管理系统中。管理员或者教师使用账号和密码登录之后,在资源学习管理系统的“微信消息”菜单下,可以发送回复信息给学生,同时学生提问的数据以及教师回复的数据均被保留用于教学研究分析。
通过对交互文本进行词频分析、聚类分析以及情感分析,可以挖掘出文本下潜藏的学生学习行为的信息,发现师生交互的特点和规律,并进一步找到优化交互的方式。本研究选取2020 ~2021 学年第二学期(下学期)以及2021 ~2022 学年第一学期(上学期)的学生提问留言进行分析,提问总数为1823 条,去除表情留言,其中可供分析的文字提问为1592 条。数据收集完毕后进行预处理,合并共同话题词,删除无效提问对数据进行清洗,提高数据质量,为下一步的文本分析做准备[46]。本研究使用基于Jieba分词的微词云软件对清洗后的文本数据进行中文分词,分词方法为混合分词法,即先用基于词典的方式进行分词,然后再用统计方法辅助。为了得到更准确的分词结果,我们通过建立自定义词典进一步筛选出与本课程相关的关键词,得出词频统计表,并制作可视化词云图形象展示高频词。利用Gephi软件的邻近算法对该分词列表做进一步的可视化聚类处理[47-49],得到学生留言提问数据的类目。此外,对于特定的高频词进一步分析了其词频随时间的变化关系以及对应提问语料的情感值变化,从而进一步挖掘学生提问在时间和情感维度上的特点与规律。对于交互文本的情感分析,利用百度智能开放平台的情感倾向分析接口来研究,该情感倾向分析方法主要基于百度大数据平台的深度学习技术,可针对具有主观情绪的中文文本给出该文本的情感数值以及置信度,并判断情感倾向极性类别。
可视化分析是利用计算机的自动化分析能力,结合人的信息认知力,将复杂的文本数据转为直观的图形,方便高效传递信息[50-52]。本研究利用词云图和聚类图直观呈现出高频词以及它们之间的内在相关性,从而帮助教师准确并高效地捕捉学生的需要,利用特定高频词及其对应语料的情感值随时间的变化图可以进一步了解师生交互在不同教学过程中的特点,从而改进混合教学模式下的互动和信息反馈方式,例如优化智能问答系统,建立预警反馈机制,实现通知发布和网络教学资源、信息资源推送的智能化。
词频是一种常用于情报检索和文本分析的加权技术,用以评估一个词在文本文件中的重复程度。词频分析是通过关键词出现频次多少的变化来确定热点及其变化趋势[43-44]。本研究经过精确分词后得到108 个关键词,其中上学期53 个,下学期55 个,并制作对应的可视化词云图(见图4),词云图中的文字越大代表该词在文本中出现的频率越高。
图4 大学物理实验课程可视化词云图
由图4 可见,在不同的教学安排下,两个学期词云图存在差异,因此师生交互的内容和特点也不尽相同。大学物理实验课程上学期学生的提问主要集中于“虚拟实验”“成绩与评分”“实验报告”以及“自测题”;下学期中“自选实验”和“虚拟实验”这两个词最为突出,其他高频词还包括“实验报告”“密码锁定与重置”“成绩与评分”以及“自测题”等。可以发现“自选实验”“虚拟实验”和“自测题”涉及大学物理实验课程混合教学模式的3 个重要教学活动,即线下自选实验、线上虚拟仿真实验以及线上自测题,它们与学生自主选择、自主学习和个性化学习有关,需要学生根据自身情况自主完成选课、参加线下讲座、登录虚拟实验平台完成实验和上传虚拟实验报告等活动。这3 个教学活动中,涉及任课教师、教学管理人员、学生以及在线网络教学平台多个对象,需要线上线下多种教学资源的配合,呈现出交互频繁且复杂的特点。“成绩与评分”和“实验报告”都与学生成绩相关,通过这个分析也发现学生对于课程的评价方式极为关注。
通过图4 也可发现学生关于实验的知识原理和操作实践的提问相比较少,提问偏向于教学管理的内容,因此有必要进一步优化智能问答系统,拓宽其回复范围。但是实验管理相关的关键词与实验原理和操作实践类关键词不同,这些关键词可能对应的问题以及答案种类繁多,各不相同,甚至同一关键词在不同的学期对应不同的问题和答案。因此,为了更全面并且准确梳理出各高频词对应的问题,需要通过聚类分析对高频词间的隐含关系进行研究。
聚类分析是在没有任何先验知识的情况下,从未标记的文本材料中创建有意义的分类,主要的聚类算法可以划分为如下几类:划分方法、层次方法、基于密度的方法、基于网格的方法以及基于模型的方法[38-42]。目前,许多聚类算法已被加入SPSS、SAS、Gephi等统计分析软件包中。本文借助Gephi 软件的数据可视化功能,利用邻近算法对学生提问语料中的108 个关键词进行聚类。大学物理实验上学期的53个关键词聚类后得到3 个团块[见图5(a)],下学期的55 个关键词聚类后得到4 个团块[见图5(b)],其中相同颜色的为同一类,每个圆对应一个关键词,圆的大小综合反映词频数目以及关联度的大小,线代表两个关键词间具有相关性,线的粗细代表相关性的大小,数字则表示该关键词的词频数。部分关键词由于和其他词无相关性,所以没有显示在该图中。
图5 大学物理实验课程关键词聚类
图5 中黄色团块里的关键词与“虚拟实验”的关联度较高,聚类为线上虚拟仿真实验类;红色团块中的关键词与“自选实验”关联紧密,自动聚类为线下自选实验类;绿色的关键词是与线下必做实验相关的;通过聚类后还发现,蓝色团块中的关键词与除虚拟实验以外的线上其他教学资源有关,例如:“自测题”“公众号”“视频”“讲义”和“资源库管理”等。从文本的聚类结果可见,混合教学模式中上、下两个不同学期内学生的提问存在差异,由于教学安排的不同,下学期中的线下自选实验活动是一个重要的分类。共同分类包括:①线上虚拟仿真实验;②线下必做实验;③线上其他教学资源。其中,“成绩与评分”这一高频词在上下学期属于不同分类,这是因为在上学期该关键词与“自测题”等其他线上教学资源关联度较高[见图5(a)],即学生对于自测题的评分等问题比较关注;而在下学期,“虚拟实验”的“成绩与评分”则更受关注[见图5(b)]。
根据聚类结果,可以进一步升级智能问答系统的功能设计,并丰富通知发布的内容。以大学物理实验(下)学期的数据分析为例说明,根据图5(b)的聚类结果,可归纳出如表1 所示的高频词类目表并总结出12 类常见的问题。由于每学年同一学期的教学安排有一定的延续性,因此这些常见问题可以为后一学年对应学期的通知发布提供参考,以期做到提前干预。例如,通过表1 归纳出线下自选实验常见问题包括有实验安排、实验预习以及实验内容的相关问题,涉及的关键词见表1。根据自选实验相关的关键词以及课程安排可有针对性地发布教学通知或公告。此外,通知内容还可以作为相关提问的标准答案录入到智能问答系统,当学生提问到这些关键词时,智能推送通知内容,提高智能问答系统的回复效率和质量。对于实验原理和操作实践相关的关键词,不仅可以通过录入问答来丰富智能问答库,还可以智能推送对应的线上教学资源给学生,为其个性化学习提供帮助。
表1 大学物理实验(下)高频词类目表
情感是影响学习者认知和行为的关键性非智力因素,学习者的情感分析是人工智能和教育领域的交叉研究热点[20-21,32-33,53-54],有助于判断学习者的学习状态。智能问答系统由于缺乏生理和心理机制可能会使得师生交互缺少情感变得疏离和淡漠化[25,55],利用情感分析数据等构建的预警反馈系统可以很好地弥补智能问答中缺少情感交流的缺陷。预警反馈系统主要依据关键词的词频数目以及情感值大小来提供预警信号给负责教师,教师收到预警信息后登录系统,查看相关问题并及时给学生以情感安抚和疏导。此外,通过提前发布通知,细化通知内容也可以对学生的疑问进行干预,提升学生的认知度。
本研究选取大学物理实验(上)学期中的高频词“虚拟实验”“成绩与评分”和“自测题”所对应的提问文本作为研究对象,探究学生部分提问情况随时间的变化规律,并利用情感分析的手段分析对应文本的情感倾向性数值。图6(a)为相关词频占比随时间的变化情况,词频占比指的是特定高频词每天的词频数占该词总词频数的比值,并把这个比值做了归一化处理。图6(b)为对应高频词的提问文本情感倾向数值关于时间的变化,情感倾向数值越高说明学生疑问越少,情绪越积极,学习体验感越好。结合图6 从整体分布趋势看,针对这3 个高频词的提问,学期末相较于其他时段更频繁。此外,学生提问较多的时间一般与教学安排时间节点、突发事件以及通知发布有关,而且当有突发情况或者问题存在时学生情感值偏低,当问题解决后情感值会上升。
图6 大学物理实验(上)高频词变化分析
图6 中绿色的3 条竖线和自测题的一些时间节点有关,其中第1 条绿色实线对应的时间恰是教学安排中学生进行实验预习自测阶段,学生在初次使用自测答题系统中遇到问题较多,情感值偏低[见图6(b)]。通过设置情感阈值构建预警反馈系统就可以及时发现学生的问题并进行疏导。此外,如果提前发布一些关于自测题的操作方法、评分方式、自测题所属微信公众号平台的用户绑定和登录的注意事项等,就能对学生可能存在的问题提前做出干预。图6 中第2 条绿色虚点线对应的时间是教学安排中划定的自测题成绩记录开始时间,可见该时间节点附近学生的提问占比也快速上升。第6 条绿色短划+双点线对应自测题的成绩记录截止时间,该时间节点后学生的问题主要围绕自测题成绩的评定以及能否延期完成,结合图6(b)可见学生情感倾向值相比于初期整体有所提高。由此可见,重要的时间节点是学生提问的高发时段,可以提前发布相关通知并利用预警反馈系统减轻大家的疑惑和焦虑。
图6 中第3 条和第4 条红色的短划线对应的时间内出现了突发情况(自测题图片无法加载、虚拟实验报告提交系统报错),引起提问量激增。在这类情况下,通过设置词频的阈值就能利用预警反馈系统来实时反馈网络教学平台的运转状态,如有异常即可迅速发现并动态调整教学安排。
图6 中第5 条和第7 条黑色线与虚拟实验以及成绩查询相关通知的发布有关。其中,第5 条黑色虚点线对应的当天发布了关于虚拟实验延期通知,此后一周内关于虚拟实验的提问大幅减少。第7 条黑色虚线对应的当天发布了成绩核查通知,学生关于成绩的问题急剧增加,其中自测题的评分方式是学生较为关心的问题(该结果与图5(a)聚类结果一致)。
根据上述分析,对于一些自主性强的教学活动,可以在开始以及结束的重要时间段内提前做好引导和反馈工作,尽量细化通知以及回复的内容,全面覆盖学生的疑问。对于出现的问题及时发现、及时修正,可避免影响学生的学习进度和学习体验。预警反馈系统利用动态设置高频词以及情感值的阈值来提供警报信息给教师,这一系统可配合智能问答系统在智能、及时、高效交互的同时,及时应对突发问题,关注学习情感体验的积极引导。
《中国教育现代化2035》明确提出,将加快推进信息化时代的教育变革作为我国面向未来的重要战略任务,建设智慧化校园、探索新型教学方式、创新教育服务业态、推进教育治理方式变革。本文在推进数字化、信息化、智能化教育与管理的时代背景下,提出利用文本分析方法对混合教学模式下的交互文本进行数据挖掘,从词频分析、聚类分析和情感分析的角度探究了学生的交互行为,并基于物理实验教学特点对智能交互系统进行设计,利用智能问答、预警反馈、教学资源智能推送和教学通知智能发布各模块耦合协作,可以更好地实现教师与学生、线上与线下的融通,尤其是对于综合实验以及实践类课程的混合教学的开展具有借鉴意义。智能交互系统的设计以期更好地服务混合教学,实现个性化、智能化、泛在化的混合实验教学新模式,进而形成开放共享、教学效果良好的信息化实验教学新体系。