华南 秦炜炜
苏州大学教育学院 江苏苏州 215123
随着“互联网+教育”的融合发展,在线学习已成为“互联网+”时代数字化学习的重要方式,也是国家教育数字化战略行动的关键支点。2020年新冠疫情的持续性暴发,更是开启了全世界最大规模的在线教育实验,在线学习研究与实践空前发展。据统计,仅2020 年疫情暴发就导致全球15.8亿学生无法返校,195 个国家的学校被迫关闭[1]。为了应对这场突如其来的公共卫生危机,全球教育系统纷纷制定和加强了远程在线学习策略[2]。我国教育部在2020 年初发布《关于在疫情防控期间做好普通高等学校在线教学组织与管理工作的指导意见》,提出实现在疫情防控期间“停课不停教、停课不停学”“在线学习与线下课堂教学质量实质等效”的要求[3],做好线上教学活动的准备工作,如:准备各类优质线上资源、学习如何使用线上教学平台。这一指导意见使在线学习得到飞速发展,在线学习也从应急走向一种“新常态”。
经统计,从开始出现疫情至2020 年5 月8日,我国采用线上教学的高校达到1 454 所,参与的教师和大学生分别达到103 万以及1 775 万,总共涉及23 亿人次;其中在线课程共开出了107 万门[4]。据《疫情下的2020 年移动互联网报告》显示,2020 年3 月在线教育用户规模大涨近一倍,即便疫情缓和后有所回落,较疫情前仍增长1.09 亿[5]。与此同时,在线学习研究数量不断增长、研究主题日渐丰富,然而在线学习依然面临师生在线教学互动不充分[6]、学生学习自主性偏低[7]等问题,研究与现实差距较大。国内在线学习研究的核心议题、主要特征、发展趋势等问题尚不明确。为了使以上问题得到解决,必须从在线学习的研究层面、弥合研究以及实践差距、提高研究效率等方面出发。
高质量论文往往预示着在线学习研究领域的发展前沿,可以在一定程度上反映在线学习研究的主要内容、典型特征和未来方向。对于一篇论文来说,关键词反映了其研究核心,能够对整篇文章进行高度概括和抽象反映;而高频关键词能够对整个研究领域的具体研究方向和内容进行全方位刻画[8]。所以,要想掌握在线学习领域研究的主要课题,可以基于聚类分析高频关键词来实现。多维尺度分析则是为了研究当前在线学习的研究热点及其变化趋势、彼此之间的关系,进而明晰国内在线学习的发展趋势。基于此,本研究对在线学习研究领域现有CSSCI 期刊载文进行可视化分析,试图回答前述与在线学习有关的若干未解问题。最终在文献计量学的框架体系下,利用社会网络分析方法,为指明在线学习的未来研究方向、推动在线学习研究领域的发展等提供一定的参考和借鉴。
本研究基于在线教育研究的CSSCI 期刊论文,以“在线学习”为篇名、关键词和摘要在中国知网(CNKI)平台进行检索。经过检索发现,“在线学习”相关文章数量自2009 年开始显著增多。因中国知网收录的CSSCI 期刊论文时间晚于期刊实际出刊时间,故时间范围限定为2009—2021 年(2021 年10月),共检索出1 566 篇CSSCI 期刊文献。基于对文献摘要的阅读,剔除会议综述、会议通知、文件讲话、重复内容以及访谈等和主题联系比较低的文献,最后得到的文献数量为1 529 篇(如图1)。由图1 可知,国内在线学习研究自2013 年开始增幅明显,并于2020 年达到高峰。如果说2013 年在线学习研究数量的增长可能与大规模开放在线课程(Mass Open Online Courses,简称MOOC)浪潮催生的“中国慕课元年”有关,那么2020 年在线学习研究的蓬勃发展无疑与新冠疫情的全球性暴发密切相关。在线学习的广泛实践催生了更多的在线学习研究,但同时也反映了对已有在线学习研究进行回溯性元分析的必要性和重要性。
图1 2009—2021 年在线学习研究CSSCl 发文量
本文在研究的过程中运用了Ucinet 社会网络分析软件、Bicomb2.0 软件(书目共现分析系统)以及数据统计软件SPSS2.0 来完成可视化的研究与分析。首先,将中国知网上的文献信息导出,然后在新建的Bicomb2.0 项目当中导入,对需要用到的字段进行准确提取,然后归类存储,再进行矩阵分析以及统计计算,形成本文的研究数据依据[9]。其次,运用SPSS2.0 对研究热点进行聚类分析,明确研究主题,并通过多维尺度分析和绘制在线学习研究领域知识图谱。最后,应用Ucinet 绘制社会网络。
本研究利用Bicomb2.0 软件从1 529 篇有效文献中提取高频关键词,以期客观反映在线学习领域的研究热点及发展方向(如图2 所示)。具体研究过程如下。
图2 研究过程
1.3.1 数据收集
在中国知网收集到的有效文件总共1 529 篇,将这些文件通过NoteFirst 格式进行导出,然后另存为.txt 格式,在所保存的文本文件当中,具体涉及所有文献的作者单位、作者名称、标题、期刊名称、关键词以及各种重要信息,以此形成高频关键词的词篇矩阵以及数据统计表,根据不同关键词出现的频率来判断该主题的研究热度以及主题之间的关联性。
1.3.2 基于词篇矩阵的聚类分析
为了对在线学习研究所表现的主题结构了解得更深入,就要聚类分析高频关键词。在SPSS2.0 软件当中导入词篇矩阵,再选系统分析,选择度量标准为二分类当中的Ochiai 系数,这些操作完成之后就能形成分析树状图。聚类分析能使研究对象的各种关键词统一归类,以保证对主题之间的关系进行判断,进而明确其研究热度和现状。
1.3.3 基于关键词的多维尺度分析和社会网络分析
多维尺度数据分析法能够通过简化多维空间的各种研究对象,使其变成低维空间,为之后的分析、定位以及归类呈现可视化的结果;而且对象之间的原始关系也能够被保留[10]。研究者能够基于可视化结果明确不同主题以及关键词之间的位置,从而对当前在线学习的具体发展情况进行客观判断。通过系统分析生成相似性矩阵,并将其导入Excel 数据处理软件。将经过整理的表格在SPSS2.0 软件当中导入并展开多维尺度分析,与聚类分析的结果相结合,完成知识图谱的绘制。然后在Ucinet 中导入相关矩阵再次处理,结果保存成.##h 文件,用来进行NetDraw 关键词社会网络的绘制,同时对所绘制出的社会网络基于“degree”条件展开中心度分析。
高频关键词就是相对频繁地出现在目标文献当中的关键词,具体的判断标准通常是累计频次达到总频次大约40%的关键词[11]。本研究应用Bicomb2.0 软件自1 529 篇文献中提取了202 个关键词,其累计频次达到总频次的40.049%,符合高频关键词的遴选标准,可以初步反映我国近年在线学习研究的热点和发展动向。鉴于不同文献的关键词存在同义词和包含的问题,需利用软件将多个同义词合并设置为一个词语,如本研究中MOOC 指代MOOCs、慕课、大规模开放在线课程等关键词;在线教育指代在线辅导、在线教育平台、在线课程以及远程教育等关键词;在线教学指代在线协作学习和在线教育等关键词;学习者指代在线学习者、成人学习者等关键词;学习投入指代认知投入、行为投入以及情感投入等关键词。最终提取出频次≥20 的关键词,共计18 个,如图3 所示。
图3 高频关键词出现频次
结果表明,我国在线学习领域研究侧重于在线教学、MOOC、学习分析、学习投入、学习者、影响因素、深度学习、大数据、社会网络分析、人工智能、学习效果、数据挖掘等方面,强调自主学习、网络课堂、翻转课堂以及混合式教学等教学模式,也注重对各种资源进行共建共享,研究过程中的具体范畴以及层次基本上都在高等教育。
聚类分析就是划分数据集为不同的类别或组别,让处于同一组的数据对象相似度更高,而处于不同组的数据完全不同。处于目标研究领域的部分关键词,能够用聚类分析把具有密切关联的关键词进行聚集以产生不同类别,进而获得不同分支在该领域中的构成[12]。聚类分析能够使研究主题的结构更加清晰,所以本研究深入分析了在线学习当中的高频关键词。词篇矩阵的基础是共现矩阵,本文研究当中基于Bicomb2.0 软件来完成高频关键词词篇矩阵的生成,并在SPSS2.0 软件当中导入,以Ochiai 系数来展开聚类分析。之后,再通过该软件完成高频关键词共现矩阵的生成,作为多维尺度分析的基础。结合专业知识背景,本研究将19 个主题词聚为四类,如图4 所示。
图4 高频主题词聚类分析树状图
按照高频关键词所形成的聚类树状图,本文将研究在线学习的热点划分为下面几类。
2.2.1 在线学习分析数据处理研究
在线学习分析数据处理研究的文献检索关键词包括“学习投入”“数据挖掘”“社会网络分析”“学习分析”。Martin[13]认为学习投入是对学习过程产生最直接影响的因素,他将学习投入划分为认知投入以及行为投入这样两个维度。认知投入就是在学习活动中学习者经过思考之后所形成的认知水平,是认知以及心理层面的高度投入[14]。而行为投入就是在学习活动中汇总学习者的各类行为,是高度投入学习活动的表现[15]。基于研究,可以通过了解学习者对课程的感知、调控和情感体验,使在线学习课程教学设计水平更上一层楼[16],增强课程的个性化以及针对性,所以很有必要研究学习投入。数据挖掘就是基于现有数据来进行所需知识挖掘的过程[17]。该技术基于对数据内涵的探究来掌握学生的情况以及具体学习环境,相关方法和技术也在进一步升级[18]。社会网络和学习分析技术有助于了解在线学习的主要研究热点与研究内容之间的关系。自2020 年开始,新冠疫情的暴发与反复促使教学主阵地从线下转至线上,倒逼在线教育的蓬勃发展。在线学习从“应急式”逐步转变为“常态化”,其应用中存在诸多局限性,比如部分在线教学的录播或直播仅是传统课堂教学的翻版,并未充分利用现代教育技术助力教育教学智能升级[19];“以机器为中心”的在线教育未能精准判断学生学习投入情况并实现因材施教;碎片化在线学习在帮助学生建立对事物整体性、系统性、一致性的认识方面存在困难等。在教育教学以及信息技术的不断融合、“互联网+教育”应用越来越广泛的后疫情阶段,克服上述弊端必须借助技术手段对在线学习的相关研究数据进行全面深度分析,明确对学生自主学习以及线上学习产生影响的关键因素,针对性地完善线上教育的教学活动设计以及教学内容,进一步提升在线学习在培养学生综合能力以及知识水平方面的针对性和有效性。由图5 可知,教育界已开始对“大规模开展在线学习”进行深入探索和深刻反思。
图5 高频关键词知识图谱
2.2.2 在线学习手段研究
本研究利用“大数据”“人工智能”和“自主学习”3 个关键词检索在线学习的学习方式和技术研究成果,旨在分析其优势及内在问题,探索解决路径。文献分析发现,相较于传统课堂教学,在线教学的数据收集、处理、信号传输能力更胜一筹。近年来,基于大数据的在线学习全周期行为资料的全面、实时、精准采集、分析、应用为在线教学改革提供了数据支撑、过程监控和效果反馈,并为教、学和管理决策的制定提供了实证依据,便于教学管理部门和教学执行者实施精准且个性化的干预指导[20]。此外,基于大数据的在线学习平台,根据不同学生的个性特征和知识结构基础,为其精准推送适宜、感兴趣的学习内容,有利于激发学生的学习动力,提高学生的自主学习效果。所以,对大数据的应用不但提高了高校管理效率,还降低了管理成本,有利于高校数字化治理和教育教学改革的长效、可持续发展[19]。“人工智能+教育”就是教育教学当中采取人工智能自适应系统,使教学效果以及信息化水平提高。而其中的个性化自适应学习系统主要是基于大数据的一种新型教育技术范式[21]。自主学习就是学生自主制订学习计划、明确学习方向、自我监控、选择学习方法以及对学习结果进行评价的一个过程。自主学习能力是制约在线学习效果的关键因素。相较于传统课堂教学,在线学习的学生更能发挥自主性,教学更具开放性,教学资源更具多样性。尽管大数据、云计算、人工智能、元宇宙等信息技术对推进在线学习高速发展、提高优质教学资源覆盖面、助力边远落后地区教学质量提升具有跨时代的意义,但在推广优秀在线教学模式、提高学生在线学习持久性和完成率、降低在线学习辍学率等方面仍面临重大困境。利用网络和实时通信技术开展在线教学模式、教学策略、教学工具培训,提高教师在线教学设计水平和教学质量,优化在线学习平台界面和功能,吸引、激励更多学生持续学习在线课程将是未来在线教育领域关注的重点工作。
2.2.3 在线学习模式与资源研究
应用“混合式教学”“翻转课堂”“MOOC”“高等教育”“开放教育资源”“在线学习”“在线教学”“网络课程”“学习者”等关键词查阅、汇总在线学习模式与资源的研究成果。在线学习模式包括基于在线教学工具的混合式教学、翻转课堂等。MOOC及其他网络课程则属于重要的在线教育资源。在线学习模式的构建与推广同在线学习资源的生成与完善互相促进、相辅相成,两者共同助力数字时代中国教育数字化转型及疫情防控常态化下各级各类学校“停课不停学”目标的实现。值得关注的是,虽然在线教育为学生提供了丰富的教学资源和便利的学习条件,但也容易使学生的学习陷于浅表性、选择迷失性等不利局面。如何科学、高效助力学生在海量繁杂的学习资源内精选出高质量、强适切性的在线课程和其他学习资料,为教育强国、人才强国建设提供技术支撑,亦是“互联网+”时代教育领域亟待解决的难题。
综合已有研究,可以将在线学习的主要影响因素分为四类:第一,个人因素,如目标与动机、在线学习技能、意志监控能力、自我效能感以及学习风格等;第二,环境因素,如人为干扰、设备条件、学习资源与平台、物理场所等;第三,教师因素,如教师的素养、教师的社会地位、授课语种、课程内容等;第四,课程因素,如课程类型、课程设计等。上述因素不仅影响学生学习质量与学习效果,同时影响学生知识建构水平和迁移能力的提升,以及创新意识和批判性思维的培养。应全面剖析不同因素对学生在线学习效果的作用机制。在微观层面,针对关键环节改进教学设计和教学策略,增强学生交互动机和交互质量感知,以实质性激励策略和高质量教学内容提升学生专注度;在宏观层面,加强信息化基础设施建设,完善政府引导、多方参与、共建共享的资源建设机制,以政策倾斜推进教育信息化均衡发展,多主体、多途径协同提升在线课程质量和学生在线学习成效。
本研究基于聚类分析了解在线学习研究在我国的主题结构。之后,通过Bicomb2.0 工具以及SPSS2.0 软件对高频关键词展开多维尺度分析,使不同主题及关键词的位置更为直观地呈现,以此对国内在线学习的发展趋势进行分析。通过研究能够得出高频关键词相似矩阵,见表1。
表1 高频关键词相似矩阵(节选)
表1 中的数字(即相似系数)代表关键词之间的相似性,通常介于0 和1 之间,其数值大小反映了高频关键词之间关系亲疏程度。越大的相似系数,代表变量具有越高的亲密度;相反,亲密度就会越低。当相似系数趋向于1 时,两个变量之间关系最为紧密。当相似系数趋向于0 时,两个变量之间关系最为疏远[22]。由表1 可以看出,关键词“MOOC”与“在线教学”的相关性最高,相关系数为0.144;关键词“自主学习”与“学习投入”的相关性最低,相关系数为0.000。将完成处理的相似矩阵在SPSS2.0软件当中导入,然后展开多维尺度分析,与聚类分析的结果相结合,完成知识图谱的绘制,如图5。
在知识图谱中,各个关键词相对均匀地分布于四个象限,体现出各关键词与“在线学习”这一主题词之间关系的紧密程度。由图5 可知,我国在线学习领域的研究内容和主题比较分散。在所绘制的知识图谱当中,坐标轴会将坐标图分割为四个象限,而横坐标在其中属于向心度(Centrality),代表的是不同主题的影响强度;其中的纵坐标是密度(Density),代表的是不同主题要素之间的联系紧密度[23]。通过分析图5 可以发现,近十年来,我国在线学习的四个研究主题在整个研究网络中处于不同象限,其发展阶段也各不相同。
在线学习当中的数据处理研究(主题一)分布在二、三象限当中,以第二象限为主,具有较低的向心度以及较高的密度,这代表当前在研究在线学习数据处理方面已经形成相对稳定和规模性的结构,但与在线学习资源以及模式的研究相比还有一定的薄弱性;位于第二象限的高频关键词主要有“数据挖掘”“社会网络分析”等,这些高频关键词之间联系密切,而且呈现稳定的研究结构,研究相对较成熟,但这也反映出其中的问题,即忽视该主题与其他研究主题的联系,在今后的研究中应扩大研究范围,开阔研究视野;位于第三象限的高频关键词主要有“学习投入”“学习分析”等,这些高频关键词之间联系较松散,没有形成稳定的研究结构,该主题和其他热点主题的联系也不紧密。
在线学习手段研究(主题二)分布在三、四象限,以第四象限为主,特征是高向心度,低密度,这代表研究结构上比较松散;位于第三象限的高频关键词主要是“大数据”,这一主题与其他高频关键词联系较松散,需增加对“大数据”的研究;位于第四象限的高频关键词主要有“自主学习”“人工智能”等,这些高频关键词关联度不高,说明该主题内部研究结构松散。
在线学习模式与资源研究(主题三)横跨四个象限,向心度较高,说明在线学习模式与资源研究位于整个研究网络的核心,是这些年来研究的主要主题;位于第一象限的高频关键词主要有“翻转课堂”“网络课程”“MOOC”“混合式教学”等,这些高频关键词不仅是整个研究网络的核心,而且它们之间的联系也较为密切,形成了稳定的研究结构和规模。这四个高频关键词的分布比较紧密,划分类团时聚集于“学习模式与资源”研究主题中,该主题也正是疫情时期在线学习的新视点和研究热点;位于第二象限的高频关键词主要是“学习者”,这一关键词与研究主题的内部联系紧密,形成了稳定的研究结构,但和其他研究主题的联系不紧密;位于第三象限的高频关键词主要是“在线学习”,此关键词是研究主题词,不再进行赘述;位于第四象限的高频关键词主要有“在线教学”“高等教育”“开放教育资源”等,这些高频关键词虽然和其他研究主题联系较为紧密,处于研究网络的核心,但在内部仍未形成成熟的研究结构,而且也没有稳定性,容易在其他主题当中变成子领域,所以后续还要对研究结构不断完善,以体现出特色。
在线学习效果以及影响因素研究(主题四)分布在第二象限,特征是低向心度、高密度,这代表在该象限当中的研究主题具有紧密的内部联系,而且研究结构稳定,但和其他主题之间没有形成紧密联系;高频关键词主要有“影响因素”“学习效果”“深度学习”等,这些高频关键词多为微观研究,与其他研究主题联系不密切。
为了搞清楚在线学习当前的研究热点和各主题之间存在的联系,进一步通过Ucinet 软件以及Bicomb2.0 书目共现分析系统来完成社会网络的绘制,具体如图6。
图6 高频关键词社会网络
由图6 可知,国内在线学习研究领域的主题分布是以“在线学习”“在线教学”“MOOC”为核心研究内容,周边环绕着“混合式教学”“学习分析”“深度学习”“自主学习”“学习者”等。“在线学习”“在线教学”“MOOC”位于社会网络的中心位置,是当前的研究热点。“混合式教学”“学习分析”“深度学习”“自主学习”“学习者”处于网络的中部位置,是连接核心主题与边缘主题的枢纽,侧面反映当前在线学习研究的落脚点。未来可从“学习者”出发,在“学习分析”和“深度学习”领域开展更全面、科学的研究项目,以期优化在线学习方式,提升学习效果。此外,“影响因素”“社会网络分析”“数据挖掘”“学习效果”“学习投入”等处于社会网络的最外围,属于在线学习体系中的边缘研究。随着大数据、云计算、多模态学习分析、神经网络分析理论与技术的成熟,当前的边缘研究有望成为新一代在线学习领域的研究热点。
对1 529 篇CSSCI 期刊论文的分析虽然不能完全反映整个在线教育的发展情况,但确实可以在一定程度上描绘和揭示当前国内在线学习的热点、特征和趋势,并为未来在线教育的研究提供方向。数据显示,国内在线学习研究主要围绕一条主线和四个热点领域进行:一条主线是在线学习的学习模式与资源研究;四个热点领域则是在线学习的数据处理、学习手段、学习模式与资源、影响因素与学习效果。
从时间的维度来看,我国关于在线学习研究的文献在2009 至2012 年几乎无人问津,从2013 年才开始出现较大增长的趋势,但整体数量仍比较低;但从2020 年开始,文献数量呈现明显“高增长”的态势,进入“高关注”阶段。
从高频关键词数量的维度来看,“在线教学”“MOOC”“学习分析”和“混合式教学”是在线学习领域里出现频率较高的词,说明这些研究领域有诸多交叉之处;其余的研究领域出现频次相差不大,可作为未来深入研究和探索的方向。
从研究主题的维度来看,关于在线学习的研究主要分为“数据处理”“学习手段”“学习模式与资源”“影响因素与学习效果”四个主题,其中“学习模式与资源”这一主题研究范围最广,包含了9个高频关键词,是在线学习研究网络的核心,相较于其余主题内部研究结构最稳定,与其他主题联系最紧密;其次是“数据处理”,该主题研究范围包含4 个高频关键词,已经形成一定的规模和稳定的研究结构,但与其他主题的联系较不紧密,研究尚不成熟;“学习手段”研究范围包含3 个高频关键词,该主题内部研究结构松散,研究尚不成熟,处于整个研究网络的边缘位置,有待加强系统性研究,进一步完善研究结构;“影响因素与学习效果”研究范围包含3 个高频关键词,该主题内部研究联系紧密,形成了稳定的研究结构,但和其他研究主题的联系不紧密,研究规模较小,处于研究的边缘。
从高频关键词分布情况的维度来看,于在线学习研究中心的关键词分别是“在线教学”“MOOC”“学习分析”“混合式教学”,是“在线学习”研究的热点领域;其次是“学习投入”“自主学习”“学习者”“影响因素”“深度学习”,未来可从这些领域着手,开展深度研究;其余关键词包括“翻转课堂”“大数据”“社会网络分析”“人工智能”“学习效果”“数据挖掘”“开放教育资源”“高等教育”“网络课程”,这些关键词还处于“在线学习”研究的边缘地带。
通过多维尺度分析结果呈现出的四个热点主题在整个研究网络中所处的位置,我们可以看出各主题间有较大差异。但必须注意,多维尺度分析结果也表现出定义不合理、聚类不完整以及无意义类团等问题[23],所以后续还需要对这些问题进行规避。
可以将我国未来在线学习的研究方向划分成以下几个方面。
在线学习的发展之所以非常迅猛,是因其存在很多优点,然而,我们也应该对其进行理性看待,了解在线学习存在的局限性,与传统教育的优势相结合,来予以解决。自新冠疫情暴发以来,我国在线教育迅猛发展的同时,亦暴露出一定的问题与不足。比如,大部分学校在线课程以面向本校学生为主,校际间课程学习的学分互认转化困难,在线课程的共享性不强[24]。为了解决在线教育现有问题,可以统筹完善学分互认机制,利用物联网、区块链等新兴技术实现学分认证与转化。此外,引导在线教育高质量发展,还可以通过制定在线教育评价标准来规范教育行为,并推动多利益相关者参与标准研制过程,充分发挥评价标准的改进功能,提升标准适用性[24]。教师是学生的辅助者、引导者,应该进一步提升在线教学的有效性。因此,探究智能时代师生协同应用现代信息技术提高教学资源可及性、使用率及应用效果具有重要意义。
目前,人工智能、大数据、数据挖掘、社会网络分析等技术仍处于在线学习体系研究的边缘地带,具有广泛的研究空间和价值。传统课堂与现代化的课堂相比,在满足学生的学习需求方面明显不足,新技术带给教育的影响非常显著。比如,若人工能智能识别、分析、构建不同在线学习者情绪和动机之间的隐藏模式,就有可能通过情绪来测算学习动机[25]。综合以上分析,在线学习一定要顺应时代发展,保证教育和新兴技术的融合发展,提供给学习者更加个性化、智能化以及便利化的环境。
现阶段,我国的在线学习研究体系大多在教学资源和模式中集中,而针对学习者自身投入、影响因素以及学习效率方面的研究内容很少。学习者的学习持续性以及学习动机与学习效率之间为正相关[26]。为此,研究者需要进一步关注在线学习的实证研究,探究不同影响因素对学习效果的作用机制。