国际教育文本挖掘研究热点与前沿透视

2021-07-20 01:24符雅茹牟智佳
开放学习研究 2021年3期
关键词:研究者协作文本

王 萌 符雅茹 牟智佳

(江南大学 人文学院,江苏 无锡 214122)

一、研究背景

近年来,随着教育大数据和人工智能技术的逐步发展,研究者对学习分析的关注和研究日益深入。在学习分析初期,基于学习行为类数据的研究较多,对其他类数据研究较少。在数字化学习过程中,不仅产生交互操作类的行为数据,还产生互动讨论类的文本数据,对文本的分析有助于发现学习者内在的心理特征信息。文本挖掘(Text Mining)是数据挖掘中的一个重要应用方向,它是从大量文本数据中抽取最终可用的信息和知识的过程。随着学习数据种类的多样化发展和文本挖掘的深入应用,基于学习文本类数据的分析得到研究者的广泛关注,并开展了大量的理论和实践探索,教育文本挖掘由此产生。教育文本挖掘是对教与学活动过程中所产生的各类互动、评价、反思类文本数据提取有效信息和知识的过程。

目前,随着自然语言处理相关研究的不断深入,为教育文本挖掘提供了新的技术支撑。理顺教育文本挖掘的研究脉络,摸清其未来研究取向,对于深化学习分析研究、优化文本分析技术具有重要的现实意义。本研究通过对近十年来文本挖掘类的文献进行内容分析,观测该领域的主要研究议题,为后续研究提供思路和借鉴。

二、数据选取与研究方法

(一)数据来源与清洗

以“educational text mining”“text analysis &online course”“text analysis & educational online discussion”“discourse analysis & online learning”“content analysis & distance education”为关键词,在Web of science核心数据库、Elsevier Science Direct数据库中进行检索,限定文献的发表时间为2010年至2019年。对检索结果进行人工筛查,剔除文本挖掘技术、工具和算法研究、文本挖掘在其他领域的应用等与教育无直接或间接关系的研究文献以及会议报告、新闻资讯等非研究性文献,最终得到111篇相关文献。

(二)研究方法

本研究采用共被引分析、共现分析、聚类分析、统计分析、时序图谱分析等研究方法,利用EndNote X9、CiteSpace 5.6、Bicomb 2.0、HistCite和SPSS 25.0等工具进行分析。其中,共被引分析旨在找出文献的相互引用关系,分析领域中的核心文献;作者合作关系分析用于了解领域内研究者之间的相互合作关系,分析找出当前合作群体分布;关键词共现分析用于探索核心关键词,作为梳理当前研究热点的基础;聚类分析法用于对关键词进行聚类,分析当前研究热点;统计分析用于整理当前常用的挖掘方法,分析方法的种类和变迁;知识图谱用于梳理教育文本挖掘的时间轴,以此来预测未来的研究趋势。

三、研究结果分析

(一)高被引文献分析

教育文本挖掘的文献量较多,时间跨度较大,理顺文献中的相互引证关系并找出关键文献,对于把握该方向的主要理论依据具有重要意义。此部分采用HistCite工具分析和绘制文献的引证关系,在参数设置上,选择显示节点为“GCS”(总被引量),显示数量选择为70,分析结果如图1所示。其中,纵向数字表示发表年份,每个圆圈(即节点)表示一篇文献,圆圈中的数字代表该篇文献在总分析文献中的序号,圆圈的大小代表其被引用次数的多少。

图1 高被引文献引证关系图谱

由分析结果可以看出,文献之间的引用关系链较少,这可能是因为当前教育文本挖掘涉及的领域较多,相互之间的联系不强。其中,被引次数较高的是第25篇,总被引量为127次,是Romero、López、Luna和Ventura(2013)撰写的“Predicting students’ final performance from participation in online discussion forums”一文,该文章展示了如何通过质心和类关联规则来获得更强大和可解释的模型集群,研究表明发送消息数量、评价文本字数、文本的平均评价值、文本中心性及其程度等是预测学生最终成绩的最重要属性,为后续研究提供了重要的预测参考指标。其次是第27篇,总被引量为113次,是Ortigosa、Martín、José和Carro(2014)撰写的“Sentiment analysis in Facebook and its application to e-learning”一文,研究者提出了一种在Facebook上进行情绪分析的新方法,开发了一个名为Sentbuk的程序,提取用户发布内容中蕴含的反映情绪极性(正面、中性或负面)的信息,以检测重大情绪变化。研究者指出,该方法可以应用于在线学习领域,利用学习者情绪信息通过适应性在线学习系统来支持个性化学习,基于用户情绪状态推荐学习内容。 除这两篇文献外,排名前十的其他高被引文献见表1。

表1 高被引文献统计信息

续表1

(二)作者合作关系分析

通过对作者合作关系的分析,可以明晰教育文本挖掘领域的主要研究者及其相互合作关系,把握不同作者的贡献度。将清洗完成后的数据导入到CiteSpace5.6中,选择时间范围为“2010~2019”,时间切片设置为一年,在“Note Types”中选择节点类型为“Author”,在“Selection Criteria”下的“Threshold”设置中,将前、中、后三个时间分区的阈值分别设定为(1,1,20)、(1,1,20)、(1,1,20),最终得到包含281个节点、409条连线的作者合作关系图谱,如下页图2所示。可以看出,Huei-tse Hou的出现频次最高,为3次,但其周围的连线较少,表明其与其他研究者的合作关系较少。其次是Cristóbal Romero、Wu He、Jui-long Huang、Kui Xie、Maija Aksela、Ming Ming Chiu等人,出现频次都为2次,除Crisóobal Romero与其他研究者的关系较为密切外,其余出现频次较高的研究者的合作关系均较少。这与当前教育文本挖掘的研究现状较为契合,研究者使用自然语言处理、话语分析、内容分析等不同方法分析不同学科、平台的文本,教育文本挖掘的应用呈现广泛化、多元化的特征,不同研究者之间的合作较为松散。已存在的成熟合作关系中,研究者的研究方向也大有不同,如以Huei-tse Hou为首的研究团体聚焦于在线论坛中学生的行为模式和局限性;以Crisóobal Romero为首的研究团体主要侧重于预测学生在在线学习中的表现,以Wu He为首的研究团体关注在线学习过程中学生的交流与交互质量。

图2 作者合作关系图谱

(三)基于关键词聚类的研究热点分析

1. 关键词共现分析

分析关键词可以快速掌握领域内的核心研究热点及其研究特性。通过分析得到包含314个节点、759条连线的关键词共现图谱,删除“text mining”“educational text mining”“content analysis”等检索关键词,并将阈值设置为2,最终得到关键词共现图谱如图3所示。其中,字体的大小表明关键词出现频次的高低,字体越大,表明关键词出现的频次越高;节点之间的连线表明关键词的中心性大小,连线越多,表明关键词的中心性越高。

图3 关键词共现图谱分析

可以看出,共现频次最高的关键词是“sentiment analysis”,频次为10次;其次是“e-learning”,频次为9次;“learning analysis”“online learning”“machine learning”“online discussion”“natural language processing”等频次均高于6次;“cooperative learning” “classification”“research method” “coi”“computer-supported collaborative learning”“writing”等频次均超过3次。在关键词连接上,“e-learning”“machine learning”与“sentiment analysis”联系最紧密,这反映出文本挖掘主要是在数字化学习环境下,利用机器学习算法进行情绪分析。其次,“Online discussion”和“computer-supported collaborative learning”联系较为紧密,表明计算机支持的协作学习及其生成文本是主要研究对象。此外“qualitative research”“research method”等词反映出教育文本挖掘也常用在梳理某研究领域的研究热点和研究脉络中。

2. 基于关键词聚类的研究热点分析

审计风险属于审计成果与现实财务之中的差距,在审计经过当中,注册会计对于所有会计部分与会计经过都具有一定的可能性出现错误的评判,所有的审计部分都很有可能出现审计风险,会计师事务所出现审计风险都是很普遍的。

将关键词生成共现矩阵,导入到SPSS25.0中,对数据进行聚类分析,选择“分类”下的系统聚类方法,设置聚类方法为组间聚类,测量区间为欧式距离,生成教育文本挖掘的关键词聚类图谱,如下页图4所示。

图4左侧代表变量名,纵轴数据代表该变量在总变量集中的序号,横轴表示变量之间的距离。可以看出,关键词主要分为五类(聚类一至聚类五),第一类是教育文本挖掘的文献来源和分析方法,主要依托在线学习和在线讨论中的数据,特别是MOOCs环境下的文本数据;在方法上主要采用机器学习、自然语言处理、信息检索等方式对文本进行分析;第二类是学生行为分析,包括学生在在线学习中的行为模式和在线讨论中的交互等;第三类是学生的认知分析和情感分析,如学生的知识建构过程和情绪情感变化;第四类是教育文本挖掘的呈现方式和方法,当前已有的呈现方式包括学习者的用户画像和模型、概念地图等(Ferreira-Mello, André,Pinheiro, Costa, & Romero, 2019);第五类是学习结果的分析和评价,如根据学生的讨论文本预测学生在线学习的辍学率、利用自然语言处理技术评价学生的写作水平等。

(四)基于时序图谱的演进趋势分析

在CiteSpace5.6工作界面上,将“Note Types”的节点类型设置为“Keyword”,其余设置保持不变,运行后生成包含314个节点、754条连线的图谱。选择可视化视图类型为“Timezone View”,为了便于清晰呈现关键词演进趋势,仅显示出现频次大于2的关键词,最终生成下页图5呈现了研究演进趋势图谱。

图5 研究热点的时序图谱分析图

可以看出,教育文本挖掘研究早期关注协作学习与在线讨论,随着教育研究和文本挖掘技术的不断发展,情感分析和课程教学问题成为中期研究主流,到如今聚焦于知识建构和认知水平。在早期阶段,研究者围绕协作学习与互动讨论进行探索,如Bower和Hedberg(2010)提出一种定量的多模态语篇分析方法来分析学生的在线协作学习,从而分析网络会议环境中任务主题、活动设计和界面选择对学生交互和协作的影响;Liaw和Bunn-Le Maste(2010)以中国台湾和美国职前师范教育学生作为对比分析对象,研究两地学习者在论坛互动中的话语特征以及跨文化对话者之间的互动模式和类型,来探索在远程协作过程中如何进行协作和跨文化学习;Hou(2011)选取了23名大学生样本,分析其在教师给定的案例情景和问题解决的任务下如何开展讨论活动,以此来检验高等教育课程中基于案例的在线协作讨论的成效。

在中期阶段,研究热点主要集中在学习情感分析与课程教学设计层面,如Esparza、Díaz、Canul-Reich、De-Luna和Ponce(2016)通过分析一个试点小组大学生撰写的评价,建立了一个情感分析模型,来评估教师在课堂上的表现;Rajput、Haider和Ghani(2016)提出了一个基于情感分析的度量指标,通过应用多种文本分析方法来解决学生的反馈问题,并借助标签云、情感评分和其他基于频率的滤波器,为教师表现提供了新的见解;Guitart、Conesa、Baneres、Moré、Duran和Gañan(2016)提出了一种利用自然语言处理技术来分析课程材料,以从课程不同方面收集信息的新方法,并且分析了概念在课程中的相关性以及概念与课程学习结果的一致性。

后期阶段主要集中在学习认知层面,如Davis和Lester(2016)要求研究生阅读与研究范式相关的文献,并在阅读后撰写讨论。通过分析这些研究生撰写的93个讨论帖子,来探究学生如何使用特定的话语资源构建在线讨论中的研究身份;Rahimi、Litman、Correnti、Wang和Matsumura(2017)利用自然语言处理的方法,设计了一个与任务相关的模型,对学生写作中的两个目标结构的分数进行预测:一是学生能否有效地使用论据,二是学生如何组织想法和论据来支撑他们的观点; Xie、Di Tosto、Lu和Cho(2018)通过文本挖掘和社会网络分析,系统地分析了美国东南部一所大学57名学生在线讨论中的讨论帖子,量化每个人的贡献,并以领导指数的形式总结学生的参与,分析群体结构以探究学生的身份认同。

通过上述分析可知,教育文本挖掘表现出三个方面的取向:①从关注学习过程中某一部分的文本分析,到关注学习活动中的整体文本分析,更加注重数据的完整性;②从基于文本的知识内容分析,到基于文本的学习心理和思维特征分析,更加注重分析的高阶性;③从简单的文本词频统计分析,到基于机器学习的自然语言处理技术,更加注重算法的智能性。此外,在分析情境上,教育文本挖掘将会从当前的单通道语篇分析走向多通道语境分析,利用系统功能语言学来解构文本互动情境中所产生的意义类型。

四、教育文本挖掘的研究热点分析

依据上述对研究热点的初步归类,结合教育文本分析与挖掘的不同应用场景和对研究议题的质性分析,我们认为,当前研究热点主要集中在以下五个方面。

(一)基于课程文本的学习行为和认知分析

课程文本包括学生在在线学习中所产生的论坛文本(讨论文本)、评论文本、对话文本、作业文本等。课程文本作为学生在学习过程中生成的学习制品,反映了学生的学习和思考过程,帮助教师了解和掌握学生对信息处理的方式和过程,以便更好地开展学习。学习行为分析一直是教育文本挖掘领域研究的重点,对其进行全面理解和准确表征是有效地进行网络学习者分析、在线课程设计、知识服务供给、学习诊断与评价的基础(张昕禹,梁越,高茜,2019)。通过挖掘学生的在线课程文本,可以清晰地了解学生的学习行为和认知过程。基于文本的行为分析逐渐成为研究者预测学生在线学习表现的重要手段,结合课程文本、活动文本、评价文本以及学生在在线学习中的点击数据、浏览数据等,能精确分析学生的表现,并据此对学生学习的行为进行评价和预测。例如:Conijn、Van den Beemt和Cuijpers(2018)以基于MOOC的混合式课程为研究对象,以学生的活动文本、活动频率、活动顺序等为分析数据,通过相关性、多重回归和过程挖掘来预测学生的行为表现,并指出线上活动可作为评价学生混合课程表现的重要指标。

在认知分析方面,研究者倾向于基于已有研究理论和学生文本,分析学生的认知能力和认知建构过程。例如:Liu和Yang(2014)基于布鲁姆教学目标分类学和Len Bird提出的3C模型,设计了一门《信息伦理》在线课程,通过分析参与者的留言帖子、对话质量、小组领导者和教师使用的辅导脚手架策略,来验证在异步的、基于文本的会议中参与者如何展现他们的认知话语,结果表明学生的认知话语受讨论问题的类型和脚手架的干预程度的影响。此外,学生的课程文本也反映出其认知的诸多维度,如Molenaar和Chiu(2014)通过分析认知、元认知和关系活动间的关系,即元认知计划组织认知活动并促进知识获取和意义生成之间的过渡,而关系活动则有助于实施这种过渡;Lin、Hou、Wang和Chang(2013)的研究表明学生在在线讨论中最突出的知识维度是元认知知识,而认知过程则主要集中在理解上。

(二)基于课堂互动文本的情感分析

学习者在学习某门课程时所流露出的情感变化,直接影响到其对课程的学习态度和最终的学习结果。基于课堂互动文本的情感分析主要采用分类、聚类、神经网络等数据挖掘方法,对文本中的情感关键词进行提取和分析。情感分析结果可作为评价学生学习过程的重要指标和改善教学的重要依据。当前,情感分析研究主要集中在两个方面,一方面研究者通过捕捉学习者在在线学习中形成的反思文本或在线讨论文本,结合特定的情感分析方法,对学习者进行情感评价并进行有针对性的干预。例如:Ozturk、Cicek和Ergul 对学生产生的交互文本进行情感分析,收集了学生在参与课程时发布的Twitter文本,用朴素贝叶斯分类算法训练数据,将文本情感分成了积极、消极和中立三类 ,以检验远程教育的接受程度。Wang、Hu和Zhou(2018)提出了一种语义分析模型,从作业、评论等实时更新的数据中跟踪MOOC学习者的情感倾向,以分析学生对课程的接受情况,通过情感量化和机器学习计算,实时预测不同学习阶段的课程完成率,为MOOC的个性化教学提供解决。另一方面,研究者倾向于利用机器学习和文本挖掘技术开发情感分析工具,以用于学生的学习情绪评价,例如:Cunningham-Nelson、Baktashmotlagh和Boles(2019)使用LDA模型探索学生在课程中各个方面的意见并将结果可视化后反馈给教师。Tian等(2014)提出了一个基于文本交互的情感识别框架,并设计了情绪类别检测方法,利用随机森林算法对学习者情绪进行分类。

(三)基于协作文本的知识建构分析

在线协作知识建构是网络学习社会化的重要产物,但当前协作知识建构中存在着“活动无协作、协作无建构或建构低水平”的状况,因此如何分析学生的知识建构过程,评价学生的知识建构水平是网络学习研究的重要议题。基于已有的知识建构框架或评价标准,结合文本挖掘技术和内容分析、数据分析等方法,对学生在协作学习中提交的文本内容、帖子数量、讨论时长等数据进行分析,以评价学生的知识建构水平,是当前对在线协作知识建构研究的主要形式。如Liu和Yang(2014)基于Garrison提出的“探究性学习社区”模型,考察了学生在线课程异步讨论中的知识建构水平,分析了学生对网络话语的态度和感知。Nami、Marandi和Sotoudehnama(2018)探索了教师在异步交流讨论中的知识建构过程,根据已有数据将教师的异步交流具体区分为不同类别,借助已有分类框架和分析方法,识别教师在认知存在、社会存在和教学存在三个方面的认知变化。

(四)基于写作文本的自动化写作评价

写作评价在教育教学中至关重要,教育研究者也曾开展了诸多的研究,但对写作的评估一直存在着费时费力且可靠性低的现实困境(Landauer,2003)。随着自然语言处理和文本挖掘技术的发展,写作评价也迎来了新的转机。词频统计、词汇多样性分析、句法相似性分析、句法复杂性分析、潜在语义分析、语义连贯性分析等算法和分析方法,能实现对学生写作文本的自动评价并检测学生是否存在剽窃行为。因此当前研究者致力于开发或利用已有评价平台,分析并评价学生的写作文本,给予学生及时恰当的反馈,以提高学生在写作中生成知识的能力。例如:McNamara、Crossley和Roscoe(2013)在已有写作评价模型的基础上进一步扩展,提出一个评价写作能力的五维框架,即词汇、句法、衔接、修辞和易读指数。研究者基于已有的智能导师系统“The Writing Pal”和评价框架分析学生的写作文本,并提供了在写作辅导系统中提供有意义反馈的手段。Akcapinar(2015)通过提供基于文本挖掘分析的自动反馈来减少学习者在线作业中的剽窃行为。Yim和Warschauer(2017)综合了已有的协作学习研究方法,分析了第二语言环境中学生的写作文本,以验证学生的协作过程。除利用已有的导师系统和平台外,研究者也致力于开发适用于自身研究的新系统或修改已有的评价系统。如Zupanc和Bosnic(2017)扩展了现有的自动论文评估系统,纳入额外的文本一致性属性作为新的衡量指标,该系统可以提高评分精度并为作者提供语义反馈。

(五)基于文本挖掘技术的评价工具和平台的开发

评价是教学的重要环节,也是教育科学研究的重要议题,学习评价是影响学生学习质量的重要因素之一(徐亚倩,赵宏,2019)。通过评价学生文本可以掌握学生的学习态度、情绪状态、理解程度和学习效果等诸多方面,帮助教师及时调整和改善教学。通过数据分析发现,文本挖掘技术也常用于开发评价工具或平台以支持教学中学生学习成果和教学效果的评价。例如:Ramachandran、Gehringer和Yadav(2017)开发了一个自动化元评论软件来审查学生在在线交流中发表的评论。该软件使用自然语言处理和机器学习技术来设置度量标准,如评论内容类型、相关性、覆盖范围、语气、数量和是否剽窃等,以便为审查者提供快速反馈,帮助其快速审查学生提交的评论内容。Hsu、Chou和Chang(2011) 研究开发出一套自动化形成性评价的算法程序EduMiner,通过一系列文本挖掘技术来减轻教学评价负担。Poce、Corcione和Iovine(2012)开发了一个“批判性思维技能和经典阅读”的平台,在已有批判性思维技能评价模型的基础上进行改编,确定了反映学生批判性思维能力的11个维度,并对学生提交的作品进行词汇量分析和内容分析,以评价学生的批判性思维水平。

五、教育文本挖掘的研究趋势述评

文本是人类语言中的重要组成部分,也是教与学思想内容的主要呈现方式,对于文本的挖掘分析不仅可以了解学习行为特征,也可以把握学习心理特征。人工智能技术、网络直播、移动学习等新兴环境和技术的广泛应用,使得文本的应用场景、识别方式、传播媒介、分析手段等都发生了较大变化。基于前述对文本挖掘演进趋势的分析,结合文本的生成情境、分析内容、处理方式对教育文本挖掘走向作一探讨。

(一)基于网络直播交流的互动模式分析

自2016年以来,网络直播以实时、双向的独特传播方式,成为继微信、微博等新媒体后的又一火爆行业。网络直播的“异军突起”,也吸引了大量教育工作者的关注,网络直播学习逐渐成为网络直播的主要内容之一。网络直播学习为学生营造了一种新颖的学习模式,学生可以在直播平台中与教师和其他学生实时开展互动,及时提问并能得到及时反馈。已有研究表明,学生在网络直播学习平台中的师生互动和同伴互动在参与模式和讨论主题上既有相似之处也有显著差异(He, 2013)。网络直播学习环境中,主要存在学生与教师之间的提问与解答、学生与学生之间的聊天讨论这两种主要的沟通交流方式,通过文本挖掘和数据分析的方式,可以直观了解学生在不同角色中的不同互动方式,从而根据学生的互动偏好和习惯,提供更为个性化的学习指导。在未来的研究中,研究者还可以分析学生在不同学科中的互动以及同一门学科不同学习背景的学生互动模式之间的异同。

(二)基于笔记文本的学习习惯分析

当前,对学习笔记的研究在医学教育领域被广泛使用,研究者利用医学生的临床笔记分析学生的医学能力,并为笔记中的不足提供补充材料(Denny et al., 2015)。学习笔记不仅能反映出学生学习成果,也能很好地反映出学生在学习过程中的耐心、细心程度以及解决问题的能力,是衡量学生学习能力的重要指标。学生在参与活动过程中的笔记和活动后的反思文本,或是学习日志、博客等,都能很好地反映出学生的学习习惯,如学生如何把握学习全过程、如何开展自主学习、是否独立钻研和思考、是否善于记录和反思、倾向于何种学习方式、倾向于何种表达方法等。通过对学生笔记的分析,可以了解学生的学习习惯、学习偏好和思维过程,结合用户画像技术可以为学生进行全面、细致地可视化画像分析,可为学生提供个性化的学习指导,也可作为教师改进教学的重要参考指标。

(三)结合线上和线下文本的元认知特征分析

元认知是认知的认知,它包括两个主要的功能:意识性及调控性,即对认知的认知和对认知的控制。对元认知的分析可以帮助学生体验学习情景、自主选择合适的学习方法以及客观评价自己的学习活动。而教育背景中的论证很大程度上依赖于学生的元认知技能发展(Martínez & Valdivia,2016)。在协作学习环境中论证被认为是促进学习者自身思维过程相互调节的工具,因此通过分析学生的论证可以明确了解学生的元认知技能。在网络学习环境中,学生经常被要求针对某一学习内容或他人的评论发表意见,以展示自己的观点和看法,但学生却少有被要求对自己的观点发表看法,评论自己的评论。通过分析学生对讨论文本的再评价,能够得出学生思维的变化以及其元认知能力的发展历程,有利于教师对学生进行过程性评价,及时掌握学生学习情况。

(四)基于讨论文本的协作学习模式研究

当前关于协作学习的研究众多,但研究者的关注点主要集中在协作学习的质量(Schalk, Marcelo,2010)、协作学习讨论内容(He, 2013) 、协作学习能力的提高(Hou, 2011)等方面,对协作学习中学习者的行为和模式等尚未形成广泛关注。学生协作对课程的完成情况起到了决定性作用,尤其是在远程教育方面(Brinton, Chiang, Jain, Lam, Liu, &Wong, 2014)。因此,有必要基于自然语言处理、潜在语义分析模型、监督学习方法等文本挖掘和分析技术来分析学生在基于讨论的协作学习中产生的文本,明晰学生的协作学习模式,为学生提供差异化反馈的同时,改进教学模式和教学方法,提高学生协作学习的效果。

(五)教育文本的语义理解和语义计算

文本挖掘和文本分析技术日臻成熟,研究者可以快速从文本中获取信息,如何将简单易懂的自然语言转换为较强专业性的数据概念、如何将相关联语义进行整合分析是文本挖掘过程中的重要环节,也是文本分析的基础和前提,但当前的研究中却较少提及。语义计算方式应当包括语义权重、分析算法、异构数据的处理等。在语义理解方面,应当建立相关模型和框架,将文本解析为结构化的、机器可读的意图与词槽信息。因此,语义理解和语义计算应是未来教育文本挖掘领域的重要研究内容之一,需要建立被广泛接受的概念和框架,为后续研究提供参考。

六、结语

教育文本挖掘是学习分析方向下的一个重要研究领域,对学习文本的分析可以为整个学习过程数据分析提供较好的证据支撑。本研究采用共现分析、聚类分析等方法对教育文本挖掘的相关文献进行了定量分析,从引征关系、合作关系、时序关系等方面进行了质性探讨,试图厘清该研究领域的热点内容与脉络。可以看出,已有研究主要聚焦于文本分析和平台开发两个方面,致力于探究在线课程中学生的行为、认知、情感、能力等方面。在数据源上需要进一步结合其他学习行为数据进行综合分析,在分析方法上依托自然语言处理和深度学习技术进行语义计算和理解,分析对象包括学习文本、师生互动文本、教学文本等。通过海量文本数据的自动化处理,提升文字处理效率和文本挖掘深度,降低人工成本,深入理解文字背后的含义,为学习设计和教学提供有力支持。

猜你喜欢
研究者协作文本
文本联读学概括 细致观察促写作
鲁渝扶贫协作进行曲
扶贫协作中的山东力量
初中群文阅读的文本选择及组织
作为“文本链”的元电影
监督桥 沟通桥 协作桥
用水痘病毒开发新型HIV疫苗
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
协作