王翠,史红梅,李志
(山东农业工程学院,山东 济南 250100)
学情分析指对学习者学习相关的特征进行分析,包括学习习惯、学习效果、学习方法和学习兴趣等。通过学情分析可以深入了解学生的整体情况和个体差异,量化教学评估效果,从而更好地改进教学内容和教学方法,提升教学质量。国内,赵振旗[1]较早提出了应加强对学生学情的研究工作,当前也有大量学者对学情分析展开研究工作,田春[2]等分析了学情分析的现状和对策;周建强[3]等探讨了学情分析在基础教育阶段的理论与实践;邵朝友[4]等以课例研究为载体进行了学情分析的研究等。国外也非常重视学情分析的研究,学情分析与知识国际会议(International Learning Conference on Learining Analytics and Knowledge,LAK)每年举行一届,促进了学情分析的发展和学者之间的交流;来自美国、加拿大、澳大利亚、英国、比利时等国家的相关学者成立了学情分析研究学会(Society for Learning Analytics Research,SoLAR)来加强学情分析的研究。
“弹幕”评论(Time-sync comments)是一种比较流行的视频评论形式。最早出现在日本弹幕视频分享网站Niconico。一般来说,视频的评论信息通常处在网页播放器下方,评论的时间往往不会对应到视频的某一帧上,导致话题实时性不强,而弹幕会记录用户在视频某一帧上发布的见解,且在视频上方飘过,观看视频的其他用户会看到某一时刻所有人发送的弹幕,因此,给观众提供一种在线互动的体验,在国内的各大视频网站得到了广泛应用。
线上课程因其不受时间和空间的限制,可以随时随地进行学习,具有天然的优势。近年来,各大高校已有一定数量的课程尝试采用线上教学的方式,尤其是近三年来,大、中、小学生“停课不停学”,通过线上完成课程的学习。进行如此大规模的线上教学活动前所未有,对于学生和教师来说是一种新的尝试,同时,也给教学督导和教学评估工作带来了巨大的挑战。学生的学习效果如何,课堂气氛是否活跃,这些原本通过随堂听课才能获得的指标数据,随着线上教学的开展,则需要更多的教学数据来支撑和佐证。
随着教育大数据和教育云计算的发展,学情分析成为了教育信息化和教学实施深度融合的领域。未来的教育将由“用经验说话”转换为“用数据说话,用数据决策,用数据管理,用数据创新”。在众多线上教育数据中,通过学习时间、学习次数、考试成绩、日常练习等数据可以从宏观上对学生进行学情分析,而如果想要进一步进行细粒度分析,了解具体到某个时间点、某个知识点,学生的理解掌握情况以及学习状态,从上述数据中无法得到确切的信息。大学生作为线上课程的主要受众,其更容易接收新生事物,且对于新兴设备和技术的使用能力较强,很容易适应“弹幕”这一新的互动评论形式。“弹幕”评论以其易操作、实时交互性强和匿名性等特点,更有利于学生敞开心扉,积极参与并发表真实的想法,受到广大在校大学生的青睐。学生在学习过程中发送的“弹幕”评论,能实时反映学生在学习过程中的真实情况,利用文本挖掘技术对其进行分析可以帮助我们在微观上、细粒度层面更加全面地了解学生对学习内容的掌握情况,是传统的学情分析的有效补充。
目前大部分的线上教学采用的方式主要包括:直接使用知名教学平台的优质课程资源、教师提前自己录制课程和教师进行课程直播等,教师与学生之间被互联网隔开,虽然进行课程直播的教师跟学生有一定的互动,但大部分学生的反应比较被动且效果不佳,使得教师无法对学生采取有针对性的教学活动,影响教学质量的提升。
学生的学习能力和学习习惯千差万别,线上教学的方式无法充分和彻底地掌握学生的个性化学习需求,而线上课程往往时间、内容、形式固定,统一按照教师提供的学习方式开展教学,与学生的个性化学习需求存在矛盾,可能造成部分学生的不适应,从而导致厌学等学习危机的产生,影响教学效果。
教学的过程不仅是知识传授的过程,也是学生和教师思想碰撞的过程,线上教学使得这种碰撞大打折扣,在线上教学中,教师往往自问自答,无法及时地获知学生的想法,在教学过程中往往有一种无力感和失落感,与此同时,学生有疑问也不能及时得到教师的解答,在学习过程中感觉乏味无助,影响学习的积极性。
目前的教育大数据挖掘多注重宏观的分析,如:通过对学生的学习时间、学习次数、平时作业情况、考试成绩等数据进行挖掘分析,得到学生学习状态、学习能力、学习态度等方面的总体学习情况分析,具体到某门课程、某个知识点的掌握程度,以及教师的授课方式和技巧对学生学习效果的影响等方面,传统的大数据挖掘就显得鞭长莫及。
收集线上学习学生的“弹幕”文本及相关数据,建立基于“弹幕”评论的线上教育实时监测数据库,利用数据挖掘的方法分析学习数据与最终学习效果的隐含关系,找到影响学生学习效果的主要因素,分析学生的学习效果、学习习惯、学习兴趣、对教师的授课方式和授课技巧的敏感度、对课程重点难点内容的掌握程度等相关情况,并进行可视化展示,在细节上对线上教育大数据分析进行有利的补充;提供课程情况分析和教师特点分析的功能,以帮助学生更好地了解自己、了解课程、了解教师,为选择课程提供一定的参考,同时也为学校的线上教学督导工作提供一定的参考。具体研究思路如图1 所示。
图1 高校线上课程细粒度学情分析的研究思路
主要包括以下三个方面的工作:
(1)建立数据库
数据是进行数据挖掘的基础,因此数据的收集和整合十分重要。本研究中,收集数据的类型主要有数值型数据和文本型数据两种,数据的类别初步选定四类:基本信息数据、学习成绩数据、“弹幕”文本、学习过程数据。这些数据要经过数据清洗、噪声去除、冗余信息去除、数据整合等步骤,最终形成线上教育实时监测数据库。
(2)建立学情分析微观模型。
将数据库中经过清洗的“弹幕”数据进行分词、去除停用词等预处理操作,通过词频统计与TextRank 算法相结合进行“弹幕”文本的关键字抽取,通过聚类分析构建文本主题模型;对与主题模型关联的文本进行情感语义分析,获取学生对各个主体的情感极性,分析其与学习成绩之间的关联关系,结合学生的学习过程和学习成绩数据,分析学生在学习过程中的学习兴趣、学习效果、对教师的授课方式和授课技巧的敏感度、对课程重点难点内容的掌握程度等相关情况。
(3)开发线上教学学情分析可视化展示原型系统。
通过实际的可视化展示,验证课题的研究成果,该系统可以读取数据库中的数据,并用可视化图表、词云图等方式展示学情分析模型的分析结果,对学生的学习情况进行画像,同时对课程和教师的特点进行简单分析。
对于视频的选取遵循视频热度高、弹幕数量多且互动性强的原则,最终选取浙江大学翁恺老师的《C 语言程序设计》下的弹幕与视频数据。该系列视频共有132 个分集,前128 个分集属于对C 语言程序设计的系统教学,后24 个分集则介绍了ACLLib 制作图形的实战案例。本研究使用全132 个分集,共采集得到158.6 万条弹幕作为实验数据集。获取其弹幕文本内容、发送时间、弹幕出现时间等信息存入csv 文件中。部分数据结果如表1 所示。
表1 获取的弹幕信息内容(部分)
以视频集中的第一个视频为例,首先取出弹幕内容共计1576 条数据,使用jieba 库对弹幕文本内容进行分词。停用词是人工输入的非自动生成的语气词等无意义的词汇,如语气助词,副词,连接词。通过处理停用词,去除除汉字外的所有符号,对文本进行重新整理并进行分词处理,以获取高频词汇,生成词云图如图2 所示。
图2 弹幕内容词云图
数据集构建完成后,首先使用Snownlp 这个库对弹幕做情感分析。用模型对每条弹幕进行训练,并对这条弹幕所代表的情感进行打分。分数越高就越积极,分数越低越消极。Snownlp 在新闻评论,舆情分析,电商评论等场景用的最多、最广。打分完成后,从结果中随机抽取十个样本,看一看情感分值,来粗略观察弹幕的整体情感倾向,如图3 所示。可以看出,有5 条弹幕情感得分为0.6 以上,有1 条弹幕得分为0.4 以下,最低得分只有0.117184。表明弹幕的情感倾向比较积极,但并不能代表整体状况。还需要进一步的研究和探索。
图3 随机抽取10 个样本的情感得分
接下来把1576 条弹幕信息的情感评分用seaborn 可视化图库展示,得到相关的分布密度概率图,如图4 所示,来分析整体的情感倾向,可以从这张概率分布密度图中看到:绝大部分数据集中在0.4~1.0 这个区间附近,密度最高点出现在0.5。将积极的分类阈值值设置为0.85,只有分值大于0.85 的将被分为积极弹幕,而情感分值低于0.5 的将会判断为消极。实验结果表明,积极评论的数量只有243 条,消极评论的数量达到了690条,约占全部评论数量(1576 条)的43.8%。由此可见,这份弹幕数据里绝大部分的情感倾向都不是很积极。结合视频的内容是对C 语言的概述,收看的用户大部分为初学者或者因为成绩不理想重新学习的同学,对他们来说,C 语言这门课程是有一定的难度的,所发的弹幕大部分消极内容是反映这门课程的难度,大部分积极的内容是对老师授课方法和授课内容的肯定。所以,弹幕信息的情感倾向与视频内容是基本相符合的。
图4 视频弹幕整体情感倾向
主题发现(topic discovery)又被称为主题识别,指利用一系列语义理解方法,从复杂的大规模信息源中抽取关键词或术语,并在此基础上加以聚类,从而发现文献主题的技术方法,旨在使用户以快速有效的方式发现信息中的主题[5]。
主题模型是以非监督学习的方式使用算法来对语料库进行聚类以生成潜在主题的统计模型。隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),是常见的主题模型之一[6],是采用三层变参数层次的贝叶斯概率模型[7],包括词语、主题和文档3 个层次。该方法可以将语料库中每篇文档的主题以概率分布的形式呈现,能够有效地聚合文本的主题特征,并且对文本长度没有严格的限制,常用于文本聚类、文本特征降维、文本主题识别研究。因为LDA 主题模型减少大批量文献分类过程的主观偏见,使研究人员能够发现潜在主题,而不是将预先建立的分类强加于数据,从而改进了学者们在文本数据中思考和解释主题的方式[8]。
下面我们使用基于TF-IDF 的语料来进行主题建模,我们指定了7 个主题,在这里我们使用的是基于并发的多核LDA 模型(LdaMulticore),得到的LDA 主题可视化效果如图5 所示,图中圆圈的大小代表主题出现的频率,主题圆圈距离的远近表明了它们之间的相似程度,此外,重叠的圆圈并不表示主题中的实际重叠,而是由n 维空间中主题在2 维空间中的投影产生的。
图5 LDA 主题可视化效果
LDA 主题关键词如图6 所示。通过结果我们可以看到各个主题的编号以及各个主题中词出现的概率。这里我们只能知道主题编号,通过提取高频词,人为判定它的主题内容。由实验结果可以看出:主题0 主要代表了大一新生这一群体的弹幕内容;主题1 主要涉及课程相关内容;主题2 主要涉及学习过程中的相关问题;主题3 反映了大家的学习状态;主题4 则更多的表明了大家的学校和专业;主题5 涉及到教学内容方面的知识。
图6 核LDA 主题关键词
根据功能需求,高校线上课程细粒度学情分析系统架构共分为5 个层次,如图7 所示。
图7 学情分析系统总体框架
(1)数据采集层。该层主要收集“弹幕”内容数据和“弹幕”相关外围数据(包括:“弹幕”的内容、“弹幕”的频率、出现的时间、“弹幕”出现时视频的内容等),同时也要收集学生的学习相关数据(包括学习时间、学习次数、考试成绩、平时作业成绩等)。由于目前没有公开的教育大数据实验数据库,这些数据的来源主要是本校线上课程的数据。
(2)数据预处理层。收集的数据中通常存在数据不完整、噪声多等问题,尤其是“弹幕”数据会掺杂大量与课程关联不大的冗余信息,需要进行数据的清洗和预处理。
(3)数据挖掘层。本层通过数据挖掘、文本挖掘和自然语言处理技术,对上一层的数据进行深度挖掘,找出规律和影响学生学习效果的相关因素。本层主要用到关联分析、文本聚类分析、情感语义分析、文本主题抽取等技术。
(4)学情分析层。本层在上一层数据挖掘的基础上,对学生的学习情况进行细粒度的学情分析,主要包括:具体课程的学习效果、学习习惯、学习兴趣、对教师的授课方式和授课技巧的敏感度、对课程重点难点内容的掌握程度等。
(5)可视化展示层。本层为学生提供学情分析的可视化展示,可以提供学情分析展示,同时也提供课程情况分析和教师特点分析,以帮助学生更好地了解自己、了解课程、了解教师,为选择课程进行学习提供一定的参考,同时也为学校的线上教学督导工作提供一定的参考。
针对目前的高校线上教育及教育大数据挖掘存在的问题以及当代大学生的特点,利用文本挖掘和自然语言处理技术对高校线上教育学生进行学情分析研究,通过采集学生在学习过程中的实时“弹幕”信息并结合线上的其他学习数据进行深入挖掘,发现数据背后的客观规律,找到影响学习效果的主要因素,分析学生的学习效果、学习习惯、学习兴趣、对教师的授课方式和授课技巧的敏感度、对课程重点难点内容的掌握程度等相关情况,并进行可视化展示,在细粒度层面对线上教育大数据分析进行有利的补充,有助于全面掌握学生的学习情况,从而为构建个性化学习环境、提供精准助学和提高线上教学质量提供一定的数据支撑。同时对更好地进行课程建设和提高教师的教学质量有一定的参考价值。