基于慕课数据的语法学习难度研究

2020-08-14 09:58陈歌
现代语文 2020年5期
关键词:数据挖掘慕课语法

陈歌

摘  要:基于Coursera平臺上北京大学《现代汉语核心语法》慕课的后台数据,对学习者数据及其学习行为进行阐述与挖掘。首先对课程信息进行总体分析;然后提取学习者观看视频和参加测试的行为数据,构建量化模型,计算出25个语法点的学习难度指数;最后从教学内容和课程设计角度,讨论语法学习难度的影响因素,为优化语法类慕课设计提供参考。

关键词:语法;学习难度;慕课;数据挖掘

一、引言

在第二语言习得领域,学习者如何学习第二语言,会遇到哪些困难,是人们长期讨论的话题。继二十世纪五六十年代的“对比分析假说”[1]之后,“难度”(Difficulty)成为第二语言习得研究中的一个重要主题。Bulté & Housen区分了结构复杂度(Structural complexity)和认知复杂度(Cognitive complexity),指出结构复杂度是语言特征、语言系统组成部分的数量、相互关系及其变化和规律;认知复杂度是学习者在学习、加工和使用二语时所付出的认知成本,一般称为“学习难度”[2]。本研究主要探讨汉语二语学习者的语法学习难度,数据来源是北京大学杨德峰教授在Coursera平台开设的《现代汉语核心语法》慕课(Massive Online Open Class,以下简称“《核心》MOOC”)的后台数据。我们围绕学习者观看视频和提交测试两类关键行为数据,从以下三个方面进行分析:1.对MOOC数据进行总体分析;2.提取视频观看完成比、视频一次性完成比、测试完成比和课程平均得分四个特征,建立量化模型,计算出课程所涉及的25个语法点的学习难度指数;3.从教学内容和课程设计角度,讨论语法学习难度的影响因素,为优化语法类慕课设计提供参考。

以往针对汉语二语教学的慕课研究成果,主要集中在慕课特点[3]、存在问题及对策[4]、[5]、技术支持[6]等宏观方面。同时,还有对汉语教学内容方面的具体研究,如陈良飞采用观察分析法,对一门“中级汉语语法”慕课中趋向补语的教学模式进行考察[7];又如辛平从教学理念的视角,对比分析了四门初级汉语教学慕课,发现目前的汉语教学慕课主要属于知识性课程,与语言教学目的匹配度不高[8]。本文则通过挖掘学习者行为数据,以期发现汉语语法点的习得规律与趋势,初步确定汉语不同语法点的难度等级,为优化语法教学类慕课的课程设计提供依据。

二、《核心》MOOC课程数据总体分析

《核心》MOOC系统介绍了汉语作为二语学习的主要语法,课程内容涵盖了词类(名词、动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词和象声词)、句子成分(主语、谓语、宾语、定语、状语、补语)、句子(句类、特殊句式、复句)、篇章(基本结构、连接手段)、表达(数字、比较、强调)五大类25个语法点。

《核心》MOOC共12讲,学习时长12周。每一讲包含若干课时,共66个课时,包括64个教学课时以及期中、期末考试各一个课时。每个教学课时主要由教学视频、测试与论坛三部分组成。教学视频语言为汉语,配中英文字幕,时长在5—14分钟不等,测试题目有5—12个不等,包括选择、填空、判断等多种类型。

该课程于2017年4月25日在Coursera平台上线,截至2019年8月1日止,共有17034人次访问过该课程,2130人注册了该课程。

三、语法点的学习难度指数

当前评估二语语法学习难度的主流方法,主要包括主观评定和客观测量两种方法。主观的方法包括:1.总体评定方法,如专家、教师或学习者对语法难度的评估[9]、[10]、[11];2.内省方法,如有声思维法[12]。客观测量方法以时间花费为具体衡量标准,如对反应时间的测量[13];或者是采用心理生理学测量,如大脑活动[14]及眼动研究[15]、[16]。

客观地说,基于内省直觉的主观方法,很容易受研究者先设理论框架的限制,难以做到框架中立。因此,越来越多的习得研究采用客观测量方法来评估学习难度。其中,时间花费测量已经在汉语语法难度研究中有所使用,如王永德通过测定反应时和反应正确率来探讨语言认知加工难易的实验研究[17]、[18]。但这些客观测量方法首先需要有一个好的研究设计,然后寻找具有代表性的被试,通过问卷调查或习得实验的途径来获取数据。这种方式成本高、难度大,需要至少半人工地处理和整理数据,而且很难在采集样本之前对各种因素考虑周全。尤其是问卷或实验会把被试的注意力转移到研究的项目上,失去调查研究的自然性,结果难以反映被试的真实情况。而慕课后台所记录的大量学习者行为数据,是在不需要任何预先设定及假设的条件下,由学习者自主产生,是对其学习过程全方位的真实记录。通过对观看视频、参加测试等行为进行量化,可回溯分析其在学习过程中遇到的难点,从而挖掘出课程中较难的语法点。

(一)模型构建

在《核心》MOOC中,学习者通过观看视频与参加测试来完成每一课时的学习,该课程后台记录了1777名学习者359,056条观看视频与参加测试的行为数据。学习者在观看视频过程中会由于知识点较难而出现多次暂停,甚至未能完成观看的情况。经对64个课时视频观看数据分析,54.5%的人一次性完成视频观看(即未存在暂停),而有43.4%的人需要暂停2—5次才能完成视频观看;对于较难的课时,学习者也存在无法完成测试,或者测试成绩较低的情况。

(二)结果分析

《核心》MOOC的64个课时共包含词类、句法成分、句子、篇章和表达五大类25个不同语法点。各个语法点的难度指数,如图1所示:

从整体上来看,25个语法点的学习难度可以分为较难、一般、简单:

1.较难(难度指数≥6):涵盖了篇章类和表达类的全部语法点。相关语法点难度指数由高到低依次是:连接手段、强调、数字、比较、基本结构。

2.一般(3≤難度指数<6):包括句子(复句、特殊句式)、词类(形容词、介词、名词、动词)和部分句法成分(主语、补语)。相关语法点难度指数由高到低依次是:复句、形容词、特殊句式、介词、名词、主语、动词、补语。

3.简单(难度指数<3):包括句子、词类和句子成分三大类。相关语法点难度指数由高到低依次是:句类、量词、代词、谓语、助词、宾语、状语、数词、定语、副词、叹词和象声词、连词。

如图1所示,难度指数最高和最低的语法点分别为连接手段、连词,它们的特征值如表2所示:

从表2可以看出,连词的类别和作用的视频观看完成比例为48.22%,篇章连接手段(上)的视频观看完成比例为40.71%;二者的视频一次性完成比例差别进一步加大,前者为58.2%,后者为40.35%。就测试而言,连词的类别和作用的测试完成率为69.42%,而篇章连接手段(上)的测试完成率只有42.57%;前者测试平均得分高达97.67分,而后者测试平均得分只有66.91分。

此外,“第三讲的课时5:连词的类别和作用”视频时长为11分钟,而“第十一讲课时2:篇章连接手段(上)”的视频时长为12分钟。虽然后者的视频时长只多了一分钟,但其视频平均观看时长(29.09分钟)却是连词语法点(16.93分钟)的近两倍。

四、语法类慕课设计优化建议

根据本研究得到的汉语语法点难度指数,我们从教学方式和课程设计视角出发,重新审视了语法点难度指数高的相关课时的课程内容设计。通过对照难度指数较高语法点及其对应的课程视频内容,探讨造成语法点学习难度指数高的原因,并为优化语法类慕课提出建议。

(一)丰富课程资源种类,融入多模态语言材料

难度指数高的语法点主要为篇章和表达等交际性强的语法点,语法教学的最终目的跟语言教学一致,是为了让二语学习者能够运用语言进行交际。慕课课堂融入多模态的语言材料,不仅能够吸引学习者注意力,增加学习兴趣,还能够给学习者还原一个真实的交际场景,有利于学习者真正掌握语法点的使用语境。本课程视频内容主要采用主讲教师讲解和PPT文字等方式,几乎没有使用图片及其他动画、影片等形式展示语言材料,这对于那些概念抽象、认知难度较大的语法点来说,也不易于学习者理解和掌握。在线课堂学习者更容易受到外界干扰和诱惑,注意力难以集中,因此,课程内容在设计上应更加注重趣味性和形象性。

(二)基于线下课堂教学经验,提前预想到教学难点

与线下课堂教学不同,线上慕课教学在录制课程视频时,师生之间既没有眼神接触,也无法进行语言沟通,很难及时发现并对语法难点进行更细致的讲解。缺少了对教学效果的实时反馈,会让教师陷入自说自话的情境中,无法及时对学习者习得过程中遇到的问题和难点进行答疑解惑,加大了学习者的学习难度。因此,教师应基于以往课堂教学经验,花费更多的时间、精力来备课和讲授。提前预料到学习者在学习某一个语法点时可能遇到的问题和困难,才能做到想学生之所想,为学习者提供一个真实的语法习得环境。

(三)优化语法点内容设计,降低语法点的输入难度

部分课程内容的信息量过大是造成学习者观看视频回放次数多或花费时间长的主要原因。如前所述,篇章连接手段(上)的视频时长与连词的类别和作用的视频时长相差无几,但其视频平均观看时长却是连词语法点的近两倍。通过对该课程视频的仔细观摩,我们发现,篇章连接手段(上)的PPT课件分布比较密集,在12分钟的课程中展示了32张PPT,信息量过大,导致学习者应接不暇。这类语法点应进行适当拆分,可录制成两个课时的视频进行讲解,调整每个课时PPT内容的展示密度,为学习者提供输入难度合理的学习环境。

五、结语

本文采用数据挖掘技术建立模型,对Coursera平台的《核心》MOOC后台数据进行总体分析;通过提取视频观看完成比、视频一次性完成比、测试完成比和课程平均得分四个特征,建立量化模型,计算出课程所涉及的25个语法点的学习难度指数;并从教学方式和课程设计角度,讨论了语法学习难度的影响因素,为优化语法类慕课提出了丰富语料形式、预想教学难点和输入难度合理的建议。

MOOC的迅速发展不仅改变了传统教学方式,为学习者提供了在线学习平台,也记录了学习者大量的行为数据。挖掘这些数据,可以分析教学内容中的重点与难点,改进课程设计,提高教学质量。尤其是可以解决二语习得等研究领域传统抽样试验方法中所存在的一些问题,如学习者数据采集成本高、难度大等。MOOC大数据中蕴含着海量的有关教与学的数据,更多的信息和知识有待挖掘。下一步研究,一方面,可以对MOOC数据中学习者观看视频、参加测试等行为进行深入挖掘,作为衡量学习成本和学习效力的依据,进一步探讨汉语二语语法教学的效率问题;另一方面,语法学习难度研究除考虑学习环境相关因素外,还应与语言结构本身的复杂性,学习者的母语背景、汉语水平、学习动机等个体差异相结合进行探讨。总之,正如Housen & Simoens指出的那样,要回答为什么某些语法结构学习起来比较困难,还需要对语法结构复杂性、学习者个人特点以及学习环境等不同因素之间的协同作用进行研究[16]。

参考文献:

[1]Lado,R.Linguistics across Cultures:Applied linguistics for language teachers[M].Ann Arbor:University of Michigan Press,1957.

[2]Bulté,B. & Housen,A.Defining and operationalising L2 complexity[A].In Housen,A.,Kuiken,F. &  Vedder,I. (eds.).Dimensions of L2 performance and proficiency:complexity,accuracy and fluency in SLA[C].Amsterdam/Philadelphia:John Benjamins,2012.

[3]王海峰.机遇与挑战:慕课和汉语教学[J].汉字文化, 2016,(5).

[4]林金锡,张亦凝.慕课对对外汉语教学的启示[J].国际汉语教育,2015,(1).

[5]王添淼,裴伯杰.汉语慕课课程个案研究[J].民族教育研究,2016,(2).

[6]刘霞.慕课时代对外汉语教师生态位研究[J].大庆师范学院学报,2018,(6).

[7]陈良飞.某《中级汉语语法》慕课考察分析——以趋向补语为例[A].北京大学对外汉语教育学院.2018年对外汉语博士生论坛暨第十一届对外汉语教学研究生学术论坛论文集[C].北京:北京大学对外汉语教育学院, 2018.

[8]辛平.教学理念视域下的对外汉语教学慕课分析[J].高教学刊,2019,(16).

[9]Robinson,P.Learning simple and complex second language rules under implicit,incidental,rule-search,and instructed conditions[J].Studies in Second Language Acquisition,1996,(1).

[10]Graus,J. & Peter-Arno,C.Defining grammatical difficulty:a student teacher perspective[J].Language Awareness,2015,(2).

[11]Rodríguez Silva,L.H. & Roehr-Brackin,K.Perceived  learning  difficulty  and actual  performance:Explicit  and  implicit  knowledge[J].Studies  in  Second  Language Acquisition,2016,(2).

[12]Cerezo,L.,Caras,A. & Leow,R.P.Effectiveness of guided induction versus deductive instruction  on the development of complex Spanish “gustar”  structures:An analysis of learning outcomes and processes[J].Studies in Second Language Acquisition,2016,(2).

[13]Godfroid,A.The effects of implicit instruction on implicit and explicit knowledge development[J].Studies in Second Language Acquisition,2016,(2).

[14]Morgan-Short,K.,Sanz,C.,Steinhauer,K. &  Ullman,M.T.Second Language Acquisition of Gender Agreement in Explicit and Implicit Training Conditions:An event-related potential study[J].Language Learning,2010,(1).

[15]Godfroid,A. & Uggen,M.Attention to irregular verbs by beginning learners of German:An eye-movement study[J].Studies in Second Language Acquisition,2013,(2).

[16]Housen,A. & Simoens,H.Introduction:Cognitive Perspectives on Difficulty and Complexity in L2 Acquisition[J].Studies in Second Language Acquisition,2016,(2).

[17]王永德.不同母語类型留学生理解汉语句子的实验研究[J].语言文字应用,2004,(3).

[18]王永德.跨语言因素对留学生理解汉语句子速度的影响[J].语言教学与研究,2014,(4).

猜你喜欢
数据挖掘慕课语法
跟踪导练(二)4
数据挖掘综述
参考答案
软件工程领域中的异常数据挖掘算法
大学生对慕课的了解和利用
“慕课”教学的“八年之痒”
慕课环境下的学习者
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书