[作者简介]*李代鹏(1992—),男(彝族),云南文山人。硕士,助教,主要研究方向为汉语教学、语料库语言学。
[摘要]基于大数据视角,在对国内外关于学习分析模型的研究进行综述的基础上,指出了现有学习分析模型的优缺点,并建构了相应的汉语学习分析模型。该模型具有以下特征:数据来源更偏向半结构数据;分析的过程注意学习的非线性与动态性特征;预测环节加入学习者特征。基于大数据视角建立的汉语学习分析模型不仅能够深化教师与学生对汉语学习的理解,还能深化教育者對学习者的理解、深化师生对自主学习的理解,对于提升汉语学习者的学习效果具有重要的指导意义。
[关键词]大数据;教育数据挖掘;学习分析;对外汉语教学
[中图分类号]H195.3[文献标识码]A[文章编号]1005-4634(2021)02-0010-07
0引言
大数据时代,数据驱动学习已成为公认的范式,其所带来的教育变革前所未有,其基于数据挖掘技术与数据分析技术提供的个性化学习与评价机制等为教学效率的提升奠定了坚实的基础。此外,随着计算机科学技术的迅速发展,对学习者学习数据的收集与存储已经变得非常容易,但如何将这些结构化或半结构化的数据转化为有效的教学资源却并非易事。虽然教育数据挖掘技术与分析技术在数据提取和分析方面起着重要的作用,但学习毕竟是一个社会化的过程,也就是说语言学习实质上就是学习者不断进行社会化的过程[1]。以社会语言学的视角作为衡量的标尺,仅仅依靠教育数据挖掘技术来进行教学决策是不完全科学的。正如托雷·赫尔教授所指出的那样:“不是所有量化的数据都有意义,不是所有有意义的东西都能被量化。”[2]基于这样的现实,学习分析得以产生和发展,由于其强调分析过程的人为干预以及关注教育之外的事物,故而学习分析在为学习者提供更加个性化与更人性化的学习模型方面,打开了一个新的突破口。目前虽不乏关于这一主题的相关研究,但多数研究仍然集中于一般的学习领域,关于其在外语教学领域中的研究尚不多见,尤其是在对外汉语教学领域,学习分析的介入更是微乎其微。鉴于学习分析本身的特点及优势,将其应用到对外汉语教学领域之中,进而建构相应的学习分析模型,具有重要的时代意义。
1学习分析的研究现状
学习分析作为科技促进教学的产物,被称为科技促进教学的第三次浪潮。自2011年“第一届学习分析与知识国际会议”开始,国内外对其进行研究的成果不可谓不多,但多数研究主要集中于一般的教育领域,而在具有特殊性的外语教学领域,对学习分析与外语教学关系的研究却少之又少。在中国知网输入“学习分析与外语教学”,检索出来的15 667条结果之中,与外语教学这一概念相关的文章只有1篇,该文对学习分析的概念进行了阐释,并分析了学习分析的几个主要要素:数据搜集、数据分析、学生学习、受益者群体和干预措施。最后自我建构了一个基于学习分析的个性化外语教学与学习分析模式[3]。
然而在更具特殊性的对外汉语教学领域,对于学习分析的研究则为零。因此,基于“大数据时代,外语教学要具备高度的柔软性,以响应学生的小众需求,实现学习定制化、移动化、社交化、多屏化、协作化”[3]的号召,将学习分析技术应用到对外汉语教学之中,并建构相应的汉语学习分析模型,对推动对外汉语教学事业的健康快速发展具有重要意义。
2学习分析的相关概念与要素
2.1学习分析的定义与发展
学习分析是近年来兴起的一个新兴领域,由于其重要的教育价值而备受国内外有关学者的关注,并得到快速发展,进而成为大数据时代转变传统教学模型、学习方式与评估机制的关键要素。早在2010年,Siemens就对学习分析进行了定义,认为“学习分析可以通过利用智能数据、学习者产生的数据和分析模型来发现隐藏的信息与社会关联,并对学习进行预测和建议”[4]。之后,不同的机构与学者对学习分析的定义进行了不同角度的发展与阐释(见表1)。
尽管不同的学者以各自理解的视角对学习分析的定义作出了相应的阐释,但仔细分析后发现,其实质上相同。
2.2学习分析的相关概念
随着教育大数据的发生,由此产生了许多与之相关的学术概念与新的研究领域,主要有:学习分析、学术分析、行为调查、教育数据挖掘、推荐系统、商业智能以及个性化自适应学习系统等。在众多的学术概念与研究领域中,与学习分析最相似且最核心的就是教育数据挖掘。
1)教育数据挖掘。教育数据挖掘是一个新兴的研究领域,其利用一系列计算机科学与心理学的方法去理解学习者的学习状况,通过收集学生在网络系统(包括学习系统、社交系统、网页浏览等)中所产生的数据而发展出各种学习预测模型,这些预测模型在建立适合学习者学习情况的自适应学习系统过程中起着关键性作用,其主要研究目标如下:(1)通过创造学生模型(包含学习者的知识、动机、元认知和态度)来预测学习者的未来学习模型;(2)探索或改善领域模型(描述已经学过的内容和理想的教学次序);(3)研究各类学习软件提供的教学支持所产生的效果;(4)通过建立计算模型(包括学习者模型、领域模型、软件教学模型)来增加教育者对学习与学习者的科学认识[10]。
为了实现上述研究目标,教育数据挖掘主要采用以下分析方法:(1)预测。探测与理解学生的学习行为。(2)聚类。将数据进行汇总并按照相似特点进行归类。(3)关系挖掘。寻找各个变量之间的关系并进行编码。(4)关联规则挖掘。找出学习者的共同学习错误,探索学习者类型等与学习内容之间的关系。(5)系列模式挖掘。捕捉一系列即时性事件之间的联系,譬如学习者在寻求学习帮助的同时所犯的错误。(6)蒸馏。对数据进行描述,以便于人们能快速地发现或归类数据特征。(7)发现模型。利用现象模型来发现学生学习行为与各种因素之间的关联[11]。
综上所述,可以得出如下结论:教育数据挖掘实质上就是充分利用现代科学技术,以系统自动收集存储的海量数据为基点,依靠各类数据挖掘技术与分析技术,对数据进行自动化分析,从而建立起相应的教学或学习模型,在预测学生未来学习行为的基础上,为学生提供一个高度个性化的自适应学习平台,以期改善教学效果,减轻教师的教学负担。
2)学习分析。在教育数据挖掘等相关领域的基础上产生的学习分析领域,在研究目标方面则略有变异。根据Larusson和White的观点,学习分析的主要目标为:(1)提升学习者与教师在教与学方面的表现;(2)改善学生对课堂学习材料的理解;(3)评估并尽力满足勤奋学习者的需求;(4)改善评估方式的准确性;(5)允许指导者或教师评估和发展他们自己的优势;(6)鼓励高效地使用各类资源[9]。
从学习分析的主要研究目标可以看出,學习分析不仅仅只关注学习者的表现与需求,而且是从一个整体的视角出发,在关注学习者的学习表现与学习需求的同时,还兼顾到教师与机构的利益,并且强调对资源的有效利用,而如何将各种资源向有助于提升教与学的方向转化,仅仅依靠教育数据挖掘的自动化分析技术是行不通的。
在“数据驱动学校,分析变革教育”的大数据时代[12],虽然以数据驱动为代表的个性化自适应学习具有重要的价值与意义,但是“对于学习分析,需要考虑如何更好地捕捉环境和情景因素”[13]。此外,学习分析的整体视角也更加符合语言习得的规律和非线性涌现的特征。
3学习分析的几种模型
3.1学习分析模型的应用
随着学习分析研究的深入,各种学习分析模型相继涌现并投入使用,目前根据学习分析概念所开发、设计并投入使用的学习分析应用如表2所示。
从以上6个学习分析模型的应用可以看出,其系统设计所使用的数据来源为网络平台,数据类型为结构化数据,采用的分析方式为自动化分析,而且评估机制仍是传统的对比评价,这似乎与前述的学习分析的研究目标在一定程度上是相悖的,更多地体现的还是教育数据挖掘的特点而非学习分析本身的特征。
3.2学习分析的主要模型框架
目前,关于学习分析的研究已经产生以下几种主要的模型框架。第一种模型由Chatti等人于2012年提出。该模型在数据收集过程中注意到了环境因素,即在数据采集过程中应注意到数据所产生的环境,只有如此才能准确地理解为什么同一环境下的学习者所产生的学习数据会出现巨大差距。此外,该模型还应用了多元语境分析的方法,将学习分析置于多元语境的框架之中,从而保证了其分析结果的广泛适应性[14]。
此外,Greller和Drachsler也发展出了一个学习分析模型[15]。该模型较为简化,对各元素的分析不够完整。如数据,建模者就只简略地从数据可用性的角度将其划分为开放和保护型数据。而在工具元素中,只指出技术、算法、理论等,但没有在模型中将几个元素所涉及的内容明确地指出来。此外,该模型将内部限制分为权限和认可,将外部限制分为习俗与标准,但这些元素到底具体代表什么内容,让读者摸不清。但该模型值得借鉴的地方在于其分析工具中加入了理论一环,从而使得整个分析过程既有由技术支撑所带来的结果的可靠性与客观性,又有以理论为背景而形成的结果的合理性。
Fiaidhi所发展的模型[16]没有细分约束类型,并忽略了重要的认可性环节,数据来源较广泛,但仍然倾向于由网络系统自动生成的数据,忽略了环境感知因素的影响。然而值得一提的是,该模型在分析工具中加入了经验法则一条,使得分析过程与分析的实质更加合理化与人性化,这是因为虽然进入了一个由数据驱动学习的数字化、个性化的学习时代,但经验逻辑的重要性永远不可忽略。此外,该模型将学习者生成的数据细分为结构化和半结构化数据,使得模型的可视化功能更加明显。因此,从整体上来看,该模型的脉络较为清楚,整合性更加明显。
综上所述,三种类型的模型各有优势与劣势。笔者基于大数据视角,将各个模型进行解构、整合,以期建立一个适合于对外汉语教学领域的学习分析框架与模型。4大数据视角下的汉语学习分析模型
4.1建立基于大数据的汉语学习分析模型的重要意义大数据时代的发展促发了教育大数据的萌发,伴随一系列网络技术、数据挖掘技术、统计技术及可视化技术的应用,教育数据挖掘产生了极大的利用价值,为改善教学效果,推动教育朝着生态教育学的视角即高度的个性化进行自适应学习方向的转变提供了前所未有的机遇。但目前的各种学习分析模型只适用于普通教育领域,而且各类模型本身又确实存在细微的缺陷,故而建立一个基于大数据视角的汉语学习分析模型具有重要意义。
1)深化教师与学生对语言学习内涵的理解。对外汉语教学是一个非常复杂的过程,其表现出很高的非线性涌现的特征。这其中涉及众多因素,包括教师的信仰、教学模式、教学内容、教学方法、教学环境,学习者的性格、动机、需求、信仰、策略和认知等,而这些恰恰是依靠数据说话的教育数据挖掘所无法解决的。同样的,虽然目前的学习分析模型也涉及到环境、经验和学生的接受性等方面,但由于学习分析最根本的支撑元素仍然是数据,数据具有巨大价值但并不能说明一切,因此其在学习分析中的地位只能是相对而非绝对的。所以仅仅依靠数据作为结果的唯一标准是完全行不通的,这是因为当学习者的感觉、信仰以及他们的推理与经验或经历被排除于课堂交际环境和教师的视阈之外时,实际上课堂就是一个非语境化的场所。最重要的是,不同于其他学科的是,汉语学习者的汉语学习永远无法离开一定的社会环境,脱离社会环境的语言学习就犹如在水面上画花纹,徒有虚言而无实意义。因此,大数据视角下的汉语学习分析,必须充分考虑超越于数据之外的更重要的元素,诸如留学生的感觉、经验、经历、教师行为等。在分析过程中,要让学习者确实感到“语言习得实际上正是一个自我内化的认知过程”[17]。而在这一内化认知的过程中,学生自我效能感的提升极为重要。传统观念里一直存在着这样一种错误认识,即认为学生的成绩总是由教师的教学方法、教师所创设的学习环境、个体的文化因素以及性格特点所决定的,而忽略了学生的自我效能与自我调控的影响[18]。基于这样的背景,通过进行学习分析应充分认识到:在留学生的汉语学习过程中,真正的掌控者是留学生而不是教师。
2)深化教育者对汉语学习者的理解。Palmer认为:“如果我们乐意朝镜子中望去,而不回避我们所看到的东西,我们就会获得这样的一种认识,即除了良好的教学之外,对学生与学科的深刻理解都同等重要。”[19]因此在大数据时代,对学习者的理解应当产生一个重要的转变,在对学习者进行深刻理解的过程中,多元智能理论将具有重要意义。
因此,汉语教师在进行课程设置之前,应该摒弃学生只拥有前两种智能的传统观点,以多元的视角来帮助汉语学习者发展他们各方面的能力。
3)深化对自主学习的认识。传统的对自主学习的认识,即学生能在没有教师监督的情况下,或当学习者远离课堂之外时,独立地、自发地进行学习,即为自主学习。但是鉴于社会语言学、认知语言学与系统功能语言学的视角,这样的认识恐怕欠缺说服力。因为处于社会环境中的学习者,其独立性只能体现为相对的独立性,即学习者只能在某一特定的环境并且具备相当的条件下才能进行独立学习,而在绝大多数时间里,语言的学习仍然是处于互动之中,是互动的产物。也就是说,学习者必须学会与其同伴或教师协同工作。此外,“自主学习是一个由学习者自身、教师、任务、教育环境共同作用的复杂过程。”[20]
基于上述事实,真正的自主学习事实上就是汉语学习者能够主动地与教师、同学、环境积极互动的结果,通过这样的交互,能够开拓学习者视野,培养他们进行批判性思考的能力,发挥人之所以为人的根本权利,最终成为自己学习世界的缔造者[21]。
4.2大数据视角下的汉语学习分析模型
大数据视角下的汉语学习分析模型不同于一般的学习分析模型,因为汉语习得的过程中具有许多不确定和无法预测的因素,而这些不确定和无法预测的因素却又常常成为影响外国学生学习汉语的关键性变量。此外,汉语学习是一个动态、复杂、非线性的过程,在建立汉语学习分析模型时必须将这些元素充分考虑进去,才能在较大程度上确保学习分析模型所产生的效用。大数据视角下的汉语学习分析模型具有以下特点。
1)数据来源更偏向半结构数据。与教育数据挖掘不同的是,学习分析融合了更多半结构化的数据,但这些半结构化数据在其来源上也仍然存在对环境和情景因素重视不够的现象。显而易见,在环境与情景影响下所产生的数据更多地表现为半结构化数据,譬如教师信念、学习环境、学习动机、感知需求等。根据语言学习是一个自我内化的认知过程的观点,这些半结构化数据在汉语学习过程中起着决定性的作用。故而基于大数据建立起来的汉语学习分析模型需要更加注重对非结构化数据的广泛追踪。
2)学习分析过程更加注重学习的非线性与动态性特征。现存的学习分析模型,注重的是通过对数据的收集、清洗、分析、预测与实施“监督和预测学习者的表现,并及早发现潜在的问题,以便采取相应的干预措施”[22]。但需要注意的是,如果仅以各类数据作为分析与实施的唯一可靠来源恐怕有所不足,还应关注语言学习过程的重要特征——动态性与非线性。动态性表现为学习动机、学习需求、学习目的、学习方式、学习环境等在很大程度上是随着许多外界的刺激或内部认知因素不断产生变化的,因此学习分析也应随其改变。此外,由于学习过程的另一个重要特征——非线性涌现,也对学习分析结果的普适性提出挑战。语言学习过程中的非线性涌现特征表现为自身的组织性(包括内容的自组织和学习者的自组织)。在不同的环境之下,各元素之间的相互作用关系错综复杂,完全是以不同的组织方式出现的。因此反射到汉语学习中,即表现为在学习汉语的过程中,当学习者的心理远离平衡状态而处于非平衡状态之时,会产生行为的变异。由于学习内容相互错杂的关系、学习者认知能力等因素,产生了一个重要现象,即学习者的学习方式并非是直线式的一环接着一环地涌动出来,而是表现出非直线的,有时还可能是逆方向的特点。因此在建立汉语学习分析模型的过程中,应该考虑到汉语学习的复杂动态性与非线性特征。
3)分析预测环节融入学习者特征。在对数据进行收集、存储、清洗、加工、分析的基础上,随之而来的则是预测环节。在分析预测的环节中,为了确保分析结果的高度个性化与特殊适用性,应加入对学习者特征的分析。关于这一点,Kumaravadivelu曾经指出:“我们越了解学生们的个人学习方法和个体特征,我们进行教学干预的效果就会越好越有效。”[23]汉语学习者由于其国别化的背景而导致个体在思维方式、价值观念、心理动向、学习方法、性别特征等方面产生巨大的差异,而这些差异也极容易导致学习过程中出现所谓的挫折期。在汉语学习分析模型的建立过程中,只有注重对学习者特征的分析才能达到理想的干预效果。
综上所述,大数据视角下的汉语学习分析模型具有注重半结构化数据、注重汉语学习过程中的复杂动态非线性特征、注重对学习者的特征进行分析的特点,综合考虑这些因素,建构了一个与对外汉语教学领域相关的学习分析模型,见图1。
图1所示的汉语学习分析模型,基于广泛数据,最重要的是基于学习者本身的特征以及汉语学习过程中所表现出来的复杂动态性与非线性特征。而在具体的分析过程中,不仅重视先进的网络技术与计算机辅助技术,还加入了经验、逻辑推理、理论合参的重要性。在最终的分析目标中,现存的学习分析的目标皆为反思、预测、总结等。此处的汉语学习分析模型的分析目标为人性化评估、个性化学习与自我反省。汉语学习者是一群特殊的个体,对其进行人性化的评估,是为了反抗以分数为主的机械化评估所产生的学习危害,激发其学习兴趣,而个性化学习则是大数据时代要求生态教育的结果。希望通过这一学习分析模型,对未来的对外汉语教学发展产生某种程度上的推动作用。
5结束语
“我们不应该把语言视为僵死的制成品,而是必须在很大程度上将语言看作是一种创造……应该更细致地追溯语言与内在精神活動相关联的起源,以及语言与这一活动的相互影响。”[24]基于大数据视角建立的汉语学习分析模型,最重要的目的就是去发现汉语学习与学习者之间的精神交互与内部认知活动,从而采取相应的干预措施,提升学习效率,培养理想化(精神与语言学习同步发展)的学习个体。因此,在未来的对外汉语教学事业发展过程中,学习分析将起着关键性的作用,这是因为通过学习分析可以使“原本模糊的印象——数字化与清晰化”[25]。
参考文献
[1] 黄慧,邵今是.社会语言学理论对二语习得研究的贡献[J].外语电化教学,2016(169):23-27+33.
[2] 孙妍妍,李艳.大数据时代的学习分析将重塑教育格局——访挪威奥斯陆大学托雷·赫尔教授[J].世界教育信息,2015(2):7-10.
[3] 甘辉,何高大.大数据时代学习分析与外语研究展望[J].外语电化教学,2016(169):40-45.
[4] SIEMENS G.what are learning analytics?[EB/OL]. (2019-05-28) [2020-05-26]. https://blogs.adelaide.edu.au/myunitransform/2019/05/28/what-is-learning-analytics/.
[5] ELIAS T.learning analytics: definitions, processes and potential[EB/OL].(2011-11-10) [2020-05-26].http://libvolume4.xyz/homescience/bsc/semester4/teachingmethodsandmediaee2/learningprocess/learningprocesstutorial1.pdf.
[6] JOHNSON L,SMITH R,WILLIS H,et al. NMC horizon report: 2011 higher education edition [EB/OL].(2011-06-08)[2020-05-26].http://www.learntechlib.org/p/182018/.
[7] LOCKYER L,HEATHCOTE E,DAWSON S.Informing pedagogical action: aligning learning analytics with learning design[J].American Behavioral Scientist,2013,57 (10):1439-1459.
[8] JOHNSON L,ADAMS B S,CUMMINS M,et al.NMC horizon report: 2013 higher education edition[M]. Austin, Texas: The New Media Consortium, 2013.
[9] LARUSSON J A,WHITE B.Learning analytics: from research to practice[EB/OL].(2014-08-21)[2020-05-26].http://link.springer.com/article/10.1007%2FS10758-015-9244-x.
[10] JEONG H,BISWAS G.Mining student behavior or models in learning-by-teaching environments[EB/OL].(2008-01-22)[2020-05-26].https://www.semanticscholar.org/paper/Mining-Student-Behavior-Models-in-Environments-Jeong-Biswas/b072bb4918da4b
09a1495f72e5a3b98457a12512?p2df.
[11] PRAKASH B R,HANUMANTHAPPA D M,KAVITHA V.Big data in educational data mining and learning analytics[J].International journal of Innovative Research in Computer and Communication Engineering, 2014,12 (2):7232-7237.
[12] 徐鹏,王以宁,刘艳华,等.大数据视角下分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》的报告解读及启示[J].远程教育杂志,2013(6):11-17.
[13] 魏雪峰,宋灵青.学习分析:更好地理解学生个性化学习过程——访谈学习分析研究George Siemens教授[J].中国电化教育,2013(320):1-4.
[14] CHATTI M A,DYCKHOFF A L,SCHROEDER U,et al.A reference model for learning analytics[J].International Journal of Tecnology Enhanced Learning,2012(4):1-22.
[15] GRELLER W,DRACHSLER H.Translating learning into numbers:a genetic framework for learning analytics[J].Educational Technology Society,2012,15(3):42-57.
[16] FIAIDHI J.The next step for learning analytics[J]. The IEEE Computer Society, 2014(16):4-8.
[17] HALEY M H,AUSTIN T Y.Content-based second language teaching and learning[M].北京:世界圖书出版公司,2006:15.
[18] TENAW Y A.Relationship between self-efficacy academic achievement and gender in analytical chemistry at debre markos college of teacher education[J].AJCE,2013,3(1):3-28.
[19] PALMER P J.The course to teach: exploring the inner landscape of a teacher′s life[M].San Francisco:Jossey-Bass Publishers,1998:2.
[20] 库玛.超越教学法:语言教学的宏观策略[M].陶健敏,译.北京:北京大学出版社,2013:55.
[21] PENNYCOOK A.Cultural alternations and autonomy[C]//BENSON P,VOLLER P.Autonomy and independence in language learning. London: Loman, 1997:53.
[22] ROMERO C R,VENTURA S.Educational data mining: a review of the state-of-the-art[J].IEEE Transactions on Systems, Man and Cybernetics, Part C: Applications and Reviews, 2010,40 (6):601-608.
[23] KUMARAVADIVELU B.Language learning tasks: teacher intention and learner interpretation[J].ELT Journal,1991,45 (2):98-107.
[24] 威廉·馮·洪堡特.论人类语言结构的差异及其对人类精神发展的影响[M].姚小平,译.北京:商务印书馆,1996:49.
[25] 乐艺.学习分析技术在大数据环境中的应用[J].计算机与现代化,2016(9):104-108.
AbstractBased on the perspective of big data, the article points out the advantages and disadvantages of existing learning analysis models on the basis of a review of domestic and foreign research on learning analysis models, and builds a corresponding Chinese learning analysis model on this basis. The model has the following characteristics: the data source is more biased towards semi-structured data; the analysis process pays attention to the nonlinear and dynamic characteristics of learning; the predictor link adds learner characteristics. In addition, the article believes that the Chinese learning analysis model established from the perspective of big data can not only deepen the understanding of teachers and students on Chinese learning, but also deepen the understanding of educators on learners and teachers and students on autonomous learning. Understanding has important guiding significance for improving the learning effect of Chinese learners.
Keywordsbig data;educational data mining;learning analytics;TCSL
[责任编辑刘冰]