孔祥雯
[摘 要] 随着计算机技术的迅速发展,在线网络资源中的语料库因其独特优势日益受到语言教学关注。通过分析在Web of Science检索到的国际西班牙语教学语料库应用研究方面的32篇文献,得出结论:国际基于语料库的西班牙语教学研究呈现多元化,但成果数量有限,尚处于萌芽阶段。在此基础上,以高校西班牙语词汇和语法教学为例,探讨DDL教学的思想和具体实践方式。
[关 键 词] 數据驱动;语料库;西班牙语;教学;词汇;语法
[中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2024)06-0029-04
一、研究背景
数据驱动学习(Data-Driven Learning, DDL)是Tim Johns 和 Chris Tribble于 20 世纪 90 年代初提出的一种基于语料库数据学习外语的教学模式。[1]主要思想是通过指导学生观察语料库数据,由学生自己概括、归纳、提炼出语言现象的特征、意义等。语料库(corpus)是具有一定结构和规模,具有代表性的语料集合,并且可以通过计算机程序被检索。随着计算机网络技术的迅速发展,语料库语言学逐渐成为语言研究的重要方法和内容,在词典编纂、翻译、外语教学、语言研究等多个应用领域发挥了重要的作用。
根据王翊等人(2022)的统计,近二十年来,语料库在外语教学中的作用不断显现。[2]语料库在我国外语教学中的应用主要分为直接应用和间接应用两个层面。直接应用是指将DDL方法应用在课堂教学、测试等实践环节,主要研究领域有词汇教学、写作教学、翻译教学、语法教学、学习者语料库、专门用途外语教学等。不少学者提出词汇在外语教学中的重要意义,要改变以往轻词汇重语法的教学模式。传统的词汇教学,忽视词汇搭配知识和预制词块的教学,而实际使用中,搭配知识很重要,实际上比单个词汇用法更为重要。Hunston等(2000)研究认为,学习者口语流利的程度取决于对预制多词词组的掌握。[3]濮建忠(2003)提出要重视词汇学习的深度,词块教学应该是词汇教学的重点,要从地道的目的语中学习词块,从而解决学习者搭配和类联接方面的问题。[4]而语料库正是能够帮助教师从语料库证据归纳最频繁使用的类联接型式、最频繁使用的词语搭配、最频繁表达的意义和功能,进而帮助学生掌握语言事实和用法模式[5]。梁茂成 (2009)提出将基于课本和课程内容的“微型文本”应用于外语课堂教学,既便于检索,又提供了适用性。[6]吴军(2010)认为将语料库应用于语法教学,有助于使语法和词汇得以联系,对语法现象的分布和频率提供全面可靠的统计,有效帮助学生提高交际能力。[7]以上研究都说明数据驱动教学(DDL)在外语教学中的应用发展迅速,特别是在英语教育方面得到了大量支持。然而通过检索,我们发现目前国内对DDL应用于西班牙语教学讨论量很小,有必要探讨在西班牙语教学中的可能性。
我国高校的西班牙语教学处于西班牙语作为外语 (ELE)的教学环境下,师生缺乏接触真实语言环境的条件,利用语料库数据驱动学习具有更为重要的意义。那么,当今国际应用语料库进行数据驱动的西班牙语教学进展到了什么阶段,呈现何种特点,如何将国内外语料库资源引入大学西班牙语课堂,应成为我们的关注点之一。本文通过分析国际基于语料库的西班牙语教学研究现状,讨论如何在高校西班牙语课程中,应用语料库促进教学实践。
二、国际基于线上语料库的西班牙语教学研究
为进一步了解国际学界对语料库在西班牙语教学领域的研究现状和发展趋势,本研究选取 Web of Science 核心合集中的 SSCI 和 A&HCI,以“语料库”“数据驱动学习”“西班牙语”“教学”等作为主题词进行搭配后检索,研究领域限定在“Linguistics”“Language Linguistics”和“Education Educational Research”,为进一步确保数据的准确性和完整性,又对所有数据进行人工筛选,去除基于自建语料库研究以及其他不符合研究条件的文献,共得到32篇文献。可见,国际上针对西班牙语教学的语料库使用研究成果较少,研究还处在萌芽阶段。接下来,我们从发文量历时变化、高产作者、主要期刊、研究领域分布等方面对这些研究进行统计分析。
国际语料库西班牙语教学研究基本可以划分为两个阶段。第一个阶段是从2010年到2018年的起步阶段,论文总数为14篇,占全部论文数量的44%。自2010年第一篇研究发表之后,每年有1~4篇文献进行相关研究。第二个阶段是从2019至今的发展阶段,论文总数为18篇,占全部论文数量的56%。除2020年有3篇文献外,每年均有5篇研究,说明自2019年之后相关研究进入快速发展阶段。
发文量排名前列的学者有Marcos García Salido,共计发文5篇。该学者来自西班牙拉科鲁尼亚大学语言文学系。其研究范围较广,涉及语料库工具使用、学习者中介语研究、学习者的搭配问题、语料库搭配检测等。另外还有Hui-Chuan Lu(5篇),其研究兴趣主要是利用语料库进行中介语研究。Nausica Marcos Miguel(3篇)主要关注语料库资源课堂使用的有效性。Narciso Contreras Izquierdo和Fermín Martos Eliche(2篇)主要研究利用语料库检测固定词块频率及其教学情况。Anita Alejandra Ferreira Cabrera和Jessica Elejalde Gómez(2篇)的兴趣在于语料库资源建设和相关工具开发。这些学者的发文占到总数的53%,足以说明他们在基于语料库的西班牙语教学研究方面做出了一定贡献,值得我们在今后持续关注。
刊載语料库西班牙语教学研究论文的期刊主要有:Círculo de Lingüística Aplicada a la Comunicación(5篇),Revista de Lingüística Teórica y Aplicada(5篇),Porta Linguarum(3篇),Corpus Linguistics and Linguistic Theory(2篇)和International Review of Applied Linguistics in Language Teaching(2篇)。这些期刊上发表论文的研究领域分布较为广泛,难以总结其主要发表的领域。这些期刊发表的语料库相关成果最多,占到总数的53%,应该在今后被重点关注。
根据语料库应用于西班牙语教学的情况,本文将所统计的论文分为四类:第一类是语料库资源建设,第二类是语料库应用于课堂教学,第三类是利用语料库进行中介语研究,第四类是其他研究。结合表1的统计对语料库应用于西班牙语教学的研究情况逐一进行分析。
(一)语料库资源建设
语料库资源建设占到整体研究成果的25%,主要体现在两个方面:一是专业语料库的不断建设。学习者语料库在推动二语习得研究方面取得了重大进展,例如,Lozano (2022)的论文CEDEL2: Design, compilation and web interface of an online corpus for L2 Spanish acquisition research,专门介绍了西班牙语学习者书面语语料库CEDEL2(Corpus Escrito del Espa?觡ol)的设计情况,以及该在线语料库在今后西班牙语二语习得研究方面的应用前景。Canales (2012)注意到语音在西班牙语教学中未受到应有的重视,设计并开发了西班牙语语音习得语料库AACFELE(Adquisición y aprendizaje del componente fónico del espa?觡ol como lengua extranjera / segunda lengua)。第二个研究热点是基于计算机技术的语料库工具开发,占全部研究成果的12.5%。Lu (2021)等人介绍了一个名为“西班牙语搭配工具(SCT)”的软件程序及其在相关语料库研究中的应用,Chacon-Beltran(2019)介绍了拼写和语法检查工具Correctme的设计理念与工作方法,将用户的文章与规范语料库进行比较后,根据搭配出现频率的综合数据,在写作时向用户提供其拼写和语法错误的信息。
(二)语料库课堂教学研究
语料库课堂教学研究的成果占到整体的37.5%,是所有关于语料库教学研究中比例最大的领域,其研究领域呈现多元化。其中,课堂教学方法研究、语法和词汇教学受到最多关注。在课堂教学方面,Miguel (2020) 通过实证研究,发现基于语料库的任务确实在二语课堂中产生了交流、解释和参与。Benavide(2015)研究考察了学生使用西班牙语料库Corpus del Espanol(Davies, 2002)的有效性,通过实际语料库搜索,找到特定搭配和标记,观察真实示例,更好地理解和使用语法概念,从而说明语料库作为语言学习工具的有效性。在语法和词汇教学方面,Izquierdo (2017)将谷歌和西班牙语语料库(CREA 和 CORPES XXI)以及 Mark Davies 的语料库(西班牙语语料库)作为参照,以便为词块频率的分级和教学提供客观数据。最后,在写作、翻译教学和教师输入研究等方面也都有一定成果。Laursen(2012)阐释了在西班牙语和丹麦语翻译课堂上,可比语料库与搭配检索软件是翻译训练的高效工具,以帮助学生认识两种语言文体特征差异,提高翻译效率。
(三)中介语研究
借助语料库资源进行中介语研究受到了较多关注,中介语研究占比达到34.4%。Lu (2022) 使用学习者语料库考查了学生的词汇搭配问题。de Diego (2019)利用两个学习者语料库CAES和Corane,以及CORPES语料库中母语者语料,对haber使用情况进行对比研究。Blanco (2021) 利用学习者语料库Caele,研究了A2和B1级别学习者动名短语的产出情况,并提出二语教师应从初级学习阶段就注重对词汇搭配的教学。Salido(2016) 使用了CEDEL2和CORANE两个学习者语料库分别研究了母语为英语、瑞典语、日语和西班牙语学习者对SVCs结构习得情况,并对研制搭配词典和相关教学提出了建议。Schnur (2021) 使用犹他州双语浸入语料库中240万字书面西班牙语分库,从西班牙语二语学生写作语料中研究词汇复杂性,考量任务类型、语言水平等与词汇复杂性的关系。
经过统计分析,我们认为国际基于语料库的西班牙语教学研究呈现多元化发展,但成果数量相较于其他语种,特别是英语,相对较少,基于网络语料库的相关研究尚处于萌芽阶段。但对语料库的研究和应用分布不均,基于语料库的中介语研究占总研究量的34.4%。而语料库资源建设、课堂教学应用、具体课型应用等偏实践应用型研究较少。因此,我们对今后基于语料库的西班牙语教学研究提出以下建议: 进一步加强西班牙语语料库建设,利用语料库进行更多课堂教学研究,利用语料库研究成果进行教材编撰,加强利用语料库进行数据驱动学习的实践等。
三、语料库驱动学习应用路径
目前,语料库在外语教学中的应用成绩斐然,我国高校西班牙语教学也应当积极开展相关应用研究,以切实提高教学效率。下面,我们利用目前主流的西班牙语网络语料库资源,探讨其教学应用的路径。随着语料库语言学的迅速发展,西班牙语国家也相继建成了各种类型与规模的语料库,为语言教学和研究提供了丰富素材。其中,影响较大的语料库有西班牙皇家语言学院推出的一系列语料库:Corpus de Referencia del Espa?觡ol Actual (CREA), Corpus del Espa?觡ol del Siglo XXI (CORPES XXI), Corpus Diacrónico del Espa?觡ol (CORDE),以及Corpus del Espa?觡ol de Mark Davies(CdE)等。
以高校西班牙语专业核心课程基础西班牙语为例,该课程内容包括西班牙语发音、口语和书面语的常用词汇用法、语法、句法规则,还有习惯用语以及交际规范等。在教学实践过程中,语料库应用更多体现在词汇和语法教学方面。
在进行词汇教学时,在线语料库平台可以提供丰富的数据资源。如通过在CdE语料库搭配检索界面,分别检索各种词类搭配,就可以在检索结果页面,呈现其典型搭配用法,并了解其语义韵。从而使学生形成词汇网络的概念,而非孤立的单个词汇,对于学生高效掌握词汇常见用法很有帮助。同时,CdE语料库索引行(KWIC)提供大量语言实例,并对不同词性进行了颜色区分,大量类似结构的高频重复,便于学习者迅速观察归纳词汇典型用法和句法结构特征等。
在近义词教学中,通过在语料库对近义词进行检索统计,可以发现在语域、搭配、类联接或语义韵等方面的差异。同样,CdE语料库的对比(Compare)功能,可直观展现词汇搭配频率差异,进而更好地辨析近义词。短语教学的痛点在于各类词典都无法提供详细讲解与示例,而语料库则弥补该不足,提供更多高质量的实例。在CORPES XXI语料库不仅显示索引行,还可以展示示例的完整文本信息。西班牙语国家众多,各国词汇用法多有不同。语料库还可以提供词汇语域分布信息。通过在CORPES XXI语料库检索词汇的使用国家分布,图表可直观展现地域使用差异。语义韵是词汇意义的重要内容,也是长期外语教学中被忽视的地方。利用语料库技术,教师可以向学生介绍并强调语义韵的重要价值,从而让学生能够正确理解和使用词汇。
传统的语法教学中,难免会碰到教材没有详尽说明、教师讲解不透彻的情况,教条机械的语法条文因缺乏大量实例使学生无法掌握相应的语用知识。此时语料库可发挥其作用,提供海量资源,实际应用频率等语用信息,弥补传统教材的缺憾。例如,中国学生受到词汇语义影响,较难认知状态动词(如ser “是”)的完成体时态(例如简单过去时)用法,且误认为其未完成体时态(如过去未完成时)会更为常见。而将语料库应用到语法学习中,学习者可以通过语料库可靠、全面的统计,获得更准确的语用认知。根据CORPES XXI语料库检索结果,ser的过去未完成时的记录共643272条,而简单过去时的记录却多达702031条。以上两种用法的使用记录可以纠正学生的错误认知,语料库的语言事实帮助师生解决语法教学中的难点。
四、结束语
在大数据和信息网络迅猛发展的时代背景下,外语学习应当摆脱时间和空间的物理限制,教师要充分利用互联网和语料库数据等各种资源,支持并推动外语教学向着自主化方向不断发展。目前,语料库数据驱动学习在高校西班牙语专业教学中的应用尚处于初期,教师对各种网络语料库的熟悉和了解尚处于摸索阶段。面对日新月异的科技发展对语言教学的赋能,高校西班牙语教师至少可以在以下几个方面加强DDL教学的研究与实践:首先,持续跟踪国内外西班牙语网络语料库和语料库软件的建设更新情况,及时了解学习,并应用于课堂教学。其次,不断拓展语料库资源在不同课型中的实践应用和推广,以期全面提高语言教学效率。最后,充分利用语料库资源,结合中国学生的习得特点,进行教材编写,设计出更符合客观语言实际的教材。
参考文献:
[1]Johnst, Kingp. Classroom Concordancing. English Language Research Journal (New Series) 4. Special Issue[C]. Birmingham: University of Birmingham,1991.
[2]王翊,张瑞娥,韩名利.国内语料库外语教学研究二十年(2000-2020):基于CSSCI 来源期刊的文献计量分析[J]. 重庆第二师范学院学报,2022 (4): 119-128.
[3]Hunston, S. & Francis, G. Pattern Grammar: A Corpus-Driven Approach to the Lexical Grammar of English [M]. Amsterdam: John Benjamins, 2000.
[4]濮建忠.英语词汇教学中的类联接、搭配及词块[J].外语教学与研究,2003(6):438-445.
[5]桂诗春,冯志伟,杨惠中,等.语料库语言学与中国外语教学[J].现代外语,2010(4):419-426.
[6]梁茂成.微型文本及其在外語教学中的应用[J].外语电化教学,2009(3):8-12.
[7]吴军.语料库与英语语法教学[J].外语学刊,2010(1):104-107.
◎编辑 王亚青