刘倬妤
(天津外国语大学滨海外事学院,天津 300204)
语料库(corpus lingüístico)是一个在真实情况下生成的大量具有代表性的文本,经过明确的语言标准筛选后,由计算机进行数据处理的资料库。语料库的使用由来已久,可以追溯到19 世纪末,ALF(Atlas Linguistique de la France)率先以数据为依托,对法国境内的语言使用情况进行全面细致的分析,西班牙对于语料库的建立始于1931年[1]。但这段时期建立的语料库,都是人工进行数据处理分析,我们称之为传统语料库。广义上来说,我国传统意义上的语料库的建立可以追溯到周代、秦代——《輶轩使者绝代语释别国方言》。近现代第一部教学目的而创立的语料库则诞生于1928年陈鹤琴《语体文应用字汇》。自从M.Baker 将语料库引入翻译研究,语料库就广泛应用于词典编撰、语法描述、二语习得、文学研究及翻译研究等领域;相对于西方,我国的语料库语言学研究起步较晚,始于80年代上海交通大学科技英语计算机语料库——JDEST。目前,针对西班牙语研究最著名的语料库是由西班牙皇家语言学院在1975年创建的CREA[2](El corpus de Referencia del Espa ñol Actual)语料库,由写作语料库和口语语料库两个部分组成。目前,西班牙很多高校已经开始组建针对不同研究方向的语料库,例如:圣地亚哥德孔波大学(Universidad de Santiago de Compostela)建立了口语语料库,旨在研究第二外语学生与本国学生在口语表达的差异,以及对词汇的使用习惯和母语对西班牙语学习的影响。该文使用的语料库为CINEAS[3](Corpus de Interlengua Española de Aprendices Sinohablantes) 由西班牙莱里达大学LECEL (Lenguas en contacto y Enseñanza de lenguas)团队创立,旨在通过对语料库中的大量文本数据进行分析,找出中国学生在西班牙语学习过程中的难点、疑点,从而帮助教师了解学生对知识的掌握情况,在今后的教学中优化教学方法、提高教学效率。截止到2019年10月底,CINEAS 数据库共收录了2 598 篇文本,共计286 112个单词(数量仍在持续增加中)。依据MECR (欧洲语言共同体框架)[4],分为A1、A2、B1、B2 4个等级。
从外语教学的起步到20 世纪中叶,教师和学生一直通过“文法翻译法”来进行语言的传授和学习,但是通过这种方法,学生并不能准确的使用和掌握这门语言。教学的目的不仅是获得语法知识,而是通过学习能对语言进行灵活的运用和表达。直到20 世纪60年代末,世界上的外语教学领域开始研究语法和语言学习的关系,并认为教学的目的在于提高学生的交际能力,开始了从语法知识向语言技能传授的转变。因此可以通过听、读、说、写4 种方式来鉴别语言的能力。我们也可以将其分为两大类,接受能力(听、读)和输出能力(说、写)。当然,语法也十分重要,对于文本的生成和理解都至关重要。研究表明,接受过系统教育的学习者比自学者的语法能力更强,但是教师的指导并不能保证学生能够掌握所有的知识,结果表明受到过教育的学习者会比自学者进步更快,能力更强,水平更高。CINEAS 语料库中的文本,都是学生对于自己知识掌握的输出,有助于研究者准确地掌握第一手资料[5]。
西班牙语中词语的类型和变化种类繁多,虽然西班牙语中副词数量十分巨大,出现的频率也很高,但是由于它在使用过程中的不需要发生变化,会忽略对它的研究。因此如今国内学界有关西班牙语副词研究并不深入;此外,教材中对于副词的用法的讲解也是简略且分散的,不利于学生系统性的掌握副词的用法和特点。在西班牙语中副词的用法大致分为3 类:(1)与动词连用做景况补语;(2)修饰形容词或副词;(3)修饰整个句子。西班牙语副词的3个特点:(1)都有重音(除tan 和连接词donde,cuando,como,cuanto,cual 以外);(2)无词形的变化;(3)有自己独特的含义。
相较于西班牙语来说,汉语中副词的用法则更为灵活。汉语中副词可以修饰名词,但是这种现象在西班牙语中是不存在的,所以学生在使用习得语言的过程中,或多或少会受到母语的影响[6]。在汉语中将副词定义为修饰、限定动词或形容词,表示程度、范围、时间、情态、语气等的词。汉语中副词的语法特征:(1)副词都能作状语;(2)副词一般不能单独使用;(3)部分副词能兼有关联作用。副词的作用在西班牙语和汉语中类似,但是从数量上来说,西班牙语中副词数量更多。从使用方法看,两者基本一致,但是略有不同:(1)西班牙语少量副词可以修饰名词(如副词NO:la no resistencia,la no intervención);(2)西班牙语中副词可以修饰副词;(3)汉语副词一般不受其他词类修饰,也不同介词结合;(4)汉语绝大多数副词只能作状语,只有个别程度副词可作补语。西班牙语副词主要充当景况补语、形容词补语和副词补语。综上所述,二者之间还是存在差别,在一定程度上会影响到学生的语言学习[7]。此外,在同样含义的词语,在汉西两种语言中的词性不同,汉语中用名词表示时间,西语则用副词; 汉语中的表示时间、地点、方式等的代词,在西语中也被看作副词。在副词的分类中,汉语中主要按照其功能进行划分,目前影响比较大的是胡裕树(1979)、黄伯荣、廖序东(1991)、北大中文系(1991),将汉语的副词分为6类。西班牙语中副词的分类更加复杂,西班牙皇家语言学院(2009)提出4 种分类方法,分别为形态结构(estructura morfológica)、含义(significado)、语法功能(naturaleza gramatical) 和句法的关联性(incidencia sintácticañ)。
该次研究以语言等级为准,随机抽取CINEAS数据库中的样本,每个等级120 份,共计480 份。在随机抽取的480 份样本中,共出现了245个副词和副词短语,其中A1:83,A2:52,B1:50,B2:60 (以单词或短语第一次出现的等级为准)。其中出现频率最高的10个单词和短语 (见表1),由此我们可以看出,muy 出现次数最多为592 次,每位学生平均使用1.23 次,前10 名中只出现了一个短语por eso。连接词的使用频率也很高,分别是第三名的cuando 和第五名的como,说明学生会经常使用时间状语从句和方式状语从句[8]。
表1 CINEAS 数据库副词高频词汇表
下面我们以también 为例,在全部的480 份问卷中,该词共出现156 次(见图1)。通过分析可以得出结论,también 是A1 级的词汇,但是B1 级别的同学却使用的最多,几乎占到了一半,根据此线索,教师可以进行分析产生这种现象的原因,掌握学生对词语的使用习惯[9]。此外我们还可以进行近义词比较,我们可以比较también 与其近义词igualmente,además ,incluso 和aun 出现的频率(见图2):5个近义词中,además 和también 从A1—B2 均有使用,频率也最高,其中B1 使用次数最多;aun 和incluso 首次出现于A2,但是aun 总共出现了两次,A2,B1 每个级别一次,但是incluso 则出现在了A2—B2 的各个级别,而且出现次数呈上升的趋势;Igualmente 只在B1 出现了一次。了解学生的词语使用习惯,有助于优化表达方式,尽量避免词汇的重复,从语料库中发现问题找出更合适的表达方式,区分词语的典型用法和非典型用法,从而提高写作的质量[10]。
图1 También 出现次数变化图
图2 CINEAS 数据库副词近义词出现次数对比图(以También 为例)
此外,我们还可以通过语料库进行错误分析,首先找出错误进行标记,检索错误出现的次数,进行错误分析。分析错误的过程需要我们了解学生使用语言的背景,语料库作为一种工具协助教学,帮助学生通过对比分析,强化语法概念,正确、恰当地使用副词,提升写作的流畅度。语料库不仅能应用于课堂教学,还可以作为语言测试的资料来源,为测试题目的设置提供材料; 此外还可以通过语料库来比较母语学习者和非母语学习者,或是不同国家的非母语学习者的词语使用习惯和差别。语料库依托于现代科学技术来对语言进行对比分析研究,透过科技的便捷性,将研究结果与教学实践相结合,开辟出一条有别于传统教学方法的新路子。