中国德语学习者对情态动词konnen的使用情况研究

2019-03-18 11:50齐冬冬
教育教学论坛 2019年7期
关键词:语料库

齐冬冬

摘要:konnen是德语中最重要、使用最频繁的情态动词之一。掌握情态动词包括掌握其变位形式和语义表达。情态动词的语义体现为它们所能表达的情态,一般区分客观情态和主观情态。本文基于中国德语学习者语料、外国德语学习者语料和德语母语者语料库,对比考察了他们对该词的使用情况,以期发现中国德语学习者的特点。

关键词:情态动词;学习者语言;语料库

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2019)07-0189-02

一、引言

情态动词的学习在德语教学中一直是一项非常重要的语法内容。德语学习者主要通过教材、阅读材料或者外教接触德语。由于学习者所处的环境以及本身的文化思维影响,学习者语言和目的语之间必然存在很大的区别。那么就情态动词的使用情况而言,德语学习者和德语母语者到底存在什么样的区别呢?造成这些区别的可能因素有哪些呢?语料库研究实际应用中的语言,能较客观地反映语言在现实生活中的使用情况。本论文用语料库语言学的研究方法对德语中最重要和使用频率较高的情态动词之一“konnen”进行研究,以期发现中国德语学习者与外国德语学习者及德语母语者在konnen的使用上存在什么区别。

二、语料选择

本论文的研究语料来源于两个学习者语料库。第一个语料库是中国德语专业大学生撰写的作文,选取自“中国德语专业大学生中介语语料库”,这是中国第一个针对德语学习者语言建设的语料库,由北京外国语大学德语系主持建设。这个语料库包括两个部分,其中一部分收录的是学生在学期考试中的作文,第二部分是中国德语专业四级考试的作文部分。考虑到篇章类别的一致性,本论文选取了第一部分语料。第二个语料库是德国柏林错误标注学习者语料库(德语全称为Das fehlerannotierte Lernerkorpus,简称为Falko)。它也有两个组成部分。一部分收录的是以德语为外语的学习者语料,其中大部分学习者都来自欧洲,另一部分是母语语料,即德语母语者撰写的作文。我们选择两个语料库中都包含的论证型篇章。这样可以提取得到三组语料:以德语作为外语的中国学习者语料(记为CL),约包括25885词次;以德语作为外语的外国学习者语料(记为FL),约包括65387词次;德语母语者语料(记为FM),约包括33806词次。

三、理论基础和研究问题

Konnen是德语中最重要、使用最频繁的情态动词之一。要正确地掌握情态动词,首先必须掌握情态动词的变位形式,其次便是要掌握情态动词所能表达的语义。变位形式比较容易掌握,学生只需要记住就可以了。相比较而言,语义就要复杂一些了。情态动词的语义体现为它们所能表达的情态。传统的语法对情态动词所能表达的情态作了区分,情态动词能够表达客观情态和主观情态,也称为客观用法和主观用法。客观情态是指句子主语和不定式动词表达的动作之间的关系。而主观情态表达的是说话者对句子所陈述的命题的态度,通常是对该命题真实性的猜测。konnen的客观用法能够表达三种意义,即可能性,能力和允许。首先,konnen表达一种由客观条件决定的可能性。如...,dass die Frauen selbst in der Sprache keine Gleichberechtigung finden konnen.(女性即便在语言中也找不到平等。例句均出自本文所选的三组语料。)第二,konnen表达一种由主语自身决定的可能性,也就是主语自身的能力,可以是生理、精神或心理上的能力,如Alle Studenten konnen sich das Ticket leisten.(所有的学生都能负担得起车票。)第三,表示允许,在这个义项中,konnen与德语中另外一个情态动词dürfen的意义相近,经常在口语中使用,来表达某人在另外一个人或机关的允许下可以做某事,如...,noch konnten sie (Frauen) sich an dem politischen Leben des monnlichen Bürgertums beteiligen.(她们也不能参与男性公民的政治生活。)

Konnen的主观用法就是表达猜测了,例如Das kann innerhalb weniger Wochen passieren.(这有可能在几周之内发生。)

我们选取的三组语料的生产者分别是中国德语学习者、外国(大部分为欧洲国家)德语学习者和德语母语者。于是我们可以做一个假设:学习者和母语之间,即便是不同的学习者群体之间,在情态动词的使用方面会存在差异。从这个假设出发,本论文尝试回答的问题是:中国德语学习者、外国德语学习者和德语母语者在使用情态动词konnen表达语义方面有什么差别?如果存在差别,这些差别是否存在显著性?

四、研究方法

第一步,提取含有情态动词konnen的句子。对于外国学习者和德语母语者语料而言,这一步比较容易操作,只需要在Falko的检索网页https://korpling.german.hu-berlin.de/cqpwi/login.php中,输入检索问题“[lemma=”konnen“]”(表示以konnen为动词原形的词)就可以得到所有含有konnen的句子,然后将检索结果存为纯文本形式,进行一些删除空行和多余字符的处理,使文本变得干净整洁,便于后面的标注。

对于中国学习者语料而言,由于中国德语专业大学生中介语语料库没有经过词目处理,所以不能直接使用单词的原形形式进行搜索。但是该库进行了词性标注处理,可以在词性标注的版本中,使用检索软件AntConc通过检索问题“\w+_VM\w+”可以使软件显示出所有含有情态动词的句子,然后用“sort”功能对检索行进行排序,便可以使包含konnen一词的句子排列在一起,這样便可以将这些句子单独粘贴到一个纯文本文件中,然后再使用文本编辑软件对文本进行一些调整,使得文本变得清晰易读。

第二步,对文本中的句子进行语义判断,进行手工标注。首先我们给konnen一词所能表达的语义设置一套编码,便于进行手工标注,针对客观用法中的可能性标记为KMOM,能力标记为KMOF,允许标记为KMOE,主观用法标记为KMS。我们要人工阅读每个文档中的所有句子,根据语境判断konnen所表达的语义义项,并且根据上面的编码进行赋码,这样我们得到的文件如下面所示:...,dass die Frauen selbst in der Sprache keine Gleichberechtigung finden konnen....,die keinen Beitrag in welcher Art auch immer leisten konnen,...

第三步,检索并进行检测。我们还是使用AntConc对标注过的文本进行检索,同时使用数据处理软件R[1]对所获得的数据进行显著性检测。首先我们看一下konnen一词的总体使用情况。FM的语料规模为33 806词次,konnen出现285次;FL包括65387词次,konnen出现621次;CL包含25885词次,konnen出现548次。如果以25000为基数做标准化处理,三个语料库中konnen出现频率依次为210、237/529。可以看到,中国学习者和外国学习者使用konnen一词的频率均要比母语者使用konnen的频率高,但是这种差别有没有显著性呢?我们使用数据处理软件R来对数据进行检测,得出的结果如下:FM-FL:p=0.1012;FM-CL:p<2.2e-16;FL-CL:p<2.2e-16。按照惯例,使用R进行数据检测时的参照值为0.05。这样,上面的数据表示的意义为,外语学习者和母语者在konnen一次的使用频率方面无明显差异;中国学习者使用konnen的情况与德语母语者和外国学习者比较起来都是显著的,即中国学习者对konnen存在过度使用的情况。那么具体到每一种语义义项,三组语料的情况又如何呢?

下面具体来看一下三组语料对每一种语义义项的使用情况。首先,我们来看客观用法中的可能性义项,按照上面的步骤,我们分别先检索出三组语料中的相应数据,然后对数据进行标准化处理,从而可以直观地看到三组数据之间的差别,最后进行数据之间的显著性检测,判断差别是否具有显著性。针对可能性义项,我们得到的数据是FM中konnen总体出现频次为285次,其中可能性义项有169次,FL的621次konnen中有433个表达了可能性,CL的548个konnen里427个表示可能性。数据显著性差异的检测结果为:FM-FL:p=0.002604;FM-CL:p=2.541e-08;FL-CL:p=0.001911。

根据这组数据,我们得到的结论是:针对客观用法中的可能性义项,两组学习者与德语母语者比较起来都存在过度使用的情况,差异显著,中国学习者的过度使用情况更为严重。

第二,针对客观用法中的能力义项,得到的数据是FM中47个konnen表达了能力义项,FL中93个konnen是能力义项,CL中80个konnen属于能力义项。数据检测的结果为:FM-FL:p=0.6263;FM-CL:p=0.5357;FL-CL:p=0.9213。这组数据之间并不存在显著差异。

第三,针对客观用法中的允许义项,FM中19个konnen表达了允许义项,FL中27个表达了允许义项,CL中20个konnen是允许义项。数据检测的结果为:FM-FL:p=0.1891;FM-CL:p=0.07463;FL-CL:p=0.6475。同能力义项一样,数据检测结果也没有显示出显著差异。

第四,针对主观用法,也就是猜测义项,FM中49个konnen表达了猜测,FL中65个表达了猜测的意思,CL中18个konnen表达了猜测的意思。数据检测的结果为:FM-FL:p=0.006399;FM-CL:p=6.497e-12;FL-CL:p=3.203e-06。数据显示的结论是,两组学习者与母语者比较起来在使用konnen一词表达主观猜测时都有使用不足的现象,而中国学习者使用不足的情况更为严重。

最后,在标注过程中笔者发现,中国学生使用情态动词的虚拟形式的情况特别少,而德语母语者使用虚拟形式的情况相对很多,所以,笔者也特别对虚拟形式作了标记,最终统计得出,FM中46个konnen用了虚拟式形式,FL中78个konnen是虚拟式形式,CL中只有两个konnen的虚拟式形式。数据检测的结果为:FM-FL:p=0.1765;FM-CL:p<2.2e-16;FL-CL:p=4.475e-16。这表明,中国学生在使用konnen的虚拟形式方面存在严重不足,而外国学习者和德语母语者在该方面没有显著差异。

五、结语

本论文得出的结论如下:中国德语学习者对konnen一词存在过度使用现象。在客观用法的可能性义项中,中国学习者和外国学习者均存在过度使用现象,中国学习者更为严重。中国学习者和外国学习者在konnen的主观用法方面都存在使用不足现象,中国学习者使用不足的现象更为明显。在使用konnen的虚拟形式方面,中国学习者较之德语母语者和外国学习者都存在显著的使用不足,而外国学习者和德语母语者之间在该方面没有显著性差异。

当然,本论文只是将研究的数据结果呈现出来,更为重要的是要对造成这些差异的原因进行探讨。一个可能的原因是,汉语和德语的差别确实对中国学习者学习德语有很大的影响。在konnen的使用方面外国学习者与德语母语者的差别要比中国学习者与德语母语者的差别小,原因可能在于這些学习者的母语都是欧洲国家语言,它们与德语的差异不像汉语与德语的差异那样大,例如汉语是孤立语,虚拟式不体现在词形变化上,这一点可能影响了中国学习者对虚拟式形式的掌握和运用情况,而欧洲语言多为屈折语,可能外国学习者更容易接受词形的变化。

本研究也还有待继续深入,例如中国学习者语料的生产者学习德语的时间还不长,处于基础学习阶段,所以可能致使与母语语料的差异较大,针对这一点不足,可以等中国德语专业大学生中介语语料库也收录进高年级学习阶段的语料时再做一次研究,观察随着德语学习时间的增长,学习者对konnen的使用情况有无改变。

参考文献:

[1]Gerhard Helbig/Joachim Buscha,Deutsche Grammatik:ein Handbuch für den Ausl?覿nderunterricht.[M] Berlin/München:Langenscheidt,2001.117-121.

[2]Gries,Stefan Th.Statistik für Sprachwissenschaftler.[M] Gottingen:Vandenhoeck & Ruprecht,2008.63-102.

猜你喜欢
语料库
《语料库翻译文体学》评介
基于语料库的“はずだ”语义用法分析
基于语料库“隐秘”的词类标注初步探究
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
语篇元功能的语料库支撑范式介入
基于英汉双语平行语料库的无根回译研究
基于语料库的近义词辨析研究——以suspect和doubt为例
低碳经济英语语料库建设与应用
基于网络语料库的“给力”研究