张志新
大学英语学习者中介语搭配特征研究
张志新
以往不少研究认为,创造性是中介语的重要特征。以COLEC和LOCNESS两个语料库为基础,通过对比分析的方法,考察中国大学英语学习者中介语搭配特征,可以从实证的角度验证前述观点。研究发现中国大学英语学习者中介语搭配总体上呈现出常规化和趋同化特征,而且词语搭配范围也明显变窄,表现出较强的保守性,并不支持中介语具有较强创造性的观点。
语料库;COLEC;LOCNESS;中介语搭配特征
中介语首先由美国语言学家L.Selinker等人提出,指学习者在二语习得的过程中形成的既“区别于自己本族语,又不同于所学目的语的过渡性语言”[1]。由于“学习者在第二语言或外语学习过程中,并不完全按照本族语的语法规则,也不硬套目的语的语法规则,而是创造性的使用学习者语言所独有的语言系统”[2],因此不少学者认为,“创造性是中介语的重要特征”[1]。针对这一观点,本文拟以语料库为基础,从中国大学英语学习者中介语搭配特征角度来加以验证,以期对大学英语教学和研究有所启发。
中介语的创造性意味着学习者的语言在语法型式上具有非典型性,这是“创造性”的天然内涵。同时,由许多个中介语文本组成的语料库必然意味着更多个性化的非典型语言运用可以得到体现,即中介语语料库中的文本在语法型式上具有较强的多样性特征,这是“创造性”的合理衍生。而词语搭配是一种重要的语法型式,因此通过考察中介语的搭配是否具有多样性和非典型性,可以验证有关中介语具有创造性特征的观点。鉴于此,本文试图通过研究回答以下问题:(1)相对于英语本族语学习者的词语搭配行为,中国大学英语学习者在其中介语文本中的词语搭配行为是否表现出范围扩大的趋势;(2)相对于英语本族语学习者的词语搭配行为,中国大学英语学习者在其中介语文本中的语言运用行为是否体现出较多的创造性搭配;(3)相对于英语本族语学习者的词语搭配行为,中国大学英语学习者在其中介语文本中的词语搭配行为是否具有多样性的特征。
为了解决上述研究问题,本研究首先确定以LOCNESS为参照语料库,以中国大学英语学习者语料库(COLEC)为待考察的中介语语料库,通过对比分析的方法,对COLEC中的节点词搭配特征进行分析研究,以验证其是否呈现出较强的创造性特征。LOCNESS所选语料均来自美国大学生,学生全部是成年英语本族语者,作文的体裁都是议论文,涉及的主题包括环境、健康、经济等议题。而COLEC中的语料均选自大学英语四六级作文,体裁也主要是议论文,涉及的主题同样包含环境、健康等议题。因此,二者具有较好的可比性。由于LOCNESS和COLEC两个语料库均经过标注,而标注的标准却不统一,因此本研究的第二步就是利用软件PowerGREP 4.0,通过正则表达式对语料库中的文本进行清洁还原。
在准备好语料库后,第三步就涉及选取具体的节点词。在词语搭配研究中,“实词处于中心的地位;在动词、名词、形容词和副词这四类实词中,名词具有很高的搭配能力”[3]。因此本研究确定以名词为节点词。为了便于研究,在综合考虑了所用语料库的规模、研究对象的可比性以及前人的做法之后,我们进一步确定了节点词使用频率不低于100以及同一节点词在两个语料库中的使用频率差不超过30的具体标准。按照前述三个标准,我们最终选取了五个节点词,具体情况如表1所示:
表1 具体节点词使用频率对比
确定好具体的节点词后,第四步就是要通过BFSU_Collocator_1.0软件进行自动提取,并结合人工排除的方法从语料库中筛选并统计出各个节点词的有效搭配词。根据前人的研究经验,我们在提取搭配词时,将跨距设定为4:4。在认定搭配词时,我们遵照两个标准:“其一,相关词项必须处于同一语法结构中;其二,相关词项的共现频率必须达到显著程度”[4]。认定词项间的共现是否达到显著程度有多种方法,“互信息3值(MI3)体现的是节点词和搭配词之间的相互吸引关系,同时可以有效降低低频词在计算中的权重,规避了经典互信息算法的弊端”[5]。鉴于MI3算法的优势,结合本研究中涉及的语料库特点,我们决定运用该方法来判定节点词与搭配词之间搭配强度。
下面是所选五个节点词在两个语料库中的搭配特征的对比情况,以及这种发现对我们所要研究的三个问题的验证情况。
研究问题I:相对于英语本族语学习者的词语搭配行为,中国大学英语学习者在其中介语文本中的词语搭配行为是否表现出范围扩大的趋势。即相对于英语本族语学习者语料库中作文文本的搭配词数目,同一节点词在中国大学英语学习者作文文本中的搭配词数目是否比较多。
为了尽可能地保证数据的准确性,我们先一个距位一个距位地通过软件自动提取相应节点词的搭配词,进而根据MI3值和语法限制关系两个具体的标准,及时地通过人工方法排除掉不合格的结果。最后,再对8个距位(即4:4)上的有效搭配词汇总合并。为了便于比较,我们对从两个语料库中提取到的有效搭配词的数目做了标准化处理。综合起来,五个节点词的有效搭配词数目对比情况如图1所示:
图1 节点词有效搭配词数目对比折线图
从图中可以清晰地看出,五个节点词在中国大学英语学习者语料库中的搭配词数量,均高于其在鲁汶本族语学习者语料库中的搭配词数量。为了进一步确定这五个节点词在两个语料库中的搭配词统计数据是否具有显著性差异,我们通过卡方检验对其进行分析,具体情况如表2:
表2 节点词标准化的有效搭配词数目差异显著性检验
从表中可以看出,五个节点词在鲁汶本族语学习者语料库中的搭配词数目均显著高于其在中国大学英语学习者语料库中的搭配词数目。也就是说,与本族语学习者语言相比,中国大学英语学习者中介语的词语搭配并没有表现出较强的创造性,其范围不但没有变大,反而明显变窄,呈现出保守的特点。
研究问题II:相对于鲁汶本族语学习者语料库中的作文文本,中国大学英语学习者作文文本中是否出现较多的创造性搭配,即相对于英语本族语学习者语料库中作文文本的搭配型式,同一节点词在中国大学英语学习者作文文本中的搭配方式是否更能够体现学习者对目标语言的创造性运用及由此而产生的独特的语言搭配模式。
所谓的创造性搭配,有两层含义。第一层含义是指非典型搭配,即搭配词不是基本意义上的运用,而是与节点词形成异常性的组合。异常组合在本研究中指的是在中介语文本中体现出来的,不符合目标语言搭配常规的现象。第二层含义是指修辞性搭配,即搭配词在修辞意义上与节点词形成组合,例如fuel his anger。
为了判断五个节点词是否具有较多的非典型搭配,我们首先需要利用BFSU_Collocator软件提取和统计出节点词在相应跨距内(即4:4距位内)的搭配词,进而通过观察关键词索引行对软件自动提取到的数据进行必要的补充和修正。经考察,五个节点词在COLEC语料库中仅拥有很少几个修辞性的和异常性的搭配,并不具有统计学上的意义。
有趣的是,虽然实际发现没能证明在中介语语料库即COLEC中,节点词的搭配具有明显的非典型特征,却能够证明所选节点词的搭配行为主要表现为基本意义上的典型搭配,而且这些搭配词在节点词的有效搭配范围中占有较大比例,具有显著的趋同性,即与英语本族语学习者相比,中国大学英语学习者倾向于为给定节点词选择相同或者类似的搭配词,并没有彰显出明显的创造性。例如,在COLEC中,与government搭配频率最高的有情态动词(should/must)、定冠词(the)以及形容词性物主代词(our),具体的显著搭配结构表现为the/our+government+should/must+do。我们的统计数据显示:在COLEC中,在L1距位上,the的使用频率占该距位上有效搭配行为总数的65.61%;在R1距位上,should与must出现的频率占该距位上有效搭配行为总数的43.45%。相比之下,在LOCNESS中,对应的数据分别为34. 18%和1.7%,差距非常明显。再如,与parent搭配频率最高的几个词为my/our/his/their/your等。经统计,在COLEC中,在L1距位上,这几个形容词性物主代词的总计使用频率占该距位上有效搭配行为总数的58.10%。然而,在LOCNESS语料库的L1距位上,它们所占的比例仅为1%。类似的状况在end和fact等节点词的搭配行为中同样得到了体现:与end搭配频率最高是介词(in/at/by/to),其中出现最为频繁的结构为in the end,在end一词的有效搭配行为中所占比例高达50.86%,而同样的搭配行为在LOCNESS中所占比例不足8.1%;与fact搭配频率最高的则是介词(in),具体的搭配行为表现为in fact,出现频率占fact一词使用总频率的76.76%,而同样的搭配结构在LOCNESS中所占比例仅为28.57%。我们可以借助图2将前述对比情况更加直观地表现出来:
图2 COLEC中的趋同搭配词使用比例对比折线图
尽管前面的统计数据和图表均显示,五个节点词在特定搭配词的使用方面具有明显的差异,但由于这种比较涉及两个语料库,而两个语料库在规模上存在差别,因此我们仍然有必要通过卡方检验,以进一步确定这些搭配词在使用频率上的差异程度。检验结果显示,上述几组统计数据存在显著性差异,节点词在中国大学英语学习者语料库中的搭配行为表现出较为明显的趋同性。具体卡方值如表3所示:
表3 COLEC中的趋同搭配词使用比例差异显著性检验
研究问题III:相对于英语本族语学习者的词语搭配行为,中国大学英语学习者在其中介语文本中的词语搭配行为是否具有多样性的特征,即相对于英语本族语学习者语料库中作文文本的搭配行为,同一节点词在中国大学英语学习者作文文本中的搭配词是否更多地表现为实词,而且实词搭配词的使用密度较高。
中介语中的创造性搭配体现的是语言学者在搭配型式上的独特性。功能词或者语法词的行为具有较好的稳定性和可预测性,不能有效地体现学习者语言系统的独有特征。而实词的组合行为则可以从语义和语法两个方面体现语言学习者独有的概念化方式,能够较为有效地说明其语言系统是否具有独创性。中介语语料库作为众多语言学习者的文本集合,理应体现出较强的多样性特征。
我们可以通过考察语料库节点词的实词搭配词密度来判断中介语语料库在语法型式方面是否具备多样性特征。实词搭配词密度是由词汇密度演化而来的概念,指经过标准化处理的节点词的实词搭配词数量同节点词搭配词总量之间的比值。我们首先用Treetagger软件对经过清洁化处理的COLEC与LOCNESS两个语料库进行统一的词性赋码,然后再利用正则表达式通过Power-GREP 4.0来统计节点词在两个语料库中的实词搭配词。最后还要对统计到的数据经行标注化处理,最终结果如表4所示:
表4 节点词实词搭配词密度对比
从上表可以看出,节点词在LOCNESS中的实词搭配词密度均高于相同节点词在COLEC中的实词搭配词密度。而且除了节点词parent的实词搭配词密度差较小外,其余四个节点的实词搭配词密度均呈现出明显的差距。这说明与英语本族语学习者相比,中国大学英语学习者较少运用更能体现学习者个性化思维的实词搭配词,而较多运用意义比较固定的功能词。
综合起来看,与英语本族语学习者相比,中国大学英语学习者的中介语搭配在范围上体现出缩小的趋势,所选搭配词多倾向于基本词义的运用,而且多数学习主体在为节点词选择搭配词时,表现出较明显的趋同性,同时实词搭配词的使用数量明显低于本族语学习者。这说明中国大学英语学习者在中介语词语搭配方面并没有体现出较强的创造力。之所以出现这样的状况,文化差异自然是一个重要的原因。例如,中国文化强调集体主义,而西方文化则更多地崇尚个人主义。而这种意识形态上的差异就可以较好地解释为什么在COLEC中出现了大量的our parents这种搭配,但是在LOCNESS中,这种搭配型式的出现频率却显著低于前者。除了文化因素,纠错式的教学和应试思维也极可能抑制了学生在语言运用方面的创造力。在纠错式教学的影响下,学生害怕出错,在语言运用方面就会更加小心翼翼,从而表现出较强的保守性。同时,为了满足应试需求,市场上泛滥起各种各样的英文写作模板。这些模板的存在无疑加剧了学生在语言运用上的趋同性,进一步影响到其在语言使用方面的创造活力。
[1]蒋德红.第二语言习得研究综观[J].安徽大学学报(哲学社会科学版),2003,27(1):109-112.
[2]李炯英.中介语石化现象研究30年综观[J].国外外语教学,2003(4):19-23.
[3]武光军,王克非.基于英语类比语料库的翻译文本中的搭配特征研究[J].中国外语,2011,8(5):40-47.
[4]杨恵中.语料库语言学导论[M].上海:上海外语教育出版社,2002:91-103.
[5]梁茂成,李文中.语料库应用教程[M].北京:外语教学与研究出版社,2011:95-97.
A Research on the Collocational Features of College English Learners'Interlanguage
Zhang Zhixin
Quite a few studies in the past proposed that creativity marks an important feature of interlanguage.Based COLEC and LOCNESS corpuses,this paper contrastively researches into the collocational features of college English learners'interlanguage in an effort to empirically test the validity of such a proposal.Findings show that college English learners'interlanguage overtly displays a trend of conventionalization and generalization and its collocation range tends to narrow.This suggests a fairly obvious tendency towards conservativeness and thereby fails to back up the argument for creativity features.
corpus;COLEC;LOCNESS;collocational features of interlanguage
李应青
H030
A
1673-1794(2014)03-0022-04
张志新,安徽财经大学外国语学院讲师,研究方向:语料库语言学与翻译学(安徽蚌埠233030)。
安徽省教育厅人文社科项目(SK2013B022);安徽财经大学科学研究基金资助项目(ACKY1357)
2013-12-09