基于语料库的英语写作中的连词使用研究

2023-12-25 01:47李浩
校园英语·上旬 2023年4期
关键词:英语写作语料库

摘 要:本研究通过比较两组语料库the Ten-thousand English Compositions of Chinese Learners (the TECCL Corpus) 和the Louvain Corpus of National English Essays (LOCNESS)中的数据,分析了中文母语英语学习者和英文母语學生英语写作中连词使用的异同,为连词使用和写作教学提供建议。结果表明,中文母语英语学习者与英文母语学生的连接词使用量和趋势相当,尽管两个语料库中连接词的使用分布存在差异。研究同时发现,连词的使用不足和过度问题显而易见。希望本研究能有助于提高教师和学习者对连词的正确使用的认识。

关键词:语料库;中文母语;英文母语;英语写作;连词使用比较

作者简介:李浩,泰山科技学院。

一、引言

本研究通过比较两组语料库数据分析了中文母语者英语学习和英文母语学生英语写作中连词使用的异同,为连词使用和写作教学提供建议。本文涉及的两组语料库分别为:the Ten-thousand English Compositions of Chinese Learners (the TECCL Corpus) 和the Louvain Corpus of National English Essays (LOCNESS)。

二、文献综述

(一)连词概述

Oxford Dictionary of English Grammar中将连词定义为用来连接单词、短语和句子的单词。Oxford Dictionary of English Grammar将连词分为两类:并列连词Coordinating conjunctions (coordinators)和从属连词Subordinating conjunctions (subordinators)。Coordinating conjunctions将语法地位同等的单元连接到一起,Coordinating conjunctions的例子有:and、but、nor、or、yet;Subordinating conjunctions将独立的两个分句结合到一起并且体现两个分句之间的关系,Subordinating conjunctions 的例子有:because、while、however等。两个以上的单词构成的连词被称作complex conjunctions,如as soon as、as if、even though。

The Oxford Companion to the English Language中有类似的定义,并且对Coordinating conjunctions和Subordinating conjunctions进行了更加清楚详细的解释。一个coordinator可以连接两个或者以上的分句;在不造成歧义的前提下,重复的subordinator可以被省略;使用coordinator的过程被称为coordinating。

(二)Cohesion和Coherence

Cohesion 是通过文本中词汇和语法形式体现的,Coherence 是文内含义之间的联系体现的。Coherence没有直观的标识,只通过含义体现连贯性,但是Cohesion必须通过文中单词和语法体现连贯性。Tanskanen 称Cohesion是体现在表面的,而Coherence是更深层次的,Coherence是读者和文本之间的对话。Coherence 和Cohesion并不相互排斥因为cohesion对读者和文本的对话同样有帮助

连词使用是提升文章语法连贯性的重要方法。但是,很多英语教师认为教会学生如何恰当地使用连词并不简单,比如,什么情况下必须使用连词,什么情况下连词是冗余的,如何使用不同的连词避免写作中用词的重复等。为此,本文作者提出以下两个研究问题:

中文母语英语学习者和英文母语学生的英文写作中使用特定连词的频率有何区别?

中文母语英语学习者的英文写作中是否存在过多或过少使用连词的情况?

三、研究过程

(一)语料库选用

研究数据来自两个语料库:the Ten-thousand English Compositions of Chinese Learners (the TECCL Corpus) 和 the Louvain Corpus of National English Essays (LOCNESS)。the Ten-thousand English Compositions of Chinese Learners (the TECCL Corpus) 由北京外国语大学提供;the Louvain Corpus of National English Essays (LOCNESS)由英国爱丁堡大学提供。

the TECCL Corpus由10000份中文母语英语学习者的写作内容构成,共计1817472字。最初,有10127篇文章收集自在线写作和评分系统,其中删除了由中文翻译为英文的文章,该语料库的最终版本含9865篇文章。

The Louvain Corpus of National English Essays (LOCNESS)是一个由英文母语者所写文章构成的语料库,其中60209字来自英国学生的A Level文章,95695字为英国大学生文章,168400字为美国大学生文章,总计324304字。

由于两个语料库字数的差别,本文研究了the TECCL Corpus语料库的前1160篇文章,共计223927字,以及整个LOCNESS语料库。

(二)研究设计

针对第一个研究问题,笔者使用the clusters and word list tool of AntConc计算了两个语料库中部分连词的使用频率。然后使用MS Office Excel计算了各个连词在各自语料库中所占总字数的百分比。

针对第二个研究问题,笔者使用了兰卡斯特大学提供的the Log-likelihood Calculator计算分析了两个语料库中各个连词使用频率的差异。若Log-likelihood 的值高于6.63,则说明两个语料库中连词使用的频率差异较大。使用差异最明显的连词后期将被单独分析。

四、研究结果

表1中内容为两个语料库中中文母语学习者和英文母语学生连词使用频率的差异。中文母语英语学习者和英文母语学生使用连词占整个语料库的百分比分别为1.824%和1.828%。使用频率总体上差异不大,中文母语英语学习者连词使用频率比英文母语学生低0.002%。

图1显示所选取的连词中,除also、but、yet、therefore外,中文母语英语学习者和英文母语学生使用频率相近,其中but使用频率差异最大。

图2显示中文母语英语学习者使用渐进连词(Progr-essive conjunction)的频率更高。图3显示中文母语学习者比英文母语学生更倾向使用nevertheless、on the other hand、on the contrary、instead和but。英文母语学生使用however和but的频率更高。

图4表明因果連词(Causal conjunctions)的使用频率,中文母语英语学习者更倾向使用thanks to、as a result、consequently。英文母语学生更倾向使用due to、because、thus、hence、therefore。

图5表明让步连词使用频率,中文母语英语学习者更倾向使用in spite of、admittedly,英文母语学生更倾向使用although、after all、though、despite。

表2显示的是两个语料库中连词使用频率的log-likelihood,该值显示出中文母语英语学习者和英文母语学生对于各个连词使用频率差异较大。其中,yet、therefore、but、due to的使用频率差异最为明显,他们的log-likelihood值分别为78.74-,62.43-,34.58+,33.14-,皆为很高的数值。

Table 2: Log-likelihood results

五、讨论

中文母语英语学习者和英文母语学生连词使用总体频率相当。研究表明,中文母语英语学习者能够较好地使用连词实现cohesion。

但是,本研究也发现中文母语英语学习者存在过多或者过少使用连词的情况,过度使用频率最高的五个连词是but、also、moreover、on the contrary、in addition,他们的log-likelihood值分别为34.58+、24.9+、23.42+、24.32+、16.96+。使用频率最低的五个连词为yet、therefore、due to、however、thus,他们的log-likelihood值分别为78.47-、62.43-、33.14-、25.47-、25.33-。log-likelihood值高于6.63则表明差异显著。过度使用和过少使用现象均较为明显。

六、教学启示

研究结果揭示了英语连词教学中存在的一些问题。足够的输入和明确的指导在英语教学中是很重要的。有限的语言输入和英语教学中缺乏明确的连词教学指导可能是中文母语英语学习者写作中连接词使用过度或不足的原因。

因此,教师应在课堂上给予学生更明确的指导,并创造机会让学生学习连词在语篇中的用法,如布置阅读任务、组织新闻阅读和分享活动等。

七、局限性

(一)研究重点的局限性

本研究仅关注中国英语学习者与英美本族语学生之间连接词使用频率的差异连接词的过度使用和使用不足情况。由于时间的限制和庞大的数据库,没有注意到连词的误用情况。

(二)数据的限制

这两个语料库的数据仅来自中小学和大学,没有收集其他来源的数据。因此,本研究只能揭示我国学生使用连词的频率和趋势。

参考文献:

[1]Aarts B. The Oxford Dictionary of English Grammar (2nd ed.)[M]. Oxford: Oxford University Press, 2014.

[2]Aidinlou N, Pandian A. The Impact of Local and Global Conjunctions on ESL Reading Comprehension: A Systemic Perspective[J]. Journal of Language Teaching and Research, 2011(2):387-395.

[3]Akindele J. Cohesive devices in selected ESL academic papers[J]. African Nebula, 2011(3):99.

[4]Anthony L. AntConc: Design and development of a freeware corpus analysis toolkit for the technical writing classroom[J]. Proceedings of Professional Communication Conference, 2005:729-737.

[5]Dai C, Liu L. The Effectiveness of Explicit Instruction of Certain Decoding Skills in Improving Chinese EFL Listeners' General Comprehension Performance[J]. Chinese Journal of Applied Linguistics, 2012(2):243-255.

[6]Ghasemi M. An investigation into the use of cohesive devices in second language writings[J]. Theory and Practice in Language Studies, 2013(9):1615-1623.

猜你喜欢
英语写作语料库
《语料库翻译文体学》评介
基于语料库“隐秘”的词类标注初步探究
浅谈如何“步步为营”指导中学生英语写作
教师反馈对不同水平高中生英语写作的影响差异性研究
母语负迁移对初中英语写作的影响
从高考英语作文评阅看英语写作中存在的问题及启示
语境与英语写作研究
词块策略在高中英语写作教学中的运用
基于JAVAEE的维吾尔中介语语料库开发与实现
基于网络语料库的“给力”研究