中国学习者英语标点符号习得探析
——一项基于中国学习者英语语料库的研究

2015-11-04 07:15
浙江外国语学院学报 2015年1期
关键词:连接词句号逗号

于 洋

(中国地质大学(北京) 外国语学院,北京 100083)

中国学习者英语标点符号习得探析
——一项基于中国学习者英语语料库的研究

于 洋

(中国地质大学(北京) 外国语学院,北京 100083)

文章以中国学习者英语语料库为基础,运用AntConc3.4.1w检索工具,从分析标点符号误用现象出发,对中国学习者英语标点符号的习得情况进行研究,并探讨该研究对英语教学的启示。研究发现:不同层次的学习者在标点符号习得上表现出一定的规律性,同时又有所差别。标点符号失误随着学习层次的提高而减少,不同层次学习者在标点符号习得上的难点是相似的,即逗号和句号。学习者的失误主要是由于母语负迁移作用和英语连接词使用的影响而形成的。

英语标点符号;标点符号习得;母语负迁移;连接词;中国学习者英语语料库

一、标点符号习得的提出

黄伯荣和廖序东指出:“标点符号是辅助文字记录语言的符号,是书面语的有机组成部分。”[1]对于英语和汉语这两种分属不同语系的语言来说,比较明显的标点符号差异在于句号和省略号的书写形式、顿号和书名号(英语中不存在)等。母语的负迁移作用使得中国学习者在英语书面语中常出现以下类似的错误:Last month Tom visited Beijing、Shanghai and Guangzhou. 该例句中,学习者在列举事物时没有使用逗号,而是根据汉语习惯误用了顿号。Quirk等[2]认为,英语标点符号用来指明语法、语义或语用关系。标点符号与词汇(特别是连接词)、句法都密切相关,因此学习者对标点符号的习得直接或间接地影响他们对整个语言的习得。这就引发了我们对标点符号习得的思考。

就目前掌握的资料来看,有关二语标点符号①的研究主要包括三个方面:(1)二语标点符号使用失误研究,例如吕岩借助语料库分析了大学英语学习者的标点符号使用情况,探讨了标点符号使用中的失误及对英语写作教学的启示[3];(2)二语标点符号教学研究,例如Osborne研究了如何利用标点符号促进语法教学[4],Meloni探讨了如何利用网络资源进行以英语作为第二语言的标点符号教学[5];(3)二语写作中的标点符号研究,例如Mugharbil[6]、Knoch[7]把标点符号与拼写、首字母大小写、分段一同归为写作技巧,他们的研究发现写作水平越高,标点符号错误越少。

总结以上研究,我们可以发现,以往对于二语标点符号的研究大多没有真正把标点符号的习得放在二语习得的层面上加以探讨,也缺少针对不同水平学习者的研究。其中,Mugharbil的研究[6]虽然是二语标点符号习得领域较为系统的一项研究,但他没有考虑研究对象的母语背景②。总的来说,标点符号在一定程度上受到了忽视,标点符号习得研究领域存在着空白点。

本文以中国学习者英语语料库(Chinese Learners’ English Corpus,以下简称CLEC)为基础,从分析标点符号误用现象入手,对不同水平的中国学习者的英语标点符号习得情况进行研究,并探讨该研究对英语教学的启示。

二、研究假设

中国学习者习得英语的过程是中介语的形成过程。中介语(interlanguage)指的是语言学习者在习得第二语言时所拥有的一种独立的语言系统,这种语言系统在结构上既不是学习者的母语也不是目的语,而是介于两者之间[8-9]。Nemser称之为“近似系统”(approximative systems)[10]115,认为二语习得的过程是这一系统逐渐接近目的语的过程[10]。据此,本文提出:

假设1 中国学习者在习得英语标点符号时,学习层次越高,所犯错误越少。

刘重德[11]和连淑能[12]指出,汉语书面语中的长句一般用逗号把句子切开,英语句子由于连接词的作用则显得长而复杂,甚至中间没有标点符号而一气呵成。汉语重意合,句子之间经常依赖内部的逻辑关系联系在一起,“形散而神聚”;而英语重形合,句子之间往往借助各种语言形式紧密结合,例如连接词。因此,汉语中逗号使用较多。考虑到母语的负迁移作用,本文提出:

假设2 针对逗号——在不需要使用逗号时,中国学习者会过多地使用逗号,这就会出现较多的逗号冗余或句号误用为逗号的情况。

假设3 针对句号——在需要使用句号时,中国学习者很可能不使用句号,而是使用逗号代替。

另外,冒号等标点符号在英汉两种语言中的用法也有较为明显的区别。如在表达“说话者说……”时,英语中多用逗号引出直接引语,而汉语中一般用冒号。鉴于这类标点符号在CLEC中的出现频率较低,数据的说服力不强,本文在此不作深入的探讨。

三、研究设计

本文采用基于CLEC的中介语对比分析方法,以AntConc3.4.1w为检索工具。CLEC语料总量为107.0602万词,包含st2(高中生)、st3(大学英语4级)、st4(大学英语6级)、st5(英语专业低年级)、st6(英语专业高年级)五个子库,它们的库容分别为20.8088万词次、20.9043万词次、21.2855万词次、21.4510万词次、22.6106万词次。为了便于纵向研究,本文从CLEC中选取了st2、st4和st6这三个子库。首先,用AntConc3.4.1w软件检索出所有标点符号使用失误(桂诗春和杨惠中[13]在CLEC中将其标记为sn9);然后根据前文提出的假设,按照不同标点对失误进行归类,对它们进行进一步的标注;最后将标点符号使用失误的频数进行基数为20万词次的标准化计算,得出相对频数,用AntConc3.4.1w来作数据的统计与分析。本文所作的标注包括各类标点符号的缺失、冗余以及它们之间的误用,共计54种,每一处标点符号使用失误都标有唯一的一个标注码,例如sn910表示逗号冗余,sn911表示逗号缺失,sn912表示句号误用为逗号。现列出部分标注码及具体示例,如表1所示③:

表1 部分标注码及示例

编号标注码失误类型示例1sn910逗号冗余probablysay“no”.Tohelp,[sn910,s]thosepatientstogo2sn911逗号缺失Iflifeislikethat[sn911,s]It[fm3,1-]ismeaningless3sn912句号误用为逗号free-medicalcareservice[sn912,s],Therefore,hastening4sn920句号冗余themainreasonisthat.[sn920,s-]people’squalityistoo5sn921句号缺失toreducesuchpossibility[sn921,s]CarWenmei,anassociate6sn922逗号误用为句号women,buttoincreaseit.[sn922,-s-]for[sn8,-s-]thewomen

四、结果与讨论

针对前面提出的三个假设,本文对数据作了统计,现将结果进行分析与讨论。

(一)统计结果

在标注过程中,本文补充了存在于CLEC而为桂诗春和杨惠中[13]漏标的一些sn9失误现象,同时忽略了一些存在疑义的CLEC原有标注。表2汇总了三个子库的标点符号失误频数以及相对失误频数。

表2 标点符号失误频数总表

子库st2st4st6失误频数977383406相对失误频数939360359

为了更清楚地反映整个语料库的情况,现列出桂诗春和杨惠中[13]712提供的标点符号失误频数(表3)以作对比。他们认为,与st3和st4相比,st5在标点符号方面失误较多,并由此得出结论:标点符号失误不一定随着语言能力提高而减少[13]。这与前面提出的假设1相悖,本文将在分析与讨论部分对此作进一步的探讨。

表3 CLEC各子库标点符号失误频数表

子库st2st3st4st5st6失误频数1083668408773395相对失误频数1041639383720349

针对假设2和假设3,本文通过图1和图2来分析逗号和句号的失误类型与相对失误频数④。

图1 逗号失误分布折线图

图2 句号失误分布折线图

下面将对这些数据统计结果进行详细的分析与讨论。

(二)分析与讨论

1.对假设1的检验及原因分析

表2显示st4和st6的相对失误频数低于st2,经过卡方检验,st2与st4、st6的相对失误频数存在显著差异性(见表4)。

表4 st2与st4、st6相对失误频数卡方检验

子库卡方值P值st2-st4273.99<0.01st2-st6286.93<0.01

总体而言,学习者层次越高,所犯错误越少。这说明中介语的发展是一个不断向目标语渐进的过程,这个结果和假设1吻合。但我们也应注意到,st4与st6的相对失误频数较为接近。特别是桂诗春和杨惠中[13]712提供的数据(表3)更是显示出较高层次学习者(st5)所犯错误反而更多。可以从两个方面解释这个现象:其一,学习者提高的过程不是一个直线上升的过程;其二,高层次学习者随着词汇、句法知识习得的进步,写作中所使用的句子结构更加复杂,有可能在标点符号使用中出现新的错误。

为了进一步检验假设1,本文对标点符号失误作了分类统计(见图3):

图3 各类标点符号失误分布折线图

图3显示:各层次学习者在标点符号习得上的难点是基本一致的,失误主要集中在逗号和句号的使用上。经卡方检验,分号、叹号、引号、省略号的相对失误频数在三个子库中具有显著性差异,相对失误频数随着习得水平的提高而降低。鉴于这些标点符号的失误频数较低,本文在此不对它们作深入的分析。统计结果显示:st2水平的学习者逗号和句号失误分别占其标点符号使用失误总数的45%和47%,st6水平的学习者在句号上的失误多于st4水平的学习者。

由图2可知,st6子库的sn912和sn920两种失误类型的发生频数高于st4子库。st6子库的sn912失误又可细分为两种子类型:(1)不断句;(2)由于连接词的使用而将句号误用为逗号(见表5)。

表5 st6中的sn912失误分类

类型失误示例不断句livingcondition,mostpeoplearestillpoor[sn912,s],it[fm3,1-]isnoteasyforanomal[fm1,-]deathisnolongerahorriblethingtooldpeople,[sn912,s]theywouldliketochooseapeacefulway连接词Chinese[wd3,-1]context,euthanasiaishumane,[sn912,-]However,sincetherearestillanumberfeewith-outthefree-medicalcareservice,[sn912,s]Therefore,hasteningthedeathofaterminally

为了进一步分析sn912和sn920两种失误发生的原因,我们重新检索了这两项失误的标注情况。由此发现,英语连接词的习得对中国学习者英语标点符号的使用有一定影响。总体而言,CLEC中st6子库使用连接词的频数高于st4子库。以therefore为例,该词在st4子库中出现的相对频数为51,而在st6子库中则为111。这在一定程度上体现了连接词习得的不完善有可能造成标点符号使用失误,较好地掌握了连接词的用法可促进学习者对标点符号的习得。因此我们不能把sn912单纯地归咎于标点符号习得方面的失误。

同时,比较sn920失误可以发现:(1)sn920失误在st4子库中的相对失误频数为8,在st6子库中的相对失误频数为50。(2)sn920失误在st4子库中分布于若干语篇,而st6子库中的sn920失误则集中出现在同一语篇,即出自同一位学习者。仔细观察表6中的例子,我们不难发现,st4和st6子库中都出现了书写过程中随手加句点的情况,句号冗余的失误和个人书写习惯之间存在着较大的关联,以上错误都是可以避免的。

表6 st4和st6中的sn920失误示例

子库失误示例st4[fm3,-]?Butwhytheysay?HasteMakesWaste?.[sn920,s-]Ithinkifwedoathing,wemustdoyouwilldowrong[wd3,1-]withyourwork..[sn920,s-]mostofyourtime,youlivesanormaloutsidethecampus,andbythewaytoearnmoney.[sn920,-]forlivingbymyself.Ithinklivingbyto[wd3,-1]you,haveyouaskedyouself[fm1,-].[sn920,s-]"did[fm3,-]Imakemybest:[cc3,2-]st6roleinkeepingthebalanceofnature.Itcan.[sn920,s-]provide[vp1,-3]usqualitywood.[sn920,s-]can.[sn920,s-]provide[vp1,-3]usqualitywood.[sn920,s-]and.[sn920,s-]beautifyourenvironmentand.[sn920,s-]beautifyourenvironment.Itcan.[sn920,s-]also.[sn920,s-]shield.[sn920,s-]offtheSomecountries.[sn920,s-]spraytoo.[sn920,s-]muchpoisonand.[sn920,s-]fertilizer.[sn920,s-]

然而,我们不能简单地根据sn912和sn920失误频数的高低来推断st6水平的学习者对标点符号的掌握程度不及st4水平的学习者。比如,由图3可知,st4水平的学习者冒号的相对失误频数要高于st6水平的学习者。

2.对假设2的检验及原因分析

各层次学习者在逗号方面的失误都是集中在sn910、sn911、sn912和sn922,即逗号冗余、逗号缺失、句号误用为逗号、逗号误用为句号,详细统计见图4。假设2指出,中国学习者sn910和sn912这两类失误会较多,这已被图1中的数据证实。

图4 逗号主要失误类型统计图

研究发现,在st2和st6子库中,sn911的相对失误频数高于sn910,这与假设2相比存在一定的不符。因此,我们有必要探讨一下逗号缺失产生的原因。这要针对不同水平的学习者来进行细致的分析。

桂诗春和杨惠中提供了CLEC各类学习者的句长比较,其中st2的句长仅为14.73[13]21,低于st4的18.17和st6的17.74。连淑能指出,汉语以中短句居多[12]64。st2的句长信息反映了高中生英语书面语的口语化倾向,对标点的使用比较随意,加上母语的影响,高中生较易产生逗号缺失的失误。

通过检索st6子库中的sn911,发现逗号缺失一般发生在以下三种情境:连接词的使用、列举事物、插入语,例句见例(1)—(3)③。这不仅是受母语负迁移作用的影响,同时还涉及到英语连接词的习得。由此可知,我们对逗号习得的研究,不能只从母语迁移方面考虑,而应该着眼于整个句子结构甚至整个语篇。

(1)acing anguish every second. If life is like that[sn911,s]It[fm3,1-]is meaningless and should regard

(2)enuis[fm1,-]three times through a week:Monday[sn911,s]Wednesday and Friday. I don’t form the

(3)thanasia:A Taboon[fm1,-]in China Euthanasia[sn911,s]also named mercy killing,which eases the pai

图4还显示,st2子库中sn922的相对失误频数最高,这也反映了高中生英语书面语中的句长比较短、句子零散、不断句的口语化特点;st4子库中sn910的相对失误频数最高,检索发现其中出现了很多but、then等连接词后面紧跟逗号的失误;st6子库中sn911的相对失误频数最高,检索发现大多也是由于连接词的使用而造成的。相关讨论详见对假设1和假设3的检验及原因分析。

3.对假设3的检验及原因分析

图2显示:st4和st6子库中sn912的相对失误频数最高,在st2子库中sn912中相对失误频数居第二位,由此可见句号误用为逗号的现象比较普遍,这符合假设3。

st2子库中失误最多的是sn922,这种现象的出现可以由对假设2的检验和分析中有关高中生英语书面语口语化的讨论来解释。

本文统计了句号使用相对失误频数最高的几个类型:sn912、sn920、sn921和sn922,即句号误用为逗号、句号冗余、句号缺失和逗号误用为句号(见图5)。

图5 句号主要失误类型统计图

前文在对假设1的检验中具体分析了sn912和sn920,在此主要探讨sn921和sn922。表7为sn921和sn922失误的示例。

表7 sn921和sn922失误示例

类型失误示例sn921supperwiththemtonight.Itwashalfpastfour[sn921,s]wewerepreparingforgoingtohavedinner.[sn8,s]Fakecommoditiesdoharmtopeople[sn921,-]fakecommodities’quality[cc1,2-]isn’toftento-day,nottomorrow.Onlythemselves,notothers[sn921,s-]Theyarenear-sightedindeed.Natureissn922itwellwith[pp2,-3]allmymind.Asaresult.[sn922,s-]I’llchangemyjobswhennecessary,butI’llconditionis[vp3,s-]good.Ontheotherhand.[sn922,s-]Someofpeopleusuallychangejobs.Thereanddon’tofferussomanyvalues[wd3,-].[sn922,-]Because[fm3,-]theyarefakecommodities.We

在大部分英语教育者和学习者看来,表7中的失误都是较易避免的。出现这类失误有以下两种可能性:(1)标点符号书写不规范,以致CLEC建库录入文本时无法正确辨识。通过检索发现,sn921和sn922中的大部分失误都是基于这个原因。(2)连接词的使用影响到标点符号的使用。例如表7中sn922例句的because是表达因果关系的并列连接词,它所引导的从句不可以作为独立的句子,所以在使用标点符号时就要考虑到该词的用法,而不能随意地使用句号。

4.小结

经过数据分析,前文提出的三个假设基本上是成立的。中介语具有不稳定性和不完备性,标点符号习得又与词汇和句法密切相关,由此我们发现标点符号习得的规律性比较复杂,涉及到多方面因素,以母语负迁移和连接词因素最为突出。

需要说明的一点是,检索整个语料库并没有发现顿号失误。在平时的英语习得过程中,中国学习者的确会误用顿号,为什么在CLEC中没有体现呢?是由于录入文本时英文输入法状态下无法输入顿号而将这类失误忽略了吗?作者咨询过参与建库的李文中教授,他解释说:主要原因是手写的几种标点符号(句号、逗号、顿号)不易区分,可能存在标点符号误输入的问题。因此,本文所作的分析有比较重要的理论和实践意义,但也存在一定的局限性。

(三)对英语教学的启示

我们应该对标点符号习得给予一定的关注,不应只重视词汇和语法而忽视标点符号教学。教师要正确认识标点符号习得的规律性和各层次学习者的特点,从英汉标点的对比出发,对学生进行必要的指导,为他们提供足够的练习。由于标点符号与词汇、句法相关,我们不能孤立地进行标点符号教学。教师可以从语篇角度,在讲解连接词的同时提示学生有关标点符号的使用,这将大幅度地减少标点符号的失误,也会促进句法的习得。另外,我们还应培养学习者良好的书写习惯,规范英语标点符号的书写。

五、结语

本文发现,不同层次的中国英语学习者在标点符号习得上表现出一定的规律性,同时又有所差别。总体来看,标点符号失误随着学习层次的提高而减少,不同层次学习者在标点符号习得上的难点是相似的,即逗号和句号,尤其以sn912等几类失误最为普遍。本文认为,中国学习者标点符号习得的特点主要是由中介语的不稳定性和教学中不够重视引起的。中介语是动态的、不断发展变化的,这也就造成了不同层次学习者在标点符号习得时会呈现出各自不同的特点。sn911等失误的发生可主要归因于母语负迁移作用和英语连接词使用的影响。本文的研究对英语标点符号教学及词汇、语法教学具有一定的积极意义,同时该研究也存在一些不足,如语料库本身的局限性使得我们对标点符号失误的分析不够全面,没有综合考虑学习者的心理因素等。因此,当前的研究只是一个初步的探讨,标点符号习得还有待于我们作更加深入的研究。

感谢中央高校基本科研业务费专项资金资助项目(2652014024)对本研究的资助。

注释:

①本文所回顾的二语标点符号研究主要侧重于英语作为第二语言的标点符号研究。

②Mugharbil的研究对象是南加利福尼亚大学的留学生,研究中没有提及他们的母语背景。

③本文的示例均出自检索软件的窗口,大多不是完整的句子。其中除了有关标点符号使用失误的标注,还包含了CLEC中关于词汇、语法等方面失误的标注,例如[vp1,1-]表示vp(动词)的第1种(及物性形式)失误,1-为失误发生的范围,-表示失误的位置,1表示失误前有1个词。联系前面这个词就可以判断出所标注处动词及物性形式的失误。本文保留了原语料库中的所有标注。

④图1和图2中涉及到的标注码包括:sn901(句号逗号同时缺失);sn910(逗号冗余);sn911(逗号缺失);sn912(句号误用为逗号);sn913(问号误用为逗号);sn914(分号误用为逗号);sn915(冒号误用为逗号);sn916(叹号误用为逗号);sn917(引号误用为逗号);sn918(破折号误用为逗号);sn919(连词and/or误用为逗号);sn9100(省略号误用为逗号);sn920(句号冗余);sn921(句号缺失);sn922(逗号误用为句号);sn923(问号误用为句号);sn924(分号误用为句号);sn925(冒号误用为句号);sn926(叹号误用为句号);sn929(连词and/or误用为句号);sn932(逗号误用为问号);sn933(句号误用为问号);sn942(逗号误用为分号);sn943(句号误用为分号);sn952(逗号误用为冒号);sn953(句号误用为冒号);sn962(逗号误用为叹号);sn963(句号误用为叹号);sn988(逗号误用为省略号);sn998(句号误用为斜线)。

[1]黄伯荣,廖序东. 现代汉语(增订三版)(下册)[M]. 北京:高等教育出版社,2002:190.

[2]Quirk R,et al. A Comprehensive Grammar of the English Language[M]. London and New York:Longman,1985.

[3]吕岩. 大学英语学习者写作中标点符号使用失误调查[J]. 北京第二外国语学院学报,2006 (4):77-81.

[4]Osborne M. Can punctuation help learning?[C]//Wermter S,Riloff E,Scheler G (eds.). Connectionist,Statistical,and Symbolic Approaches to Learning for Natural Language Processing. Berlin/Heidelberg:Springer,1996:399-412.

[5]Meloni C. Using the web to teach punctuation[EB/OL]. ESL Magazine,2002 (March/April)[2005-05-01]. http://www. eslmag. com/modules. php?name=news& file=article&sid=64.

[6]Mugharbil H. Second language learners’ punctuation:Acquisition and awareness[D]. Los Angeles,CA:University of Southern California,1999.

[7]Knoch U. Diagnostic writing assessment:The development and validation of a rating scale[D]. Auckland:The University of Auckland,2007.

[8]Ellis R. Understanding Second Language Acquisition[M]. Oxford:Oxford University Press,1985.

[9]Larsen-Freeman D,Long M H. An Introduction to Second Language Acquisition Research[M]. Beijing:Foreign Language Teaching and Research Press,2000.

[10]Nemser W. Approximative systems of foreign language learners[J]. International Review of Applied Linguistics in Language Teaching,1971 (9):115-123.

[11]刘重德. 文学翻译十讲[M]. 北京:中国对外翻译出版公司,1991.

[12]连淑能. 英汉对比研究[M]. 北京:高等教育出版社,1993.

[13]桂诗春,杨惠中. 中国学习者英语语料库[M]. 上海:上海外语教育出版社,2003.

ACorpus-basedStudyofEnglishPunctuationAcquisitionbyChineseLearners

YU Yang

(School of Foreign Languages,China University of Geosciences (Beijing),Beijing 100083,China)

This paper analyzes Chinese learners’ misuse of English punctuation in Chinese Learners’ English Corpus (CLEC) with AntConc3.2.1w. It indicates that there are certain rules in English punctuation acquisition by Chinese learners,and there are also differences in the acquisition between learners of different levels. The comma and the period are the most difficult punctuation marks for them to acquire. However,the frequency of errors decreases for high-level learners. The negative transfer of Chinese and the use of English conjunction lead to the misuse of punctuation. This study also provides enlightenment for English teaching in China.

English punctuation;punctuation acquisition;negative transfer of Chinese;conjunction;Chinese Learners’ English Corpus (CLEC)

H319

A

2095-2074(2015)01-0052-08

2014-12-17

于洋(1983-),女,山东曲阜人,中国地质大学(北京)外国语学院讲师,文学博士。

猜你喜欢
连接词句号逗号
句号
逗号
连动结构“VP1来VP2”的复句化及新兴小句连接词“来”的形成
句号失踪记
句号
逗号
宾语从句的语序
句号提意见
吸引阅卷老师的“连接词”
自傲的逗号