刘文慧,周世界
(1.中南林业科技大学班戈学院,长沙 410004; 2.湖南省教育科学绿色教育研究基地,长沙 410004; 3.大连海事大学外国语学院,辽宁大连 116026)
话语标记语(discourse markers)是一种常见的语言现象,它包括部分连词(如and, therefore, because)、副词(如actually, frankly)、感叹词(如well)以及某些短语或小句(如as a consequence of, I mean)。[1]话语标记语普遍存在于口语和书面语中,它不依附于句法和语义结构,在语篇方面有许多整体功能。Qirk在20世纪50年代首次关注到这种话语标记语现象,但他并没有对这种语言现象进行深入研究。[2]20世纪70到80年代,话语标记语逐渐开始受到语言研究者的重视。进入20世纪90年代,对话语标记语语义和功能方面的研究开始呈现出系统性。随着国内语料库语言学的发展,学界开始关注话语标记语在二语习得中的作用。目前,国内相关研究多数是关于话语标记语定义、特征、语用功能和语法化方面的研究,主要集中于英语习得者对某些特定话语标记语使用情况的研究,并且随着英语话语标记语在二语习得领域研究的深入,汉语领域话语标记语的研究近些年也繁荣起来,但有关不同水平外语习得者和本族语者书面语之间、书面语与口语之间的整体性、多维度研究还不多。[3-6]本文通过语料库方法,对比分析自建的外语习得者书面语语料库、中国学生英语口笔语语料库和英国国家语料库,研究我国大学阶段外语习得者书面语中话语标记语的使用情况。
由于研究的出发点或视角不同,话语标记语出现过多种名称,如语义联加语(semantic conjuncts)、语用标记手段(pragmatic devices)、语用标记语(pragmatic markers)、语用功能词语(pragmatic function words)等。从诸多名称不难看出,话语标记语至今还没有一个公认的确切定义。由于话语标记语缺少确切一致的定义,其分类也多种多样。Philip按逻辑关系将话语标记语分为逻辑连接标记语(logical connector type markers)和填充标记语(filler type markers)。逻辑连接标记语是指以逻辑关系将语篇连接起来的连词或副词;填充标记语是指不表达具体信息内容,只用于填充停顿的标记语,在话语中具有一定的交际功能和意义。[7]本研究采用这种方法对话语标记语进行分类,表1是在Philip和王立非等[7]的话语标记语分类表格基础上修改而成,其中逻辑连接标记语类分为13类,填充标记语类根据书面语特征去掉了无明确含义的填充语,只保留有含义的填充语一类。本研究拟通过对备选语料库中话语标记语在数量和类型两个变量上的研究,调查我国大学阶段外语习得者书面语中话语标记语的使用情况和特征。
表1书面语话语标记语分类
本研究试图通过语料库研究回答以下三个问题:
(1)普通水平外语习得者书面语中话语标记语与本族语者之间的异同;
(2)普通水平外语习得者书面语中话语标记语与高水平外语习得者之间的异同;
(3)普通水平外语习得者书面语、高水平外语习得者口语和本族语者口语中话语标记语之间的异同。
本研究采用语料库语言学的研究方法,备用语料来源于三个语料库:自建的外语习得者书面语语料库、中国学生英语口笔语语料库(SWECCL)和英国国家语料库(BNC)。
自建的外语习得者书面语语料库由湖南某高校外语教师共同建立,设计规模为100万词,目前主要由书面语语料构成,反映普通水平外语习得者水平。该语料库收集了2013年到2017年普通非英语专业外语习得者的限时作文,文体以议论文为主,基本可以反映普通水平外语习得者的外语写作水平和特征。本研究分别从大一和大二学生作文库中随机抽取约5万词,共约10万词符作为样本语料。
中国学生英语口笔语语料库是一个包括书面语和口语语料的大型外语习得者语料库,由南京大学与外语教学与研究出版社联合开发。该库分为书面语语料库(WECCL)和口语语料库(SECCL)两个子库,总库容约为200万词。SECCL口语子库主要依托全国英语专业四级口语考试语料,主要反映高水平外语习得者水平。WECCL笔语子库的书面语料主要从国内9所不同层次高校的英语专业一到四年级学生中采集,其设计规模与SECCL大体相等,均为约100万词。本研究从笔语子库的限时作文子库和口语子库的口语文本文件中各随机抽取约10万词符作为样本语料。
英国国家语料库是当代最具代表性的英语语料库之一,在20世纪90年代初由英国政府、牛津大学、兰卡斯特大学和朗文出版公司等联合建立,代表本族语者水平。英国国家语料库包含书面语和口语两个子库,总容量约为1亿词,其中书面语子库约9000万词符,占总库容的90%,口语语料约1000万词符,占总库容的10%。BNC的最新版BNCXML2007,采用国际通用标准化标注体系,使用三级赋码标注,使标注错误率减少到1%。本研究从BNC书面语子库和口语子库中各随机抽取约10万词符作为样本语料。
本研究采用语料库对比研究的方法,首先从三个备选语料库中分别随机抽取约10万个词符,之后用文字处理软件Wordsmith 6.0中的单词列表(wordlist)和词汇检索(concordance)两个功能分析抽取出的语料,之后提取语料中话语标记语的位置、使用类型、使用总频数和每种话语标记语的使用频率,并对可以表述多种话语关系的话语标记语进行分类,最后使用统计软件SPSS 19.0对收集的数据进行差异分析。
表2是基于自建书面语语料库和BNC书面语子库的话语标记语在数量和类型两个变量上的数据描述及统计分析。表2数据显示,在自建书面语语料库中,普通水平外语习得者使用的话语标记语在数量和类型两个变量上都大于本族语者,其中外语习得者共使用6636个话语标记语,涉及表1中的话语标记语类型68个,而本族语者共使用4241个话语标记语,涉及表1中的话语标记语类型60个。T-test结果显示,普通水平外语习得者与本族语者在话语标记语数量上存在显著性差异(Sig.=0.003,远小于临界值0.05)。
表2基于问题1的数据描述及统计分析
表2数据表明,我国普通水平外语习得者话语标记语使用在总体数量上显著高于本族语者,甚至某些词有过度使用的倾向,这个研究结果与其他研究者的发现不谋而合。[8-9]例如,陈伟通过对比Lucy语料库和中国学习者英语语料库(CLEC)发现,与英国学生相比,中国大学生话语标记语使用在总体频率上呈现出使用过度的趋势。[9]但本研究的结果也与一些研究者的结论相悖。[10-11]这些研究者注意到,由于受母语和思维方式的影响,中国外语习得者英语写作的篇章结构缺乏连贯性,在写作中容易忽视连接性词语的使用。
在实践中发现,这两种看似矛盾的现象在普通水平外语习得者的书面语中确实同时存在。笔者认为,普通水平外语习得者书面语中过多或过少使用话语标记语都是受外语水平限制的结果。根据表2中最后一列的差值对比数据,在14种类型的话语标记语中,除了总结性标记语和选择性标记语(差值分别为0和-21),其他12种话语标记语都显示出普通水平外语习得者使用话语标记语的频率明显高于本族语者,有些话语标记语甚至有过度使用倾向,如对比性标记语、因果性标记语、强调性标记语和资格性标记语的差值分别高达277、636、287和276。普通水平外语习得者由于受到外语水平的限制,写作过程中常常难以确切充分地表达观点,此时,他们倾向于使用熟悉的副词、连词和短语等话语标记语辅助文章内容阐述,结果常常造成过度使用某些话语标记语。此外,国内外语测试对写作中句子连接词使用的评判标准也是造成普通水平外语习得者过度使用话语标记语的原因之一,所以普通水平外语习得者的书面语中往往堆砌了过多的副词或短语,内容的连贯性和观点阐述反而显得不足。另一方面,在一些普通水平外语习得者的书面语中,表示逻辑关系的连接词出现频率低于本族语者的现象也比较常见。究其原因,汉语是一种注重意合而非形合的语言,普通水平外语习得者外语水平较低且容易受汉语负迁移影响,因而导致其在英语写作过程中忽视话语标记语的逻辑连接作用。
表3是基于自建书面语语料库和WECCL语料库的话语标记语在数量和类型两个变量上的数据描述及统计分析。表3数据显示,在自建书面语语料库中,普通水平外语习得者使用的话语标记语在数量和类型两个变量上都小于高水平外语习得者,其中普通水平外语习得者共使用6636个话语标记语,涉及表1中的话语标记语类型68个,而高水平外语习得者共使用话语标记语7827个,涉及表1中的话语标记语类型72个。T-test结果显示,普通水平外语习得者与高水平外语习得者在话语标记语数量上不存在显著性差异(Sig.=0.173,远大于临界值0.05)。
表3数据表明,普通水平外语习得者与高水平外语习得者的书面语话语标记语在数量和类型上差异与共性并存。表3最后一列差值对比数据表明,普通水平外语习得者在书面语中比高水平外语习得者使用更少的话语标记语,体现了外语水平对话语标记语使用频率的影响。在分析语料过程中发现,普通水平外语习得者使用的话语标记语不仅在数量和类型两个变量上都低于高水平外语习得者,而且大量使用如for example, but, if, I think等难度和复杂度较低的话语标记语,而as well as, indeed, furthermore这类话语标记语的使用频率较低。外语水平较高的外语习得者受母语负迁移影响相对较小,在写作中注意通过使用精准度高的话语标记语体现句子之间的逻辑连接关系,虽然不能完全排除有堆砌话语标记语的可能性,但实践经验和诸多研究结果表明,英语非本族语者的英语写作水平与话语标记语使用数量呈正相关,高水平外语习得者能够更有效、更均衡地使用话语标记语,使内容表达更复杂、更明确。[11-12]
但值得注意的是,普通水平外语习得者与高水平外语习得者书面语语料中的话语标记语之间并不存在显著性差异,而且较大的Sig值(0.173)说明二者之间的差异较小,更多的是呈现共性的特征。同时,一些研究者也发现相似的研究结果。如郭威的研究发现,水平较高的外语习得者作文中话语标记语的数量高于水平较低的学习者,但不存在显著性差异。[12]无论是普通水平外语习得者和高水平外语习得者之间的共性还是差别,反映的都是中国外语习得者在外语习得过程中共存的特征。
表4是自建书面语语料库、SECCL和BNC口语子库中出现的10个最高频话语标记语在数量和类型两个变量上的数据描述。表4数据显示,在自建语料库中,普通水平外语习得者使用频率最高的10个话语标记语共涉及7个类型;在SECCL语料库中,高水平外语习得者使用频率最高的10个话语标记语也涉及7个类型,与普通水平外语习得者相比缺少因果性标记语和列举性标记语,多了对比性标记语和有含义的填充语;在BNC口语语料库中,本族语者使用频率最高的10个话语标记语涉及6个类型,与普通水平外语习得者相比缺少资格性、时间性和选择性话语标记语,多了对比性和重复性话语标记语。从总数上看,SECCL中高频话语标记语出现的数量6874为最高,自建语料库的4877次之,BNC口语子库的3595最低。
表3基于问题2的数据描述及统计分析
表4基于问题3的10个最高频话语标记语数据描述
表4数据结果表明,普通水平外语习得者书面语中话语标记语与高水平外语习得者口语有很大相似性。自建书面语语料库与SECCL语料库相比,and出现的数量均为最高,if, very, when, after四个话语标记语出现有重合,虽然排序不同但都处于比较靠前的位置。自建书面语语料库与BNC口语子库相比,for example, so, and 和also同时出现在10个高频话语标记语中,但是它们在BNC口语子库中的位置处于中间靠后,尤其是and,频数只有335,排在第6位。
自建外语习得者书面语语料与SECCL语料之间的相似性和与BNC口语语料之间的巨大差异说明,中国外语习得者的书面语表现出较强的口语化倾向,而且口语也表现出书面语的倾向。其他研究者和笔者的实践观察都发现,中国外语习得者常常混淆书面语和口语之间的差别,导致在外语口语中使用一些典型的书面语话语标记语,而外语书面语中容易出现典型的口语话语标记语。[13]此外,笔者之前的研究,通过对比SWECCL和兰卡斯特大学的LANCAWAE语料库发现,在笔语词汇多样性和复杂度两个指标上,我国高水平外语习得者均低于国外双语习得者和本族语者。[14]本研究结果中,在使用最频繁的10个话语标记语上,我国外语习得者在数量和类型上都远高于本族语者,说明我国外语习得者存在过度或过少使用某些话语标记语的现象。不同语料库组合对比产生的相似性和相异性的结果表明,外语习得者对书面语和口语话语标记语之间的语境差别注意不足,同时也印证了中国外语习得者使用话语标记语的特征。
通过以上研究得到的主要结论总结如下:
(1)普通水平外语习得者书面语中话语标记语在频数和类型上都超过本族语者,原因可能是受到外语水平的限制,普通水平外语习得者倾向于使用话语标记语弥补表达观点能力的不足。此外,外语测试写作的评分标准和母语负迁移也是影响中国外语习得者恰当使用话语标记语的原因。
(2)与高水平外语习得者相比,普通水平外语习得者书面语中话语标记语使用的数量和类型都较少,但二者之间不存在显著性差异。高水平外语习得者更多使用难度和复杂度较高的话语标记语,反映出其外语水平较高,力图通过使用话语标记语达到逻辑表达更清晰的目的。但是高水平外语习得者与普通水平外语习得者之间的相似性也反映出中国外语习得者在外语习得过程中存在共性的特征。
(3)与本族语者相比,普通水平外语习得者书面语中话语标记语呈现口语化倾向,同时与高水平外语习得者口语中话语标记语在数量和类型上有较大相似性,二者都呈现出书面语的特征,表明中国外语习得者对书面语和口语中话语标记语之间的语境差别缺乏明确认识。