刘黎岗 刘柳
(1. 成都医学院 外语部,四川 成都 610500;2. 西南科技大学 外国语学院,四川 绵阳 621010)
语言复杂度 (linguistic complexity)作为语言能力不可或缺的要素之一,通常用来指语言产出中所用词汇、结构的广度和难度。人们也通常用语言变化性 (variety)、多样性 (diversity)和详细度 (elaborateness)来指语言复杂度。语言复杂度是一个多维度的复合构念,其自身理论构建与测量开发受到研究者长期关注 (Bulté et al., 2012)。其子维度(词汇复杂度、句法复杂度)在研究中经常被作为因变量,用以观测其他因素对语言产出质量的影响。在这类研究中,最重要的无疑是语言复杂度与语言能力、语言测评的相关性研究和影响语言复杂度因素的研究,因为这些研究涉及语言能力,尤其是二语能力的发展与评估,也涉及二语能力的有效提升。
因此,语言复杂度的相关研究可以分为三个路径:(1)从理论构建和研究操作出发,探寻语言复杂度的组成维度和有效测量各维度的观测指标;(2)从二语能力发展与评估出发,探寻语言复杂度与二语能力、二语产出质量的关系;(3)从二语习得出发,探寻学习者背景、任务类型、任务准备等因素对语言复杂度的影响。本文就上述三个路径对语言复杂度的研究进行回顾,阐述已有研究所做出的贡献,分析这些研究存在的问题,对研究的方向和视角提出建议,并对将来研究做出展望。
正如名称里“复杂”二字所示,语言复杂度是一个多维度的复合构念,其定义经历了从笼统、抽象到清晰、具体的过程。笼统的定义如“复杂度是指使用更具难度和挑战性的语言……学习者所产出语言的详细程度” (Ellis et al., 2005: 139) 和“复杂度是指学习者的中介语系统所具有的复杂度” (Skehan, 2003: 8)。这种定义虽然直观反映了人们对语言复杂度的认识,但忽略了语言复杂度的具体维度,且不便于测量。鉴于此,Bulté 和 Housen (2012: 27-28) 根据语言的基本要素(词汇、语法)构建了语言复杂度的两大子维度:词汇复杂度和语法复杂度。词汇复杂度又分为词汇广度和词汇深度,语法复杂度分为语法丰富度和语法深度。词汇广度由稠密度和多样性组成,词汇深度由词汇难度和词汇构成组成;语法丰富度由句法丰富度和形态丰富度组成,语法深度由句法难度和形态难度组成。Bulté和Housen从词汇、句法、形态三个层面解析了语言复杂度的构成,使之具有层次性和可操作性。
随着复杂度维度的不断完善和计算机技术的发展,人们开发出的测量指标也越来越多,这改变了测量纯粹依靠人工和机器测量指标较为单一的局面。词汇稠密度可以通过实意词与所用词汇之比进行观测;词汇多样性则有多种测量指标:类符形符比、Guiraud指数、D测量等;词汇难度则通过低频词与总词汇量之比进行测量;句法复杂度既有整体测量指标如T-unit平均长度、C-unit平均长度、AS-unit平均长度、S-nodes/T-unit等,也有具体测量指标如子句/T-unit、从属子句/子句、子句平均长度、名词短语/ T-unit、动词短语/ T-unit等;形态复杂度则通过曲折/派生丰富度(T/F: Types/Family)、曲折丰富度(CLAN: Computerized Language ANalysis)、动词曲折丰富度(MCI: Morphological Complexity Index)进行测量。这些测量指标各有侧重,而且能互为补充,如句法复杂度指标涵盖了句子、小句、短语三个层面,使人们对句式结构的观察更为系统、更有层次。不仅如此,国外研究者还就词汇复杂度、句法复杂度分别开发出能够测量多个维度的复杂度分析器,如Lu (2012) 的“Lexical Complexity Analyzer”、 Lu和Ai (2015) 的“L2 Syntactic Complexity Analyzer”、 Biber et al. (1999) 的“Biber Tagger”和 McNamara et al. (2014) 的“Coh-Metrix”。比较而言,国内有关语言复杂度理论的研究尚显缺乏,操作方面的研究主要针对测量指标的有效性和不同指标的优劣,如陈慧媛(2010)比较了T单位长度和每个T单位的S节数量,赵俊海等(2012)考查了每个T单位从属句、非限定动词和衔接成分,刘黎岗等(2018)对语言复杂度的理论界定、维度设立、测量指标进行了梳理评价,侧重介绍各维度测量指标的优劣及如何使用,但对语言复杂度理论界定的不足缺乏深入探讨。
语言复杂度是语言能力的具体呈现,语言产出中的词汇和语法结构决定了语言产出的质量与交际效果,探究复杂度各维度与二语能力的关系,有利于我们了解二语能力的发展、变化,帮助我们建立科学、客观的二语能力测评标准。研究者从不同二语水平、不同二语阶段就词汇复杂度和句法复杂度进行了比较。就词汇复杂度而言,研究主要集中于三个层面:(1)比较词汇复杂度各子维度对语言产出质量的影响 (Lu, 2012) ;(2)探究词汇复杂度测量指标对语言能力的预测效果 (Yu, 2010);(3)探究学习者的语言产出在词汇复杂度上的变化和发展趋势(文秋芳, 2006)。虽然这些研究各自的关注点并不一致,但研究结果都说明词汇复杂度不同维度对二语能力的作用并不相同。因此,在建立语言能力测评标准时,必须要区分词汇复杂度不同维度的权重。
句法复杂度是语法复杂度的重要维度,由于其包含句子、小句、短语几个层面,对二语能力的研究更多地是从句法复杂度入手。句法复杂度的研究也集中于三个层面:(1)就语言单位长度、从属关系、短语复杂度等维度进行不同能力(如学习者与本族语者)的比较 (Ai et al., 2013);(2)就对Biber Tagger, Coh-Metrix, L2 Syntactic Complexity Analyzer几款不同句法复杂度分析器进行比较,探究句法复杂度分析器对具体维度的测量能否清晰体现各维度的构念 (Lu,2017);(3)关注学习者句法复杂度各维度的发展规律和特点(Crossley et al., 2014)。Ortega (2003) 通过对25项研究的综合分析,指出句法复杂度与二语能力的发展并非线性关系(即所谓的能力越高,句式结构越复杂),高能力的二语水平往往体现在短语层面,而非句子层面。国内研究主要关注语言水平对句法复杂度的影响(鲍贵, 2009)和我国学习者句法复杂度的发展模式(纪小凌, 2009)。这些研究都说明,句法复杂度在不同能力阶段表现不同,能力评估不能遵循“句式越复杂能力就越强”的原则,在不同能力发展阶段,句法复杂度与词汇复杂度的发展也未必同步。
语言复杂度不仅受能力差异影响,还受语体、语域、任务准备时间、任务复杂度、任务完成方式、学习者母语等多种因素的影响,探究这些因素对复杂度是否有影响以及如何影响,有利于提高学习者二语能力,帮助人们做好研究设计、控制好研究变量。在这些因素中,学习者母语因素与能力差异相似,都属于学习者的内在因素,而语体、任务复杂度等都属于外在因素。因此,此类研究分为两类,一是关注哪些外在因素对语言复杂度有影响以及如何影响,二是关注内在因素学习者母语是否有影响以及如何影响。就外因而言,有研究发现,语体、语域对词汇多样性、词汇难度和词汇共现特征是有影响的 (Biber et al. 2016; Kyle et al., 2016),充足的准备时间会提升学习者写作句法复杂度 (Ellis et al., 2004)。任务复杂度涉及任务元素的多少和种类,经常出现不一致的研究结果。Kuiken et al. (2005) 发现通过元素变量增加任务复杂度对词汇、句法复杂度并无显著影响,而 Frear 和Bitchener (2015)的研究结果却相反。Rahimi 和 Zhang (2018)则发现任务复杂度对词汇、句法复杂度的部分子维度有显著影响,而非所有维度。国内研究中,王静萍(2013)发现任务复杂度对词汇复杂度有显著影响,对句法复杂度的影响却不显著。鉴于任务复杂度的研究结果不一,王丽萍等(2020)采用词汇、句法复杂度的多项指标对其影响进行全面探究。这些研究告诉我们,语言复杂度受多种外在因素影响,不同因素对复杂度具体维度的影响也不相同,因此,我们在进行语言复杂度的研究设计时,必须要做好研究设计,对这些外在因素进行控制。
比外在因素更具影响的内因是学习者母语。Lu 和Ai (2015) 发现了不同母语对英语学习者笔语句法复杂度的显著影响;Paquot (2013) 发现法国英语学习者在词汇搭配、词汇-语法模式、词汇使用频率等方面都受母语影响;Khushik和 Huhta (2019) 对相同能力的信德和芬兰英语学习者进行了对比,认为母语不同的相同能力学习者在写作句法复杂度上仍有明显差异;Ehret和Szmrecsanyi (2019) 甚至认为母语比学习者接受的二语教学时长(L2 instructional exposure)更能影响语言复杂度。这些研究表明,与外因相比,母语对二语语言复杂度有着更为显著的影响。因此,我们在研究语言复杂度与语言能力关系时,必须把母语因素考虑在内,因为即使是语言能力相同或相近的语言学习者,由于母语的影响,其二语语言复杂度特征或发展规律却未必一致。
词汇复杂度、句法复杂度是语言复杂度的两大基本维度,其测量也具有可操作性,但这种定义也有自身的问题。第一,Bulté和Housen的词汇复杂度定义虽然涵盖了词汇的广度和深度,但却过于强调词汇的形式而忽略了词汇的意义。首先,词汇不能局限于单个的词,还包括词汇之间的搭配和组合;其次,词的功能、句法特征、宗教及文化意义等,都属于词汇知识的必备内容(Richards, 1976: 77),而词的这些属性只有通过词与词的搭配才能有所把握。现有的词汇复杂度维度只能测量学习者使用了什么样的词汇,而词汇如何使用,使用是否地道,还需要新的测量维度。第二,Bulté和Housen的句法复杂度维度也是重形式而轻意义。句法复杂度虽涵盖了句子、小句、短语三个层面的句式结构,但目前的指标更多的是测量句子、小句长度和从句、短语数量,不能反映学习者如何组构句式,使用什么句式,使用是否地道。此外,由于语言能力与句式结构复杂度并非呈正比关系 (Ortega, 2003),现有的句法复杂度指标对一些地道的简单句反而无能为力。因此,有研究者已开始尝试建立新的复杂度维度,Ryshina-Pankova (2015) 对高水平学习者笔语中的名物化手法进行了分析,因为名物化是实现语法隐喻的重要手段,而语法隐喻是语义复杂度的重要标志。这与Berman 和 Nir-Sagiv (2004: 375) 的观点一致:“我们不仅需要从语言形式的频率和分布来观察语言,也需要根据语言形式出现的语境和语域来观察它们的意义和功能。”
鉴于此,语言复杂度的维度不应局限于词汇复杂度和句法复杂度,还应有语义的维度或形义结合的维度,或许有关短语学的研究能为我们提供一些思路。短语是词的组合,既属于词汇范畴,又属于句法范畴。因此,从短语出发能同时观测词汇、句法复杂度,弥补词汇复杂度、句法复杂度两分法各有侧重而割裂两者做法的不足。通过短语,我们可以看到词汇的句法特征、搭配倾向以及词汇之间的共现规律。短语复杂度既可以采用Biber的多维分析法 (MD Analysis: Multi-dimensional Analysis),也可以采用词块研究的方法进行观测,这样就能观测到短语的组合特征及规律,并据此观察其意义和功能,而不只是观测短语数量。目前,Paquot(2019)已开始尝试建立语言复杂度的短语维度,因为短语最能体现中高级到高级二语能力的变化。因此,笔者认为,短语复杂度不应只是句法复杂度的一个子维度,它应该是与词汇、句法复杂度并列的维度,其测量指标应形义兼具甚至以义为主,而不能局限于目前句法复杂度测量指标里的短语数量。
控制好其他因素是进行能力差异研究的前提条件。从能力差异入手进行语言复杂度对比的研究主要有三个途径:本族语者与学习者比较 (Ai et al., 2013)、不同水平学习者比较 (雷蕾, 2017) 以及学习者语言复杂度的跟踪历时比较(文秋芳, 2006)。然而,Ortega (2015:90)在对比了部分写作句法复杂度的研究之后发现,不同研究对学习者复杂度维度变化的结论并不一致,甚至矛盾,认为这种结果的出现可能是能力差异、学习者母语和不同体裁共同作用的结果。所以,即使能力差异是造成复杂度差异最主要的因素,但在实际研究中很难完全区分语言能力、学习者母语、任务体裁各自对复杂度的影响。因此,要确保此类研究结果具有可比性,就能力差异进行复杂度研究时,应尽量减少母语、任务体裁等因素的影响。研究者可以就复杂度进行同一母语学习者不同英语学习阶段的比较,而进行比较的语言产出在语体、语域、任务难度等方面都要尽可能一致。
研究者已发现句法复杂度的发展与语言能力的发展并非线性关系。如前文所述,高能力更多体现在短语复杂度而非句子复杂度。此外,学习者对二语形容词、副词的掌握在语言能力发展阶段上也有差异(Ortega, 2015: 90)。那么,这是否意味着,复杂度的某一维度在某个能力级上能作为其显著特征或判断标准,而在另一能力级则不能作为其显著特征或判断标准?对这个问题的回答需要研究者对不同能力级的语言特征进行充分的研究。虽然已有研究对短语、句子等维度在不同能力级的表现进行过对比,但其覆盖的复杂度维度和能力级都十分有限。未来的研究应对复杂度的各个维度在所有能力级的表现进行全面的覆盖,提取每一维度的发展轨迹,确定各维度在不同能力级的权重,只有这样,才能系统把握各维度与语言能力的关系。对中国英语学习者进行的语言复杂度各维度发展研究,有助于我国英语能力测评体系的科学开发与合理使用。此外,对学习者复杂度发展变化的研究不能只局限于一些孤立的词汇或结构数量,还应包括短语的特征、意义以及名物化手段的使用。
语言复杂度受多种因素影响,我们在进行相关研究时,不能仅从复杂度自身的发展和语言能力的发展去思考复杂度问题,必须对这些影响因素进行区分和控制。比较而言,语体、语域、任务准备、任务难度等因素更容易区分和控制,因为这些因素属于外在因素,便于研究者在操作时进行区分。而母语因素难以区分,因为它与学习者语言能力、智力等因素一样,属于内在因素。即使已有的有关学习者母语的研究,按照母语对学习者进行了分组,也很难说不同组学习者的复杂度差异都来自母语。这是因为,母语差异研究的一个前提是不同母语学习者的二语能力要一致,在实际操作中却很难保证语言能力一致。第一,从理论上看,语言能力就是一个包括复杂度、准确度、流利度的多维度复合构念 (Skehan,1998),并且复杂度自身也是多维度的复合构念,语言能力一致是否意味着其所有维度都一致或大多数维度必须一致?第二,从操作上看,如果用机器进行判断,即使每个维度的测量指标都较为准确、客观,语言能力也不等同于所有测量指标的简单相加;如果是人工判断,不同的评判人对不同维度的地位有不同认识。因此,很难或者说不可能确保语言能力完全一致,即使权威的学习者语料库如鲁汶国际英语口语语料库(LINDSEI: Louvain International Database of Spoken English Interlanguage)也只能保证学习者语言能力尽可能接近。在操作中,人们很难把母语和语言能力这些内在因素完全区分开,并且不是所有的二语特征都会受到或相同程度地受到母语影响 (Ortega, 2015: 84),母语对二语复杂度影响的研究都是建立在一种高度的盖然性之上。
母语对二语复杂度的影响属于跨语言影响或语言迁移(linguistic transfer),这种影响或迁移通常是双向的。由于母语和语言能力不易区分,有研究者认为学习者二语复杂度并非呈线性发展,而是受到其自身发展、语言能力、学习者母语共同的影响 (Ortega, 2015: 84)。因此,Ortega (2015)呼吁未来的相关研究要使用同一学习者的二语和母语两种样本,才更有利于探究母语和能力差异各自对复杂度的影响。然而,由于语言迁移具有双向性,这种做法也未必能较好的区分能力差异和母语各自的影响。二语习得的过程不仅包含语言迁移,还包括概念迁移 (conceptual transfer)。概念迁移包括学习者对新概念的内化、对母语形成的已有概念系统的重构、母语和二语概念系统的融合、母语概念的弱化等 (Jarvis et al., 2008)。因此,语言迁移不是单向的,而是双向的 (Jarvis et al., 2008)。如果要使用同一学习者的二语和母语样本,必须把语言迁移的双向性考虑在内。对于二语初学者,二语对母语的影响虽然很弱,但学习者的二语也不够成熟,其二语样本作为研究对象不是很理想;对于高水平学习者,其二语样本是理想的研究对象,但其母语受二语影响较大,对比其母语、二语样本未必能收到理想的效果。要进行二语和母语样本的比较,较理想的方法是就同一批学习者在二语水平的初级、中级、高级各阶段的两种样本进行比较。
语言复杂度是二语习得、二语能力研究不可回避的话题,其自身理论的进一步完善、典型特征的提取、研究方法的规范都有助于我们更加科学、系统地认识语言能力的本质和发展规律。
第一,语言复杂度维度和指标的增加。现有的语言复杂度维度重形式而轻意义,而语言是形、意结合的产物,语言复杂度必须要建立意义维度或形义结合的维度,才能全面、客观地反映学习者所掌握语言的复杂性。Ryshina-Pankova (2015)、Paquot (2019)已经进行了很好的尝试,短语学的发展也给予了我们很好的启示,一方面我们需要建立与意义相关的新的语言复杂度维度,另一方面我们也需要开发和完善与新维度相关的测量指标。
第二,语言复杂度各能力级典型特征的提取。能力差异是影响语言复杂度最重要的因素,而语言复杂度发展与能力发展的关系仍不清楚,尤其是复杂度各子维度在各能力级的表现如何,同一子维度在不同能力级的特征是否有差异,哪些子维度最能体现从低级到中级、从中级到高级的能力变化,这些都有待进一步研究。未来的研究应对中国英语学习者复杂度各子维度在不同能力级上的表现进行探究,确定不同能力级的典型特征,为我国语言能力评估体系的开发和完善提供参考和借鉴。
第三,语言复杂度母语因素研究方法的规范。母语与语言能力一样,都是影响学习者复杂度的内在因素,因此,母语对复杂度影响的研究必须尽可能地控制好其他变量。母语影响的研究可以遵循Jarvis (2000)提出的研究框架,即学习者目标语表现的组内同质性、学习者目标语表现的组间异质性、学习者母语表现和目标语表现的组内一致性。一方面可以就目标语进行学习者与本族语者及不同母语学习者的比较,另一方面可以进行同一批学习者母语和目标语的比较。
语言复杂度作为语言能力最重要的构成要素,其理论研究、测量开发已经为我们认识和测量语言能力提供了系统的理论和方法。然而,语言复杂度的现有维度亟待拓展,新的测量指标有待开发,它才能成为形、义兼顾的更加科学的复杂度理论体系。语言能力和学习者母语是影响语言复杂度最重要的内在因素,语言复杂度各子维度与语言能力、学习者母语的关系如何,还有待进一步研究。这些研究不仅有助于我们了解语言复杂度的发展规律、建立语言能力测评体系,还能帮助我们减少母语对目标语习得的影响,提高语言水平。