王海华,杨 仔
(大连海事大学 外国语学院,辽宁 大连 116026)
如何衡量语言能力一直是二语习得领域关注的焦点。自20 世纪90 年代Skehan(1996)首次提出将复杂性、准确性和流利性(CAF)这三个维度结合起来对语言能力进行多维度衡量后,[1]CAF 成为衡量学习者语言能力不可或缺的三要素。[2]Wolfe-Quintero et al.(1998)将语言发展指标归纳为四大类,即:句法复杂性、词汇复杂性、流利性和准确性。[3]经过大量研究,这四类指标都被证实为“衡量语言水平发展最有效的工具”。[4]本研究对近五年(2015-2019)核心期刊刊发的关于我国英语学习者语言输出中CAF 相关论文为对象进行统计分析,以确定研究热点及现状,并对相关研究进行分类,旨在为相关领域研究提供参考。
国内外大多数研究都将语言复杂性分为句法复杂性和词汇复杂性两个维度,[5][6]并依据相应指标对其进行衡量。句法复杂性又称句法成熟度或语言复杂性,指“语言输出中不同形式的变化范围及形式复杂化程度”。[7]Read(2000)将词汇复杂性定义为词汇丰富性,包括词汇复杂度、多样性和密度三个方面。这些属于词汇复杂性的广度定义,[8]Bulté 和Housen(2014)认为词汇复杂性还应该包括词汇深度这一纵向特征比如词汇的搭配。因此,词汇复杂性也是一个多维度构念,二语学习者只有同时把握了词汇复杂性的广度及深度特征,才算真正掌握了这些词汇。[5][9]
Pallotti(2009)认为准确性是指符合特定规范的程度。[10]Foster 和Skehan(1996)将准确性定义为学习者输出语言形式与目标语接近的程度。[11]
Skehan 和Foster(2007)将流利性定义为以正常语速说话不间断的能力。[12]Wolfe-Quintero et al.(1998)认为书面语流利性指的是在特定时间里能够写出的单词数,[3]可见目前大多数相关研究对流利性的定义都偏重对语言形式的表层特征,而忽视了对语言传递意义内容的连贯性。
T 单位、AS 单位是测量句法复杂性最基本的语言单位,Johnson(2017)在其研究综述中提到每个T单位中的子句数量是测量书面语句法复杂性使用的最广泛的指标。[13]T 单位指“包含有一个主句,以及附加和嵌入的所有从句和非从句结构的不可分割的最小单位”。[14]AS 单位为“一个独立分句及与其相关的从句,或是次小句单位(sub-clausal unit)及与其相关的从句”。[15]AS 单位相关指标多用来测量口语的语言维度。
词汇复杂性的测量可以通过词汇复杂度、多样性及密度这三个观测变量。[6]其中,词汇多样性相关研究最多,使用最频繁的测量指标是类符与形符之间的比例(TTR)。[13]其相关数学变体,比如经过标准化处理的类符与形符之比、词汇多样性指标(MTLD)等能够减少因为文本长度带来的影响,从而提高了测量信度。[13]对于词汇复杂度,大多数研究采用了间接测量法,最常见的是利用Laufer 和Nation(1996)的词频分布(LFP)计算不同词频水平的单词数在文本中所占的比例,[16][17]但其对文本长度要求过高,不适合测量水平较低的二语初学者的词汇复杂度。使用频率最少的是词汇密度,它可以通过实义词/词汇总量或者实义词/功能词这两个指标来测量。[13]
口语准确性测量通常可以通过如无错T 单位数、无错AS 单位比例等测量。[18]书面语准确性最常采用Wolfe-Quintero et al.(1998)推荐的可靠指标,[3]即:无错T 单位比例。因其信度较高,被很多研究者采用。[14]
口语流利性可以通过语速、中断进行测量。语速可以通过每分钟产出音节数进行测量。中断可以用平均语流长度及停顿平均长度两个指标测量。Wolfe-Quintero et al.(1998)推荐使用T 单位平均单词数或者无错T 单位平均单词数来测量书面语流利性。[3]
为了研究我国英语学习者语言输出中CAF 相关研究的热点及现状,以CNKI 为数据源,对2015年到2019 年6 月间发表在核心期刊上主题为CAF相关的研究进行了检索,手工剔除了研究对象二语非英语的中国学习者的文献,最后得到共计43 篇核心期刊论文。研究者首先对这些论文依据语言输出的不同维度进行分类比较,然后对其关键词进行可视化分析研究热点。根据语言输出形式不同分为书面语和口语,对其发文量分别进行统计。最后通过阅读论文摘要及结论部分,对我国英语学习者语言输出中CAF 的研究内容进行分类,确定研究热点并展开讨论。
图1 发文数量分类
如图1 所示,对语言输出CAF 三个维度都有所涉及的论文有24 篇,此外,只对复杂性或准确性或流利性涉及的论文分别有12 篇、3 篇、和2 篇,另有1 篇论文同时研究了语言的流利性和准确性,此外还有1 篇论文同时涉及了语言复杂性和准确性。大多数研究者同时对CAF 三个维度进行了研究,涉及语言复杂性这一维度的论文数量最多,单独对语言准确性和流利性的相关研究都较少。
图2 关键词词云
将43 篇论文的关键词进行词语云可视化分析如图2 所示,可以看出在对CAF 相关研究中,语言复杂性的研究最多(字符大小代表该关键词出现的频率的高低,字符越大说明此关键词出现频率越高),这也验证了图1 的统计结果,即:涉及语言输出中语言复杂性的相关研究最多,其中句法复杂性最为显著。通过词语云,也可以发现对二语写作中的CAF 的相关研究多于对相应的口语研究。此外,任务、动态系统理论、测量也是CAF 相关研究中出现的高频词。
图3 不同输出形式中CAF 的发文数量
图3 显示,43 篇论文中共有26 篇对书面语输出的一个或多个语言维度进行了研究,有15 篇论文对口语输出的一个或多个维度进行研究。通过此统计结果可以得知,研究者们对书面语输出语言维度的关注远远多于口语,只有2 篇同时对书面语和口语输出的语言维度进行了研究。该统计结果也验证了词云中相关关键词的出现频率,即:对书面语输出的语言维度的相关研究多于口语。
通过使用NVivo 对43 篇论文中语言维度的测量指标进行编码分类,得到表1 数据。
表1 CAF 书面语常用测量指标
根据语言输出形式不同,把CAF 测量指标分为两大类,表1 为书面语中CAF 的测量指标,只包括发文数量大于1 的指标。可以看出对书面语句法复杂性的研究最多(该统计结果从词云关键词的频率分布也可得出),其测量指标也最多,词汇复杂性研究数量与准确性、流利性研究数量基本持平。
表2 为口语CAF 常用测量指标,只包括发文数量大于1 的指标。如表2 所示,口语CAF 研究数量整体少于对书面语中CAF 的研究(该统计结果从词云关键的频率分布也可得出,即:二语写作的字符大于口语),口语流利性的相关研究多于对语言其他维度的研究,其中对口语词汇复杂性的相关研究最少。此外,准确性测量指标也较多。
表2 CAF 口语常用测量指标
通过阅读43 篇论文的摘要和结论部分,根据主要研究内容的不同,对这些文献通过NVivo 进行编码,对文献内容归类,如图4 所示,我国近五年(2015-2019)有关语言输出中的CAF 相关研究的主要内容可分为三大类:1)第一类是将语言输出CAF 三维度测量结果当作因变量的研究,共29 篇,其比重最大,为68%。2)第二类主要为语言输出CAF 发展的动态研究,共7 篇,此类研究约占16%。3)第三类为有关语言输出中CAF 测量指标、组成维度及各维度特点的研究,共7 篇,该类研究占论文总数的16%。
图4 研究类型发文数量比例
第一类研究集中考察不同的任务复杂度、任务类型、教学方法等自变量对因变量语言输出中CAF的影响,如邢加新、罗少茜,吴雪峰等等。[19][20]
在第二类研究中,大多数研究者基于Larsen-Freeman 的动态系统理论对学生书面语语言不同维度的发展进行了研究,探讨其发展规律,如王海华等。[6][14]但目前有关口语输出不同维度发展的动态研究较少,未来研究者们可以对此方面做更深入的探索。
第三类研究中包括了对语言输出CAF 测量指标、各维度特点的研究,其中较多研究者关注中国学生书面语句法复杂性特点,如雷蕾等,[21]该统计结果也符合词云图中句法复杂性作为一个较高频词语的出现频率。
自Skehan(1996)首次提出将语言复杂性、准确性和流利性这三个指标结合起来对语言能力进行多维度衡量之后,相关研究取得了丰硕的结果。通过检索2015 年到2019 年6 月末发表在核心期刊,以有关我国英语学习者语言输出CAF 的论文为对象进行统计分析,发现多数研究者选择对语言的三个维度同时进行研究,语言复杂性的研究是三个维度中最多的。目前对书面语输出中语言各维度的相关研究还是远多于相应的口语研究。我国近五年的相关研究已不局限在对语言三个维度的定义和测量指标上,而是重点考察不同的自变量如任务复杂度、任务类型、教学方法、手段对因变量语言输出CAF 影响的研究及语言发展的动态研究。