张新玲 刘 杨
(上海大学,上海,200444;中山市第一中学,中山,528403)
多语能力是国家参与构建国际话语体系的重要软实力,也是21世纪公民不可或缺的关键技能,在全球化和逆全球化浪潮并行,为世界提供教育的中国方案等背景下,关注以语言能力标准为代表的外语教育和多语能力建设,是中国文化传播、世界文明互鉴的现实路径之一(王文斌 2023)。作为语言学习、教学、测评的统一标尺,语言能力标准是语言考试标准化、外语教材编写、课堂教学与评估、学习者自评、用人单位选拔人才等的基础依据,相关研究日益重要,是中国标准、中国方案必不可少的内容。
因此,有必要对比研究《欧洲语言共同参考框架》(Council of Europe 2001)《中国英语能力等级量表》(中华人民共和国教育部、国家语言文字工作委员会2018)《国际中文教育中文水平等级标准》(中华人民共和国教育部、国家语言文字工作委员会2021)这三大最具影响力的国际语言量表。研究成果可为国家语言政策制定、外语教育、教材编写、考试开发提供全方位视角,为语言能力量表修订提供参考,是中华文化国际传播的语言教育方案的组成部分。
语言能力量表包含“一系列不断上升的语言能力水平”(Council of Europe 2001:40),是对学习者使用语言完成交际所需能力的系统描述。迄今为止,国内外具有代表性的外语语言能力量表有《等级标准》《量表》、ACTFL量表(American Council for the Teaching of Foreign Languages)、CLB量表(Canadian Language Benchmarks)、ASLPR量表(Australian Second Language Proficiency Ratings)等。就我国当前国家战略而言,《等级标准》和《量表》是中国方案,与影响深远的《欧框》交相辉映,在时代特色和实践价值上具有重要意义。
《等级标准》和《量表》是中华人民共和国教育部和国家语言文字工作委员会分别于2021年和2018年正式发布的国家标准。前者用于国际中文教育教学、学习、测评,已通过十余种外语面向世界发行;后者为我国首个用于英语学习、教学、测评的统一标尺(刘建达 2019:11)。《欧框》由欧洲理事会2001年首次出版、2018年修订,是外语学习、教学及评估的整体方案,已被译成40多种语言,深刻影响了欧洲乃至全球语言教学与测评研究和实践。
语言能力标准研究是当今学界热点之一。据不完全统计,LanguageTesting等专业SSCI刊物发表文章近300篇;就《欧框》而言,约13项研究获国家社科基金和省部级科研项目资助,近40篇论文在CSSCI刊物亮相。自“外语能力测评体系建设”(国务院 2014)和《量表》项目启动以来,已有50多项相关研究获国社科等资助,中国学者在专业SSCI刊物发表论文数倍增,在CSSCI刊物发表论文百余篇。
已有研究主要聚焦:(1)单语外语能力量表介绍和阐释,涉及研制背景、原则、意义、级别划分、描述特点、修订建议等(Figueras 2012;刘建达 2019;王海萍 2023);(2)《欧框》和语言考试的对接研究(Khalifa &Ffrench 2009;Fleckensteinetal.2019);《量表》与国内外英语考试的对接研究(王华 2020);(3)《欧框》和《量表》的对比研究(彭川 2021;彭川、刘建达 2021)、《欧框》与《等级标准》的对比研究(张新生 2021)等。
上述研究有其历史意义和当下贡献,尚存以下不足:(1)对语言能力标准的文化呈现和价值取向缺乏系统研究,不能充分体现价值塑造、知识传授和能力培养三者融为一体的立德树人精神(中华人民共和国教育部 2020);(2)《等级标准》研究尚于起步阶段,迫切需要蓄力推进;(3)对三个量表的对比研究有待扩展。
语言能力标准是教育目标实现和国际英才管理的重要手段,是目标语对应的文化、历史、地理、国情、价值体系、思维方式,乃至意识形态等的载体,对政策制定、教育管理、考生及其他利益相关人具有重要影响,具有权力和控制性质。因此,拟从价值取向、语言能力构念、描述框架三方面对比《等级标准》《量表》和《欧框》,以期为相关研究、实践与量表修订提供参考。
价值取向指“主体在价值选择和决策过程中一定的倾向性”(李德顺 1995:286)。Risager(2018)提出涵盖国家、公民教育、跨国研究等方面的文化分析框架,可用于分析外语教学材料中的文化、社会和世界面貌。其中,国家指所呈现的具体国家及其内容/特征,这一维度把国家看作已然存在的本质,研究语篇中对他者(目标语)文化的呈现与作者的身份定位(Risager 2018:71)。公民教育指多元文化/语言背景下学生的公民身份教育,旨在帮助个体基于“普遍的人类价值观和愿望看待不同文化,认识群体及其文化特殊性”(Byram 2008:187);外语学习者应在多元文化语境下关注、参与社会问题(Risager 2018:116)。跨国研究关注全球化以及学习者在全球范围内可能的流动(同上:12)。
本文采用定性和定量相结合的方法,通过分析量表文本呈现:(1)国家及其自然、经济、政治和文化等的全面程度来阐述国家维度;(2)从文化多样性、语言多样性、当今世界面临的重要问题讨论公民教育;(3)从跨国交流、人员国际流动、跨国通信(互联网)等方面分析跨国研究。
研究手段上,除文本分析外,还基于三大语言量表中的描述语,建立小型语料库、展开分析。《等级标准》正文3682中文形符、词汇表和语法表29552词符;《量表》正文中文37314形符;《欧框》共计57255英文形符。采用ROST CM6对中文语料进行分词统计,并人工核对、清洗数据。采用AntConc工具统计词频。统计原则为:记录体现国家、公民教育、跨国研究特征的高频词(词频为3及以上的实词)频次,分析各高频词所在描述语上下文文本,剔除不适用者,得到实际频次。
如表1所示,《等级标准》中大量呈现目标语国家中国及中国文化元素,尤其强调向全球汉语学习者传播中国高等教育、民俗文化及书法等代表性文化符号,地域上凸显首都北京,注重饮食文化和节日习俗。比较而言,《等级标准》对中国哲学思想、宗教文化的呈现较少,对当代中国的政治、自然、国情的展示有提升空间。
表1 三大量表中的国家维度①
《量表》响应《深化新时代教育评价改革总体方案》中“努力培养担当民族复兴大任的时代新人,培养德智体美劳全面发展的社会主义建设者和接班人”的号召(中共中央、国务院 2020),强调用外语讲好中国故事。其描述语呈现中国及以传统节日和神话传说为代表的中国传统文化,但对当代中国的经济、政治、自然、地理等的融入比重较低。最后,可能是由于要满足欧盟一体化的开发需求,《欧框》只提及国家/民族,未突出呈现具体国家及其风貌。
如表2所示,三个量表都关注文化多样性,强调学习者的跨文化交际,着力塑造有社会责任感和国际视野的公民。比较而言,《等级标准》对文化多样性和当今世界面临的重要问题描写最少,未考虑多语关照。《量表》十分注重引导外语教师和学习者关注文化多样性和社会问题,但对学习者母语与目标语言之间的关系,以及目标语和其他外语之间的关系鲜有涉及。《欧框》对语言多样性、文化多样性和社会问题的关照比例较为均衡,强调多语、语言变体和多元文化。
表2 三大量表的公民教育维度
从词频统计来看,三个量表都涵盖了跨国流动、跨国交流和跨国通信内容,但各有侧重(表3)。例如,《等级标准》强调以留学和出国为代表的跨国流动;《量表》注重外事、互联网等跨国交流;《欧框》十分强调以互联网为载体的线上交流和跨国通信,对交际方式变革着墨颇多。
表3 三大量表的跨国研究维度
在对目标语的语言地位处理方面,三个量表有所不同。中文是联合国官方语言之一,《等级标准》对其在全球政治、经济、文化交流、互联网社群、社交媒体中的地位描写较少。《量表》和《欧框》则将目标语视作世界语言。比如,《量表》认可学习英语语音变体,破除了以母语者为终极评判标准的价值取向。这既符合英语非母语使用者数量超过母语者(Graddol 2006)的实际情况,又有助于提高中国英语学习者的外语自信和交际意愿。《量表》还关注英语学习者与母语者之间的关系,将学习者视为跨文化交际对象,培养其跨国交流意识。《欧框》将目标语定性为世界语言而非母语者语言,《欧框扩展版》将 “母语使用者”表述更新为“目标语使用者”。
构念指“考试所要测量的概念或特征”。语言能力(language proficiency)通常被定义为“使用一种语言的知识和能力,无论它是如何、在何处或在什么条件下获得的”(Bachman 1990:16)。
三个量表均以交际语言能力模型(Bachman 1990)为理论基础。《等级标准》将中文水平界定为“学习者运用中文完成某项语言交际任务时所表现出的语言水平”(中华人民共和国教育部、国家语言文字工作委员会 2021:1)。《量表》将语言能力定义为“语言学习者和使用者运用自己的语言知识、非语言知识以及各种策略,参与特定情境下某一话题的语言活动时表现出来的语言理解能力和语言表达能力”(中华人民共和国教育部、国家语言文字工作委员会 2018:1)。《欧框》提出“以行动为导向”(action-oriented approach)的语言学习理念,认为语言能力是“一个人执行行动所需的知识、技能和特征的总和”(Council of Europe 2001: 9)。此外,《欧框扩展版》在描写框架中增加了多语能力和多元文化能力(Council of Europe 2020: 30),从语言使用者而非语言本身来描述语言实践(García 2009),将多种语言、模态资源视为整体语言库,强调策略性选择、综合运用全部语言库以达到最佳交际效果(García &Li 2014)。
《量表》和《欧框》(含扩展版)将语言能力视为语言活动、语言知识和交际策略的结合体(彭川 2021;彭川、刘建达 2021)。其中,语言活动方面,《量表》包括听、说、读、写、译,《欧框》包括输入、输出、互动、中介(mediation)。语言知识方面,《量表》包括组构知识(语法知识和篇章知识)和语用知识(功能知识和社会语言知识),《欧框》包括语言、社会语言、语用三维度。《量表》和《欧框》描述框架均包含策略能力。
《等级标准》既继承已有量表的智慧,又体现中文特色,从言语交际能力、话题任务内容、语言量化指标三个维度描述语言能力。其中,言语交际能力对应《量表》和《欧框》的语言活动,包括听、说、读、写、译五项技能;语言量化指标是《等级标准》研制组专家结合汉语正字法特征,将中文学习者所需的语言知识提炼为由音节、汉字、词汇、语法构成的四维基准,并加以量化。《等级标准》的语言策略未独立呈现,却蕴含在技能描述语中。例如,1级听力描述语中“能够通过图片、实物等辅助手段理解基本信息”体现听力策略(中华人民共和国教育部、国家语言文字工作委员会 2021:2)。
综上,《欧框》(含扩展版)《量表》《等级标准》均强调语言使用的动态过程,“涉及对交际语境中信息的评估与意义的协商”(Bachman 1990: 98)。三者不同之处在于:(1)对基本语言技能的分类维度不同。《欧框》(含扩展版)对语言技能的四分法(输入、输出、互动、中介)将互动能力作为一项独立语言技能;《量表》将其融入三项基本语言技能中,即理解能力、表达能力、翻译能力中;《等级标准》则包含听、说、读、写、译五种技能,似未强调互动技能。(2)《欧框扩展版》紧随教育领域多语主义发展前沿,提出多语与多元文化能力理念,并创制了相关量表。
值得深思的是,三个量表对技能综合的关注均不足。近年来,外语教学与测评中的综合性任务(integrated tasks)研究强调技能综合(张新玲、张思雨 2017:22),而三个量表未能就读/听写结合或者读/听说结合做出明确描述,不能充分反映真实情景中所需的典型语言活动和所需语言能力。
在描述框架上,三个量表既有相似之处,又各具特色。《等级标准》采用“3+5”新路径(李亚男 2021),《量表》将语言能力表征为组构能力、语用能力、理解能力、表达能力、翻译能力、策略能力六个方面(中华人民共和国教育部、国家语言文字工作委员会 2018: 5),《欧框》包括通用语言能力、交际语言能力(语言能力、社会语言能力、语用能力)、语言活动、语言策略、语境、交际主题、交际任务、交际语言过程、文本九个方面。《欧框扩展版》补充了线上互动量表、中介策略量表、多语与多元文化能力及其量表、手语能力及其量表(Council of Europe 2020: 23)。《欧框》针对语境、语言交际过程、文本等制定了描述语,《量表》和《等级标准》则将上述内容融入于各个量表的描述语之中。
三个量表都采用“能做”(can do)的肯定式描述语结构,描写“学习者能完成什么+完成的程度”,有助于提升学习者自信心和自我认知意识(Faezetal. 2011)。如前所述,《等级标准》增加了语言量化指标,其描述语构成为“能完成什么+完成程度+话题任务+语言量化指标”。其中,“完成程度”体现为听力语速、口语语调、词汇语法、阅读速度、写作速度等;音节、汉字、词语、语法等级指标以量化形式呈现。这种定性和定量相结合的描写范式,极大地提高了量表的可操作性,方便教师进行课程大纲设计和形成性评估,也提高了学生自评的科学性和便利性。
《量表》的描述语由“能做什么、做得怎样、在什么情况下做”三部分构成。 “能做什么”包括理解、表达、阐述、论证、评析、判断、评价、协商、叙述、描绘、互动等;“做得怎样”(完成程度)通过准确度、清晰度、自然度、恰当性、风格、连贯等指标加以描述。《量表》详细刻画了“在什么情况下做”。比如,初级学习者可借助表情、手势等非言语辅助手段完成交际任务。
《欧框》同样采用“能做什么、做得怎样、在什么情况下做”三要素描述语结构。 “能做什么”包括理解(A1-C2)、表达(A1-C2)、交流互动(A1-B2)、描述(A2-B1)、阐释(B2)、识别隐含意义(C1)、总结(C2)、重构(C2);“做得怎样”主要通过词汇难度、语速、清晰度、流利度、反应速度、连贯性、准确度、交际有效度等指标来界定;“在什么情况下做”以话题任务形式呈现。
从描述语结构看,《等级标准》和《量表》仅以中文或英语学习者为对象,描述语示例化更具体,在教材编写、考题设计、自评表开发中的可操作性更强。《欧框》作为欧盟各国共同的语言教学、测评参考标准,其描述语并非针对某一具体语言,体现了“语境自由”和“语境相关”的双重原则(North 2000:29)。
级别划分是语言标准制定过程的重要一环,所采用的级别数目应“足以区分学习者在不同阶段能力的发展情况……不应超过人们能够合理一致地做出区分的级别数”(North 2000:35)。
三大语言能力量表的级别跨度均具有广泛覆盖面。《等级标准》与《量表》相似,都为三等(初等、中等、高等)九级(1-9级),前者是国际中文学习者终身适用的标准,后者是覆盖教育全学段的英语能力标准(刘建达 2021b:9)。
《欧框》涵盖从入门级别至高级学术级别的语言能力描述(Carlsen 2012),分为初、中、高三等六级(A1、A2、B1、B2、C1、C2),可根据教学和评测需要灵活细分次等级,如在A2级别上可以分出A2.1和A2.2两个级别等。《欧框扩展版》增设预备级(Pre-A1),弥补了《欧框》在小学、初中阶段描述语匮乏的不足。
语言量表级别的精细度与应用语言学的研究成果有关,如学习者在某一阶段的进步较为明显,对应等级的划分则更为精细(韩宝成 2006:445)。总体而言,随着二语习得、外语教育研究的深入,国际语言量表呈现级别细化并形成三等九级的趋势。随着语言与内容学习的深度融合,上述量表未来可能拓展“语言+X”“X+语言”内容,进一步充实各等级的内涵。
语言能力标准是构建国家外语能力测评体系的核心内容。研究发现:(1)在价值取向的国家维度上,《等级标准》和《量表》的具体程度和内涵阐释高于《欧框》。在价值取向的公民教育维度上,三个量表的趋势相同,均注重跨文化公民教育,以培养具有国际视野、跨文化批判思维、社会责任感的公民。但内涵略有差异,《欧框》《量表》《等级标准》在语言多样性、文化多样性、社会问题三个要素的范畴和程度总量上顺次下降。在价值取向的跨国研究维度上,三者均凸显全球化背景下日益频繁的跨国流动和交流,但《欧框》《量表》《等级标准》在跨国通信的呈现上依次递减。(2)在语言能力构念上,三者均突出交际语言能力;《欧框扩展版》融入多语主义、超语理论等新兴要素。翻译能力、多语与多元文化能力、线上虚拟互动或成为重要趋势。(3)在描写框架上,三个量表都采用“能做”的表述方式,但结构和维度略有差异。从时间序列来看,三个量表等级划分不断细化,语言指标量化,示例化趋势明显,操作性不断增强。
综合前人观点和研究结果,提出以下修订建议:
《等级标准》:(1)力求均衡全面呈现中国面貌,反映互联网为代表的跨国通信对交际的影响,体现多语意识,通过中国的语言标准,展示中国话语体系、价值观、思维方式,为中华文化跨文化国际传播服务。(2)注重技能综合,包括听/读后写、听/读后说,反映真实交际情境。(3)跟踪事后效度验证研究、《等级标准》与HSK的对接研究、与国际汉语教材开发操作等进展,形成更多维修订思路。
《量表》:(1)关注结果效度验证证据。现有研究表明《量表》具有现实性、有效性、科学性,具有较好的公平效度、构念效度和程序效度,未来效度验证研究可重点关注基于使用论证的结果效度(朱正才、李俊敏 2021;刘建达 2021a)。(2)进一步提升可操作性。可以典型语言活动为单元,为外语教学与学习,尤其是教材编写,提供更具操作性的参照(刘建达 2021b)。(3)研发更完整的翻译能力等级量表(同上)。(4)增加在线互动和技能综合内容,体现跨语实践和多语意识,重视母语与外语的依存关系,为“重新构架中国的外语教育政策,重新定义中国的外语教育学”提供路径(杨枫 2023:1) 。
《欧框》:(1)提升描述语语言质量。可通过提供精准定义以及量化描述的手段改善现有版本用词晦涩、模糊的问题(Alderson 2007;Figueras 2012;Deygers 2021)。(2)补充效度证据。语言能力标准的构念效度举足轻重,《欧框》的事前效度验证主要基于专家判断,可增加:实证数据支撑(Deygers 2021);对二语学习者真实学习情况的调查,避免把学习者看作各项能力同步发展的标准化、理想化的个体(Figueras 2012)。(3)充分阐述部分要素。比如中介交际活动缺乏清晰的理论界定或数据支撑(Deygers 2021),有必要探索中介能力与输入、输出之间的复杂关系。(4)扩展多语概念内涵和多元文化边界。
附注
①表1~3内部分内容来自《等级标准》词汇表和语法表。