王佶旻
提 要 汉语能力标准旨在对汉语使用者不同的语言水平等级进行定义和描述,为汉语教学和测验提供统一的标准参照体系,也为国家制定语言政策提供咨询。全球化视角下的汉语能力标准的研究对象应该包括普通公民、少数民族、海外华裔以及外国人。制定全球化视角下的汉语能力标准是必要的、可行的,文章提出了汉语能力标准的框架体系及其研究方法与步骤。
关键词 汉语能力标准;语言能力描述语;语言测验
Abstract Chinese Proficiency Criterion aims at making definitions and descriptions of Chinese speakers different language proficiency levels, so that it can provide a unified standard referencing system for Chinese language teaching, learning and testing, as well as the consultation for the development of national language policies. The subjects that the Chinese proficiency criterion target at are Han Chinese, ethnic minorities within China, overseas Chinese and foreign learners. This study describes the necessity and feasibility of establishing Chinese proficiency standards from the perspective of global Chinese. Based on extensive review of the existing language testing systems both overseas and in China, the paper also proposes a framework of developing Chinese proficiency criterion and research methodology and procedures.
Key words Chinese proficiency Criterion; description on Chinese proficiency; language testing
一、 解 题
国家、社会和个人都需要了解语言能力的现状、获取提高语言能力的方法和途径。这就迫切需要制定一部汉语能力标准,通过标准的实施和应用来真实地刻画、描写、测量和评价语言使用者的能力水平,指导和规范语言教学和测试,并为国家制定语言政策提供咨询。
全球化视角下的汉语能力标准研究中有两个重要的概念,即汉语能力标准和全球化。语言能力标准是根据语言使用者的行为表现来定义其语言水平的能力量表。汉语能力标准旨在对汉语使用者不同的语言能力水平等级进行定义和描述,从而为汉语教学和测验提供统一的标准参照体系。这个体系包括三个主体:第一, 对不同能力水平的区分,即能力等级的制定与测评;第二,对不同等级的总体描述,即描述具备某一水平等级的语言使用者带有区别性特征的语言表现;第三,对不同等级语言技能的能做(can-do)描述,即描述在现实生活中,处于不同等级的语言使用者能够完成的语言任务。
我们说的全球化视角包括三个方面。一是汉语使用者的范围,包括全球汉语(或华语)的使用者。二是文化传承的视角,海外华裔在使用、传播和继承华语的过程中体现了传承中华文化的心愿,而华裔的华语能力与华语教学也呈现出相对复杂多样的情况,了解和维护海外华语教育与文化传承具有重要的社会意义。三是汉语国际传播的视角,汉语能力标准的制定不仅要面向公民,面向华裔,也要面向外国汉语学习者。因此,全球化视角下的汉语能力标准研究将涵盖四个子维度:汉语作为母语的公民语言能力标准、少数民族国家通用语言文字应用能力标准、海外华裔汉语能力标准以及汉语作为第二语言的外国人语言能力标准。
以全球化的视角研究语言能力标准具有特殊的社会意义。中国的国情使得语言和语言教育成为国家统一和社会稳定的重要影响因素。因此汉语能力标准的研究既要面向以汉语为母语的普通公民,也要面向少数民族,了解少数民族对国家通用语言文字的应用能力,并为他们制定相应的能力标准。海外华裔对继承和发扬中华语言文化充满热情,而海外的华语教育环境复杂,华裔的华语文能力的现状和发展对于维护周边安全起着重要的作用,因此汉语能力标准必须要考虑到华裔这部分。此外,随着中国综合国力的增强,汉语走出去成了热点问题。汉语的国际传播是国家软实力的体现,在汉语国际传播的过程中,语言教育、学习和测试都需要统一的指导和规范,而汉语能力标准正可以承担这一功能,因此汉语能力标准的制定也应包括外国汉语学习者。
二、语言能力与能力标准的研究现状
1. 国外的语言能力标准
语言能力标准的出现是应用语言学领域的一件大事,涉及语言教学和测验的统一评价标准。国外最早的语言能力标准是20世纪50年代美国外交学院(Foreign Service Institute,简称FSI)制定的FSI量表。FSI量表经过修订后发展成为联邦政府语言协调会(Interagency Language Roundtable,简称ILR)能力量表。这两种量表是语言能力标准的雏形,到了20世纪70年代,逐渐开始走入美国教育领域,成为一种类似于语言评价标准的规范性量表。推动国外语言能力量表发展的是ACTFL大纲。ACTFL大纲是美国教育测验服务中心(Educational Testing Service,简称ETS)和美国外语教学委员会(American Council for the Teaching of Foreign Language,简称ACTFL)在ILR量表的基础上修订而成的。ACTFL大纲的出现在语言测试、语言教学、外语学习和政府政策方面都产生了深远的影响,它对能力等级的划分、等级标准的界定和语言表现的描述都为以后的能力标准的制定提供了参考。可以说,ACTFL大纲是第一个真正意义上具有能力标准性质的纲领性文件。但这个大纲对能力等级的划分和描述缺乏定量的依据,这一问题在ACTFL大纲的几次修订过程中都没有得到应有的重视。
21世纪出现的《欧洲语言共同参考框架》(Common European Framework of Reference for Languages,简称 CEFR)是一个比较成熟的语言能力量表。它是全欧的共同参考基础,可用于制定现代外语教学大纲和考试大纲,也可用于设计外语能力评估体系,同时还可作为编写教材的指南。CEFR虽然是一个被广泛认可的能力标准,但它也存在一些问题,其中一个突出的问题是缺乏定量描写。Weir(2005)还指出了CEFR的另外两个问题:第一,CEFR虽然在作业类型以及使用背景等方面对若干影响语言运用的因素做了描写,但并没有说明这些因素会对学习者产生什么样的影响;第二,CEFR没有说明学习者的能力是由哪些成分构成的,如果对学习者的能力结构缺乏说明或定义,考试的开发者就很难开发出有效的考试。
除以上语言能力标准外,澳大利亚的ISLPR量表(International Second Language Proficiency Ratings)、加
拿大的CLB量表(the Canadian Language Benchmarks)和日本的英语能力描述语(the EIKEN Can-do List)等都是各国制定的语言能力标准。
2. 国内的语言能力标准
国内的语言能力标准包括三个领域:对外汉语教学、公民语言能力和少数民族汉语教育。对外汉语教学领域最早的能力标准是1988年出版的《汉语水平等级标准和等级大纲》(试行)。这个大纲把汉语水平分成五个等级,而词汇(包括汉字)、语法、功能和文化,均分成四级(甲、乙、丙、丁)。在此基础上,1992年出版了《汉语水平词汇与汉字等级大纲》,1996年推出了《汉语水平等级标准与语法等级大纲》。2007年,国家汉办发布《国际汉语能力标准》,作为海外汉语学习与教学的标准。《国际汉语能力标准》由五个水平等级组成,每个水平等级都有三个层面,即总体描述、口头和书面交际能力描述、口头和书面理解与表达能力描述。
这两部标准虽然得到了较好的使用和推广,但仍存在以下四点不足:第一,对能力和水平等级的描写不细致;第二,现有的标准覆盖的能力范围不够大;第三,没有实现与水平测验的等级对应;第四,没有在不同的语言间建立联系,因此缺乏兼容性,不能和国际接轨。
在公民语言能力标准研究领域,近20年来,国家语言文字工作部门和有关部委陆续面向社会推出了普通话水平测试(PSC)、汉语能力测试(HNC)、汉字应用水平测试(HZC)、职业汉语能力测试(ZHC)等测量工具;香港考评局和高等院校也开发了普通话水平测试、普通话水平考试(PSK)等测量工具。以普通话水平测试为例,自1994年实施测试以来,参加测试的人数已达到5000万人次,并于2000年载入《国家通用语言文字法》,成为汉语母语教学及评价中的重要资源,这些测试都是面向汉语母语者的测试。普通话水平测试和汉字应用水平测试的内容各自限于普通话或汉字,显得比较单一;职业汉语水平测试包括阅读理解和书面表达而忽略了口头表达的考查,对语言能力的考查也不够全面;汉语能力测试考查汉语口语理解能力(聆听)、汉语口语表达能力(说话)、汉语书面语理解能力(阅读)和汉语书面语表达能力(写作),综合性比较强,尚属试测阶段。
国内关于少数民族国家通用语言文字应用能力标准及评价体系的研究也有较长的历史。2001年已启动中国少数民族汉语水平等级考试(MHK)项目。MHK是专门测试国内母语非汉语的少数民族汉语学习者汉语(国家通用语言文字)水平的国家级标准化考试,主要考查少数民族学生实际运用汉语进行交际的能力,考查少数民族学生运用汉语工具完成生活、学习、工作和社会交往任务的能力。经过几年的研究,先后出版了《中国少数民族汉语水平等级考试大纲》(一级至四级),制定了少数民族汉语水平四个等级标准,形成了从民族小学到民族大学的汉语达标测试。
随着中国少数民族地区与其他地区在经济和文化等方面的交流日益频繁,少数民族地区对汉语能力的要求也呈现出多层次的专门化趋势。原用于汉语课程结业标准的语言能力描述显然只属于学科领域,无法满足社会生活中不同职业对劳动者的汉语需求,也无法真实反映汉语在少数民族中的应用状况。因此,在MHK的基础上,需要重新定义少数民族国家通用语言文字应用能力。
三、汉语能力标准的框架设计
中国现有的汉语能力标准与测试研制于不同的时期,有着各自不同的目标、内容、原则和方法,因此相互之间很难兼容。我们希望在一个统一的框架下,以统一的原则、方法和步骤来制定全球化视角下的汉语能力标准与测评体系,使之既有针对性又有兼容性。汉语能力标准体系的总体框架设计分为四个部分。
(1)语言能力结构说明与等级描写,这部分对标准所描述的语言能力结构与内容进行具体说明,并阐述等级划分标准与每个等级的区别性特征。
(2)描述语数据库。每一套标准都要有详细的语言水平等级描述,每一条描述语都要有定量指标。
(3)语法、字词大纲。这一部分可以根据实际需要来制定,比如针对普通公民的母语能力标准可以不要语法大纲,因为母语者通常具有对本族语的语法敏感性,很少会犯语法错误。
(4)配套测验与使用说明。标准的推广和使用需要依靠测验,并且测验也可以在很大程度上起到检验标准的作用,因此语言能力标准与配套的语言测验是一种相互依存的关系。
这个框架体系如图1所示。
我们设想的汉语能力标准将包括普通公民的语言能力、少数民族的国家通用语言文字应用能力、海外华裔的汉语能力以及外国汉语学习者的语言能力四个领域。每个领域有不同的使用人群和实际需要,但在标准的制定过程中可以依据相同的原则、方法和步骤,我们希望在统一的框架下开展这四个领域的标准制定工作,使之成为一套标准体系。
四、汉语能力标准研究的方法与步骤
全球化视角下的汉语能力标准研究应当包含以下五个方面的内容。
1.语言能力定义与等级描写的理论分析
制定语言能力标准首先需要定义语言能力并明确其描写方式。我们认为语言能力是人们在现实生活中使用语言处理各项任务的能力,它的关键在于交际能力。从操作层面出发,可以定义为以策略能力为枢纽,由语法能力、篇章能力、以言行事能力、社会语言学能力诸方面组成。语法能力包括涉及语言规则的那些能力,这些能力决定了学习者在表达特定意思的时候,对词汇、句式进行选择,并用语音或文字等物理形式使其实现。篇章能力指的是按照语言应用的惯例把句子等语言片段组成成段话语的能力,这包括连贯、照应和修辞能力。以言行事能力包括言语行动和社会功能两个要素。社会语言学能力是指对语言发生的社会文化环境的敏感程度和驾驭能力(Bachman 1990;Bachman & Palmer 1996)。
在语言运用过程中,听、说、读、写四项技能既有联系又有区别。Brown(1996)在模式和渠道两个层面上区分了口语、听力、阅读和写作四种语言技能。Brown认为模式有两种,一种是接受的,另一种是产出的;渠道也有两种,一种是书面的,另一种是口语的。四种语言技能在模式和渠道上的表现是不同的,口语渠道和书面语渠道都有接受性和产出性两种模式,正是通过这两种模式的相互作用,一定渠道的交际任务才得以完成。
综上所述,语言能力的评价需要将听、说、读、写四个方面作为既相互独立又紧密联系的整体进行全盘考虑。我们认为对语言能力的描述应从听、说、读、写四个方面分别进行。在每一项技能中,我们都从三个层面进行描述。第一个层面是能力概说,以概括的语言对每一水平等级进行描述,描述的主要任务是找出每一水平等级的区别性特征。第二个层面是“能做”描述,通过语言任务的形式对不同水平等级的学习者能够做什么进行详细描述。“能做”描述也要从不同的子能力维度展开,以典型的作业任务为描述的依据,而非随意描述。第三个层面是量化指标,主要从字、词掌握数量,阅读、听力和写作的速度等方面来区分不同水平的使用者。
语言能力的定义和描写还涉及能力等级的划分,等级划分既要科学客观,又要与国际接轨,如与欧洲语言共同参考框架兼容。因而采用三等六级的等级数目比较现实,分别表示为:初等(起步级、初阶级)、中等(入门级、良好级)和高等(熟练级、优秀级)。
在制定汉语能力标准体系的过程中,需要准确把握不同群体的语言能力结构特点和能力水平分布。母语者的能力差异主要在于书面语和社会文化层面,二语者的差异在于语言表现的准确性和流利性上。因而不同群体的能力描述侧重点不同。语言能力标准作为一种能力量表,需要科学准确地定义量表的测度、全距和单位。
2.语言能力描述语数据库及其参数体系研究
语言能力描述语是语言能力标准研究理论中的一个特定概念。它是指在现实生活中,处于不同水平等级的语言使用者能够完成的语言任务与所具备的语言特征。实际上,语言能力标准就是在语言能力结构框架下,对语言水平进行划分、描写和测评的一个能力量表。在这个量表中,描述语扮演了重要的角色,研究者们使用不同的描述语刻画不同的能力水平以及能力的不同方面。因此,描述语数据库本身就应当是语言能力标准研究的题中应有之义。这项研究包括描述语的收集和编写、描述语项目参数估计以及数据库结构和服务平台建设。
语言能力描述语数据库不是描述语仓库,而是与能力标准配套的语言能力水平等级描述体系。这个体系应该有四个特点:有序、有量化指标、便于检索、服务于语言能力标准的实施与推广。描述语数据库的参数体系包括每一条描述语的能力属性(如阅读能力/阅读过程)、等级归属(如入门级)。我们认为语言能力描述语数据库的结构可以包括基本文献库和汉语能力描述语数据库。基本文献库由我们收集的国内外有关语言能力的描述语组成,充当基本素材库,可以为有关部门、行业和研究机构提供资料。数据库结构如图2所示。
3.描述语调查问卷与抽样方案的设计
描述语调查问卷使用描述语刻画语言水平,通过自评(或他评)形式调查语言使用者的能力水平,同时获取描述语的项目参数(难度、能力维度)。在调查中,所有问卷均使用李克特量表并以正向提问方式提问。同时以专家对描述语水平等级的预判结果为基础,将描述语初分等级,编制成问卷。
描述语的问卷调查是一项十分艰巨的工作。因为调查对象分布广泛,描述语的数目较多,为经济可行,在实验设计上需要采用分层随机抽样和矩阵取样设计相结合的方法对被试的语言能力状况进行调查,从而获得描述语的相关参数,具体方案如下。
(1)采取分层随机抽样法完成被试的取样。根据地域、学历、职业、性别等变量对被试总体进行分层,然后在每层中进行随机取样,保证每层中的样本数基本接近,拟选取6000人作为调查对象。
(2)采用平衡的不完全组块设计完成题册的设计和施测。本研究的描述语分为听、说、读、写四个维度,假设每个维度的描述语有45条,则共有180条描述语。将180条描述语分配到12个组块中,分别为L1—L3、S1—S3、R1—R3和W1—W3(L为听力,S为口语,R为阅读,W为写作),每个组块包括15条描述语,每个题册由4个组块组成,每个组块仅在一个题册的4个可能的位置上出现一次,且每个组块仅和其他组块配对一次,不同的题册之间由相同的组块加以链接。施测时,题册在被调查群体中以螺旋式发放,每位被试随机接受1个题册的测试,即完成60道题目。
(3)使用项目反应理论(Item Response Theory,简称IRT)方法估计题目参数和被试的能力参数,并通过不同题册间相同的组块将所有的题目参数和被试能力参数统一到同一个量尺上。
4.与标准配套的测验框架体系的制定
语言能力标准的实施和推广在很大程度上依赖于相应的语言测验,同时语言测验的编制也迫切需要标准的指导。因而在语言能力标准的研究和建设过程中需要考虑配套的语言测验。测验框架体系初步的结构如图3所示(见下页)。
5.等级量表间的链接和全球化能力标准的框架体系设计
汉语能力标准的制定原则是科学、实用、兼容、可推广。科学是指方法科学,并可经实证研究的检验。实用是指具有较强的针对性和可用性。兼
容是说能力量表之间具备一定的换算关系,有两方面含义:一是与国际接轨,如与CEFR接轨,二是全球化视角下各类能力标准的相互关联。
标准之间的相互关联需通过测验之间的相互关联来间接地实现,并且这种链接在技术上是比较困难的,我们拟以阅读能力测验为试验田,使用垂直等值设计建立公民、少数民族、华裔和外国人汉语阅读测验间的链接。具体方案如下。
采取锚测验设计,运用项目反应理论分别估计的方法对四套阅读能力分测验进行垂直等值,从而实现阅读能力标准之间的兼容,构建相互链接的阅读能力标准体系。具体方法如下。
(1)编制一份大尺度(难度与跨度足够大)的阅读理解锚测验;
(2)向公民、少数民族、华裔和外国汉语学习者分别施测相应的阅读理解分测验和步骤(1)中编制的锚测验,完成等值数据的收集工作;
(3)使用上述四个被试群体在锚测验上的作答数据,运用BILOG-MG估计锚测验的题目参数以及四个被试群体的能力分布(将其中一个群体的能力量尺设定为平均数0,标准差1);
(4) 使用上述四个被试群体在相应的阅读理解分测验上的作答数据,分别估计四个阅读理解分测验的题目参数及四个被试群体的能力分布,能力的平均数和标准差分别设定为步骤(3)中估计出的值;
(5)通过步骤(3)和(4),四套阅读能力分测验的题目参数都置于同一分数量尺上,完成测验分数的垂直等值,从而实现各标准之间的链接。
五、结 语
全球化视角下的汉语能力标准以科学、实用、兼容和可推广为基本准则,并使标准建立在对语言能力及其结构进行充分定义的基础上,以详细、适用的语言能力描述语为语言水平等级描述的支撑,通过大量的实证研究获取语言使用者能力状况的第一手资料,以及描述语项目参数的数学指标,从而建立起真正意义上的语言能力描述语数据库。以全球化的视角建立汉语能力标准,使标准能够覆盖到普通公民、少数民族、华裔和外国人等不同群体,并运用语言测验理论和心理测量技术实现多测验、多量表间的关联,建立起不同汉语使用者群体的能力常模,使汉语能力标准在使用中具有更加科学的解释力,实现与国际接轨。
参考文献
国家对外汉语教学领导小组办公室汉语水平考试部 1992《汉语水平词汇与汉字等级大纲》,北京:北京语言学院出版社。
国家对外汉语教学领导小组办公室汉语水平考试部 1996 《汉语水平等级标准与语法等级大纲》,北京:高等教育出版社。
国家汉语国际推广领导小组办公室 2007 《国际汉语能力标准》,北京:外语教学与研究出版社。
教育部民族教育司中国少数民族汉语水平等级考试课题组 2001 《中国少数民族汉语水平等级考试大纲》,北京:北京语言学院出版社。
中国对外汉语教学学会汉语水平等级标准研究小组 1988《汉语水平等级标准和等级大纲》(试行),北京:北京语言学院出版社。
Bachman, Lyle F. 1990. Fundamental Considerations in Language Testing. Oxford: Oxford University Press.
Bachman, Lyle F. and Adrian S. Palmer. 1996. Language Testing in Practice. Oxford: Oxford University Press.
Brown, James Dean. 1996. Testing in Language Programs. Upper Saddle River: Prentice-Hall, Inc..
Weir, Cyril J. 2005. Limitations of the Common European Framework for Developing Comparable Examinations and Tests. Language Testing 22(3), 281-300.
责任编辑:丁海燕