汉语水平考试的历史回顾及研究述评

2016-02-15 04:35:20赵琪凤
中国考试 2016年9期
关键词:效度汉语考试

赵琪凤

汉语水平考试的历史回顾及研究述评

赵琪凤

本文以汉语水平考试(HSK)为例,通过梳理HSK的发展历程,对HSK相关研究进行述评,较为全面地呈现了HSK近30年的发展研究概况。这一基础性研究将有助于学界对汉语水平考试自身发展和学科建设形成系统、全局的认识。

汉语水平考试;HSK;理论与实践

1 引言

汉语水平考试是专为外国人和非汉族人的汉语水平而设计的一种标准化考试,该考试由北京语言大学(原北京语言学院)自主研发,诞生于1984年。经过近30年的发展,汉语水平考试已经得到了广大考生、专业院校及用人单位的高度认可,成为国际知名的汉语测试品牌,其测量结果的稳定性和科学性得到测试研究领域的关注和探索。在汉语作为第二语言的标准化水平测试领域,HSK是当之无愧的领航者,在经历了探索、拓展和改进3个发展阶段后,于2010年逐渐退出历史舞台。然而,测试研究人员在长期的HSK研发过程中积累的宝贵经验,形成的多视角研究成果,都具有很高的理论和实践价值,值得进一步回顾和梳理,总结和述评。

2 HSK的历史回顾

汉语水平考试在过去的近30年中,大体经历了三个主要的发展阶段。根据孙德金的界定,大致分为初创期、拓展期和改进期。

2.1 初创期(1980—1990年)

在HSK初创期的10年里,研发小组成员树立了中国自主品牌的信念,完成了对HSK的定位,梳理了HSK的理论依据,并通过大量实验反复验证该考试的可靠性和有效性。

2.1.1 创立中国自主品牌

托福考试于1981年进入中国后,给国内的外语教学(包括英语作为第二语言的教学和汉语作为第二语言的教学)都带来了启发。当时国内汉语水平考试尚处于空白时期,一些国外的考试机构视图提供资金,聘请北京语言学院的汉语教师参与研发汉语水平考试,但是研发出的汉语考试知识产权不属于中国。这一点触动了北京语言大学的一些教师,他们开始思考独立开发汉语考试的问题,汉语水平考试应当是中国的自主知识产权,而不应成为由国外考试机构掌控的标准化考试。于是,汉语水平考试研发课题从1981年开始筹备,进行一些基础研究工作。1984年12月,当时的北京语言学院正式成立了由刘珣等5人组成的“汉语水平考试设计小组”。可以说,该小组的成立是HSK成为国有自主品牌的基础,研发小组的成员在各方面都不够完善的条件下开始了长期的摸索和实践,为创立自主品牌作出了巨大的努力。

2.1.2 完成HSK的定位

关于HSK的定位,刘英林、郭树军、王志芳进行了详细的介绍和说明。HSK的定位是一种多功能、多用途的水平考试,同时也是一种具有稳定、准确标准的标准化考试。

HSK的多功能体现在3个方面,分别是HSK作为测量考生汉语实际水平的主要标尺,HSK作为检查和评估教学效果、教学质量的重要依据,HSK是对对外汉语教学进行宏观指导,推动教学内容和教学方法的改进或改革。HSK的多用途主要包括:界定留学生进入我国大学学习时必须具备的汉语能力标准;界定我国对外汉语预备教育结业时应具备的汉语能力标准;界定国外汉语学习者来我国学习时分班的能力标准;界定汉语非母语者获取普通汉语水平证书的能力标准。

关于HSK的标准化,刘英林等指出,HSK成为标准化考试需具备的3个条件:第一,对考试误差进行一定程度的控制,使其产生符合要求的信度。第二,使考试产生符合要求的效度。第三,建立几种较为稳定、准确的标准。

总之,在初创时期,HSK的定位得到了明确的界定和详细的说明。

2.1.3 确立HSK的理论依据

HSK作为一种标准化的语言能力测试,和世界上诸多语言测试一样,都是多学科交叉应用的产物,有其特定的学科基础。

2.1.3.1 HSK测了什么

HSK研发中最关键的问题之一,是要回答“测什么”的问题。在这个方面,语言学及应用语言学专业中的一些研究方向,例如第二语言习得研究、第二语言教学理论等为解答“测什么”这一难题提供了答案。

通常情况下,测试和教学是紧密结合的,测什么与教什么也是密切相关的。在HSK的研制过程中,汉语语言学方面的知识,尤其是汉语类型学的特点在试卷设计中得到很好的体现,例如汉语拼音方案的界定,汉语语法的虚词和语序问题,汉语书面语以汉字为书写符号的特性都在考试设计中有所呈现,体现了汉语水平考试所必须具备的汉语语言学知识特征。

第二语言习得理论为研制统一的、标准化的汉语水平考试提供了重要理论依据和现实基础。语言学习是一种行为,语言习得是一种过程。第二语言习得研究中对母语习得和第二语言习得之间的共通之处和诸多差异的研究,为我国对外汉语教学领域的汉语水平等级标准和等级大纲的制定提供了理论支撑和实践依据。

第二语言教学范畴中的宏观语言教学理论,为研发标准化和规范化的汉语水平考试奠定了理论基础。宏观语言教学理论由3个方面构成,分别是语言水平等级标准和等级大纲、能力型教学模式、语言水平标准化考试。这3个方面既是方法问题,又是理论问题。这一教学理论是从我国对外汉语教学40年的群体性经验中提炼出来的,是在继承传统语言教学和语言教学4大环节理论的基础上提出来的,它能够梳理以往语言教学理论中的混乱状况,拓宽教学理论研究的路子,促进语言教学理论向纵深发展。因此,第二语言教学理论在总体建构上明确了汉语水平考试的位置和职责,并明确了汉语水平考试的重要地位。

由此可见,从HSK研制之初,研究人员就在认识上和实践上遵循科学理论的指导。刘珣等在介绍HSK的设计时,专门强调了语言形式、语言功能和交际能力等重要理论问题,并对这些理论问题有比较深入的思考,并将这些思考与考试的实际研发很好地结合起来,成就了汉语水平考试在学理层面和应用层面的科学性和合理性。

2.1.3.2 HSK如何测量

语言既是一种社会现象,也是一种心理现象。汉语水平考试是对汉语语言能力的测量,自然需要一定的测量手段对考生的语言能力作出评估。测量活动无处不在,但是对语言能力的测量不同于对长度、温度等属性的测量。因为语言能力这种心理特质是抽象的,语言能力是什么?如何构成?这一系列的问题都有待探究,语言测试则是在探索中对考生群体的一个抽样样本进行测量,从而对语言能力进行推论和解释。因此,在如何测量的问题上,心理测量学为HSK的研发提供了理论和方法上的依据。

心理测量学是指依据一定的心理学理论,使用一定的操作程序,给人的能力、人格及心理健康等心理特性和行为确定出一种数量化的价值。HSK的研发就是依据心理测量学的理论和方法,研发纸笔测验,在测验的试卷结构、长度、题目类型和数量、施测过程、评分阅卷、分数体系的划定等方面努力追求测量学上要求的高信度、高效度,确保测量结果的可靠和有效,保证试卷的高质量。

2.1.4 大量的调查实验

HSK自诞生以来,大大小小的实验和调查难以细数。为确保HSK考试的稳定性,HSK研发小组于1985—1987年进行了3年大规模的试测和试用,调查范围广泛。由1985年最初研发试测的第一套HSK试卷,只在当时的北京语言学院试验,回收有效试卷362份,到1986年将试测范围从北京语言学院扩大至北京师范大学、北京大学、陕西师范大学等15所高校,并于1987年进行了第三次大规模试测。3次考试都达到了很高的信度,信度系数分别为0.949、0.964和0.97。HSK要取得成功,最重要的是保持试卷难易度的稳定性和一致性,正如桂诗春教授所讲,“这是标准性测验设计中难度最大、技术性最强的一个问题”,是保持考试标准的均衡性和继承性的关键。从持续3年的大规模试测结果来看,1985—1987年度考生通过这3份试卷获得的成绩是稳定的、可靠的。

在试卷的效度研究方面,当时HSK研发小组对试卷的理论效度和效标关联效度进行了检验。3次试测分别对试卷之间、阅读理解和听力理解等分测验之间、以及于全卷之间的相关程度进行了分析,完成了对构想效度、内容效度和共时效度的研究。在预测效度检验方面,研究人员通过跟踪调查,分别于1986年9月和1987年9月调查了参加1985年和1986年HSK考试的学生,了解他们在大学期间的专业学习情况,这方面的调查追踪对于确立合理的能力标准非常重要。从效度研究结果来看,HSK具有较高的有效性,试卷用于入学测试较为准确和可行。

这3年大规模的试测和实验工作,积累了详实的数据和资料,得到了客观准确的分析结果,为HSK的科学性考查奠定了基础。1989年,原北京语言学院正式推出汉语水平考试,并于当年成立北京语言学院汉语水平考试中心。此后,原北京语言学院汉语考试中心仍然不断地开展各种形式的实验和试测,定时监控HSK的科学性和准确性。

2.2 拓展期(1990—2000年)

HSK经过10年的开创,以其稳定性和可靠性,得到了考生和各个院校的认可。同时,随着中国经济的发展,中国与世界各国的合作往来愈加频繁,越来越多的汉语非母语者需要学习汉语,由于学生所处的地区、母语背景的不同,学习汉语时间长短的差异,需要有不同等级的考试来考查学生的汉语水平。因此,HSK在其发展的第二个10年里,形成了完整的考试体系,并且配套形成了等级标准和等级大纲,同时在HSK研究方面也更加深入和全面。

2.2.1 建立完整的HSK考试体系

随着HSK的影响越来越大,考生人数也逐渐增加,汉语水平考试研发人员对考试体系进一步规划和思考。1989年正式推出的考试只是限定在初级和中级水平,还没有满足高级水平和初学者水平。经过几年的调研和研发,汉语水平考试中心于1993年正式推出HSK(高等),原有的“汉语水平考试”命名为HSK(初、中等)。紧接着,在1997年又推出HSK(基础)。至此,HSK考试形成了完整的考核体系,分别为HSK(基础)、HSK(初、中等)、HSK(高等),这3种考试在等级上互相衔接,可以满足高级水平、初中级水平以及初学者水平的需求,基本覆盖了各个层次的汉语学习者。

2.2.2 形成整套的《汉语水平等级标准和等级大纲》

与考试体系相配套的,是各种等级大纲和考试大纲的制定。汉语水平考试的研发者们在研发不同等级考试的同时,制定了5种作为HSK命题主要依据的考试大纲,它们分别是《汉语水平词汇与汉字等级大纲》《汉语水平等级标准与语法等级大纲》《中国汉语水平考试大纲(基础)》《中国汉语水平考试大纲(初中等)》和《中国汉语水平考试大纲(高等)》。以上5种考试大纲的制定,是HSK等级体制科学性的重要保证。

2.3 改进期(2000—2010年)

20世纪末21世纪初,HSK经历近20年的发展,成为著名的语言测验品牌,累计考生人数近百万(含国内少数民族考生)。HSK需要进一步发挥它的社会服务功能,汉语水平考试的研发人员也一直保持着“用户至上”的意识,最大限度地满足汉语学习者的各种需求。因此,在新的时期下,HSK需要面临改进和创新,研发出具有强针对性的汉语考试,并改进HSK考试。

在这一背景下,原汉语水平考试中心对HSK进行了改进,并公布了汉语水平考试(HSK)改进方案,改进后的HSK具有如下特点:第一,不改变HSK的基本性质和用途;第二,注重考察语言交际能力,同时兼顾语言知识;第三,在分数体系、分数解释以及等级划分上更加科学、合理;第四,初、中、高各级考试都设计了口语和写作测验,实现了听说读写的全面测评;第五,试卷结构更加合理,题型设计反映了教学和习得的规律。

与此同时,根据海外市场的需求调查和用户反馈,原汉语水平考试中心又开发了适用于零起点汉语学习者的HSK(入门级)考试,实用汉语水平认定考试(C.TEST)系列考试,包括客观卷考试和口语面试。

可以看到,随着时代的发展,HSK的研发也在与时俱进,在保证试卷科学性和可靠性的同时,关注市场和用户需求,多元化、多角度地开发考试,只有这样才能在激烈的市场竞争中始终保持领先地位。

3 HSK的相关研究

纵观HSK发展的近30年历史,与之相伴的是测试研究者对HSK考试的各项研究。本文将这些研究概括为两个主要方面:一是有关HSK的宏观研究,二是HSK的具体研究。

3.1 有关HSK的宏观研究

所谓HSK宏观研究,一方面是指HSK研发之初的设计理念、性质定位等总论性的研究论文,这些研究旨在促成HSK从无到有的历史性的转变,介绍和解释HSK在不同历史时期的设计理念和研发定位。另一方面,还指HSK学理层面的理论研究,这些研究是为了解决和确定有关HSK在学理层面的归属和界定问题,具有一定的概括性和前瞻性。

3.1.1 HSK总论及设计定位

在宏观方面的研究,最早的一篇具有代表性的论文是HSK的5位创始人(刘珣、黄政澄、方立、孙金林、郭树军)合作的《汉语水平考试的设计与试测》,该论文在第一届国际教学讨论会上宣读,引起重大反响,也首次宣布中国独立设计完成了汉语水平考试。之后,陆续有文章发表在《世界汉语教学》《语言文字应用》等汉语教学类的期刊上,内容关于《汉语水平考试(HSK)的性质和特点》《高等汉语水平考试的设计原则和试卷构成》《汉语水平考试(HSK)的研究新进展》等等,大多数发表的论文集中在HSK初创期。到了21世纪,HSK创始人之一郭树军应《人民日报海外版》之邀,发表了名为《HSK——成功的汉语水平考试》的简讯,对HSK的研发和实施进行了客观、全面的介绍和评价。2007年,原汉考中心“HSK改进工作项目组”,在《世界汉语教学》发表了《中国汉语水平考试(HSK)改进方案》,介绍了改进后的HSK在试卷结构、分数体系等多方面的调整和改进。孙德金从历时的角度,梳理了HSK的科学本质,再一次宏观地研讨了HSK的理论与实践。

3.1.2 理论探索

在明确HSK的性质定位的同时,考试研究者们也在更加深入、全面地研究HSK,尤其是在HSK的学理层面,研究者们从第二语言能力结构、汉语能力研究、构想效度研究等深层面的理论问题入手,在国内较早地探索这些语言学、心理学等公认的难题,并进行了细致、有益的探讨和分析,张凯探讨了语言测验和乔姆斯基理论的关系,陈宏对语言能力结构和结构效度进行了较为深入的探索。进入21世纪,王佶旻、张凯再一次对语言能力和构想效度进行了思考和研究。赵琪凤对构想效度理论展开了进一步的探讨。这类基础理论的探讨是改进考试设计,保证考试测量有效的基础和前提。同时,基础理论的探索也带动语言测试研究方向的学者和研究生深入思考,促进实践应用研究的开展。

3.2 有关HSK的具体研究

在HSK的具体研究中,研究者从不同的角度对HSK进行分析和检验,本文将从以下几个类别分别进行综述。

3.2.1 HSK的信度和效度检验

信度和效度是心理测量中的两个重要概念,也是HSK质量的重要指标,效度尤其是重中之重。关于HSK信、效度的实证检验自然必不可少。原汉考中心的专家们曾就效度问题作出过探讨,郭树军、张凯、陈宏等都对HSK的构想效度进行过检验。后来,北京语言大学语言测试方向的研究生陆续对HSK的信、效度进行了多角度、多方面的检验和验证。

3.2.2 命题与HSK的题型研究

HSK试题的编写,试卷的结构组成,题型设置以及每种题型的测试效度等信息,同样值得研究和检验,在这个方面也不乏研究者进行细致地分析,通过实证检验的结果来对试卷的题型设置,命题原则等提出改进意见和有益信息等。

3.2.3 HSK评分研究

HSK评分研究,尤其是主观性考试(口语考试和写作考试)的评分,会存在评分员主观因素的干扰,因此评分研究也是HSK研究的主要选题之一。研究者们从口语考试评分标准、题型和题数的组合形式、写作评分标准的设置等多角度展开研究,研究成果不仅为实际的主观性评分标准的改进提供参考信息,同时对提高主观性评分的效率和分数可靠性监控等方面的提高也颇有帮助。

3.2.4 HSK等值及考试公平性研究

HSK等值研究方面,谢小庆对15种等值方法做了比较,对HSK确定合理的等值方案很有帮助。在考试公平性方面,一些研究者也做了大量的分析,从题型、题目等多角度探讨考试的公平性问题等。

3.2.5 后效研究及题库建设研究

HSK的后效研究,主要集中在对考试效果,尤其是考试对教学的影响方面,这一社会学视角的测试研究也受到不少研究者的关注等。HSK经过近30年的发展,已经形成了专门的题库,对于题库的建设,研究者也有所思考,其中几位原汉语考试中心的研究者根据多年的工作经验,对HSK题库建设做了一些有益的探讨等。

总之,在HSK发展的近30年里,原汉语水平考试中心的研究者们以及语言测试方向的研究生们,围绕着HSK开展了大量的研究,包括基础理论研究和具体应用研究,这些研究涉及考试的各个方面,有HSK的研发设计研究、理论探索、信度和效度研究、分数解释和评价研究、公平性研究、预测与等值技术研究、主观性考试评分研究等等。多数的研究报告都依据大量的调查研究和试验检验,这些基于大量数据和实证材料的研究结果,为HSK的改进和发展提供了切实可行的证据支持。因此,HSK的发展壮大与它背后坚定的研究团队是分不开的。

4 小结

本文通过对HSK近30年的历史回顾,以时间为纵线梳理了HSK的发展历程,大致可以归纳出HSK发展的历史轨迹,经历了初创期的学习和摸索阶段,完成了对HSK的性质描述和定位问题,并明确了HSK的理论基础,开展了多次大规模的试测和实验,通过数据证明HSK的稳定性和有效性。接下来的拓展期,HSK研发队伍完成了考试体系的全面架构,形成了HSK(基础)、HSK(初、中等)、HSK(高等)3个等级的考试,实现了对不同水平等级考生的考试需求。在新世纪的改进期,HSK研发者们对HSK进行改进,实现对考生听、说、读、写的全面测评,并开发了其他强针对性的汉语考试。这样一个紧跟时代发展的考试研发和实施历程,体现了我国汉语考试研发的进步。

HSK多年来的发展,离不开研究人员对HSK本身的各方面理论研究与实践研究,大量的研究论文从多角度、多侧面探讨HSK各方面的问题,这些基于大量数据和实证材料的研究结果,为HSK的改进和发展提供了切实可行的证据支持。

历史研究是学科理论建设的一项基础性工作,汉语考试学科理论的建设同样需要对汉语考试进行全面的历史研究。本文通过梳理汉语考试的发展历程、分析汉语考试的现实问题,将进一步思考汉语考试的未来走向,为今后对汉语考试自身发展和学科建设提出系统的、全局的认识奠定坚实的基础。

[1]北京语言大学汉语水平考试中心“HSK改进工作项目组”.汉语水平考试(HSK)改进方案[J].世界汉语教学,2007(2).

[2]柴省三.蕴涵量表法在HSK阅读理解测验公平性研究中的应用[J].考试研究,2012(5).

[3]陈宏.第二语言能力结构研究回顾[J].世界汉语教学,1996(2).

[4]陈宏.结构效度与汉语能力测验——概念和理论[J].世界汉语教学,1997(3).

[5]陈宏.在语言能力测验中如何建立结构效度[J].语言教学与研究,1997(2).

[6]郭树军.汉语水平考试(HSK)项目内部结构效度检验[C]//汉语水平考试研究论文选.北京:现代出版社,1995.

[7]郭树军.HSK——成功的汉语水平考试[N].人民日报海外版2002.

[8]黄春霞.概化理论及其在HSK测验中的应用[J].云南师范大学学报(对外汉语教学与研究版),2004(2).

[9]黄理兵,郭树军.HSK阅读理解试题的语料和命题[J].世界汉语教学,2008(2).

[10]刘镰力.中国汉语水平考试(HSK)的等级体制[J].世界汉语教学,1999(3).

[11]刘镰力.汉语水平测试研究[M].北京:北京语言文化大学出版社,1997.

[12]刘珣,黄政澄,方立,孙金林,郭树军.汉语水平考试的设计与试测[C]//第一届国际汉语教学讨论会论文选.北京:北京语言学院出版社,1995.

[13]刘英林.汉语水平考试(HSK)的理论基础探讨[J].汉语学习,1994(1).

[14]刘英林,郭树军,王志芳.汉语水平考试(HSK)的性质和特点[J].世界汉语教学,1988(2).

[15]聂丹.汉语水平考试(HSK)写作评分标准发展概述[J].云南师范大学学报(对外汉语教学与研究版),2009(6).

[16]任杰.中国境内外HSK成绩公平性的分析[J].语言教学与研究,2002(5).

[17]孙德金.汉语水平考试(HSK)的科学本质[J].世界汉语教学,2007(4).

[18]孙德金.汉语水平考试发展问题略论[J].中国考试,2009(6).

[19]田清源.HSK主观考试评分的Rasch实验分析[J].心理学探新,2007(1).

[20]王佶旻.国外语言测验领域对语言能力的研究述评[C]//考试研究文集.北京:经济科学出版社,2002.

[21]王佶旻.HSK(改进版)口语考试的设计[C]//中国汉语水平考试HSK(改进版)研究.北京:北京语言大学出版社,2010.

[22]谢小庆.对15种测验等值方法的比较[J].心理学报,2000(2).

[23]张凯.汉语水平考试结构效度初探[C]//首届汉语考试国际学术讨论会论文选.北京:北京语言学院出版社,1995.

[24]张凯.语言测验和乔姆斯基理论[J].世界汉语教学,1998(2).

[25]张凯.考试的反馈[C]//汉语水平考试研究文集.北京:经济科学出版社,2000.

[26]张凯.语言测验理论与实践[M].北京:北京语言大学出版社,2002.

[27]张凯.语言测验的测度和精度[J].语言文字应用,2004(4).

[28]赵琪凤.也谈构想效度本质及其定律网络[J].中国考试,2013(3).

[29]赵琪凤.效度研究领域中的争议[J].中国考试,2014(6).

A Review on the History and Research of the Chinese Proficiency Test

ZHAO Qifeng

The historical research is a basic work of the construction of the discipline theory.The construction of the discipline theory of Chinese examination also needs to carry on the comprehensive historical research to the Chinese examination.Taking the Chinese Proficiency Test(HSK)as an example,by combing the development process of HSK,this paper reviews the related research of HSK and makes more detailed and comprehensive presentation of the development of HSK in recent 30 years.This basic research will lay a solid foundation for the development of the Chinese language and the construction of the subject.

the Chinese Proficiency Test;HSK;Theory and Practice

G405

A

1005-8427(2016)09-0047-7

(责任编辑:周黎明)

本研究得到国家语委科研项目“汉语考试的历史、现状及发展趋势研究”(编号:YB125-138)、北京语言大学院级科研项目(中央高校基本科研业务专项资金)(编号:16YJ050009)、“北京语言大学青年英才培养计划”项目资助。

赵琪凤,女,博士,北京语言大学,副研究员,硕士生导师(北京 100083)

猜你喜欢
效度汉语考试
学汉语
金桥(2022年6期)2022-06-20 01:36:16
轻轻松松聊汉语 后海
金桥(2020年11期)2020-12-14 07:52:56
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
追剧宅女教汉语
汉语不能成为“乱炖”
华人时刊(2017年17期)2017-11-09 03:12:08
Japanese Artificial Intelligence Robotto Take Entrance Examinations
中学科技(2017年5期)2017-06-07 13:01:01
被看重感指数在中国大学生中的构念效度
心理学探新(2015年4期)2015-12-10 12:54:02
你考试焦虑吗?
中学科技(2015年6期)2015-08-08 05:35:38
外语形成性评估的效度验证框架
准备考试