论普通话水平测试研究内容

2012-01-28 14:36聂丹
中国考试 2012年6期
关键词:普通话测试水平

聂丹

论普通话水平测试研究内容

聂丹

规划普通话水平测试学科的研究内容是一个系统工程,需要找准研究主线,划定研究区域,理清研究层次,从宏观到微观地对普通话水平测试研究内容进行分层和分级。本文探讨了普通话水平测试研究的6个基本问题,在此基础上,依次阐述了普通话水平测试研究内容的“二分法”、“三分法”、“四分法”等宏观分类法以及微观分类法。这一系统工程的建成有助于普通话水平测试研究者明确研究定位,理顺研究思路,洞悉研究路向,减少研究的盲目性和重复性,增强研究的方位性和条理性。

普通话水平测试;学科;研究内容

普通话水平测试(PSC)是世界范围内少见的专门测试母语者标准语水平的大规模的口语测试。它从酝酿、产生、发展到不断深化,已经走过了30年历程,形成了一支素质优良的研究队伍,产生了大量研究著述,初步确立了PSC的学科地位,受到越来越多语言学和测量学研究者的关注。然而,作为一门新兴学科,当前的PSC研究还不能完全适应PSC事业发展的需求。其中,一个突出问题就是PSC的研究内容缺少科学规划。仅从研究成果的数量来看,各研究领域的发展还不平衡,某些领域出现研究“扎堆”的现象,而另外一些领域却相对冷清甚至无人问津。从研究成果的质量来看,重复性研究比较多,创新性研究和深度研究不足,研究的连续性、系统性有待提升。而这些问题其实也是任何学科发展之初常常会出现的问题,只有通过理性、科学的研究规划才能解决。为此,我们有必要对PSC的研究内容进行全面规划,使PSC研究步入规范、有序的科学轨道。

PSC可以研究和应该研究的内容非常广泛,这是因为PSC活动涉及的因素很多。面对方方面面的研究内容,以及它们之间千丝万缕的联系,我们需要分清主次、理顺关系,对众多研究内容进行系统的梳理和归类。姚喜双等(2011:2)将PSC活动中涉及的众多因素归纳为四个方面:“测试主体、测试对象、测试依据和测试手段”。在此基础上指出:“测试活动的四个要素之间有各种各样的联系,互相作用、互相影响,共同促进测试活动的发展。普通话水平测试研究不局限于测试活动中测试员的某个测试技巧或者应试人的应试策略,而是研究伴随普通话水平测试事业发生、发展的一般规律。普通话水平测试表现形式很多,但无论哪种形式都要区分测试对象的水平,这是普通话水平测试不变的规律。普通话水平测试研究的就是如何准确区分测试对象的普通话水平。”这也就提出了PSC研究内容的主线。

对PSC的研究内容,可以从不同角度进行分类。例如,聂丹(2011)根据PSC30年的研究成果,将其研究内容归纳为八大领域:宏观课题研究、测试依据研究、测试主体研究、测试客体研究、测试手段研究、测试界域研究、测试作用研究、测试评价研究。除此之外,更宏观的分类方法还可以有“二分法”、“三分法”、“四分法”等。不管怎么分类,PSC研究都需要回答或解决6个基本问题,这些基本问题也构成了PSC学科理论体系的概念框架。

1 普通话水平测试研究的基本问题

在探讨PSC的研究内容之前,需要明确PSC研究的基本问题。参照盛炎(1990:4)对第二语言教学理论基本问题的剖析,我们认为PSC研究应该能够回答以下6个基本问题:

(1)谁(who)。参加PSC的人是谁?什么性别、年龄、民族?来自哪个地区?居住在乡村还是城镇?他的方言是什么?普通话水平如何?教育背景如何?从事何种职业?他个人的智力怎样?有什么样的个性?普通话学习中有什么样的风格和策略?应试时他的身心状态如何?有什么样的应试策略?测试普通话的人是谁?什么性别、年龄、民族?来自哪个地区?有什么方言背景?普通话水平如何?教育背景如何?从事何种职业?他的测试理念和风格是什么?测试经验是否丰富?有什么样的个性?测试时他的身心状态如何?教普通话的人是谁?什么性别、年龄、民族?来自哪个地区?有什么方言背景?普通话水平如何?教育背景如何?他的教学理念和风格是什么?教学经验是否丰富?有什么样的个性?教学时具体采用什么教学方法?等等。

(2)什么(what)。测什么?教什么?学什么?什么是汉语普通话?汉语标准语的发展历程是什么?什么是方言?汉语方言的种类和特征是什么?普通话水平是什么?如何对普通话水平进行描述?什么是地方普通话?如何对地方普通话进行分层和分类?习得方言与学习普通话的过程有什么不同?PSC的目标、性质、特点、原则、作用、内容等各是什么?PSC的理论依据是什么?等等。

(3)怎么样(how)。怎么样测普通话水平?怎么样保证测到的结果是可靠、有效的?应试者怎么样保证自己有出色的应试表现?影响应试者普通话测试成绩的因素都有哪些?这些因素之间有怎样的关系?怎么样学习普通话?怎么样保证普通话学习的成功?学习普通话的认知过程是怎样的?学习者应该用什么样的策略和风格学习普通话?影响学习者普通话学习水平的都有哪些因素?这些因素之间有怎样的关系?怎么样教普通话?影响普通话教学效果的都有哪些因素?这些因素之间有怎样的关系?PSC对社会有怎样的影响?普通话的测试、学习与教学之间存在怎样的相互作用关系?普通话的测试、培训应该怎样为推广普通话服务?等等。

(4)何时(when)。方言区的人何时学习普通话?年龄对普通话学习有何影响?学前儿童怎样习得普通话?在校儿童习得了方言之后,如何学习普通话?普通话学习有没有“关键期”?学习普通话的最佳年龄是什么时候?普通话教学或培训的总量及时间以多少为宜?PSC的题量和时间以多少为宜?普通话水平提升一个级别需要多长时间?等等。

(5)在哪里(where)。环境对普通话学习和使用有何影响?在不同方言区学习和使用普通话有何差异?在城镇和乡村学习和使用普通话有何差别?在不同工作环境学习和使用普通话有何差别?机测与人测对应试表现和普通话成绩有何影响?不同地区的普通话推广情况有何不同?不同地区的PSC内容与评分细则是否应该有所区别?哪些地区在PSC实施和管理方面取得显著成效?等等。

(6)为什么(why)。为什么要开发PSC?为什么PSC在组织形式、测试内容、测试方法、等级标准等方面确定了当前的格局?学习者为什么学习普通话?为什么参加PSC?为什么不同方言区学习者在普通话学习中存在不同的缺陷或偏误?普通话学习中的“化石化”现象是什么原因造成的?等等。

上述问题都是围绕普通话的测试、学习、教学与培训提出的,比较全面地囊括了PSC的内部和外部因素,试图探究各个因素之间错综复杂的关系。其中有关“什么”与“怎么样”的问题尤其重要。对上述6大基本问题的解答,就构成了PSC研究的概念框架,也是PSC学科理论体系的基本架构。PSC的研究内容就是从不同角度对上述基本问题的研究和解答。

2 普通话水平测试研究内容的“二分法”

PSC研究的基本内容可以概括为两大方面:一方面是围绕着“普通话”的研究,另一方面是围绕着“测试”的研究。

2.1 关于“普通话”的研究

关于“普通话”的研究即对普通话和普通话水平的研究,旨在回答“测什么”的问题。这是有关汉语本身的研究,以语言学及其相关学科为研究基础,包括汉语普通话的语音、词汇、语法等语言要素的研究,语言能力(特别是口语能力)评价标准的研究,汉语普通话与汉语方言的对比研究,地方普通话(中介语)系统的研究等。

2.2 关于“测试”的研究

关于“测试”的研究即对PSC这一测量工具的研究,旨在回答“怎么测”的问题。这是有关测量工具效度和信度等的研究,以测量学及其相关学科为研究基础,包括PSC的任务设计研究,评价标准研究,评分方法研究,测试组织和实施办法研究,测试员队伍建设研究,现代技术在测试中的运用研究等。

除了上述最核心的两大块研究内容之外,鉴于PSC实践活动的特点,PSC研究内容还包括普通话“怎么教”、“怎么学”以及PSC的语言政策、社会功能、社会评价等。这些相对于核心研究内容来说,可算作PSC外围的研究内容。

3 普通话水平测试研究内容的“三分法”

张凯(2006:3-10)曾将语言测试的研究内容归纳为三大类:理论研究、技术研究、应用研究。其中,理论要解决的是“某物(或观测对象)是什么”的问题,这是个认识问题;技术要解决的是“对某物进行什么样的处理并使它变成什么东西”的问题,这是个操作问题;应用要解决的是某物怎么用的问题,这是个社会问题。PSC作为一种现代语言测试,自然也应该包括上述三方面的研究内容。

3.1 理论问题研究

测试中的基本理论问题是效度问题,语言测试的效度问题就是一个测试是否测到了以及在多大程度上测到了语言能力。而要解答这个问题,需要先回答一个更为基本的理论问题,即语言能力是什么?由于语言能力深藏在人脑之中,要想探究它的本质及构成实非易事。从乔姆斯基的语言能力(language competence)理论到海姆斯的交际能力(communicative competence)理论,人们对语言能力做了广泛、深入的探讨。但时至今日,这仍然是一个尚未圆满解决的问题。而当这个问题出现在语言测试里时,它就变成了效度问题。如同语言学界对“语言能力”的理解尚无共识一样,测量界对效度的回答也同样困难(张凯,2006:5-8)。这就使效度问题和语言能力问题成为语言测试中最核心、也是最难解决的理论问题。

在PSC研究中,有关普通话水平到底是什么(涉及语言能力问题)以及PSC是否测到了它想测的普通话水平(涉及效度问题),对这样的测试基本理论问题的研究还远未开展起来。而对这类问题研究的空缺,会使PSC研究缺少理论根基,使PSC学科体系缺少理论内核,成为“无根之木”或者“空心木”。因此,关于PSC的基本原理、理论构架,关于普通话水平到底是什么、其表现是什么,关于PSC的构想及效度等诸多理论问题,都需要深刻的研究和探索。

3.2 技术问题研究

测试中的技术问题大致可分作两类:一类用来控制题目和测试的质量,另一类用来提高测试的效率(张凯,2006:3-5)。在语言测试开发和实施的全过程中,需要使用一系列技术手段来控制题目和测试的质量。每一个环节和步骤都涉及很多技术性问题,其共同目的主要是减小测量误差,保证测试具有较高的信度。除此之外,大规模的测试还要考虑实施效率问题。如何在最短时间内测试到最多的考生,同时保证测量质量不受影响,这是需要不断探索的课题,往往需要现代信息技术的介入,而这其中存在着大量的技术问题。

在PSC实践中,有关国家级题库建设以及计算机辅助测试评分系统开发是最重要的技术问题之一。其中,普通话水平测试题库的建立是规范测试工作、提高测试效率的一个重要技术手段。在建立题库的过程中,应该始终严格以PSC大纲为依据,根据各方言区的普通话特点,组织语言学、测量学与计算机等相关领域的专家,编制科学实用的程序,研制符合语言学标准和测量学、统计学要求的规范的题目、等值的试卷,建立题目和试卷自动生成的系统以及数据查询系统,从而最终建立PSC国家级题库。关于计算机辅助PSC评分系统的研发工作,目前在测试的前三项上已经达到很好的应用,这其中的技术工作包含“建立一个顶级标准数字化音档库,通过不同等级样本与应试者样本的语音匹配、分析、比较,运用实验语音学方法,客观展现应试者的普通话语音面貌,借助语音识别技术,建立标准音、错误音、缺陷音的匹配模板,提供出应试者的参考评分。研究的重点是:PSC中错误音与缺陷音总体语图模式的分析、识别。研究的难点是:普通话语音变化的复杂性和多样性,使建立相应的匹配模板异常困难,技术路线也需在实验中探索。”

总之,在技术研究部分,包括测试的信度检验、等值手段、命题技术、评分方法等多方面的研究课题,对于同一研究课题又有不断更新的技术手段,每种技术手段都有不同的适用范围以及不同的应用效果。比较、检验、选择和改进这些技术方法,是测量学的一个重要研究内容。需要指出的是,一种新的技术手段的产生,往往是以新的理论模型为基础的,因此,技术和理论问题也常常是相伴而生的(张凯,2006:10)。

3.3 应用问题研究

开发语言测试的首要目的,通常并不是通过测量去揭示语言能力的本质,而往往是作为一种评价能力的工具或选拔人才的手段而被应用于社会生活中。应用问题研究主要探讨的就是测试应用于社会生活中的种种问题。其中,公平性是首先需要考虑的问题。测试如果对一部分社会群体比较适合,而对另一部分群体不太适合,这个测试就是不公平的,或者说存在DIF(differential item function⁃ing)。由于普通话推广是在全社会范围内进行的,不同方言区、不同行业对普通话学习和使用的要求和情况不同,而PSC对不同地区、不同行业是否存在DIF,也是一个需要研究的社会性课题,这方面的研究乏人问津。

由于测试与社会生活存在千丝万缕的联系,每一个接触面都可能会产生新的研究课题。除了测试的公平性问题之外,PSC应用问题的研究还包括测试的后效以及测试辅导和培训等种种社会性问题。特别是PSC作为国家推广普通话的一个重要手段,其社会责任和社会作用尤其重大,因此它在社会应用方面必然存在广大的研究空间。

需要说明的是,理论问题、技术问题、应用问题常常是相互交织的。比如,概化理论一般被认为是现代测量三大理论之一,但是张凯(2006:10)将其归入技术研究部分,理由是“概化理论的核心内容就是一套方差分析技术,概化理论的目的是控制和分解误差,它基本上不回答(或不直接回答)‘所测特质/能力是什么’的问题。”再如,DIF问题属于社会应用问题,但其研究方法涉及很多统计技术,因此也可以视为技术问题。

在规划研究内容时,要注意防止重技术研究、重应用研究而轻理论研究的倾向。张凯(2006:10)将这种倾向称为“技术上的巨人,理论上的矮子”。而事实上,PSC30年的研究状况恰恰存在这种轻理论研究的现象,纯理论的研究屈指可数。同时,在技术研究和应用研究方面,内容挖掘的广度和深度也还远远不够。

4 普通话水平测试研究内容的“四分法”

PSC的根本目的是“以测促训”,即通过测试促进普通话培训,带动普通话学习,最终提高人们的普通话水平(姚喜双等,2011:57)。因此,PSC的研究内容可以归纳为四大方面:服务于PSC的汉语普通话研究、PSC这一测量工具的研究、服务于PSC的普通话教学培训研究以及普通话习得过程和规律研究。

4.1 服务于PSC的汉语普通话研究

该领域主要研究“测什么”的问题,具体包括测谁、测什么能力、测什么内容、测多少等。①测谁。即研究测试对象,关注其所在方言区、职业、年龄、专业背景等。②测什么能力。即研究普通话水平是什么,关注其构成因素和表现形式,在此基础上对普通话水平进行能力分级描述。PSC等级标准就是这类研究的成果形式。③测什么内容。即研究汉语普通话,尤其是普通话语音系统,从而确定测试的内容范围和测试点;特别要研究普通话与方言的异同,以确定测试的重点和难点。PSC内容大纲就是这类研究的成果形式。④测多少。这是“量”的研究,包括测试内容的总量以多少为宜,各测试点的数量比重如何分配等。

4.2 PSC这一测量工具的研究

该领域主要研究“怎么测”的问题,关注测量工具的有效性和可靠性,寻求测量普通话水平的最佳途径。研究内容包括对测试各个环节的科学性和可行性的检验及评估,主要有总体设计、命题制卷、实施测试、阅卷评分、统计分析、考务管理、测试员队伍建设、现代化测试手段等系列环节,并从信度、效度、可行性及后效等方面对PSC的整体质量进行评价和研究。可以说,这是体现测量学研究特征的一个重点内容,需要大量测量学理论和方法的介入。但在PSC研究成果中,这类研究无论从内容的广度还是研究的深度上都还存在很大的提升空间。不仅很多测试环节没有得到关注,而且理性思考明显不足,缺少科学的研究方法和实验手段,主要还流于感性的描述和经验的总结。

4.3 服务于PSC的普通话教学培训研究

这一领域主要研究“怎么教”的问题,关注普通话教学及培训过程,寻求有效的教学途径。研究内容包括教学大纲的制定、培训教材的编写、培训课程的设置、教学的方法技巧、应试策略辅导等。该研究内容在PSC研究中成果颇丰,但普遍缺乏科学的理论和方法指导,重复性研究较多,研究质量不高。

4.4 服务于PSC的普通话习得过程和规律研究

这一领域主要研究“怎么学”的问题,涉及普通话学习过程与学习规律的研究,需要引入中介语理论、偏误分析、对比分析等语言学习理论,还需要借鉴心理学、社会学等相关学科的理论与方法,迈出了传统语言学研究的范畴,具有跨学科的研究特点。具体研究内容包括:①对学习者语言本身的研究。即对学习者从方言向标准普通话过渡中的地方普通话的研究,相当于对学习者的中介语进行研究。这方面的研究既包括静态、共时的中介语特征或规律的研究,也包括动态、历时的中介语习得过程的研究。②对学习者普遍认知规律与习得方式的研究。后者包括汉语普通话语言各要素的习得方式研究,特别是普通话语音习得方式的研究。③从学习者的外部因素(如社会因素)、学习者的内部因素(如心理因素)以及学习者的个体差异(如生理、情感、动机、认知特点和学习策略)三个侧面对学习者进行研究,关注影响普通话水平的各种因素,并探讨各因素之间相互作用的关系。

上述四方面的研究内容结合起来,就是PSC研究的内容框架。

5 普通话水平测试微观内容的研究

“二分法”、“三分法”和“四分法”都是从宏观层面对PSC研究内容所做的分类。而每一块宏观的研究内容都是由一个个微观的研究内容构成的,都需要通过一个个微观问题的研究来落实。所以,在规划完宏观研究内容之后,还要继续细化分类,规划微观的研究内容。而“宏观”、“微观”只是相对而言的,如果A课题细化成a、b等课题,而a课题又细化成(a)、(b)等课题,那么A相对于a、b来说,前者就是宏观研究内容,后者就是微观研究内容;同样,a相对于(a)、(b)来说,前者也是宏观研究内容,后者是微观研究内容。

比如,对于“影响PSC成绩的学习者因素研究”这样一个研究内容,可以细化出更微观的研究内容:

(1)民族因素对测试成绩的影响研究——迁移(语音、词汇、语法等);

(2)方言因素对测试成绩的影响研究——迁移(语音、词汇、语法等);

(3)职业因素对测试成绩的影响研究——播音员、教师、学生、公务员、其他行业等;

(4)专业因素对测试成绩的影响研究——文科专业、理工科专业等;

(5)受教育程度对测试成绩的影响研究——普通大中专院校、职业技术培训类院校等;

(6)生活地域因素对测试成绩的影响研究——城市、农村等;

(7)生理因素对测试成绩的影响研究——年龄、性别等;

(8)认知因素对测试成绩的影响研究——智力、学能、学习策略、学习风格等;

(9)情感因素对测试成绩的影响研究——性格、态度、心理等;

(10)应试动机因素对测试成绩的影响研究——教育需要、职业需要、兴趣需要等。

上述因素只是罗列了大概,并未穷尽全部影响因素。而且,各条因素的排序是随意的,并未作重要程度之分。只有对上述各条因素进行了系统研究之后,有关“影响PSC成绩的学习者因素研究”才可以说得到了比较充分的研究。

总之,规划PSC学科的研究内容也是一个系统工程,需要找准研究主线,划定研究区域,理清研究层次,从宏观到微观地对PSC研究内容进行分层和分级。这一系统工程的建成有助于PSC研究者明确研究定位,理顺研究思路,洞悉研究路向,既能看到“树木”,也能看到“森林”,既能“瞻前”,也能“顾后”,从而减少PSC研究的盲目性和重复性,增强PSC研究的方位性和条理性。

[1]国家语言文字工作委员会普通话培训测试中心.普通话水平测试实施纲要[M].北京:商务印书馆.2004.

[2]聂丹.关于普通话水平测试研究走向的思考[J].语言文字应用,2011(2):92-99.

[3]盛炎.语言教学原理[M].重庆:重庆出版社.1990.

[4]姚喜双,韩玉华,聂丹,黄霆玮,孟晖.普通话水平测试概论[M].北京:高等教育出版社.2011.

[5]张凯.语言测试理论及汉语测试研究[M].北京:商务印书馆.2006.

Thoughts on Research Contents of Putonghua Proficiency Test(PSC)

NIE Dan

It is a system engineering to program the research contents of putonghua proficiency test(PSC),which needs defining the research principal line,dividing the research area,organizing the research level,and following the stratification and grading principles for PSC research contents from macroscopical to microcosmic.This paper discusses 6 essential questions of PSC research.And on that basis,it takes turns to tell about the macro classification(“Dichotomy”,“Trichotomy”and“Quartation”)and the micro classification for PSC research contents.The completion of this system engineering will help the PSC researchers to understand the research orientation,to straighten out the research ideas,to know the research routes clearly,and thus to reduce the blindness and repeatability,and to enhance the sense of orientation and order in PSC research.

PSC;Discipline;Research Contents

G405

A

1005-8427(2012)06-0003-7

本课题为北京语言大学青年自主科研支持计划资助项目(中央高校基本科研业务费专项资金资助)(11JBB021),谨致谢忱!

北京语言大学

猜你喜欢
普通话测试水平
张水平作品
幽默大测试
作家葛水平
加强上下联动 提升人大履职水平
“摄问”测试
“摄问”测试
“摄问”测试
我是中国娃爱讲普通话
17
广而告之推广普通话