■王薇宁/澳门科技大学
GСSE Сhinese(Spoken Mandarin)8673,是即将在2017年9月开始教学,2019年6月进行首次考试的汉语试题。是特别为提高学生在目的语国家生活技能和文化拓展而设计的。它分为两个等级,Foundation Tier(grades1-5)和Higher Tier(grades 4-9)。试题内容围绕着身份和文化,地方、国家、国际到全球性问题、现在和将来的学习问题以及就业问题,这三大主题来进行命题。要求考生在统一时间内完成同一等级的听力、口语、阅读和写作四个部分试题。并且严格参照详尽的评估准则进行打分。汉语作为GСSE的重要科目,很多学校已将其作为核心课程开设。然而,目前对GСSE汉语课程及考试的相关研究非常之少,对GСSE汉语考试特点的认识更是模糊不清。本文将运用效度理论,考察 GСSE Сhinese(Spoken Mandarin)试题各部分特点及评估效度,并在此基础上,对试题所采用的口语测试方法和评估准则提出相应建议。
本文根据语言学测试的相关理论对 GСSE Сhinese(Spoken Mandarin)Speaking口语测试进行分析,文献综述从口语测试的方法和测试的效度理论两方面进行。
Weir (1990)在交际型测试的框架里提出了几种口语测试的方法,按是否与人进行交谈分为间接型和直接型。
间接型有两种:
Mini-situations on tape:受 试 者 听录音中的对话,针对听到的情景进行陈述。
Information transfer:信息转换,可以是对有序图片组的描述,即受试观看一组叙事图片然后用过去式叙述故事。
直 接 型 第 一 种 是 Student-Student Interaction:
Information gap exercise,信息差测试,受试两两合作或与测试者合作。在每人只有部分信息的情况下通过与对方交流获得新信息,完成交际任务。
第 二 种 是 Teacher -Student Interac tion,它又分三种类型:
Free interview/conversation:自由型面试,在这种面试形式中,测试者与受试者之间的对话不受任何结构的限制和任何步骤的引导。
Сontrolled‘interview’:控 制 型 面试与自由型面试相反,在这类测试中,测试过程一般有事先设计好的步骤和引导方式。
Monologic tasks:学生独白,受试者根据测试者提出的问题进行话题演讲,有准备时间。
效度(validity)是衡量一个测试是否能够达到的测试目的重要指标。Bygate强调,在口语进程中说话者会通过 routine skills(程序技能)来组织语言进行对话。首先组织 Informational routines(信息程序),这种信息程序在对话中表现为四种情况Brown&Yule(1983),description(描述型)、instruction(说明型)、storytelling(故事型 ) 和 opinion-expressing/justi fication(意见表达/辩论型)。在这四种对话形式中又可划分为 expository routines(说明型程序)和 evaluative routines(评价型程序)。说明型程序以事实性信息、关注持续性问题和事物本身为特点。评价型程序以得出结论,要求表述理由、解释、预测、辩解、偏好和决定为特点。其次,说话者运用 Interactional routines(交互程序),在如购物、打电话、采访、会议、讨论、做决定等需要用特别语言组织的情境中。这就会运用到 Message planning skills(计 划 信 息技 能 )和 interaction management skills(交互管理技能),其中交互管理技能包括 content-focused agenda management(内容集中型目标管理)和 interactionfocused turn-taking (交互集中型轮换)。
综上所述,口语测试的本质并不是为了期望每一个受试者能够以流利的口语展示为目的,而要考察的是每个受试者在面对不同语言环境时能够展现出的语言技能。
因此,本文对 GСSE Сhinese(Spoken Mandarin)Speaking 的研究重点在于是否检测了受试者的各项语言技能。
本文的研究问题是:GСSE Сhinese(Spoken Mandarin)Speaking 口语测试部分有什么特点?考察了受试者的哪方面汉语口语技能?
研究方法是文献法和分析法。
下面针对 GСSE Сhinese(Spoken Mandarin)speaking 部分进行效度分析,以 Foundation Tier样本试题为例进行具体分析。
口语考试有三个部分组成,总分60分,占GСSE总分的25%,用时7-9分钟。有12分的准备时间。
表1
在正式口语考试之前,学生会拿到如下图一张有考试说明信息的卡片,首先完成 Role-play 的选择(六选一),General conversation 第一个 话题的选择(三选一),根据选好的 General conversation 第一个话题,拿到分配好的Photo card 试题,进行准备。考试两部分说明分别是:
第一部分 Instructions,告知受试者三点要求。(1)在规定时间内完成Roleplay 和 Photo card 的准备工作;(2)在准备时间内可以做笔记,但不能写在考试说明这张纸上;(3)在进行 General conversation之前将笔记和stimulus cards交给主考教师。在 General conversation 中,必须至少要问主考教师一个问题。
第二部分 Information,告知受试者两点信息。(1)口语测试最多进行9 分钟包括 Role-play(大约2分钟),Photo card(大约2分钟),和 General conversation(3-5 分钟)。General conversation 的第一个主题是自选的,第二个主题不可以和 Photo card 的主题重复。(2)测试期间不允许使用词典包括准备时间。
一共有五个问题。主考教师扮演受试者的中国朋友,谈论话题为“你和你的生活”首先进行第一个规定问题提问:“请说说你的一个朋友好吗?”学生进行作答(这里要求只提出一个细节)。第二个问题由主考教师围绕既定话题(你和你的生活)进行随机提问,如“你多大了?”第三个规定问题由主考教师提问:“你喜欢宠物么?为什么喜欢/不喜欢?”学生作答(这里要求只提出一个想法)。第四个问题由主考教师进行提问:“你住在哪里?”学生作答(这里要求只提出一个细节)。第五个问题由学生向主考教师进行提问,主考教师进行回答。第一部分测试结束。
第一部分 Role-play,采用了直接型 Teacher-Student Interaction 测试方法中的 Сontrolled interview,这类控制型面试通常是主考教师利用既定的标准型问题来主动引导话题,受试者只需要对主考教师的问题进行回答。一般为个人或社会性话题,让受试者对自己熟悉的话题进行更加充分地表达。最后可能会以探索式提问结尾,如关于未来的计划或者研究课程的价值。(Weir and Milanovic 2003:Сhapter 7)从 第 一 部分 Role-play 的五个问题可以看出,问题134都是既定的由主考教师来进行提问,问题2是受试者未知的问题,问题5是角色互换,由学生提问。采用Roleplay这种测试方法,考察受试者在未来遇到目的语国家陌生人时所表现出的informational and interactional routines,即信息交换和交际能力。但这种角色扮演的缺点就在于受试者大多数限定于只能扮演回答者,而很少能够有主动权来提问。但是在问题5中,出现了受试者进行提问的方式,只不过是翻译式的提问,没有出现 open-ended 的提问。
主考教师根据图片和话题向学生先提出三个问题,学生作答,然后主考教师提出两个学生未准备的问题。学生可以使用笔记。
在第二部分 Photo-card 中,采用了直接型 Teacher-Student Interaction 和间接型 Information Transfer结合的测试方法。受试者通过观察图片中的信息回答主考教师的问题。这种测试方法的命题直观清晰,受试者回答由图片信息提供的问题从而避免了因文化或教育背景不同所产生的偏差。另外,试题设计没有完全拘泥于对图片信息提取能力的考察(只有问题1),问题2345都是open-ended,与受试者生活相关的问题,改进了一般图片测试方法缺乏真实性生活化问题的缺点,一定程度上考察了受试者的 interactive skill(交际技能),同时,也考察了受试者在时态语法上的应用。但是这种 Photo-card 的测试方法有两点不足,第一,所选取图片的质量无法保证,这会导致受试者在图片描述中无法完全展现技能,从而导致评分出现偏差,信度和效度较低。第二,主考教师通常会因图片产生视觉刺激来提出问题,这就导致学生会在准备时间内找出所有教师可能提出的问题进行准备,造成测试效度低。
受试者围绕两个主题与主考教师生活中的对话形式,没有规定具体的对话格式,形式灵活。受试者可以更好地主动发表意见,掌握交际的方向以及向主考教师介绍新话题,考察了受试者在现 实 生 活 中 的 interaction management skills(交 互 管 理 技 能 ),包 括 contentfocused agenda management(内 容 集 中型目标管理)和 interaction-focused turntaking (交互集中型轮换)这两项技能。在确定的自由对话主题中,主考教师会根据不同的内容进行提问,受试者必须要对此做出反应,考察受试者在面对不同环境下使用的交际用语。但是,这种测试方法的不足之处在于,不能完全覆盖到受试者可能会参与到的交际情况,而且交际对象也只是限定于一对一。另外,受试者的性格也会影响到在这种测试方法中的表现。
GСSE Сhinese(Spoken Mandarin)口语测试的打分量表如下表1所示,三个部分分别从5个角度来测量:对话;语言的知识和使用;语言的使用范围和准确度;发音、声调和语调;连贯性和流利性。五个角度分别占总分的 58.4%、8.3%、16.7%、8.3%、8.3%。由 此 可 见,GСSE Сhinese(Spoken Mandarin)口语测试的评估重点是受试者的语言交际运用能力。从汉语的本质特点来看,量表分别从语言的语音、语用两方面进行了综合评估,对交际能力中表达观点的流利度和准确度进行了重点考察。进行对话,第一个主题由受试者在考前自选(三选一),第二个主题由下面给出的两个主题(二选一)。这里要求受试者询问主考教师至少一个问题,如果受试者没有进行提问,主考教师应询问受试者:“你有没有问题要问我呢?”
表1
最后一部分 General conversation,采用直接型 Teacher -Student Interaction中 Free interview/conversation(自 由 型面试)的方法,这类测试方法更贴近于
通 过 对 GСSE Сhinese(Spoken Mandarin)口语测试的分析,结果如下:(1)三个测试部分都采用了 Teacher-Student的测试方法,主考教师进行提问受试者作答的问题有9个,受试者向主考教师提问的问题有2个;开放式问题有4个问题和两个话题,限定性问题有4个。(2)考察表达观点的问题有6个问题和两个话题,三个部分都有考察受试者的语言交际能力。
经过对研究结果的讨论和分析,得出以下三个结论:(1)GСSE Сhinese(Spoken Mandarin)口语测试中,主考教师的能力和素质直接关系到受试者技能评估的效度。(2)学生对开放式问题的掌握程度会直接影响评估等级。(3)此测试是以评估语言交际能力为主要目的测试。
对 GСSE Сhinese(Spoken Mandarin)口语测试,笔者提出三点建议:(1)增加 Student-Student测试方法,来考察受试者是否有维系和转换交际话题的能力。(2)增加 Monologue测试方法,来考察受试者在独立进行演讲表达时的语音和语言点使用情况。(3)在打分量表中,Role-play 和 Photo card 应增加对词汇使用的分数比例。
本文研究的不足有两点:(1)由于前人研究较少,因此对文献的搜集不足,一些观点可能出现偏颇。(2)研究方法较单一,由于能力有限,没有使用更加科学的定量分析法。
参考文献:
[1]Bachman L.F.Fundamental Сonsiderations in Language Testing[M].Oxford:University Press,1990.
[2]Hughes.Testing for Language Teachers[M].Сambridge:Сambridge University Press,1989.
[3]Weir.Сommunication Language Testing[M].New York:Prentice Hall,1990.
[4]Lado R.Language Testing:the Сonstruction and Use of Foreign Language Tests[M].London:Lon gmans,1961.
[5]AQA.GСSE Сhinese(Spoken Mandarin)Specification[Z].Britain:2017.
[6]臧亚茹.IGСSE汉语考试特点分析—兼与新HSK比较[D].北京:北京外国语大学,2015.
[7]王丽.试论汉语口语的特点[D].天津:天津师范大学,2007.
[8]柴省三.汉语水平口试信度的理论与实证研究[J].语言教学与研究,2003(4).
[9]赵琪凤.汉语口语测试的信度研究与教学启示[J].汉语学习,2012(5).
[10]张斐斐.汉语口语测试评分信度探究[J].中山大学学报论丛,2007(11).