近25年中国语言测试研究热点及趋势分析
——基于国家社科与教育部社科立项数据库的实证分析

2018-10-26 06:43:42王小梅贾永华
武夷学院学报 2018年7期
关键词:社科测试语言

王小梅,贾永华

(闽江学院 外国语学院,福建 福州 350108)

语言测试是应用语言学研究的一个重要分支,伴随着语言教学出现,语言测试的应用研究也得到发展。它不但涉及到教学法、二语习得理论、语用学、认知语言学、心理语言学、教育测量学等学科,而且还运用到计算机应用技术,现已独立发展成一门跨学科的综合性学科。国内学者从整体、效度、反拨效应、社会属性、统计模型、测试真实性、现代技术、批判等不同角度对语言测试研究做了综述。国家哲学社会科学(以下简称“国家社科”)基金项目和教育部人文社会科学(以下简称“教育部社科”)基金项目彰显了我国人文社会科学的研究水平,这些研究项目更多的是从宏观方面反映了学科研究的热点、现状和发展趋势。而本研究试图对两个基金资助项目中包含“测试”和“测评”的立项项目关键词进行词频统计和分析,希望为中国语言测试研究的深度开展提供不同的观察维度。

一、数据来源与研究方法

(一)数据来源

本文语料源自两个基金项目数据库:国家社科规划办公室国家社科基金“项目数据库”和教育部社科研究管理平台“按项目研究检索”数据库。笔者分别在“项目名称”栏输入“测试”和“测评”检索,手动剔除与语言测试无关的项目后显示:国家社科基金30项,教育部社科基金255项,后在教育部社科研究管理平台手动增补2015—2017年10项,共计295项。由于检索未设定项目类别、学科类别、立项时间等,这两个基金1993-2017年间所有包含“测试”“测评”的立项名称都包括其中。

(二)研究方法

本文依据文献计量学方法,以295项国家社科和教育部社科立项名称作为研究对象,利用图悦词频分析工具(图悦是一款国内在线词频分析工具)进行关键词词频统计,选取高频词,采用内容分析法和纵横向比较分析法对立项项目名称的关键词进行研究分析,理清国内语言测试研究的脉络,展望未来研究趋势。

二、统计结果与分析

(一)统计结果

通过对两项基金语言测试的立项项目统计分析后发现:国家社科语言测试研究立项来自于重大项目、一般项目、青年项目、西部项目和后期资助项目五类;教育部社科语言测试研究立项来自于规划基金项目、青年基金项目两类;国家社科基金语言测试研究立项全部来自语言学领域;教育部社科基金语言测试研究立项绝大部分来自语言学学科,极小部分来自外国文学、中国文学、管理学、教育学、艺术学、经济学、统计学、社会学、新闻学与传播学、国际问题和交叉学科。而在项目立项数量上,教育部社科项目立项的数量远超过国家社科立项数量,而国家社科的项目立项数量近几年有明显地增多,而且一般项目和重大项目的比率高。中国语言测试项目研究在二十一世纪初(2001-2008年)出现高潮,立项数量多达229项,占总量的77.63%;而二十世纪末两类总量20项,比例最小,占 6.78%;2009年至今也不多,仅 46项,占15.59%。具体立项数量如图1:

图1 1993-2017年国家社科和教育部社科语言测试立项数量统计Fig.1 Quantitative statistics of language testing projects of National Social Science Fund and Humanities and Social Sciences of Ministry of Education from 1993 to 2017

把三个时段的国家社科基金和教育部社科基金的立项项目名称分别输入图悦词频分析工具,获取:1993-2000关键词36个、2001-2008关键词150个、2009-2017关键词106个。按照高频关键词选择标准(一般为截取的高频词累计频次达到总频次的40%左右[1]),获取:1993-2000高频词 13个(词频≥2),2001-2008高频词37个(词频≥5)、2009-2017高频词29个(词频≥2)。所有高频词按(频次)关键词这种格式显示,其结果见表1:

表1 1993-2017年语言测试项目名称高频关键词Tab.1 High frequency key words of language testing project names from 1993 to 2017

调查统计一段时间之内的关键词词频,能够观察并发现此领域的总体特征,把握此领域的研究热点,由此预测未来的研究趋势。为了更好梳理语言测试研究近25年的研究脉络,本文以上表数据为基准,辐射软件生成的所有关键词,对之进行纵向和横向分析,据此推断未来的研究方向。

(二)纵向分析

1.1993-2000年语言测试立项名称关键词

从表1可见,1993-2000年两社科基金有关语言测试研究立项名称的高频关键词有:测试、英语、普通话、标准、外语、教学、大学、汉语、中学、素质、教育、任务、理论。结合图悦分析出的36个关键词,可以归纳出:这期间的语言测试集中在英语语言测试研究有10项,汉语语言测试研究有9项,还有一项涉及韩语测试;这些项目主要从理论、测试标准、具体教学三个角度进行研究,大部分着眼于大学阶段这个层次的语言测试。此阶段的语言测试具有如下特点:第一,语言测试研究主要集中在宏观的理论层面,立项的名称都是大而广,如 《英语语言测试研究》《汉语测试理论研究》;第二,语言测试研究主要集中在英语和汉语这两个语种;第三,研究者都将语言测试作为一个独立的个体研究,很少涉及与测试相关的其他环节的研究,如教学。20世纪80年代,国内的学者开始关注外语测试,介绍国外相关的理论,进而影响汉语的测试研究。因此,此阶段的语言测试研究仅仅是个开始。

2.2001-2008年语言测试立项名称关键词

从表1可见,2001-2008年两社科基金的语言测试立项名称的高频关键词有:测试、英语、普通话、大学、教学、专业、实践、模式等37个。结合图悦分析出的150个关键词,可以归纳出此阶段的语言测试具有如下特点:

从语种角度看,语言测试依然主要集中在英语和汉语两种语种。其中含有关键词“英语”立项高达116项,“外语”7项(主要也是研究英语方面的测试),“英汉”1 项。含关键词“普通话”“汉语”“方言”“语文”立项分别为52项,11项,3项和2项。此外,包含关键词“双语”的有4项,“俄语”的有2项,“日语”的有2项。除了小语种,语言测试的研究触角开始伸向了双语教学。

从研究内容看,此阶段的研究内容从理论层面扩展到实践层面,以理论为基础,重在实践,重在改革。包含关键词“理论”立项16项,“实践”立项19项,“改革”立项 14项,“实验”立项 2项,“实践性”和“可行性”各立项1项。语言测试离不开语言教学,两者相辅相成,教学自然就成为语言测试研究的第一位,包含关键词“教学”立项36项,进而研究具体语言能力的测试:包含“口语/写作/语音/听力/语法/语用/声学/词汇/口试”等关键词的立项高达57项。随着对语言认识的深入,人们的语言观产生变化,进而影响语言测试的研究内容,包含“项目/策略/任务/认知/交际/思维”等关键词的立项23项。另外,语言测试的规范也是研究的热点之一,包含关键词“测试模式”立项19项,“标准”立项12项,“建设”立项8项,“评分”立项8项,“试题库”和“试题”立项共 9项。“大纲/命题”立项各1项。语言测试是在多学科的基础上发展而来,其研究本身就包涵跨学科,但从此阶段的立项项目看,包含关键词“语料库”立项3项,“心理学”立项2项,比例不大,还有很大的发展空间。

从研究的测试类型看,涵盖了成绩测试、学能测试、水平测试和诊断测试,包含关键字“课程/成绩/考试/四级/四六级/成就/诊断/教材”等立项25项。从研究的测试题型看,只有3项立项是跟题型有关联的,其中1项具体研究完形填空。从测试的工具看,语言测试研究从人工走向智能化。语言测试是多种科学的结合体,可以概括为两类:语言科学和技术科学。前者给测试馈入内容,后者给测试馈入手段。计算机技术的发展给语言测试研究注入了新鲜的血液。包含关键词“计算机/语料库/网络/无纸化/校园网/教学网”立项共18项。

从研究的测试对象看,主要集中在大学,包含关键词“大学”(50 项)、“高校”(14 项)、“四级”(5 项)“大学生”(4 项)、“本科”(3 项)、“对外经贸大学”(2 项)、“院校”(2 项)、“民办高校”(1 项)、“理工科”(1 项)、“学院”(1 项)、“高职院校”(1 项)、“吉林大学”(1 项)和“留学生”(1项)共86项。研究的测重点集中在专业。包含关键词“专业”立项25项,“培训”“非专业”“职业”共有6项。此阶段的研究对象比较宽泛,涵盖了大部分的测试群体,体现了国内常见的测试形式,只有个别研究以某个学校或某个群体为依托。而其他方面的研究对象集中在高考,包含关键词“高考”立项5项,“中学”立项2项。国内语言测试的研究学者主要来自各个高校和各大考试机构,研究身边触手可及和熟悉的测试,以及影响重大,社会关注度高的语言测试。

21世纪初,国内的语言测试研究出现“井喷”状态,体现在教育部社科8年期间的228项立项数量上,随着Lado博士撰写的《语言测试》——语言测试领域的第一本专著出版,国外学者在语言测试领域进行了长达近六十年的不懈研究,建立了完整的研究体系,积累了丰硕的成果。籍此国内学者站在巨人的肩膀上,结合国内的实际情况,尝试进行语言测试的细化研究,拓宽研究广度,丰富研究内涵,但是其研究的深度还不够,在此期间仅有1个课题获得国家社科立项(国家社科的立项经费比教育部社科的立项经费多,从世俗的角度而言,国家社科立项比教育部社科立项分量重)。

3.2009-2017年语言测试立项名称关键词

从表1可见,2009-2017年两社科基金的语言测试立项名称的高频关键词有:测试、英语、测评、标准、汉语、写作、理论、任务、高考、效应等29个。结合图悦分析出的106个关键词,可以归纳出此阶段的语言测试具有如下特点:

第一,语言测试研究语种范围进一步扩大。此阶段的研究延续了前一阶段的特点,语言测试依旧以英语和汉语为主(都是立项13项),但开始兼顾日语、维吾尔语、蒙古语、双语、汉英等语言的测试。甚至语言测试的研究范围也拓宽到我国少数民族的语言,这对于我们保护及发展少数民族语言是一大幸事。

第二,语言测试研究侧重标准化的探讨。语言测试是一项极其严谨的活动,需要建立一定的行业标准和准则,保证考试的科学性、客观性和公正性[2],这是其健康发展的基石。因此有学者一直致力于等级标准的研究,与之相关的立项有13项,占据近三分之一的立项:有从宏观讨论标准的制定,如《标准化语言测试的标准制订与效度研究》;有具体到学科测试标准的制定,如《新TEM-8写作测试量表建构研究》;有某一语言能力测定的研究,如《中国大学生学术英语口语能力等级量表及测评标准应用研究》《中小学生英语阅读能力标准及测评体系研究》。国内大规模语言考试往往是涉及众多考生切身利益的高风险考试,具有广泛的社会影响力,为这些考试制定科学的等级量表及测试标准不仅是必要的,而且要与时俱进。

第三,语言测试的影响研究成为热点。语言测试这一行为不是独立的,是与特定社会环境紧密相连的。语言测试一旦使用,就会产生一定的影响,这种影响体现在三个方面:水平认定,反拨和社会影响[3]。近年来,语言测试的影响研究成了热点之一,与之相关的立项有5项:《语言测试反拨效应理论视角下的高考英语改革研究》《批判语言测试视阙下CET的反拨效应研究》《PISA测试对发达国家课程改革影响研究》《阅读能力发展机制理论及其与阅读教学和测评的关系研究》《口译职业资格认证测试的理论体系和运作模式研究》。

第四,语言测试的服务对象从国内开始面向国外。随着中国国力提升以及文化“走出去”的战略实施,汉语的影响力日益扩大,外国人学习中文的热情开始高涨,对外汉语的测试研究成了新宠。立项项目如《对外汉语考试的理论框架与测试模型研究》《对外汉语分级测试研究》很好地体现了这一趋势。

第五,语言测试跨学科的结合研究展现新内容。语言测试与统计相联系,造就《累进辩论法与语言测试辩论研究》;与语料库相结合,成就《基于语料库的语言测试研究》;与计算机相结合,提出《计算机自适应语言测试模型设计》;还开始跟比较语言学结合,关注比较、对比,从而获得语言测试后续的方向和动力,不仅有双语比较,如《中外留学生语言测试体系比较与研究》;还有三语比较,如《藏汉双语者藏汉英三语者心理词汇语义表征的 SOA多点测试法与ERP对比研究》。

此阶段的立项数目虽然不多,但是国家社科的立项(26项)比教育部社科的立项(20项)多,而且其中有3项属于国家社科的重大项目,在质上有进一步的提升。因此,此阶段的语言测试研究,题目涉及范围更大,且结合实际情况,更有原创性、开拓性、针对性和现实性,这也符合国家社科立项的精神。

(三)横向分析

根据图悦词频分析工具获取的1993-2017年语言测试项目名称关键词词频数,按照频次及排名可将近25年来中国语言测试研究分为以下几类:

1.语言测试研究语种主要是英语和汉语。英语【7-116-13】和汉语(普通话、语文)【8-63-13】两类关键词都在这三个阶段稳居前二。每种语言都有其特点,语言测试的研究要依附于某一语言。语言测试的研究发源于英语语种国家,而且国内学习外语选择的语种大多是英语,这里有国家发展战略的因素,因而英语水平测试在各级各类外语考试中所占比重大,涉及面广,因此英语语言测试研究始终是此领域的常青树。随着社会的发展,普通话水平测试的开展,对外文化的宣传和对外汉语的兴起,普通话测试的研究是学者关切的话题。

2.语言测试的理论实践研究。理论【2-16-4】,是语言测试的研究基石,是指导实践【1-19-0】的依据,是改革【0-14-2】的动力之源;实践是理论的基础,是检验改革成果的试金石;改革完善理论,推动实践的发展。语言测试的理论和实践研究相辅相成,推进国内相关测试的改革发展,或探索【0-6-0】、建设【0-8-1】、开发【0-5-0】、设计【0-4-1】与实际情况相符,能真实反映考生语言能力的测试模式【0-19-2】、模型【0-2-2】,或解决测试中遇到的问题,提供对策【0-5-0】,或评价【0-5-1】、改进现状【0-3-0】。这既是学者们的出发点,也是追求的目标。

3.具体语言技能方面的测试研究。语言能力是一种综合性的能力,具体体现在听说读写译的能力上。口语【1-17-2】、写作【0-12-5】、语音【0-12-1】、听力【1-5-1】、语法【0-5-0】这些相关课程【0-7-1】的技能【0-2-0】是语言测试者较为关注的语言技能测试,尤其像口语、写作、语音之类主观性强的语言测试,评分主观性强,随意性较大。如何科学地考查考生的语言能力,如何平衡信度和效度等等问题是研究者十分重视的话题。

4.语言测试的社会属性研究。Kunnan指出,语言测试不是孤立的,而是发生在由政治经济,教育环境,社会文化环境以及技术及基础设施环境等一系列相互交叉,相互影响的环境所编织的社会关系网络之中[4]。在过去的十几年间,语言测试变得越来越专业化。语言测试行业如同法律、医疗行业一样也需要建立一定的行业标准和准则。标准【5-12-6】、评分【0-8-0】、等级【1-2-3】、分级【1-2-2】、大纲【1-1-0】、指标【0-1-1】、细则【0-2-0】、制定【0-1-1】、命题【0-1-1】、指南【1-0-0】等是语言测试常见的话题。此外,测试的信度【0-3-0】和效度【0-13-6】(信度和效度是手动检测所得的结果)研究是每个测试工作者高度关切的话题。一开始,学者们主要关注测试的信度和效度的研究,随着效度研究范畴和界限的扩展,伦理道德研究越来越受到关注,已经成为效度研究不可或缺的一个维度[5]。

5.语言测试工具、内容方面的研究。各种语言测试理论的研究,其最终是为各种形式的语言测试服务。随着科学技术和信息技术的不断发展,各种语言测试的工具和内容也进行了一些更新。远程【1-0-0】、智能【1-0-0】、计算机【0-7-2】、语料库【0-3-1】、试题库【0-5-0】、网络【0-5-0】、无纸化【0-1-0】等各种测试工具进入研究人员的视野。随着语言教学理论的发展,语言测试内容经历了任务型语言测试,交际型语言测试和认知诊断。两基金的立项课题也体现了这一过程,任务【2-4-4】、项目【0-7-0】、交际【0-2-2】、认知【0-2-1】、诊断【0-2-1】、策略【0-6-1】、难度【1-1-2】、语用【0-3-1】等是学者关注的语言测试内容。

6.语言测试效应研究。语言教学是第一性,语言测试是为其服务的[6]。语言测试发展至今,经历了前科学语言测试阶段、结构主义阶段、社会语言学阶段和交际语言测试阶段。但是不管处在哪个阶段,语言测试都是检验学生学习效果的重要工具,也是教师获得教学反馈的最直接方式,能够促进语言教学的发展。教学【3-36-2】,主要是大学【3-50-2】、高校【0-14-0】、本科【0-3-2】的专业【1-25-2】课程【0-7-1】教学,公外学生【0-16-2】四级【0-6-0】教学或者教学效应【0-3-3】、反拨【0-6-2】(手动检测)等是研究者经常思考研究的课题。

(四)未来研究趋势

根据对1993-2017年近25年的国家社科和教育部社科立项题目关键词的横向与纵向解剖分析,我们可以试图预测未来语言测试的研究趋势,主要有:

1.基于理论的实践研究随着时代的发展进一步深化。语言测试的设计开发和使用仍将受到不断发展的语言学理论的挑战,受到思辨,创新和开拓的教育理念的挑战,受到先进的统计测量技术和信息技术的挑战[7]。例如国家“互联网+”行动计划的提出,推动了信息技术与教育领域的融合发展。慕课、翻转课堂、无缝学习等在语言教学的创新应用,为各教育阶段的学习、课程、教学、考试、决策管理、评价体系、人才培养模式等带来革命性的变化。这些变化对语言测试的影响需要学者们进行开拓性的实证研究。除了英语、普通话这两种常规语言测试外,双语(主要是汉英或者英汉)、少数民族语、小语种,甚至三语方面的语言测试,特别是具体在语用、篇章、交际、翻译等能力方面的测试会是未来研究的一个方向。

2.语言测试的社会属性研究继续升温。上世纪80年代,语言测试的社会属性研究逐渐兴起。国外学者不仅从心理测量学和效度理论研究两个传统研究领域中的社会观,而且从语言测试实践的社会政治功能、社会学理论、测试伦理道德与测试者的责任等方面展开研究。但国内学者较多关注前面两项的研究,少有人涉及后面几项的研究,因此,语言测试的社会属性研究在我国还有很大的发展空间。Bachman指出语言现象的丰富性和语言能力的多维性使我们无法简单地,完全客观地用一把单维度的尺子去测量,测试的工具性和社会性又为语言测试者增添了艰巨的责任感和使命感,这些也正是语言测试研究不断探索的方向[8]。

3.跨学科的语言测试研究也会不断加强。一方面,语言测试本身就是融合多个学科而成的语言学研究分支。另一方面,社会科学的研究趋势是越来越理科化,渐趋于严谨的量化研究。2015年,中央提出了网络强国战略,“互联网+”、大数据、云计算,在此背景下,人文学科研究应引入多元研究方法,实现研究的更新与转型。测量学科的迅速发展,新的统计工具的开发应用,语料库的深度应用都能给语言测试注入新鲜血液,使其研究方法更趋于多样化和复杂化。例如项目反应理论(IRT)中的多层面Rasch模型能够分析影响考试成绩的多个因素,并估算出各个因素对成绩的影响程度,这种模型如果在语言测试中使用,则能有效提高评分的质量,确保语言运用考试的公平和有效。

4.外语测评体系标准化将成为重要的研究内容。我国英语考试种类繁多,但是其功能不同,导致不同考试成绩无法比较,缺乏统一的评价标准,并且考试处于不断改革变化以适应社会的发展需求之中,以致考生需花费很多时间和精力重复应考。我国应建立国家外语测评标准,在此基础上,推动考试内容和形式的改革,完善开发系统性的外语考试项目,推动形成性评价与终结性评价相结合的研究,以期建成标准统一、功能多元的现代化外语测评体系。外语测评体系的建立是项浩大的工程,极需众多各级语言测试研究人员参与其中并为之努力。

三、结语

国内语言测试研究历史虽然不长,但因其融合多学科知识,已吸引众多学者激情参与,取得了各类不同的研究成果。本文让数据说话,从1993-2017年国家社科基金和教育部社科基金的立项课题的关键字出发,由此“窥一斑而知全豹”,分析了近25年来中国语言测试研究的大致内容和走向。随着全球化进程的加快,语言作为一个交流工具会愈加受到重视,而语言测试的研究发展步伐也会加快。我们作为语言教学人员和测试研究学者有责任有义务在这条道路上继续前行,不但要积极申请各级各类研究课题,而且还要及时参与、组织各类语言测试相关会议,在语言测试研究的国际舞台上发出更响亮的声音,取得更加丰硕的成果。

猜你喜欢
社科测试语言
社科成功展示
社科成果展示
社科成果展示
幽默大测试
幽默大师(2020年11期)2020-11-26 06:12:12
语言是刀
文苑(2020年4期)2020-05-30 12:35:30
“摄问”测试
“摄问”测试
“摄问”测试
让语言描写摇曳多姿
累积动态分析下的同声传译语言压缩