周 梅
信息化背景下普通话水平测试管理制度研究
周梅
摘要:普通话水平测试是国家级汉语口语测试,目前,计算机辅助测试已经基本取代了人工测试,并且实现了全国测试管理网络化。考务复杂化,测试安全性受到多方威胁,测试环境一致性差是普通话水平测试信息化阶段产生的新问题。测试的组织者和管理者,需要厘清问题、寻找对策,保证普通话水平测试的质量与公平。
关键词:普通话水平测试;管理;信息化
普通话水平测试是一项大规模的以汉语作为母语者的口语测试活动,是由一系列测试环节按时间先后顺序排列组成的测试行为过程。普通话水平测试包括四个基本要素:测试主体、测试客体、测试依据、测试手段。[1]74组织管理是普通话水平测试手段的重要组成部分。组织管理以测试目的为纽带,将测试主体和测试客体联结为矛盾统一体,使测试活动朝着既定的测试目标运行。2007年,计算机辅助普通话水平测试(下称“机辅测试”)率先在安徽和上海试点推行,至2015年年底,各省(直辖市、自治区)已经全部开始推行“机辅测试”,实现了全国普通话水平测试信息化管理。因此,以2007年“机辅测试”试点为界,技术的应用将普通话水平测试划分为传统测试与现代化测试两个阶段。现代化测试组织管理阶段既积累了经验,也堆积了问题。本文尝试总结机辅测试管理系统运行中存在的问题并剖析原因,在系统开发者和使用者之间建立信息通道,以期改进系统、改善管理,最终实现保障效率,保证质量,维护测试安全性与权威性的目的。
一、普通话水平测试中管理制度的重要性
普通话水平测试是一项复杂的语言能力评测系统工程。从测试实施之初,普通话水平测试的管理一直是研究者们讨论与关注的重要议题。
(一)普通话水平测试是口语测试
普通话水平测试方法为口试,和笔试相比,口语测试的组织难度与控制难度都比较大,主要表现在:程序复杂,除了应试环节,还有备测与候测环节;考场要求高;应试序次性不仅影响测试规模,在考务管理方面也更加复杂;需要对应试人进行应试培训方能保证测试顺利进行;主试人需要具备一定的专业能力,且有数量上的要求。
(二)普通话水平测试规模宏大
随着普通话的推广进程,普通话水平测试规模迅速发展。从1994年普通话水平测试实施以来,全国每年参加测试的人数不断攀升;应试人群多样化,具有广泛性特点;测试主体(测试员)在管理与发展上,存在满足测试规模的数量上的要求和测试能力的专业上要求的矛盾。总之,前所未有的测试规模对测试工作提出了新的控制与管理上的课题。
(三)普通话水平测试是一项国家级、高风险性的语言测试
时任教育部语言文字应用研究所所长、国家语委普通话培训与测试中心主任姚喜双在《推普工作的重要抓手——谈依法推进的普通话水平测试》中曾经指出:“普通话水平测试不是一般的学术性测试,不是可有可无的,而是关系到推普大业的一项测试。”[2]普通话水平测试是国家级考试,普通话水平测试等级证书全国通用。《国家通用语言文字法》施行后,普通话水平测试成为国内唯一经法律确认、受政府委托而开展的语言测试。《国家通用语言文字法》还明确规定:“凡以普通话作为工作语言的岗位,其工作人员应当具备说普通话的能力。以普通话作为工作语言的播音员、节目主持人和影视话剧演员、教师、国家机关工作人员的普通话水平,应当分别达到国家规定的等级标准;对尚未达到国家规定的普通话等级标准的,分别情况进行培训。”(第十九条)普通话水平测试的结果和证书具有对相关行业的资格的证明作用,具有较高的社会权重。从社会学角度看,普通话水平测试又是一项高风险的语言测试。这些特性都要求普通话水平测试的组织管理必须保证考试的严肃、公正和权威。
上述特征决定了普通话水平测试的组织管理的复杂性,对普通话水平测试管理制度的探索是测试实践的重要内容。
二、普通话水平测试信息化管理制度中存在的问题
嵌入信息化管理系统的计算机辅助普通话水平测试,不论在测试方式方面,还是在管理手段方面,都与过去完全的人工测试大不相同。学者们也对机辅测试给予了高度关注,围绕着考务问题、测试安全问题、作弊问题、环境问题以及技术应用问题进行了深入研究。因为各地使用的是同一套测试软件和管理系统,因此从这些研究中可以管窥全国机辅测试信息化管理中存在的问题。
(一)考务问题
考务问题是一个持续热议的话题,具体表现为报名系统功能不完善[3]和监考程序复杂[4]。就测试报名而言,一是系统不支持网上报名,当测试任务集中、报名量大时,该系统就会暴露出任务繁重、容易出错的缺点。二是测试管理系统不支持与学校教务系统对接。高校学生是普通话水平测试的主要对象,据2009年的统计,在普通话水平测试中,学生参测比例高达77.5%。[5]2测试报名系统信息收集项目与学校管理不一致,与学校的教务管理系统无法对接,造成测试管理上的不便。就监考程序而言,一是机辅测试监考机缺少语音提示,人工操作程序繁复、耗时,考务工作任务相对较重。二是测试时间安排以批次为单位进行衔接,而不是以考生个人为单位,不能像托福网考那样实现随到随考的时间安排。
(二)测试安全性问题
安全性始终是考试管理的核心问题。机辅测试的安全涉及面非常广泛,主要包括软件的安全、数据的安全和试题的安全。
1.软件安全问题
在传统的纸笔考试中,试卷安全是考试安全的首要问题。在信息化时代,首要问题是软件。数据的传输、试题的发布等都需要通过软件操作来进行。目前机辅测试的软件尚未增设加密措施,考试结束后,需要考务人员通过操作考试机删除考生身份信息、测试题目以及考生作答的语音数据等信息。但是,这些与测试有关的数据可以通过一些数据恢复软件进行恢复。许多校园电脑使用的恢复软件都具备这种功能,从而增大了考试信息泄露的可能性。
2.数据安全问题
考试数据(比如:考生信息、考生答题语音数据等)在考试结束后,必须安全回收,回送给考试的管理者,以便于评分、存档等。这个环节特别重要,因为任何考试数据的丢失都将给考试带来不可挽回的损失。为了保证考试数据的安全,通常需要:异地备份考试数据;封存考场服务器,直至考试成绩公布,并确认考生对考试成绩无异议。
普通话水平测试在考务管理中,由于测试数据上传速度慢,考务人员不得不将数据长时间存储于机房,而普通话水平测试场地多数为开放式的非专用考场,在此期间很容易造成测试数据外泄,包括试题、考生身份信息和答题信息外泄。同时,不能排除有学生为获得试题有意窃取这些信息。此外,单机版测试可能造成考试过程中数据的意外丢失。为了防止病毒入侵,便于机房维护,一般高校机房的电脑都装有还原卡,以保证电脑重新启动后会恢复到原有状态。在进行普通话水平测试时,如果出现电脑崩溃、机房停电等意外情况,存储于计算机中的测试数据就会丢失,对测试而言这种意外是毁灭性的。
从理论上讲,在服务器上建立虚拟磁盘进行网络数据存储,或者增加一台普通话考试专用计算机并使用密封机柜管理,可以解决软件安全和数据安全问题。但是现实中存在操作上的障碍:一是导致硬件成本提高,而学校仅负责考试组织,考试的质量与安全与其并无直接的利害关系,因而对加大投入并不积极;二是空间有限,存在没有足够的空间摆放新的设备的问题;三是数据管理缺乏制度保障,作为与不作为只取决于责任心;四是管理者自身对安全问题认识不足,技术能力有限。
3.试题安全问题
考试的次数多了,也会影响试题的安全,因为试题曝光次数多了,容易发生泄露。因此,试题库必须能够为计算机化考试提供足够的试题,而且试题必须能够定期更新。题库的试题更新是保障考试安全的一个重要措施。试题的更新不是简单地向试题库添加新试题,这些新试题必须经过试测并等值到试题库的参数后才能加入试题库。因此,基于计算机的考试可以通过随机试测的办法获取新的试题:每一次考试都嵌入一些试测试题,这些试题不参与考生能力的估算,只是获取考试数据并进行等值分析,这就意味着,试题库应随着考试的不断组织而得到自动更新。
机辅测试后,由于试题外泄,普通话水平测试用试卷已经越来越无密可保。其原因在于:①普通话水平测试题库试题有限,固定使用的仅有50套试卷,不能自动更新,且各个省(区、市)在使用时又有所缩减。②普通话水平测试频次很高,试卷曝光率高。③机测软件不支持随机抽题。测试分批进行,测试任务必须由管理人员事先分配,更改批次任务需要花费很长时间。在实际考试过程中,为了保证考试效率,只能在间隔几轮后再循环一次试卷,试卷使用重复率高。④测试软件不支持随机组卷,试卷固定不利于保密。⑤测试自身对应试的反拨作用。在市场上和网络上都出现了测试第四项“说话”的答案,一些考生将这些答案带进考场或者背诵下来应试,对测试造成严重干扰。
(三)测试环境问题
《计算机辅助普通话水平测试操作规程》对专用测试室和兼用测试室都有所规定:专用测试室应有独立测试机位若干,测试机位应为2平方米以上独立空间,隔音效果良好,内置测试设备1套。利用常规教室或语音室作为测试室的,其室内各机位的间隔不得少于3米。但是在实践中,机辅测试使用专用测试室比例远远少于兼用、共享的计算机房。在机辅测试试验初期,叶军等人的研究提出测试的环境要求是,独立测试室一室一机,多媒体或计算机房共用测试室,一间机房以不超过8台考试机为宜。[6]多年实践证明,这样的要求很难做到。
利用现有机房作为测试考场,优点是不需要太多投入,这是目前普通话水平测试考场安排的主要方式。但是,在机房测试存在考生之间相互影响的问题。由于考生的应试作答的语音数据中相近的测试机位彼此声音混杂,前三题机测成绩受到了影响而失真。[7]还有研究者观察到的测试站的测试现场情况是,考场人数太多,应试人距离间隔不足,测试现场过于嘈杂。[8]此外,由于测试场地是共用机房,测试安全存在隐患,硬件设备也较容易出现故障。
普通话水平测试是一项标准化考试,理论上要求对每一位考生提供的测试软硬件必须统一,施测条件标准化是其基本要求,也就是说,在测试环境方面应该实行严格控制,保证所有考生都能在同等条件和相同的气氛中应试,使每个考生的水平都可以得到全面真实有效的反映。当然,就地区差异显著的现实情况而言,要实现测试环境的标准化在目前来说还只能是一种理想。
三、对普通话水平测试信息化管理制度的思考
目前有关普通话水平测试信息化管理的研究成果多是问题研究,从某种角度来说正是对机辅测试管理现状的描述和呈现。将这些零散的研究聚拢一起的时候,有些问题就会渐渐眉目分明,对探索机辅测试管理制度改革具有一定启示意义。
首先,测试安全性一直困扰着基于计算机的语言测试,特别是大规模的、高风险的语言测试。托福、GRE考试都出现了关键题目被考生记住然后用于传播和散布的现象。测试安全性事关测试的健康发展。一是损害了测试的效度。不论是泄题还是替考,都导致了测试的分数已经不能解释为应试人的普通话水平,考试成绩和水平推断之间断裂了逻辑联系,考试成绩变得没有证据价值。二是降低了测试的声望。一个试题满天飞的测试没有什么严肃性可言。不能有效遏制替考、作答舞弊的测试也是缺乏权威性的。三是影响了测试的发展。比如题库建设、试题改进,在测试安全性不能得到保障的前提下,题库建设只会白白耗时耗力、浪费钱财。四是违背了测试伦理。国际语言测试协会(International Language Testing Association)于2000年专门颁布了语言测试的道德准则,从道德哲学层面提出九项规范测试行为的原则。个人隐私保密原则是其中的第二项,规定语言测试从业人员对测试中的考生所有信息负有保密责任。应试人报名信息、答题语音信息数据的丢失,其危害性后果应该被充分估量。普通话水平测试要想发展成为一个与国际著名语言测试相比肩的品牌,测试管理者需要在管理思想上与国际接轨。
其次,就目前考务管理来说,应该改进管理系统,使管理系统更加成熟和方便。在软件改进过程中,应该吸收一些组织管理者的意见,软件设计团队应该多元化,测试、编程、管理成员在专业上互补,从而进一步完善测试管理,使技术更好地服务于测试。除此之外,鉴于机测管理环节多,考务工作比人工测试时期对考试安全性影响大得多,可以考虑从制度建设方面来保障考务工作的规范化。
再次,场地标准化是考试的基本要求。可控性强是标准化考试的重要特征之一,要求考试设计和实施的全过程,均按一套系统的、科学的程序进行,并能有效控制整个流程中与测试无关因素的干扰,使各个环节的质量符合规定的标准。目前,测试场地的显著差异造成了一定程度的不公平。当然,让所有应试人都在专用测试室中考试,实现这一理想还有很长的路要走。那么,目前可以调整的就是对测试的进一步规范管理,严格限定考场中的人数,在追求效率的同时兼顾质量。
机辅测试管理现状不容乐观,高层级的测试管理机构有必要对机辅测试进一步跟踪研究、全面评估,从而更好地为普通话水平测试工作提供业务指导、质量监控和技术支持。
参考文献:
[1]姚喜双,韩玉华,聂丹,等.普通话水平测试概论[M].北京:高等教育出版社,2011.
[2]姚喜双.推普工作的重要抓手:谈依法推进的普通话水平测试[J].语言文字应用,2010(3):26.
[3]李洪亮.高校计算机辅助普通话水平测试规范化研究[J].中国考试,2011(10):44-47.
[4]刘爱民.高校计算机辅助普通话水平测试中存在的问题及对策[J].重庆文理学院学报:自然科学版,2011(3):90-92.[5]韩其洲.国家普通话测试回顾与展望[M].北京:语文出版社,2010.
[6]叶军,王颐嘉,周鸣之,等.计算机辅助普通话水平测试实施研究[J].语言文字应用,2007(S1):142-148.
[7]项立.计算机辅助普通话水平测试中混响时间及数据安全问题探讨[J].语文学刊:基础教育版,2011(9):11-12.
[8]韩玉华.计算机辅助普通话水平测试试点地区的调查研究[J].首都师范大学学报:社会科学版,2009(S3):29-33.
(责任编辑 孟俊红)
文章编号:1006-2920(2016)03-0074-04
doi:10.13892/j.cnki.cn41-1093/i.2016.03.014
作者简介:周梅,文学博士,安徽警官职业学院基础部副教授(合肥 230031)。