论机辅测试中测试员在封闭测试环境下的行为模式困局

2016-04-06 00:28

莫 运 晓

(武汉交通职业学院,湖北 武汉 430065)



论机辅测试中测试员在封闭测试环境下的行为模式困局

莫 运 晓

(武汉交通职业学院,湖北 武汉 430065)

摘要:普通话水平测试机辅测试是应试人和测试员分别在不同的封闭环境下独立完成,封闭环境下测试员的行为模式有一些困局。阐释这些困局产生的原因并提出解决思路及建议。

关键词:普通话水平机辅测试;封闭环境;行为模式

国家普通话水平测试工作从2006年开始进行计算机辅助测试试点,计算机辅助测试在2009年开始在中国大陆全面铺开,到目前为止,机辅测试已经比较成熟,积累了一定的经验。但是机辅测试有些地方还不能完全实现计算机智能化,仍需要人工完成。在人机合作的过程中,有些地方并不是尽善尽美,出现了一些困局,这些值得我们思考和探讨,以期将来改进。

1计算机机辅测试和封闭环境

在机辅测试的过程中,前三题有文字凭借的读“单音节字词”“多音节词语”和“朗读短文”项,都可以由评测软件完成,但是第四题“单向说话”,由于语料不可预估,必须由测试员人工测评。最后得分由系统的前三题打分和测试员第四题打分相加综合而成。

普通话水平测试进入机测阶段,和以前的测试方式相比发生了革命性的变革。考生和测试员分别在封闭环境下完成自己的任务。考生进入测试室开始考试,面对的电脑设备,只需要按照屏幕要求进行朗读和单向说话,无需进行交流,没有测试员现场评判,不会受周围环境的影响。

但是明显不同于以往。以前测试员都在考试现场,每组测试员“面对面”,可以互相交流讨论;机测以后,测试员是“背对背”,根本不和搭档见面,更无从交流讨论,是绝对的独立完成。整个过程不受外部环境和他人的干扰和影响,这种环境正是管理学上所说的“不受环境影响也不与环境发生相互作用的系统”[1],完全是一个封闭的环境。

在传统的人工测试活动中,应具备四大要素:测试主体(测试员)、测试对象(考生)、测试依据(《普通话水平测试纲要》)和测试手段[2]。而在机测活动中,四大要素只有测试主体未变,其余都发生了变化:测试手段发生了变革,由人工测试走向电脑智能辅助;测试员只需配备网络、电脑和与之配套的声音设备就可以进行工作。测试对象不再出现。由于机测和以前的测试手段不同,所以测试依据也发生了显著变化。原有的《普通话水平测试纲要》并未包含机辅测试评分的内容,故各省各自制定了相应的《评分细则》或者《计算机辅助普通话水平测试第四题评分补充规定》。

由于测试手段的变化,使得测试环境发生相应的变化,形成各自封闭的测试环境。在不同的封闭的环境下,测试主体和对象分别完成各自的任务,互不干扰,当然也可能产生互动。这样的封闭的测试环境,对考生来说,有利有弊。由于现场没有考官,可以缓解考试压力。但是测试开始调试设备等过程也会使有些考生产生紧张情绪,同时也可能由于现场没有考官干预而产生漏读、背稿、朗读文本、无效语料、缺时等现象。

对于测试员来说,评测的封闭环境也是利弊互现。最大的优势是避免了人情分的出现,评测结果更加公正。由于单人在线评测,时间上相对来说比较宽松自由,而且可以反复听,有利于提高准确率;因无法和搭档交流讨论,不易受他人影响,评分相对客观。在这样的封闭环境下进行独立评测,弊端也是无法回避的。没有了前三题的参考,仅凭第四题单向说话三分钟,对应试人的语音做全面的判断,确实有一定的难度;再加上测试员本身的个体差异,就会造成评分的差别。

2测试员在封闭测试环境中的行为模式困局分析

普通话水平测试在我国已经开展20年,培养了大批普通话测试员。测试员们在进行测评打分的时候,听辨和记录同时进行、测评标准上定性和定量结合,随着经验的不断积累形成固定的测评行为和完成的方式,这就是测试员的行为模式。在机辅测试中,这种行为模式却步入困局。表现为,在没有前三题作为参考的情况下,测试员要么不敢轻易扣分,要么评分失准;在无法和搭档讨论的“背靠背”的打分模式下,两名测试员给出的分数相差过大。

普通话水平测试第四题评分时,测试员的主观因素对分值影响很大。比如从生理上来说,测试员天然的听力水准会有细微差别,所以对于语料的听辨会有细微的不同,那么对于语音的正误缺陷的判断就会有所差异。还有,测试员自身的语音水平和受方音影响的程度,也左右着测试员评分的水准。另外,虽然评分的标准是统一的,但是每个测试员对评分标准的理解和把握不完全一致,会导致打分的差异。还有,测试员的态度、业务水平不同,也会造成评分的不同。

在封闭环境测试评分中,在测评第四题的操作中,绝大多数测试员是坚持按照标准正常打分。但是因为没有面对面的搭档,没有了参考和借鉴、讨论,测试员对自己评分水平易产生不自信或打分失准,导致在评分过程中对评分标准的把握出现过松或者过严的情况。有时候测试员担心自己把握标准过严,而采取从轻处理;有时候因为不知道应试人前三题得分情况,害怕因为自己的分数导致应试人“不及格”,有意放松(因为普通话水平测试的等级可以直接影响应试人的从业资格)。最常见的应试人在三分钟内错误超过15个音节就归为五挡扣9分,很多时候,测试员都只扣四挡8分,不会扣到9分。也有测试员觉得把握标准越严越好,或者担心自己把握标准不够精准,从严打分。最突出的表现在高分段,把一挡打成二挡、二挡打成三档,造成评分失准。

测试员对待测试的态度也是影响评分准确度的重要因素之一。在第四题的评判中,如果只注意应试人的语音标准程度,对应试人的词汇语法的方言现象轻易放过,就会出现评分误差。在机辅测试中,应试人在封闭环境下不受任何干预地完成测试。在没有人干预的情况下,会出现在人测考场上不会出现的状况,如说话断断续续甚至长时间不说话,或者重复一些没有意义没有评判价值的语句,或者带了稿件甚至从现场网上搜到范文进行朗读。遇到这种录音,机测测试员如果稍一马虎,就会放过,仅仅机械评判应试人语音的错误、缺陷,忽视流畅度、朗读文本、离题等项的评分,就会造成很大的评分误差。所以测试员的在测评的时候,必须具备严肃认真的态度,严格按照机辅测试的评分细则打分,而不仅仅依靠人测的评分经验。

3机辅测试测试员行为模式困局的解决思路及建议

要减少机辅测试中测试员封闭环境测试的困局,笔者认为可以从以下方面下功夫:

3.1加强对应试人的测前培训,减少评分干扰

为减少应试人在考场上因没有人工干预容易出现的诸如缺时、无效语料等状况,切实加强测前培训,并且加重机测部分内容的培训,使应试人了解机辅测试、掌握相应的应试常识,从而避免无谓的失分。这样,对于测试员来说,应该可以减少非语音现象的出现,能让测试员更专注于对应试人语音的评分。

3.2改进机测评分界面,完善评分项目,增加前三题分值作为参考

目前大家使用的国家普通话水平测试信息管理系统,在第四项评分页面只有语音标准程度、流畅、词汇语法、缺时、离题、无效语料这几个评分项目,应试人经常出现的“朗读文本”扣分项目并没有出现,应把这一项增加进来。另外,建议在第四题的评分页面增加机测系统所给出的前三题的分值,这样测试员就对应试人的语音情况有个大致的了解,可以作为第四题测评时的参考,避免了评分的盲目性。其实,提供前三题的分值作为参考更主要的目的是解决测试员在封闭环境测试时产生的焦虑心理,使之能更自信地打分。

3.3加强测试员培训,提高其业务水平,增强其敬业精神和责任感

测试员的业务水平是测试质量的保证。在机测的封闭环境下,难免出现新的情况和新的问题,各测试站应该切实加强对测试员业务的培训和职业操守的教育,定期或者不定期举行学习、研讨、培训,以提高其业务能力,并增强其责任意识和敬业精神。

参考文献:

[1]罗宾斯.管理学[M].北京:中国人民大学出版社,2006.

[2]姚喜双,等.普通话水平测试概论[M].北京:高等教育出版社,2011.

[3]杨康.计算机辅助普通话水平测试评测质量影响因素分析[J].考试研究,2013,(5).

[4]邹斌.机测普通话说话项测评分析与对策研究[J].镇江高等专科学报,2011,(4).

[5]陈申.语言文化教学策略研究[M].北京:北京语言文化大学出版社,2001.

责任编辑:李增华

作者简介:莫运晓(1970—),女,湖北武汉人,硕士,讲师。研究方向:语言及语言应用。

收稿日期:2015-12-03

中图分类号:H102

文献标志码:A

文章编号:1674-6341(2016)01-0083-02

doi:10.3969/j.issn.1674-6341.2016.01.036