魏 华
(江西外语外贸职业学院 江西南昌 330099)
网络语言学习环境中的听说测试信度与效度分析
魏 华
(江西外语外贸职业学院 江西南昌 330099)
语言测试是教学环节中不可或缺的重要组成部分,科学的评价体系能够有力地推动语言人才的培养。本文就当前网络语言学习环境中的听说测试进行信度与效度分析,阐述了网络化听说测试的利弊,提出了这一测试改革的进一步思路。
网络语言学习;听说测试;信度与效度
语言测试是应用语言学领域的后起之秀,是一个“深奥且不受欢迎的行当”(Bachman & Palmer, 1988), 但是社会对测试的需求推动着这一科学的发展。(2011,金艳)。笔者认为,语言测试是一个包含人文价值观的特殊项目,特别是其“产出性”技能的测试,对测试的评价体系带来了难度。结合当前语言网络化学习的发展趋势,本文将对语言听说测试的信度与效度进行分析,拟达到科学评价标准。
语言测试是用来衡量语言习得的重要手段之一,因此一直以来受到教育界学者的共同关注。笔者院校非常注重语言教学与测试,虽然在各测试工作中列有明确的量化测评标准,但随着测试手段的不断革新,在出卷、评卷等方面能否达到科学的信度与效度都存在一定的问题。
语言测试的两个重要评价指标就是“信度”和“效度”。“信度”是指语言测试的可信度。Bachman(1996)定义“信度”为测试的一致性(consistency of measurement),即同样的试卷在不同的环境中是否能达到同样的测试效果。这对当下使用网络环境下的测试起着非常重要的作用,因为一份缺乏信度的试卷根本实现不了测试的价值。“效度”是指语言测试的“可靠度”。武尊民(2002)定义“效度”为测试需考查测试的目标,即考试结果需用来评判预定要测试的语言能力,是一种测试与测试目标之间的相关性。“信度”与“效度”既矛盾又统一,可以说,任何测试难以达到两者的最高点。因此,在测试题型、组卷、评卷中,尽量减少“信度”的误差和增大“效度”的效果是语言测试必须考虑的因素。
在国际化英语语言测试能力的需求下,网络化语言测试模式在众多学院考试中得尝试,带动了语言测评的教改工作。我院近年采用了蓝鸽校园网语言学科平台为师生搭建了课堂教学、作业、自主学习、测试等实用模块。这里主要介绍测试模块在语言考评中的运用情况。
为适应我院学生特点,针对听说测试我院采取了语言学科平台中的智能化题库平台。老师可以自己设定相应的专业化题库,并按照题目属性分类,进行试题的添加、删除等工作。
然后输入“难度系数、试题形式”等条件,系统自动生成试卷。此类测试与之前的纸质试卷相比,在难度系数上更得到了科学的把控;在监考、阅卷上也更加科学化、智能化,节省了大量的人力和物力。更加关键的是,网考无纸化测试推动了测试的趋势发展,使语言学习者能够适应国际化英语水平考试和社会应用型人才培养的要求,充分达到了测试的可信度。但同时,我院测试改革还处在起步阶段,在硬件设备上还有待优化。更加值得关注的是,在平时语言教学中,如何有效利用学科平台中的教学板块和其他板块,使其真正促进语言的教学和测试,做到教考的有机统一,能够科学实现测试的效度。
在语言听说测试的改革中,从传统纸质考试到机考再到网考,经历了前后近5年的时间。虽在考试方法、设备使用方面都已比较娴熟,但为达到最大化的听说测试信度和效度,测试的出卷、组卷、评卷工作总在不断优化之中。
在试卷的出卷环节中:为提高信度,要求采用客观题,如选择题,确保测试结果的客观性;同时,为确保效度,试题也采用了部分主观题,如回答问题、两人对话。在组卷方面:要提高信度,就一定要考虑试题本身的可靠性和评分的可靠性这两个方面。试题本身的可靠性主要取决于试题的范围、数量、试题的区分度等因素;评分的可靠性主要取决于评分标准是否客观和准确。以大二上学期试卷为例,我们采用了三个大题,各部分之间梯度由易到难,考查了测试对象的语言听说综合运用能力,这也同时保证了测试的效度,特别是表面效度和内容效度。在评卷方面:要同时注意客观性和主观性的评价。一般来说,客观题的评分标准在测试前就已得到保证,可以全部录入测试平台由机考一次性完成,关键是主观性的评价还要由教师根据预定评判标准给测试对象打分,并且由两位教师(听说课和口语课)共同完成主观题打分。
组卷题型
这是一份大二学生上学期组卷模式,兼顾了听说两项基本技能的测试,而且非常合理地把二者相互结合,达到了科学测试的目的。但是,题型偏向主观,缺乏客观题,乃至信度不高。但这份试卷效度非常高,区分度也很明显,这也正说明信度和效度难以统一,但在今后的进一步改革尝试中,可以站在增加信度的角度上,优化题型。例如:第二大题可改为选择题:听小短文,然后根据意思选择正确答案。总而言之,这份试卷还是可行的。Davies(1990)提出,我们能够使一个高效度的测试增加信度,但我们难以使一个高信度的测试更加有效。笔者也认为:语言测试应该更倾向于效度,这将推动语言教学向培养学生实用语言能力方向发展。
信度和效度是语言测试的两大基本要求,而网络化测试带动了现代化技术在教育体系中的科学改革,能够更加科学全面地实现测试的信度和效度检验。测试任务和网络多媒体技术的有机结合也将是目前教育的必然发展趋势,其良好创建了集立体化和生态化为一体的交际情境,有助于考试有效语言的输出,但同时也对教育硬件环境和软件环境提出了更高的要求。
[1]金艳.语言测试半个世纪的发展历程——“第33界语言语言测试研究研究学术研讨会”综述[J].外语测试与教学,2011(10).
[2]吴小青.从我校英语测试谈语言测试的信度与效度[J].科技信息,2011(21).
[3]施丽娜,徐芝苹.国内十年语言测试信度与效度研究的统计分析[J].四川教育学院学报,2010(12).
[4]赵成发.谈语言测试的信度与效度[J].西安外国语学院学报,2010(3).
[5]Bachman L and Palmer A.Language Testing in Practice[M]. Oxford University Press,1996.
The reliability and validity of the test in the environment of network language learning
Wei Hua
(Jiangxi College of Foreign Studies, Nanchang Jiangxi,330099, China)
Language test is an important part of teaching, scientific evaluation system can greatly facilitate the language talent cultivation. This article analyzes the reliability and validity of the test in the environment of network language learning, elaborates the advantages and disadvantages of network listening testing, put forward ideas of this test reform.
network language learning; listening and speaking test; reliability and validity
H31
A
1000-9795(2014)04-0408-02
[责任编辑:刘丽杰]
2014-02-19
魏 华(1975-),女,江西南昌人,副教授,从事英语系教学工作。
江西省高等学校教学改革研究省级立项课题(JXJG-12-38-4)。