对《新HSK六级》真题的信度分析

2019-04-15 02:27肖依琴
神州·上旬刊 2019年4期
关键词:试卷分析信度

肖依琴

摘要:语言测试是语言教学的重要组成部分。从教师来看,测试可以反映教学工作的质量和效益,发现教学中存在的问题,起到改进教学的作用;从学生来看,测试可以检查学生的学习效果,检验语言知识和技能的掌握情况,发现学习中的问题,以促进学生更好地学习。本文将选择一份语言测试题,分析其信度,并提出改进意见。

关键词:语言测试;信度;试卷分析

一、试卷分析的信度

一个好的语言测试必须注重其可靠性,又叫“信度”。“信度”指测试结果的稳定性,即用同一标准在同样方式下测量同一个人时,每一次应该产生相同的值(2004,周小兵)[1]。例如,同一篇作文,第一位教師评80分,第二位教师同样给80分,则说明评分具有信度;如果第一位教师评80分,第二位教师评40分,则说明评分没有信度。测试的信度一般用0.0-1.0之间的数字表达,叫可靠性系数,越接近1,可靠性越高(英语作为第二语言的托福考试,可靠性系数大约为0.95)。在语言测试项目中,语法、词汇、阅读的可靠性系数比较高,听力、口语次之,因为写作的评分标准比较难把握,所以写作部分的可靠性系数最低。

对测试信度产生影响的因素有很多,除了测试的场所、环境、设备,主要有以下几点:(1)测试量的多少。在考虑学生考试状态的前提下(避免题量过大引起的疲惫感),题目量越大,让学生发挥的可能性越大,这样能提高测试的信度;(2)评分的准确性。根据评分标准的不同,一般来说,客观题比主观题的信度高,虽然如此,但在编写试卷的时候也要注意客观题和主观题的分配比例,不能一味追求信度而忽视主观题的编写。

二、试卷分析

新汉语水平考试(新HSK)考查汉语非第一语言的考生在生活、学习和工作中运用汉语进行交际的能力(《新HSK考试大纲》,孔子学院总部)[2]。本文选取的是国家汉办编制的2016年新HSK6级第2套卷。该卷共分为三个部分:听力(50题,35分钟)、阅读(50题,50分钟)、书写(1题,45分钟)。

(一)听力

听力细分为三小部分:①1-15题,给出一段情节完整的(约20秒)的个人朗读音频(其中男朗读者、女朗读者比例均衡),要求考生在四个选项中选出与所听内容一致的一项,其中每题的间隔作答时间为13秒;②16-30题,每5题为一个听力单位(约2分30秒),先给出一段男女对话音频,再依次提问;③31-50题,每4题为一个听力单位(约1分50秒),给出一段个人朗读音频,再依次提问。

听力部分存在以下几个问题:①听力的朗读音频均为标准普通话,不符合真实生活中的语境(真实语境应是各种方言掺杂的语音,或者带有乡音的普通话);②听力环境安静,话语节奏平稳,语音清晰可辨,不符合真实生活中的语境(真实语境存在不可避免的杂音,说话者思考时的话语停顿及语序颠倒、重复);③听力类型单一,第16-30题的朗读材料均为男女采访音频,而考生在实际生活、学习和工作场景中会遇到更多听力类型,例如电话、新闻、演讲、报告等;④答题选项提供的关键词,会引导部分学生采取低级的听力策略,如听“关键词”,而不是关注语篇本身的意义。例如第21、29、36题都是“数字题”,学生只要重点听到该数字就可选出正确答案。又例如第27题,“A.很成功,B.不值得借鉴,C.效果不理想,D.有经验也有教训”这四个选项态度区分明显,A表肯定,B和C表否定,D表中立态度,各选项之间不存在干扰信息,只要听到态度关键词就能选出正确答案;⑤部分选项为常识题,不需要听或理解内容即可排除并进行选择。例如第2题,“A.不渴时不要喝水”这一选项在听前就可以马上排除,第14题,“C.《西游记》是一部历史小说”这一选项涉及文化知识,如有了解中国古典文学的考生可在听前排除这一选项,这类文化题也不应在听力部分出现。

(二)阅读

阅读细分为四小部分:①51-60题,给句子,选出有语病的一项;②61-70题,给不完整一句话或一小段内容,选词填空,补足句子或段落;③71-80题,给一篇不完整的文章,选句填空,补足文章,每五题为一大题;④81-100题,每四题为一大题,给出一段文章,根据问题选出正确答案。

阅读部分存在以下几个问题:①改病句属于句子范畴的认知,不应在阅读部分考察,阅读属于理解范畴,而改病句涉及到语法层面,二者考查范围不同;②同理,选词填空考察的是词汇范畴的认知(词义相同,考察词语的搭配练习),也不应在阅读部分考察,且选项部分设计不合理,考生可利用排除法得到正确答案。例如第61题“随着生活节奏的不断加快,现代人工作之余需要用娱乐来调节身体的紧张______,只一味地工作,不______任何娱乐活动,最终会______身体健康。”选项“A.情况、举行、不利,B.情形、举办、阻碍,C.状况、参与、防止,D.状态、参加、损害”,这四个选项中的三个词语与其他选项各不相同,不存在互相干扰、混淆,如考生知道“损害+身体健康”,那他可以马上锁定D选项,其他都可以不再比对,即考生只需要选出其中一个正确答案就能得到整题的答案,并不会进行完整地阅读;③第三部分的选句填空虽然也是句子范畴的考察,但是优于第一部分的改病句练习,因为选句填空涉及到上下文的衔接,需要通过阅读语境来得到答案,但是部分选项的不合理设计也会使考生采取低级阅读技巧作答,投机取巧,在不理解文意的情况下选出正确答案。例如第72题,“首先,是最强壮的狼,即咬死猎物的狼先吃,然后是强壮的狼吃,(72)_______”,我们可以清楚根据关联词“首先、然后”,推断选项中含有“最后…”的为正确答案。其次,选项的个数与文章空缺的个数一致的问题,会导致考生减少一个题目的阅读量,也就是说考生可以避开自己知识理解的薄弱环节,通过排除剩余法得到最后一个答案,这会大大降低考试的信度,判卷者无法根据答案得到哪个知识点为考生的薄弱环节,不能起到测试检测考生学习效果的作用,也不能通过发现问题从而改正问题;④第四部分的根据文章选答案中也出现了词汇范畴的考察(选择词语描述及词语意义的考察),不适合出现在阅读题中。例如第87题“文中画线词语“无恶不作”的意思是___________?”,选项“A.非常努力,B.忍受了很多痛苦,C.做了非常多的坏事,D.取得了很大的成就”,这一题是考察“无恶不作”这个成语的意义,且选项A、B、D的感情色彩都为褒义,通过排除法考生也能得到正确答案。又如第88题“根据上文,下列哪个词最适合形容‘第三个人?”,四个选项“A.平凡,B.高尚,C.奢侈,D.聪明”也都是对形容词“平凡、高尚、奢侈、聪明”的词义理解;⑤根据《新HSK考试大纲》要求,测试目的在于考查汉语非第一语言的考生在生活、学习和工作中运用汉语进行交际的能力,那么测试内容就应该模拟生活、学习和工作情景或与之相关(议论文、说明文为佳,而不是记叙文、散文或者寓言故事),而第三、四部分的阅读材料与这一原则不符,例如第76-80题的阅读文本是一篇叙事性的励志故事,第85-88题的阅读文本是一篇神话寓言故事,这类阅读在考生平时阅读范围内的出现频率较低,没有贴近考生生活、学习和工作的阅读环境。

(三)书写

该测试要求考生在10分钟内阅读一篇约960字的记叙文(阅读时不允许抄写、记录),并要求在35分钟内将该记叙文缩写至400字(只复述文章内容,不加入自己观点),标题自拟。

书写部分存在以下几个问题:①该部分只考察了考生的缩写能力(叙述故事的能力),不允许加入自己的观点,不属于真正意义上的写作训练,不能突显考生的写作技能与逻辑;②从测试给出的要求来看,考生需复述文章内容,并且在阅读时不允许抄写、记录,这一点需要记忆因素的参与,偏离了写作的目的和测试所想得到的理想结果;③根据汉语考试服务网公布的《新 HSK 考试评分说明》(0 分:空白。低档分:内容与提供材料相关性不大;内容不连贯,有语法错误;有较多错别字。中档分:内容与提供材料基本相符,有语法错误;内容与提供材料基本相符,有少量错别字;篇幅不够。高档分:内容与提供材料相符,结构合理,表达连贯,无语法错误、错别字。)[3]来看,评分标准中将“错别字”作为一个扣分项是不科学的,写作并不是考察文字书写的正确与否,而是考察逻辑思维和写作技巧。笔者在该文的第一部分就已提到:“评分标准以及评分的准确性会对测试信度产生影响”,如果写作部分的评分标准将“错别字”作为扣分项,那么这个测试的信度将会大大降低。

三、试卷改进方法及建议

前文已对新HSK6级第2套卷进行了大致的分析,指出了影响信度的因素以及编写不足之处,针对这些不足,笔者将从听力、阅读、书写部分分别提出试卷改进方法及建议。

(一)听力部分的改进与建议

①听力的朗读音频不应该只有标准普通话,还应加入各种方言掺杂的语音,或者带有乡音的普通话,努力贴近真实生活中将遇到的语音情境;②设置多样的听力环境,不仅要有安静的(话语节奏平稳,语音清晰可辨),还要有嘈杂的,断断续续的,模拟真实生活中的语境(真实语境存在不可避免的杂音,说话者思考时的话语停顿及语序颠倒、重复);③设置多样的听力类型,不仅仅是男女采访音频,还要考虑在实际生活、学习和工作场景中可能遇到的更多听力类型,例如电话、新闻、演讲、报告等;④答题选项编写完成后需要再次检查,是否存在“听力盲区”,即不需要听、理解就能得到的常识性答案;⑤答题选项要尽量避开字面“提示词”,编写者可以考虑在问题上多绕弯来避免考生运用自下而上的低级听力策略,而不是直接的,关于内容的提问。

(二)阅读部分的改进与建议

①编写者在考虑阅读题的形式时,要时刻谨记测试目的和原则,不能混淆对句子语法、词汇意义的掌握与对阅读材料的理解能力,要避免“改病句”、“词义理解”这类题型出现在阅读题型中;②在设置阅读题的答案选项时,要注意每个选项的内容与其他选项的关联度,尽量设置混淆项,对于“选句填空”这类题目,应该增加1到2个错误的干扰项,而不是将选项数量与空缺数量设置成对等数,这样能避免考生利用排除法得到正确答案,以减少实际所需的阅读量,在阅读中出现“偷工减料”的现象;③根据《新HSK考试大纲》要求,测试内容应该模拟生活、学习和工作或与之相关的情景,选取考生平时阅读范围内的出现频率较高的材料。其中议论文、科学说明文为佳,尽量避免用记叙文、散文或者寓言故事、神话故事作为阅读材料。

(三)书写部分的改进与建议

①书写部分选取的缩写题材不应是叙述性的故事材料,而应是带有学术性质的语篇材料,且不考慮记忆因素的干扰,应允许考生根据原文进行缩写,并在最后呼吁考生发表自己的观点,考察其语言概括、写作技巧和辩证思考的能力;②完善书写部分的评分标准,取消“错别字”的扣分项,并对判卷者的评分进行再处理,例如,同一篇文章由多位判卷者进行评分,去掉一个最高分,去掉一个最低分,最后取其他判卷者评分的平均值为最终分数,同时对于评分数与其他判卷者差距悬殊的,要求驳回重判,通过这种方式来增评分的准确性,从而保证测试的信度。

四、结语

现在的大部分论文都关注语言本体和教学方面的研究,而语言测试作为一个语言学习的重要环节,容易被大家所忽视,笔者希望通过该篇的分析能让自己重新认识语言测试,在以后的学习或工作上,能够保持一种辩证发展的思维和科学的态度去看待问题,解决问题。

参考文献:

[1]周小兵,对外汉语教学入门[M].广州:中山大学出版社,2004:178.

[2]国家汉语水平考试委员会办公室考试中心,新HSK考试大纲[Z].北京:经济科学出版社,2001.

[3]汉语考试服务网,新HSK 考试评分说明[Z].

猜你喜欢
试卷分析信度
Double fête,double plaisir
《广东地区儿童中医体质辨识量表》的信度和效度研究
让试卷分析更贴心
预科数学试卷分析与重难点教学探索
科技成果评价的信度分析及模型优化
耳鸣残疾问卷中文版的信度和效度检验及其临床应用
中文版脑性瘫痪儿童生活质量问卷的信度
翻译测试的评分员信度研究*——TEM8 翻译项目评分员问卷调查记略