杨帆
(湖北大学文学院,湖北 武汉 430000)
HSK五级短文阅读类试题内容效度研究
杨帆
(湖北大学文学院,湖北 武汉 430000)
HSK阅读类试题相较于对话式的选词填空类和内容理解类试题有质的飞跃,着重考察汉语的综合能力。本文以HSK五级中的20篇短文阅读类试题为样本,从文本输入和技能输出两个方面研究其内容效度。研究结果表明,这5套HSK试卷的短文阅读部分的内容效度较高,有利于考察学生的汉语综合能力,但也需要进一步的改善。
HSK五级短文阅读;内容效度;文本输入;技能输出
(一)新HSK简介。
2009年11月,国家汉办正式推出了新汉语水平考试(HSK),以适应“汉语热”的国际形势及考生需求。新HSK相对于旧HSK主要有以下几点优势:第一,遵循“考教结合的原则”。考试与教学相结合,考什么、教什么,使考试不为难倒学生,只为检测学习内容。不仅有利于学生掌握汉语综合能力,而且能提高学生学汉语的兴趣和信心。第二,确定具体词汇量,增加考试等级。旧HSK在实施过程中收到最集中的反馈意见就是“太难”,致使很多学生放弃了汉语学习。汉语本身的确很难,但“千里之行,始于足下”,我们可以一步一步来,将汉语教得简单,新HSK的6个等级和相对应的词汇量对于考生而言,是由易至难的“跳板”,引导学生分阶段、分层次提高汉语综合能力。第三,关注汉语应用能力,提高考试效度。“新HSK在题型设计上避免考查语言知识、应试能力,使考试成绩反映汉语教学水平,反映考生实际汉语交际能力。”[1]
(二)考试大纲与考试内容一致。
效度(validity) 就是指实证证据或理论依据对测验分数解释或基于分数所做决策的充分性、恰当性支持程度的综合性评判。[2]就语言测试而言,效度主要回答了两个问题:考的是学生的什么能力以及是否考了应当考的能力。[3]而追求高效度的第一步就是保证内容效度。原则上,考试内容应根据考试大纲制定,特别对于新HSK这种“考教结合”的考试而言。内容效度,就HSK而言,指一套HSK测试题的测试内容是否反映了它的测试要求,即考试大纲与考试内容是否达到了内在一致性。新HSK五级考试大纲规定“通过HSK(五级)的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演讲”。[4]由此可见,相对前四级重对话的目标,从五级开始拔高至阅读,这也是本文着重考察HSK五级短文阅读类试题内容效度的原因。
本文主要研究HSK五级短文阅读类试题的内容效度,所以选取了H51001,H51002,H51004,H51005四套样卷中的20篇阅读理解作为研究对象,主要从文本输入和技能输出两方面研究其内容效度。文本输入包括生词量、难易度、长度、题材和语料真实度五个部分;技能输出包括理解主旨大意、查找事实细节、根据材料进行推断、理解作者的观点态度和信息提取归纳五个部分。前者主要分析语篇本身是否符合考试大纲的要求,后者侧重分析试卷本身是否达到它所宣称要测试的内容。
(一)文本输入。
1.生词量、难易度、长度。
新HSK根据考试等级规定了相应的词汇量,如表1所示。考生掌握150个规定生词就可通过HSK(一级),300个生词就可通过HSK(二级)等等,适合学生分阶段、分任务、分目标完成汉语学习要求。据统计显示,HSK( 一级)合格率约 93%,HSK(二级)约92%, HSK(三级)约 86%, HSK(四级)约 68%, HSK(五级)约 66%, HSK(六级)约 63%。[5]至少从合格率这一角度考量,新HSK的出题难度还是比较合理的,反映了汉语国际推广的要求。
表1 HSK等级词汇量
本文统计的四套样卷中,阅读篇章长度如表2所示。篇章长度的跨度基本在250到550之间,每套试卷基本做到长短结合,除H51004样卷中篇章3、4、5皆超过500字,会给考生带来非正常难度,影响内容效度。所以,HSK五级短文阅读每篇应控制在350至550之间,有长有短。我们可以推断,除H51004外的其他3套试卷,能更好地考察学生的汉语应用能力。
表2 阅读篇章字数统计
2.题材。
阅读篇章的选材应该尽量多样化、广泛化,不要专业化,特别是不要选择考生利用背景知识就能大致了解内容的文章,要着重于考察语言能力——即考生通过阅读文本能明白的知识。因此,在选择 HSK 的阅读理解材料时,要最大限度地选择那些考生普遍感觉熟悉的一般性文章作为阅读材料。[6]在条件范围内做到相对公平,以达到最大效度。
表3 题材类型
HSK五级短文阅读篇章部分题材如表3所示,包括人生哲理、社会生活、个人经历、科学知识、文化教育等,题材较为广泛。其中人生哲理类篇章居首,占35%。通过对部分HSK五级短文阅读篇章的题材分析,两个问题值得考虑。第一,哲理类文章过多。不管是社会生活、个人经历还是文化教育类文章,最后的落脚点都在人生哲理上,客观描述类或商业经济类文章几乎没有。过分集中于某类题材会影响考试效度,而且也会让考生有猜题、押题的行为,不能真正反映考生的语言水平。第二,反映社会热点、现状的文章较少。在分析的20篇文章中,有3篇关于社会热点、现状的文章:“80后”,“网络阅读”,“女主外,男主内”。我们可以发现,这三篇也不是当下的社会热点,而是旧的社会热点。此类文章多出现,才能真正反映社会生活,让考生学到鲜活的、热腾腾的汉语,也才能符合大纲“通过HSK(五级)的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演讲”的要求,提高考试效度。
(二)技能输出。
输出主要指考生获得的阅读技能或者说是这份测试想要测试考生是否获得了所考的阅读技能。根据HSK五级短文阅读类试题的分析,将所考察的技能分为以下五个部分:理解主旨大意,查找事实细节,根据材料进行推断,理解作者的观点态度,信息提取归纳。所考查的技能分布如表4所示。
表4 HSK五级短文阅读类试题技能分布
如表4所示,HSK五级短文阅读注重对事实细节、推断预测和信息提取归纳的考察,分别占29%,25%和29%。这与HSK五级考试大纲“通过HSK(五级)的考生可以阅读汉语报刊杂志,欣赏汉语影视节目,用汉语进行较为完整的演讲”的要求基本一致。总体而言,除了作者的观点态度题偏少,试题类型的整体分布比较均匀,有利于考察考生多方面能力。但就单篇文本而言,部分技能考察过于集中,例如H51001篇章三考察了三个信息提取归纳题(78,79,80),篇章五考察了三个推断预测题(88,89,90),H51002篇章四考察了三个推断预测题(83,84,85),H51005篇章二的四道题全部考察的是事实细节题(75,76,77,78)。单篇阅读材料的考察技能过于集中,覆盖面小,不利于考察考生对文章各方面的理解,从而降低考试效度。不仅要从总体上达到试题类型的均衡,也要在单篇阅读文本上尽量多地考察各方面阅读技能。
本文通过对H51001,H51002,H51004,H51005四套五级HSK样卷的短文阅读试题研究发现,在文本输入方面,生词量和难度适中,但某些篇章长度过长,且有一套试卷中几篇阅读文本都过长的现象,变相提高了考试难度;题材涉及领域较多,但过于集中于人生哲理类;语料真实,无生造语料的情况。在技能输出方面,试题类型的总体分布比较均匀,单篇文本对某种技能的考察过于集中。总体来说,这5套HSK试卷的短文阅读部分的内容效度比较高,有利于考察学生的汉语综合能力。
[1] 张晋军,解妮妮,王世华,李亚男,张铁英.新汉语水平考试(HSK)研制报告[J].中国考试.2010(09)
[2]Messick,S.(1989) Validity.In R.L.Linn (ed.) ,Educational Measurement,13-103.New York: American Council on Education and Macmillan.
[3]刘润清,韩宝成.语言测试和它的方法[M].北京: 外语教学与研究出版社,2000:208
[4]孔子学院总部.新汉语水平考试大纲[M].北京:商务印书馆,2009
[5]柴省三.关于HSK阅读理解测验构想效度的实证研究[J].世界汉语教学.2012(02)
H31
A
1671-864X(2016)07-0269-02
杨帆(1992-),女,汉,湖北武汉,全日制在读硕士,湖北大学文学院,研究方向:汉语国际教育。