地理开放性试题评分标准浅析

2013-03-19 06:06华东师范大学资源与环境科学学院200241陈昌文
地理教学 2013年11期
关键词:评分标准开放性试题

华东师范大学资源与环境科学学院(200241)巢 娜 陈昌文

新课改后,开放性试题受到越来越多的研究和关注。开放性试题虽然给阅卷工作带来了难度,但是却给考生以更大的思维空间,为考生提供了展示自己能力的机会和平台,有利于考生思维空间的拓展和对考生创新精神的考查。因此,近年来开放性试题已成为命题的一个热点,地理学科也不例外,其具有的综合性、地域性、开放性等特点非常适合命制开放性试题来考查学生的地理观察能力、实践能力、思维能力、表达能力等等。但是,开放性试题需要人工评分,相对于选择题,其评分误差比较大,考试结果的信度相对较低。同时,只采用按采分点的多少来打分的方法显然已经不适应新课改的要求,不仅评分标准自身存在不少漏洞,而且这种方法完全忽视了考生在作答过程中的思维品质,不能较好地反映考生的认知技能或思维能力表现程度的差异。因此,不少专家认为命题技术是否能够跟得上时代的要求就在于开放性试题的命制与评分,而评分问题恰恰是开放性试题命制的一个瓶颈。本文重点对目前高考地理开放性试题评分标准存在的问题进行剖析。

一、评分标准没有对不同分数等级进行较为清楚的描述和定义

开放性试题一个很大的缺点在于每个评分教师对评分标准的理解不可能完全一致,因此,命题人员在编制出试题后,必须制定尽可能清晰、详细的评分标准,对不同的分数等级进行较为清楚的描述和定义来指导考试后的评分,以减少开放性试题的评分误差,增强测量结果的可靠性。然而分析我国一些大规模考试中的地理开放性试题的评分标准会发现,多数的评分标准都存在过于概略这一问题。尽管在实际评分中可以制定评分细则来弥补评分标准的先天性缺陷,但依然不能令人满意。

【例题1】(2011年上海市高考地理卷第32题)产业结构优化原理要求“一个区域的产业结构应该与区域内的自然环境、社会经济环境以及生产力发展水平相协调,体现出有别于其他区域的特点和优势”。根据这一原理,分别评价环渤海地区北京、辽宁区位商指数Lij>2的行业集聚的合理性。

环渤海地区五省市部分制造行业区位商指数表

答案要点及评分标准:

北京:经济发达,拥有人才和技术优势,因此发展技术和资金密集型行业与该区的区位优势相协调。(2分)

辽宁:煤炭、石油、铁矿资源丰富,因此发展资源密集型行业与该区的区位优势相协调。(2分)

显然这一题的评分标准就很不清晰,不知道两分的分值分别是如何赋予的,这种情况下,评分教师不能正确领会评分标准对不同分数等级的概念性描述,不能对考生显著不同的、独立的行为特征作出区分。该题要求“分别评价环渤海地区北京、辽宁区位商指数Lij>2的行业集聚的合理性”,试题共占4分,其中北京、辽宁各占2分,理论上看2分的得分等级应该是三个,即0、1、2分,也就是说评分者要有效地区分出三个行为特征等级。可是评分标准中并未说明怎样区分不同层次水平的答案,考生的答案通常会五花八门,1分的答案要不要界定?怎样界定?如果有学生答“北京:科学技术力量雄厚,适合发展通讯、计算机及其它设备制造行业”,该怎样评分呢?该答案列出了北京发展通讯、计算机及其它电子设备制造行业的一个重要的条件,即科技力量发达,但却只是列出了一个论据来论证,主要论据明显不完整,这样的情况可以得分吗?阅卷评分教师依据评分标准不能对此做出准确的判断,在彼此独立评分的情况下就会无从下手或按照主观的理解来赋分。

众所周知,考生的成绩不但受考试要测量的知识和技能、方法与能力的影响,也受到其他一些因素的影响。如果各位阅卷评分教师都只得依据自己的主观理解对开放性试题评分,就会造成测量误差,进而在一定程度上影响对考生学业水平、学科能力的考查结果,降低考试结果的可靠性和使用价值。

一个科学的评分标准应该是清晰明确的,尽可能的对于考生在答题中表现出的行为特征和每一个等级进行较为清楚的描述和定义。该题的测量目标是“分析和评价各类地理资料的能力”,进一步分析该试题的应答过程或要素,大致应该包括:①通过表格数据判断出北京、辽宁区位商指数Lij>2的行业是哪些行业。②运用地理知识正确且具体的说明这些行业分别在北京和辽宁集聚的原因。③做出评价,就这些行业分别在北京和辽宁集聚合理与否做出自己的判断。其中①要素是回答出②、③要素的前提和基础,而且学生往往会将①要素并入③要素中,也就说学生在回答出③要素时往往蕴含了①要素的信息。该题分值为两分,笔者认为是否可以将①和③要素进行合并。下面是笔者设计的关于该题的评分标准。

要素分值 参考答案 评分细则 说明说明理由1分北京经济发达,拥有人才和技术优势。经济方面:经济发达或生产力水平高或资金雄厚等;技术方面:科技水平高或高等科研院校集中等;人才方面:人才丰富或劳动力素质高等。至少答到两点不同方面(经济、科技、人才方面)的正确理由;其它无关理由不得分。做出评价1分因此北京发展通讯、计算机及其它电子设备制造行业(或者技术和资金密集型行业)合理。其它如:“因此北京适合发展……行业”、“因此有利于北京发展……行业”或者“北京……行业集聚,是因为……”等等表述,只要表达出了考生做出相应评价的推理过程,即可得分。学生在回答这一要素时,答案中必须蕴含北京区位商指数Lij>2的行业是通讯、计算机及其它电子设备行业,或者技术和资金密集型行业。否则不得分。

需要说明的是,如果学生将对北京区位商指数Lij>2的行业的判断单独列为一点,则只有当判断正确,且后面有自己的评价内容时才能得分。此外,“说明理由”和“做出评价”两个要素可以颠倒顺序,先做出评价然后说明理由也可。

二、评分标准与试题测量的行为目标或认知技能要求不一致

“测量什么”是考试设计的核心问题之一。关于试题测量的行为目标或认知技能要求,即每道试题到底是测量学生的哪一行为目标,在考试设计和命题时就已确定。而如果在对试题进行评分时,评分标准与该试题测量的行为目标或认知技能要求不一致,便不能保证评分推测的有效性。

【例题2】(2012年上海市高考地理卷第47题)从气候、地形、水文、植被要素的相互联系,说明乙地地理环境的整体性特征。

图1 非洲自然带分布简图

答案要点及评分标准:

该地属于热带雨林气候,终年高温多雨(1分),位于刚果盆地,地势低平(1分),这种气候和地形条件,造就了流量丰富的刚果河水系(1分);湿热气候又为热带雨林植被的发育提供了良好的条件(1分),从而形成了该地的地理环境整体性特征。

此题是考查学生的地理知识和地理思维能力,具体地说是考查学生是否知道世界各大洲、部分国家的主要地理特征,是否能够分析、解释各类地理事物的空间结构及联系,是否理解组成陆地环境各要素(气候、地形、水文、生物、土壤)之间相互联系、相互制约和相互渗透,构成地理环境的整体性。该题让学生从气候、地形、水文和植被要素的相互联系说明乙地地理环境的整体性特征,也就是让学生说明乙地各要素表现为什么特征,是如何相互联系的,且重点应该在于对于各要素间相互联系的分析,即本题不仅考查了最基础的也是低端的认知技能——记忆,更考查了高端认知技能——分析。

但是,从该题提供的答案要点和评分标准来看,与该试题测量的行为目标或认知技能要求不尽一致,有点偏离。一方面,根据满分4分的分配可以看出,2分分配给了对气候、地形特征的事实性描述,2分分配给了气候、地形对水文的影响分析以及气候对植被的影响分析。因此可以看出该题并没有将对高端认知技能“分析”的考查放在更重要的位置;另一方面,该题是让学生说明乙地地理环境各要素之间的相互联系,这种联系应该是相互的,是多向的。而该评分标准仅列出了气候、地形对水文的影响以及气候对植被的影响,四个要素之间相互联系的分析并没有充分展示出来,与设问的要求不一致,没有充分反映试题的测量目标。

由此评分标准带来的负面影响就是降低了考试的效度。教育评价最基本的功能是鉴定功能——认定、判断评价对象合格与否、优劣程度、水平高低等实际价值的功效和能力,用考试结果对学生进行鉴定,判断其对学科知识和技能的掌握程度,能够运用这些知识和技能解决哪些问题。如果要使评价足够有效的话,就必须以事实为依据,以“标准”为准绳,这个“标准”在大规模的考试中则体现为“评分标准”,若评分标准与试题测量的行为目标或认知技能要求不一致,势必会降低对考试结果解释和使用的有效性。就这一题来说,命题者不仅希望考查学生低层次的认知技能,更希望考查高层次的认知技能,其立意完全符合地理新课程的教学目标,遗憾的是评分标准却没能延续和展现这一立意。下面是笔者设计的关于该题的评分标准。

分值 要素 参考答案 评分细则 说明1分 气候对水文的影响需正确描述气候和水文特征,若前面已经描述过气候特征了,则可省略对气候特征的表述。1分 地形对水文的影响该地为热带雨林气候,终年高温多雨,因此造就了径流量丰富且季节变化小、无结冰期的刚果河水系。气候对于水文特征(径流量大小、径流量季节变化、有无结冰期等方面)的影响,答到一个方面可得1分。需正确描述地形和水文特征,若前面已经描述了地形特征,则可省略对地形特征的表述。1分 气候对植被的影响该地位于刚果盆地,地势低平,有利于聚水;高原向平原的过渡地带水位落差大,水能资源丰富。答到一个方面可得1分。需正确描述气候和植被特征,若前面已经描述了气候特征,则可省略对气候特征的表述。1分 地形对气候的影响终年高温多雨的气候造就了生长密集、常绿、品种丰富的热带雨林植被。需正确描述地形和气候特征,若前面已经描述了地形特征,则可省略对地形特征的表述。1分 植被对水文的影响该地地势低平,地形较闭塞,进一步增强了该地终年高温多雨的气候特征。需正确描述植被和水文特征,若前面已经描述了植被特征,则可省略对植被特征的表述。1分 总结说明 乙地各地理要素之间相互影响、相互作用,形成了该地地理环境的整体性特征。热带雨林植被覆盖好使得水土保持好,河流含沙量小。

需要说明的是,①该题一共4分,答到了以上5点中的3点即可得3分,其他合理答案可酌情给分,最后做出了总结说明得1分,但如果只有总结说明则不得分;②考生的应答组织应该体现出因果推理的思维过程,体现出从因到果的逻辑思维能力,而不是各要素特征的胡乱拼凑;③以上5点有的可以合并起来分析,分值不减少。例如可以将气候和地形对于水文的影响一起分析,也可以将气候对于水文、植被的影响合并起来分析。

三、评分标准不能有效反映考生地理思维品质的差异

地理思维是现代人必须具备的一种思维品质,而思维品质描述的是个体的思维特点和差异,主要体现在深刻性、灵活性、批判性和创造性等方面。我们既要在教学中重视对学生地理思维能力的培养,也要把对学生地理思维能力的检测、评价放在地理教学测评的重要地位。从地理开放性试题题型的特点看,它是有利于考查考生地理思维品质的差异的,但是实际上不少地理开放性试题的评分标准并未能有效地反映考生地理思维品质的差异,主要表现为:

1.不能有效反映考生地理思维深刻性的差异

思维的深刻性,就是思维的抽象逻辑性,其集中的表现在能否抓住事物的规律和本质,深入思考问题,预见事物的发展过程。思维的深刻性可以说是人最重要的思维品质。但是有些开放性试题的评分标准却并不尽如人意。

【例题3】(2010年海南省高考地理卷第21题)读图分析基多气温特点,并说明形成原因。

答案要点及评分标准:

特点:终年温和(2分),年较差很小(2分),昼夜温差大(2分)。

形成原因:地处赤道附近(2分),海拔高(接近3000米)(2分)。

基多气温的特点主要表现在两个方面:季节变化的特点是终年温和、年较差很小;气温日变化的特点是昼夜温差大。基多所处的纬度低,在赤道附近,气温本应表现为终年高温,年较差小,但是由于海拔高所以使得气温终年温和。而基多的昼夜温差大则主要是因为海拔高,空气密度小,白天大气对太阳辐射的削弱作用低,晚上大气对地面辐射的保温作用差,因此气温的日较差就大。可以看出,这道试题主要是考查学生分析、解释各类地理事物的地理思维能力,要求学生能够根据图上的地理信息分析出基多气候的特点,并对其气候特点的形成原因进行深入、准确、清晰的解释。因此,这是一道比较适合对学生地理思维深刻性的差异进行区分的试题。

但是,该题的评分标准却没有有效地反映考生所具备的地理思维深刻性的差异。评分标准将基多气温特点的形成归结于“地处赤道附近,海拔高”这两个原因,虽然说这两个原因是基多气温特点形成的总的原因,但是具体分析起来影响基多气温的每一个特点形成的机制是不太一样的,不同的气温特点对应不同的形成原因。可是该试题的评分标准只是简单地将这两点原因列举出来,并没有具体呈现从原因到结果的推理过程,即使考生并不理解其中的缘由仅凭图片上明显的线索也可能猜测得分。这样的评分标准可能带来的结果就是,那些只是将原因简单呈现出来的考生,与思维严谨、表达有条有理的考生得到的分数是一样的,也就是说具备地理思维深刻性的考生与不具备地理思维深刻性的考生在得分上不能区分。

2.不能有效反映考生地理思维灵活性的差异

思维的灵活性是思维活动的智力灵活程度,它和发散性思维密切相关,发散性思维注重联想,注意一题多解,注重新颖。地理思维灵活性强的学生概括和迁移能力强,善于探寻多种合理而灵活的答案。地理开放性试题给考生以更大的思维空间,有利于考生思维空间的拓展,但在现实的地理开放性试题的评分过程中,有的评分标准却忽略了对考生地理思维灵活性的差异的区分。

【例题4】(2010年上海市高考地理卷第60题)为吸引更多的台胞游客到西藏旅游,对该地如何进一步开发与利用旅游资源提出合理化建议。

答案要点和评分标准:

加强该区交通、宾馆等基础设施建设;大力宣传青藏高原文化特色;合理开发和布局新的旅游景点和线路;保护高原独特的自然、生态环境(2分,任答两点即可)。

这道试题要求学生就如何进一步开发与利用西藏旅游资源提出合理化建议,非常适合考查学生的发散性思维,考查学生是否善于从不同的途径解决问题。该题的参考答案及评分标准提出了四种不同的建议,并注明任答两点即可,学生可以从任意的两个方面来提出自己的建议,给予学生应答的空间,这一点可以看作是对学生地理思维灵活性的重视。

但是,该题的评分标准却没有有效地反映考生所具备的地理思维灵活性的差异。因为评分标准表明只要任答两点即可得满分,那么答出两点建议的学生和答出四点建议的学生得到的分数就会是一样的,可是能想到四点建议的学生肯定在地理思维的灵活性方面要强于前者,但是该题的评分标准却没能将两者的差异区分开来,没能有效地反映出学生地理思维灵活性的差异。

3.不能有效反映考生地理思维批判性的差异

思维的批判性,就是在思维活动中是否善于严格的估计思维材料和精细的检查思维过程的智力品质。是循规蹈矩、人云亦云,还是独立思考、善于发问,这是思维过程中一个很重要的品质。批判性思维的最终目的是更清晰地了解问题的本质以便决定合理的信念或行动,或者为问题的解决提供某种思路,从宏观层次上看主要是教导人们养成良好的理性品质。有些地理开放性试题很适合考查学生是否善于独立思考,评分标准就应该对那些具有健康而富有创造性的怀疑精神和自主思维能力的学生予以肯定和区分,但是现实的评分标准却没能考虑到这一点,忽视了那些具有地理批判性思维的考生的应答。

【例题5】(2010年山东高考地理卷第30题)现有A、B两处拟选地址,根据地质地貌条件,海水浴场和滨海地质公园分别适宜建在何处?并说明理由。

答案要点及评分标准:

海水浴场适宜建在A地(1分);海滨地质公园适宜建在B地(1分)。

理由:A地:坡缓水浅、有沙(砾)滩(2分);B地:岩石裸露,海蚀地貌发育(2分)。

该题主要考查学生阅读各类地理图表、文字和数据资料,获取地理信息的地理技能,以及通过获取的地理信息解释地理问题,提出解决问题的思路的地理思维能力。由于解决问题的思路可以是多样的、具有创造性的,因此考生在这道试题上可能出现反映地理思维批判性的应答。

但是从该题的评分标准来看,首先,没有有效地反映考生是否具备地理思维批判性。从图上的等高线和等深线来看A处确实适宜建海水浴场,等深线稀疏,坡缓水浅,而且处在一个天然的港湾,风浪小。B处为凸向海洋的一个岬角,等高线密集,附近有一个海蚀崖,海蚀地貌发育,比较适合建海滨地质公园。但是如果有学生考虑到B处岩石裸露,坡陡水深,认为在此建海滨地质公园不能保证游客的安全,容易发生事故。这样的答案该不该给分呢?按理说该学生根据等高线和等深线地形图正确的判断出了B处的地貌特征,只是在为该地的规划建设提出建议时给出了自己独立思考下与标准答案不同的看法,那么评分标准是否应该为考生这种具有批判性的应答留出空间?显而易见,该题的评分标准没有考虑到这点。

其次,该题的评分标准没有有效地反映考生所具备的地理思维批判性的差异。前面提到该题解决问题的思路可以是多样的、具有创造性的,因此出现的具有地理思维批判性的应答也会是从不同的角度加以批判的,在批判上也有水平的高低之分。比如说,有的考生在考虑到B处建海滨地质公园不能保证游客的安全,容易发生事故后,提出了在图中A、B处以外的另外某处建海滨地质公园的看法。这样的应答是在对问题进行详细的理性的分析之后,不盲目受限于设问,根据自己的独立思考提出的解决问题的方案,反映了考生具有更高水平的地理思维批判性。那么这样的应答是否应该同样得分,或者对其予以加分鼓励?该题的评分标准都没有考虑到。笔者认为,每个人思考问题的角度不一样,正是因为这种多样性才让这个世界的思维之花绽放得如此绚丽,也才让这个社会在理性中不断前进。教育培养出来的学生应该是具有批判性思维的不盲从、不轻信的人才。因此地理开放性试题的评分标准也应该注重对学生是否具备地理思维的批判性,以及地理思维批判性的差异进行有效地反映。

近些年来,地理学科的考试测量越来越侧重于地理思维能力的考查,评分标准若不能有效地反映考生思维品质的差异,对于开放性试题分数解释和使用的有效性则会降低。更重要的是会影响教师日常的教学行为,因为教育评价提供了衡量教育过程或结果好坏的标准,自然它对整个教育教学活动具有一种导向或指导作用。也就是说,评什么、怎么评,将有力地引导被评价者在教育教学工作中做什么、怎么做。它就像一根“指挥棒”一样支配着或引导着教育教学工作者的各个环节,包括教育内容与方法的选择、教育过程的展开等。如果评分标准忽视学生思维能力的考查,或者不能有效反映学生思维品质的差异,那教师在教学过程中自然会忽视学生智能的发展。

四、评分标准的分值分配忽略主次

试题的赋分必须集中在测量的行为目标上。在每一测量目标上,不同步骤之间分数的分配,要考虑每一步骤对该行为目标的重要性,对重要的步骤赋分相对较多,对次要的步骤赋分相对较少。例如,下面这道试题的评分标准体现了对试题分值分配的重视。

【例题6】(2010年上海市普通高中学业水平考试地理试卷第23题)黄河下游地区缺水严重除了自然因素外,其人为原因主要有___________(至少答两点)。

答案要点和评分标准:

生产生活需水量大,供不应求(1分),水污染严重(或利用率低、水资源浪费严重)(1分)

该题的评分标准明确表示只有答到:“生产生活需水量大,供不应求”这方面才能得到1分,如果考生同时答到“水污染严重”和“水资源利用率低”两点,虽然这两个方面都是黄河下游地区缺水的原因,但也只能拿到1分,因为这个地区缺水最主要的原因“需水量大”这一点被忽略了。这样的评分标准注重区分了答案的主次。水资源缺乏是现在人类社会普遍面临的一个资源问题,但是不同的地方水资源缺乏的主要原因是不同的,我国西北内陆地区缺水主要在于自然原因,而长江三角洲地区降水丰富,河网密布,缺水的一个主要原因是水污染严重。所以我们应该具体问题具体分析,这也是地理学科一个最重要的特点——地域性的体现,地理学不仅研究地理事物的空间分布和空间结构,而且阐明地理事物的空间差异和空间联系,因此教师在授课时应该体现地理课程的这一性质,同样,命题与评分时也要体现这一性质,这样设计出来的评分标准才会符合地理课程标准对地理学科课程性质的定义,也才能体现地理学科的学科特色。但是有的地理开放性试题的评分标准在赋分时并没有考虑分值分配的主次问题,例如下面这一道试题。

【例题7】(2012年上海市高考地理卷第32题)简析我国高新技术产业区域分布基本特征形成的区位条件。

答案要点和评分标准:

我国东部经济基础雄厚;人才众多;交通便捷;环境较好。(任答两点即可,每点2分)

我国高新技术产业主要分布于东部,主要原因应该在于东部地区经济基础雄厚,人才众多,科技力量强,而交通便捷、环境较好则为较次要的原因。该题2分,任意答到答案要点列出的两点则可拿满分,也就是说回答“东部经济基础雄厚、人才众多”与回答“交通便捷、环境较好”同样都可以得2分。这样的评分标准忽略了答案的主次,重点和非重点的回答没有在分值上得到体现,明显缺少区分度,难以区分学生在思维能力上的差异。这样的评分标准眉毛胡子一把抓,就不利于教师在平日教学过程中厘清问题解决的主要矛盾和次要矛盾,难以给学生形成思维的层次性以正确的引导。

综上所述,一个公正而有效的地理开放性试题评分标准非常重要,它不但关系到根据考试结果推测考生地理学科能力的有效性和可靠性,而且从更深层次考虑,它还关系到试题是否能帮助教师更加深刻地理解课程的内容标准,促进教师改善教学行为;关系到试题能否帮助学生更加深刻地理解所学的地理知识内容,促进学生知识的建构;关系到能否打破制约地理开放性试题命制的瓶颈,为开放性试题提供更大的空间。因此,通过透视现有的高考地理开放性试题评分标准存在的问题或许可以为科学的评分标准的开发提供一定的经验和启发,促进地理教育的发展。

[1]雷新勇.基于标准的教育考试: 命题、标准设置和学业评价[M].上海: 上海科学技术出版社, 2011.

[2]雷新勇.大规模教育考试: 命题与评价[M].上海: 华东师范大学出版社, 2006.

[3]邵志芳.思维心理学[M].上海: 华东师范大学出版社, 2007.

[4]郅庭瑾.为思维而教[M].北京: 教育科学出版社, 2007.

[5]金娣, 王刚.教育测量与评价[M].北京: 教育科学出版社, 2002.

[6]陈澄.新编地理教学论[M].上海: 华东师范出版社, 2006.

猜你喜欢
评分标准开放性试题
基于DOPS评分表细化体格检查评分标准的应用研究*
2021年高考数学模拟试题(四)
例析三类开放性问题的解法
初中英语开放性探究式阅读教学策略
2019年高考数学模拟试题(五)
《陈涉世家》初三复习试题
2019届高考数学模拟试题(二)
永远的格纹
初高中英语作文评分标准初探
针对TOPIK评分标准的韩国语写作教育