教育评价作为当前课程改革的重要内容之一,人们对它已越来越关注并进行了相关的研究。档案袋评价法(Portfolio Assess-ment)又译作“成长记录袋”评价或“档案录”评价,与国际学生评价项目(Program for Interna-tional Student Assessment简称PISA)作为当前国际上较为流行且得到普遍认可的两种评价方式,势必会对我国的教育改革产生影响,使人们对教育评价问题进行重新反思。档案袋评价法和国际学生评价项目是近些年由国外传到我国的两种先进的教育质量评价法,其中档案袋评价法引入时间已然不短且已有部分地区进行了实际操作,但参与的中小学教师和研究人员对它的具体内涵和理念的理解还止步于表层。在PISA从国外引进以来的四次测试中,我国仅有少数地区(上海参加了2009年的阅读素养评价项目,天津、北京和潍坊则参加了2006年关于科学素养考察在大陆地区进行的试点性测试研究,香港、澳门和台湾也有参加)参与,且大部分地区对其研究也只是处于引进和描述阶段。本文对这两种评价方法产生的背景、实施的办法、存在的问题等方面进行对比分析,通过找出其中所蕴含的对我国教育评价政策有所帮助的内容,试图形成一种适合我国国情的教育评价体系,以期对我国教育评价改革有所贡献,也希望能够为教育决策者提供一定的参考。
一、研究背景
进入新世纪以来,社会对教育质量问题的关注与日俱增,因而如何科学有效地对其进行衡量,即教育评价问题,就成为了教育研究者和决策者,以及社会各界关注的焦点。我国新一轮课程改革的一个重要环节就是教育评价改革,其目的是对传统重分数轻技能、多指责少表扬、重灌输轻启发的评价方式进行改革,以期实现“学生的全面发展和终身学习”,关注学生的参与和学习的过程。档案袋评价法和国际学生评价计划、项目就是符合这种评价理念的两种评价方法。
“档案袋”评价法是以杜威的“学生为中心”、“教学民主化”的教育思想为理论根源,始于20世纪80年代的评价改革思想为思想基础的评定方法,属于发展性评价的一种,最先实践于美国。该评价法通过学生本人、教师、家长、同学甚至社会人士,将体现学生学业表现、心理发展等材料进行有计划、有选择性的收集,结合分析和解释,反映学生在生活、学习和心理上的发展、成就和进步状况。
国际学生评价项目是经济合作与发展组织(The Organizationfor Economic Cooperation andDevelopment简称OECD)于1997年发起的,为OECD成员国协作监控教育成效的评价项目。该评价项目是建立在终身学习的基础上设计的测试,十分注重国际间的合作和交流。PISA从个体学习者、教学、学校和教育体制四个层面进行分析,同时还从社会、文化、经济以及教育因素等方面对学生和学校进行考察。其测试内容包括学生的阅读能力、数学能力和科学能力,三者组成一个循环体(如图1所示),而且在每一次评估中只对其中一个主要领域作深入评估。如2000年国际学生评价重点是阅读素养,2003年转向数学,并引入了一个新的领域,即问题解决能力,2006年转向科学,2009年又重新回到阅读,以此类推。
二、档案袋评价法与P15A差异分析
理论基础。档案袋评价法产生的时代正是杜威的“从做中学”、“教育即生活”教育理论大行其道、建构主义等教育思想蓬勃发展的时代。这些理论所强调的注重学生自我参与性和主观能动性的观点对档案袋评价法的形成和发展产生了巨大的影响。除此之外,加德纳的多元智力理论、斯滕伯格的三元智力理论等也对人们重新看待学生发展提供了一种新的角度。
PISA评价方式关注的是学生运用知识技能处理在现实生活中遇到难题的能力,而不仅仅是考察他们对学校特定课程的掌握程度,更注重学生运用在校所学知识能够做些什么,以及可以做到哪种程度。因此,在国际学生评价项目中贯彻的始终是一种终身学习的理念,即教育是为了生命潜能的充分发展(包括身体、认知、情感和技能等方面的发展)。
评价目标。每一种教育评价方式必有其特定的评价目标,即此项评价测量的是学生哪一项或者哪几项素质,属于形成性评价还是终结性评价,其测试结果是可以作为选拔人才标准的还是仅仅作为一个水平和程度的呈现等。
档案袋评价法不仅具有设计上的创意和方法上的创新,而且符合我国新课程改革“关注过程”、“强调质性评价”以及“教学与评价整合”的改革趋势。它的进行和实施具有连续性,显示的是学习者的成长过程。另外,它体现了学习者学习全程的多元信息,在达到教学目标的同时,也注重挖掘学习者隐藏的学习潜能。
PISA评价既是一项选拔性测试,又是一种水平性测试,即通过PISA测验,其结果既可作为选拔的标准,又能够看出受测者当时的学业水平。其研究目的是为了了解即将完成义务教育阶段的各国中学生(15岁)是否具备了未来生活所需要的知识、技能,是否为终身学习打下了良好的基础。它关注学习成果的质量,学习成果的等价性和学习机会的均等性,教育过程的有效性和效率,以及教育对社会经济的影响四个子目标的实现。也就是说,PISA的评估重点并不在于检验学生是否很好地掌握了学校的常规课程内容,而主要是在于评价学生是否做好了应对未来挑战的准备。
评价主体。一项评价主要由谁实施、实施的对象是谁,这便涉及评价项目的主体。PISA项目主要针对的是OECD国家(后来也有一些非OECD成员国家如中国参与)中的15岁的青少年(相当于初中毕业生),测试其是否具备终身学习的基础知识和技能,因此可以说PISA研究项目的研究对象是确定的。而对于档案袋评价法,其研究对象则是不确定的。就目前此项研究实施的情况看,研究对象有幼儿园的儿童,有中小学生,也有大学生,甚至有研究者认为对艺术类学科或者学生在几乎没有什么压力的时间段用档案袋评价,其效果会比较好。因此,无论从研究的适用者方面还是研究的实用性角度考虑,档案袋评价法的研究对象都是不确定的,相对于PISA研究法,其包括的范围也更大,更细致。
评价内容和类型。评价内容即研究,它是对学生的某些素质,某些方面进行测量、关注;类型则是根据一定的标准或者衡量尺度对研究进行种类划分的结果。
档案袋评定具有极大的灵活性,它的具体构成因使用目的、提交的对象和学生的具体情况不同而产生差异。目前,对档案袋分类较为权威的是美国学者格莱德勒的分类方法,他依据档案袋的不同功能,将其分为理想型(ideal)、展示型(showcase)、文件型(documentation)、评价型(eval-uation)以及课堂型(class)五类。理想型,即通过一段时间的成长,帮助学习者成为自己学习历史的思索者和非正式的评价者;文件型,即用于记录学生的成长、进步与成就,内容包括学生作品、同学反映,以及教师对其在德、能、勤、绩等方面的评价、观察、考查意见、表现性测试结果;展示型,即用于向家长和其他人展示由学生本人选择出的最好、最喜欢的作品,以及成果和获得的荣誉证书、获奖证书等;课堂型是一种总结性文件,用于向家长、管理者报告学生情况,其具体内容包括根据教育教学目标描述所有学生取得的成绩及表现情况的总结,以及教师的年度课程、教学计划及修订说明,还有教师给每个学生在德、智、体等方面的评语;评价型,即根据预定的标准,对学生所取得的成绩及表现情况进行标准化的评价。还有约翰逊的三形态说,即按照人选材料的性质将档案袋分为最佳成果型(best-worksportfolio)、精选型(selection port-folio)和过程型(process porffo-lio)三种。另外,根据档案袋的严密程度和是否具有规范性的结构又将档案袋分为结构性档案袋、半结构性档案袋和非结构性档案袋三种。
与档案袋评价法相比较,PISA评价法的评价类型则简单得多,它选择阅读、数学、科学素养三个领域作为其评估对象,认为这是现代生活所必须具备的基本知识和基本技能,也是人们应对生活所需的关键能力。作为一种循环式的评价方式,PISA评价法每3年进行一次,分别测评学生的阅读、数学和科学素养。阅读素养具体是指“被测试者能理解、运用和反思文章的能力,以增加个人的知识,发挥个人的潜能,参与社会活动,实现个人的目标”;数学素养指“学习者能识别、理解和从事数学工作,能从数学的角度做出充分判断,是目前和将来的个人生活、职业生活、与同伴和亲戚的社会生活,以及作为建设性的、有爱心的及反思性的公民的需要”;数学素养则是指“学生能运用科学知识,发现问题,得出有根据的结论,以便理解和帮助做出对自然界和通过人类活动使其变化的决策”。每一种素养都包括内容(概念)、过程和情境三个维度,每一次评价都以其中一种素养为主,其他两种素养为辅。
三、实施结果分析
档案袋评价法经过数年的实施和测验后变得更加系统和规范,在一些地区也有了成功实施的典型,如北京宣武师范学校附属第一小学设计的“笔耕袋”、“阅读袋”,北京师范大学中山实习小组开展的“愿望袋”活动,有的学校还设计了数学“出题本”,这些都显示了档案袋评价法广阔的应用空间。另外,档案袋的实践经验指向行动研究是进行档案袋评价法的最有效途径。
PISA利用现代教育测量理论,在时间短、样本量小、试题量大、覆盖面广、成本低、误差小、减轻学生负担、减少考试焦虑的同时,确保了评价的科学性,拓宽了评价的内容与形式,使教育评价更具实用价值,取得了广大教育研究者和师生、家长、学校的一致认可。2000年,PISA共收集了近26万有效的学生样本,实现了阅读素养的提取信息、解释说明、反思并评估,还有数学素养和科学素养5个维度的测量与评价;2003年,PISA共收集了27万多个有效学生样本,实现了数学素养的变化和关系、数量、空间,以及形状、不确定性、问题解决、阅读素养和科学素养7个维度的测量与评价;2006年,PISA共收集了39万多个有效学生样本,实现了对科学素养的识别科学问题、科学地解释现象和使用科学证据等三个科学能力,以及科学兴趣、支持科学探究等两个对待科学的态度和阅读素养、数学素养等7个维度的测量与评价。2009年,PISA有68个国家和经济体参加,其内容除了在2006年设计的阅读素养内涵基础上有所发展之外,还开发了电子阅读技能的评估。总之,每次PISA测试的结果都会引起广泛的关注,如“芬兰模式”等。另外,在2009年的测试中,上海作为我国大陆唯一参加的地区还获得了三项测试均位居首位的好成绩。
在取得成绩的同时,这两种评价法也存在一些问题,其中较为突出的有:各个参与主体(教师、学生、学校及家长)对评价方法的认识不够充分,使评价方法的施行受到阻碍甚至无法顺利实施;以应试教育为主、高考为指向标的教育目标仍对一部分人的教育观念具有导向作用,导致“偏离正轨”的档案袋评价法难以施行;时间和精力的投入对已经极为忙碌的中小学教师来说是极大的挑战和困难;档案袋内容不明确且缺少客观的评价标准;在实施过程中容易流于形式,且会因为缺乏交流和反馈导致同一区域的评价内容和标准不同;PISA实施的不连续性对学生的测评无法持续;繁重的准备工作消耗大量的人力、物力和财力;整个测评对教师和参与研究者的素质要求较高等。
研究者们也发现,要有效开展这两种评价法就必须强化评价主体的理解与互动。另外,科学选择评价内容与评定标准对提高评价的质量和发挥其教学价值有着极为重要的意义。
四、对我国基础教育评价的思考
我国的基础教育在实现了对既定的义务教育任务的完成之后,已进入全面提高教育质量的阶段。如何进行科学、合理和有效的教育评价,使教育评价成为提高教育质量的有效手段、成为实现教育管理和教育决策科学化的重要保障,以及促进学生健康发展的必要环节,是摆在教育研究者面前的一项重要任务。上述所提及的档案袋评价法和PISA评价法则可以为我们提供一些这方面的启示。
我国新一轮的基础教育改革更加关注学生的主动性和参与性,倡导学习环境和内容的生活化和情境性。PISA评价法与档案袋评价法中关注的——学生是否准备好去应对未来的挑战、注重学习过程等与基础教育改革所要求的也有相同之处。
但不可否认,作为仍处于发展过程中的评价方法,无论是这两种方法本身还是施行时所要求的主客观条件都在一定程度上存在一些障碍和困难,如上述已经提及的一些问题。PISA虽说已经具备了极高的科学性、合理性和认可度,但毕竟只是3年举行一次,在这期间对学生的学习和能力如何进行评价、采取哪种方式评价,这都是需要解决但尚未解决的问题。另外,在评价施行之前的准备工作和活动进行中的工序繁琐而复杂,需要大量人力、物力和财力的投入,这无论是对参与活动的教师、学校、评价组织,还是教育主管部门来说都将是巨大的投入。
然而即便存在诸多困难,但就目前世界教育评价的发展来看,跨国间的教育评价合作已是大势所趋,因此我国参与PISA评价项目也是必然的要求和结果。PISA是一项在理论、技术、管理上具有先进性的系统研究,亦是一项以改进教育政策为目的的实证研究。这种科学的评价方式势必会给我国的教育评价制度提供有意义的借鉴。
首先,除了关注测试结果中显示的学生之间的成绩差异外,PISA也注意到学生与学校的背景,并更加关注学校和教育政策在提升学生发展方面的作用,而这正是我国目前教育评价研究或教育评价手段与方法中甚少涉及的。PISA从教育公平与均衡发展的角度出发,提供了学生成绩差异的社会经济根源及教育资源投入效益预测等更深层次的分析报告。它主张各阶层的孩子都应得到良好的发展与成长的教育,这也与当前我国倡导的教育均衡、关注教育投资的有效性相一致。因此,要建立同我国国情一致的教育评价制度,就必须深入分析影响教育成效的各个因素,挖掘各区域对教育有决定性作用的影响因素,在建立全国大的评价制度的基础上因地制宜地提出各个区域有针对性的次级评价策略。
其次,若将PISA项目的评价对象进行扩展,则PISA每3年进行一次的测试制度正好与我国现行的“6-3-3”学制的阶段划分一致。也就是说,在小学三年级结业后进行的第一次测试可以作为小学初级阶段的学业水平判断,后续便是在小学六年级—一小学升初中的年份、初中三年级——初中升到高中的年份、高中三年级,即所谓高考年份(以上安排是按照我国大部分地区实行的“6-3-3”学制进行安排的,另外一些特殊地区则应进行具体分析)。PISA的这四次测试结果既能有效显示以上所述各个阶段我国青少年的学业进度和水平,并作为终结性的能力测试对学生进行考核,又能对学生的毕业升学起到正常纸笔测试所起到的筛选作用。
最后,针对一些部门和人士提出来的在PISA每3年一阶段的测验间歇如何对学生进行评价的问题,我们认为,可以通过将PISA评价法与档案袋评价法和传统的纸笔测试方式相结合来解决,由此也可建立起一整套评价体系。这就与国际上流行的、认为评价方法应当多元化的趋势相吻合。
我国新一轮的基础教育改革更加关注学生的主动性和参与性,倡导学习环境和学习内容的生活化和情景化,这是时代对教育发展提出的新的要求。PISA评价方法和档案袋评价法作为世界上较为先进和科学的评价方法与这些要求不谋而合,因而对其进行合理有序的整合和安排后产生的多元评价,势必会对我国教育评价制度的完善产生有益的影响。
作者单位均系陕西师范大学旅游与环境学院
(责任编辑 罗登廉)