贵州师范大学心理学院 高旭亮
教育统计与测量不仅是现代教育学科群中的重要成员,还是高等师范院校教育类专业的必修课程。它的基础知识和技能是广大从事教育行业工作者都应该掌握的一门现代科学。[1]教育统计与测量课程包含教育统计学和教育测量两部分内容。教育统计主要包括了描述统计和推断统计等内容,描述统计是对数据进行总体的概括分析,推断统计是指如何利用样本资料来对总体进行推论。[2]教育测量主要包含了:一是如何开发和编制科学的教育测评测验;二是如何评价题目质量和测验质量,以提高测验的精度。
学习和掌握教育统计与测量的理论和技术,对于从事现代教育行业工作者具有重要的作用。具体来讲,第一,教育统计与测量能够指导教师编制科学的测验。在平常的教学活动中教师经常会自编测验来对学生进行测评,如果自编测验的质量本身存在很大的问题,那么基于测验分数进行的推论就会存在较大地偏差,即不能对学生的能力做出正确的评估。因此,焦璨和张敏强(2012)指出作为一名合格的教师,必须要学会编制科学的教育评估测验,这涉及教育测量中测验编制的内容。[3]第二,教育统计与测量能让教师学会对测验结果进行科学的评价,即教师能够应用恰当的统计方法对测验分数进行分析,例如,对测验分数进行基本的描述统计,包括班级平均分,标准差,以及按分数段统计学生的比例;教师可以了解每个学生在班级中所处的位置、了解学生在某些教学方法中是如何学习的、发现学生在学习中的优势和劣势,从而帮助教师了解如何更好地教孩子/学生,使教学过程更有效。第三,教育统计与测量是开展教育科学研究的重要工具,统计和测量,是我们进行教育研究设计,其中包括调查设计和实验设计,科学地收集数据,包括抽样和测量,特别是对研究中获得的数据进行分析的有力方法和工具。[1]Garfield和Chance(2000)指出统计与测量可让学习者更好地认识教育现象的本质和规律,培养科学的思维方式,并对测验数据进行定性和定量的分析。[4]
总之,对于教育类专业的本科生而言,掌握教育与统计测量的基本原理、分析方法具有重要的意义。焦璨和张敏强(2012)指出只有掌握了教育统计与计量的基本概念、理论和方法,才能完成基础教学工作,成为一名优秀的教师。[3]
当前,教育统计与测量课程在教学过程中主要面临来自三个方面的问题,分别是教材内容略显单薄、教学方法单一、课程设置欠佳。
当前教材的教育测量内容主要以经典测量理论(CTT)内容为主。该理论的出发点是假设考生的反应之间的系统效应仅是由于其感兴趣的能力(即真实分数)而引起的。所有其他存在于考试材料、外部条件或考生内部的潜在变异来源,要么被假定为通过严格的标准化而保持不变,要么被假定为具有非系统性或“随机性”的影响。[5]戴海琦和罗照盛(2013)指出由于CTT理论的天然缺陷,其导致它在实际应用中存在较大的局限性。例如,其项目参数的估计严重依赖于所使用的被试样本;参加不同考试的考生之间无可比性;测验误差估计的“笼统性”;由于受到标准化测验环境的影响,其测验结果推广性有限。[6]
为了克服CTT理论的缺陷,测量学专家提出了新的测验理论:项目反应理论,概化理论以及新近发展的认知诊断理论。[7]这些现代测验理论在教育评价中逐渐发挥着越来越重要的作用。然而,当前教育统计与测量的教材几乎未提及现代测验理论,这并不利于学生更好地了解测验理论的新发展,掌握现代教育测评的新趋势和新理念。
本课程的教学方法主要是基于教师对基础知识的讲解,例如,统计原理,统计方法,公式推导。教师在课堂上很少解释与本课程相关的实际应用案例。其实,该课程是一门实践性很强地课程,学生在学习这门课程时,除了要理解教育统计与测量的方法、原理之外,更重要的是了解这些方法的实际应用,当面对实际测验数据时,能合理地选用这些统计和测量学方法分析测验数据,挖掘测验信息。当前教育统计与测量课程的教学过程过于注重知识的讲解,即理论与实践不能很好地结合,过分强调理论讲解会降低学生学习的兴趣和热情。
课程设置不合理表现在课时安排不合理。该课程共计48学时,全部为课堂讲授,并未安排上机实验课时。该课程的一个重要目标是让学生学会统计分析软件的使用,其中包括SPSS和Mplus等软件的使用。大部分章节需要使用SPSS软件进行分析,包括描述统计,比较平均值,方差分析,回归分析,非参数检验,题目难度和区分度、测验信度和效度分析,而Mplus软件主要用于演示因子分析(EFA和CFA)章节的数据分析过程。这2种统计软件的使用都需要在机房进行教学,其缺少上机实验安排,且不利于学生练习和掌握统计软件的使用。
基于该课程所面临的3个问题,我们分别从3个方面提出了提升的策略:重组教材内容,丰富教学方法,合理安排课堂讲授和上机课时。
对于当前教育统计与测量教材内容较少介绍现代测验理论的缺点。建议在教材编排中增加一个章节来介绍测验理论与技术的新发展。新增加的章节重点介绍三种新的测验理论:项目反应理论(IRT),概化理论(GT)和认知诊断理论(CDT)。其中,对于IRT的介绍至少应该包括:(1)与CTT理论相比,IRT的主要优势体现在哪些方面;(2)IRT的基础模型;例如,Rash模型,Logistic模型;(3)IRT基础模型的拓展;例如,多维IRT模型,多级评分IRT模型,多维多级评分的IRT模型;(4)项目特征曲线;(5)IRT模型的参数估计软件;(6)IRT的相关技术,例如,信息函数在评价项目和测验质量的应用,计算机化自适应测验的开发、原理和实际应用案例,题库参数的等值技术。
概化理论的简介应包含:(1)测验分数的测量学意义;(2)误差来源的多样性与总分方差的结构;(3)概化理论的研究方法;(4)概化理论的测验情境关系理论,其中包括测量目标,测量侧面,概化理论的真分数概念;(5)测验设计的模型与种类;(6)G研究和D研究。
认知诊断理论的介绍应该包含:(1)认知诊断理论的发展过程;(2)认知诊断的基本概念;包括认知诊断的目的,属性,属性逻辑关系,认知诊断模型;(2)Q矩阵理论;(3)认知诊断的流程;(4)编制认知诊断测验的方法;包括测验编制的基本原则、编制的过程;(5)认知诊断模型的介绍;(6)认知诊断测验的实际案例;(7)认知诊断数据的分析。
增加案例法在教学过程中的应用,通过案例法教学,让学生更了解统计测量方法在实际中的重要应用,激发学生的学习兴趣和动机。例如,在讲解标准化教育成就测验这一章节内容时,给学生介绍当前国际上大规模的教育成就测验—国际学生评估项目(PISA测验)。以某一年PISA测验的内容,施测流程,数据分析过程,数据结果等为例,来详细解释标准化教育成就测验的施测过程和重要应用。通过分析PISA测验所涉及的一些教育测验理论和数据分析技术,引导学生掌握标准化教育成就测验的编制过程、数据分析方法。了解教育测评理论在大规模学科成就测验中的重要意义,激发学生的学习热情,鼓励学生不断提高专业素养,培养刻苦钻研的精神。
该课程总计48课时,全部为课堂讲授课时。建议将课时分为课堂教学和计算机操作,课堂教学32课时,计算机实验教学为16学时。其中,实验课时穿插与课堂讲授中,每一个章节讲授完之后,安排2节上机实验。例如,当学习完集中量数和差异量数等内容后,安排2节课时为上机实验操作,在上机课中教师演示如何使用SPSS软件对数据进行描述统计分析,学生跟随老师的步骤进行课堂练习。为了让学生更好地掌握统计软件的使用,老师可布置一个课后作业,让学生完成一份使用软件来分析数据的作业。作业内容可为对一些实例数据进行分析。例如,相关分析,比较平均值,方差分析,因子分析,回归分析,以及对一份测验数据进行测量学分析,包括单选题的选项分析,多级评分题目的分数分布,题目难度和区分度,测验信度和效度等的分析。
教育统计与测量在教育学类专业中是一门重要的应用型学科,但就目前该课程在教材内容,教学方法和课程设置等方面仍存在一定的不足。未来的改进策略可以考虑重组教材内容,增加介绍一些新的测验理论,让学生及时了解教育测评的最新理念和趋势;增加课堂小组讨论和案例教学来丰富教学方法,从而提高学生的学习热情;合理安排课堂讲授和实验上机课时,增加上机操作课时,让学生在实际操作中掌握统计分析软件的使用。