王立东,曹一鸣
(1.中国人民大学 附属中学,北京 100080;2.北京师范大学 数学科学学院,北京 100875)
在影响学生学习的各种因素中,教师无疑其中是最值得关注的因素.有关教师作用的论述古来有之.特别是自 19世纪以来,越来越多的学者认为,面对学校数量的大量增长,原有的“学者自然是教师,学过就能教”的认识需要改变,并进一步认识到教师的教学水平存在差异,进而催生了对于有关教师对学生学习影响的更加深入的思考与研究[1].
进入20世纪,以统计学为基础的量化研究方法开始大量地被应用于教育研究,在这个背景下,学界开始尝试利用量化研究方法,基于大样本数据深入地、全面地、精细地分析教师对于学生学业成就的影响(Teacher Effect).不同背景的学者基于不同的视角对于这个主题进行了探讨.如,教学领域的学者倾向于探讨教师的知识水平、课堂教学实践等特征与学生的学业成就有什么样的关系(如是否教师的PCK水平越高,学生成绩就越好,是否数学专业背景教师的学生成绩更好等),关心在此基础上完善相应的教育教学理论、指导教师教育与职后培训;教育经济与政策领域的学者倾向于探讨教师作为一种资源投入,经过一定的教育过程后,取得什么样的教育产出(如高学历的教师是否会对于学生学习产生更积极的影响等),关注以之为依据指导有关的教育政策决策与教育资源配置(如是否投入资金培养、聘任更多的高学历教师等).
针对数学教学领域内的既有研究,从研究的基本视角、研究方法(技术路线)和代表性研究成果等维度进行述评,并在此基础上展望未来有关该主题的研究方向.
回顾已有的有关研究,关注该主题的学者在专业背景、研究目的与研究兴趣等方面存在明显的差异,并形成了两个基本研究视角.
一类学者将教师对学生影响的关注点放在课堂教学层面,研究学生的学业成就与教师教学实践以及教师本身固有的特征(teacher characteristics)有什么样的关系,关心的是教师效能、教师绩效、有效教学等方面的问题[2],关注完善教学理论,指导教师的教学实践以及教师职前、职后教育等.从基于课堂教学的特征可以看到,这是一类从微观视角出发的研究.
Dunkin & Biddle(1974)提出了4组变量,作为后续研究的基本话语系统,为这类研究奠定了基础:
(1)前变量(Presage)(教师特征、教学经验、培训以及其他影响教学行为的特征);
(2)背景变量(context)(学生、学校、社区以及班级的背景特征);
(3)过程变量(process)(教师、学生的可观察的行为);
(4)结果变量(product)(智力因素和非智力因素等方便的变化).
该类研究的基本技术路线是量化地讨论上述变量间的因果关系.
另一类学者关注教育资源投入与成果产出之间的函数关系,试图为教育政策决策与教育资源配置提供依据.随着研究的深入,许多研究将对师资的投入和学生学业成就作为重要的投入与产出.如:讨论教师受教育程度、教龄等资源“投入”与学生学业成就“产出”之间的关系等[3~4].可以看到这是一类从教育政策与经济学角度出发的宏观视角的研究.
教育生产函数是教育投入与产出之间的一种统计关系,旨在研究教育的生产过程和学校的内部效率,在全球范围内已成为教育经济学的重要研究领域[3].
其中Ait为某个学生i在t时刻的学业成就;代表家庭背景的变量;代表同伴变量的影响;代表学校投入变量;代表学生固有的(innate)能力.
在著名的Coleman报告中,Coleman与同事为这类研究建构了一个基本范式[5],产生了广泛的影响.该报告受美国教育署委托,对种族、宗教,以及家庭出身等方面造成的学校机会不均等情况进行调查研究,以教育生产函数为工具来讨论教育公平的状况.研究表明学生的背景和社会经济地位(socioeconomic status)对于学生的成就显示出比学校投入更大的影响.
自20世纪80年代以来,不同视角的研究呈现出整合的趋势[6].即从某种意义上讲,教师影响研究是一类可以为不同领域的理论与实践提供依据的基础性研究.虽然研究者的学科背景、研究目的、对于研究成果的应用等方面存在较大差异,但从研究方法(技术路线)与研究成果上看又有很大的相似度,在很多情况下可以互相回答对方的研究问题.
在两个基本研究视角下,既有研究运用了多样的研究方法(技术路线),选择不同的变量、从不同的角度刻画教师影响,运用不同的统计分析方法对于教师影响的尺度进行估计.在此基础上,获得了多样的、各具特色的研究结论.
下面将尝试在投入—产出研究的框架下,结合 Dunkin& Biddle(1974)提出的话语方式综述既有研究的研究方法(技术路线)和代表性结论.
在统计模型的框架下,估计教师影响的尺度,并在一定的教育理论指导下,寻找能够对于学生成就产生显著影响的教师变量已经成为研究者所采取的主要技术路线.许多有关教师的变量被用来刻画、分析教师影响的结构(构成投入变量),这些变量包括教师的人口学因素(Demography Background)、教师的内在心理特征因素(如PCK等)以及教师(课堂教学)行为因素等几个类别,其中前两个属于前文提到的前变量范畴,第三个属于过程变量范畴.
2.1.1 教师的人口学变量
在众多的可选因素中,教师的人口学因素(如性别、年龄、教龄、学历水平、专业背景等)常被研究者用来解释教师影响.这是一类可通过简单的调查问卷获得,同时可以方便地应用于实践中的变量(如作为教师选聘的依据等).
代表性结论:谢敏,辛涛,李大伟(2008)[7]基于TIMSS2003数学测试中美国、瑞典、日本和香港4个国家(地区)八年级学生及其教师的数据获得教师的性别、教龄、受教育水平、专业和教师资格对学生数学成绩的预测力较弱,同时具有地域差异的结论.Wayne & Youngs(2003)[8]综述了21项研究的结果表明:教师的学位与学业课程(coursework)在其他学科的结果是不确定的,但在数学学科上,高中学生明显的从具有数学教师资格证、数学相关的学位和修读过数学相关的课程的教师中学到了更多.Graber(2009)[9]分析利用美国Midwest State 的9-12年级学生和教师的数据,发现在对于高贫困水平的学生,教师的资格与其学业成就呈现中等水平的相关.
简评:以上的因素通常是一类比较容易获得的教师特征信息,但同时这类变量只能较小地解释教师的影响[10],而且这种解释往往是不确定的[3].因此,通常这类变量通常会被包含在教师影响研究中,但不独立地描述教师影响.
2.1.2 教师的内在心理特征
在讨论教师的人口学等外在前变量的同时,有许多研究关注教师的内在因素,如教师的知识、人格、期望、观念、态度等内在的个性心理特征.其中教师的教学内容知识、学科知识、一般教学知识等都是学界关注的重要因素,特别是Schulman有关教师知识的工作发表以来,相关研究更是受到追捧[6].
代表性结论:Hill, et.al(2003)的工作强调了教师的“为教学的数学知识”(Mathematical Knowledge for Teaching)的重要作用,这个概念是指用来完成教数学这个任务的数学知识.他们基于美国样本研究表明:教师的上述知识正向地预测了一年级和三年级学生的数学成就增长(gain),作者强调,其中针对一年级的结果尤其令人惊讶,它反映了即使对于非常初等、简单的教学内容,教师的这类知识仍然起到重要的作用.李琼,倪玉菁[11](2006)利用来自中国大陆东南地区某大城市的15所学校的32名老师和1 691名四年级和六年级学生的样本的研究结果表明:教师的学科教学知识(由涉及学生思维特点与解题策略、诊断学生的错误概念、教师突破难点的策略与教学设计思想的10个任务情境题目测量)对学生的数学成绩具有显著的预测作用.
除教师的知识外,部分研究探讨了一些非智力因素,如自我效能、个性、动机、态度等个性心理特征的因素也被纳入到刻画教师影响的变量范畴,特别是早期的研究(如 20世纪上半叶的研究)(Hill, et.al, 2003[2]; Campbell, et.al,2003[6]).
简评:前两类教师变量可以被认为是对于学生成绩的固有的、静态的预测变量(同时也往往被认为是间接变量),即前文所述的前变量—结果研究.这是教师进入课堂,与学生发生作用前的特征,也可以认为是教师变量中影响学生成就的间接因素与前变量,同时也是做出与教师有关的教育决策的指标依据(如在教师培训中加强PCK的内容,以及重视提高教师数学修养[12]等).
2.1.3 教师的课堂教学
前两类教师变量可以被认为是对于学生成绩的固有的静态的预测的变量,即前文所述的前变量—结果研究.与之相对应的是直接反应教师与学生作用的教师(课堂)教学行为,即教师变量中影响学生成就的直接因素(也有研究将其称为过程因素),即前文所述的过程—结果研究.
代表性结论:黄慧静,辛涛(2007)[13].利用TIMSS 2003研究数据中美国、瑞典、日本和中国香港4个国家或地区的教师课堂教学和数学成绩测验数据,研究结果发现,在基于教师问卷数据获得的教师特定的行为因素中,教学的准备、对作业的重视、对考试的重视、对推理和问题解决的重视、电脑的使用确实能有效影响美国和瑞典的学生数学成绩,但对两个亚洲国家(地区)的学生数学成绩没有影响.
Brophy & Good(1986)[14]综述了大量相关的早期研究成果,如有关向学生提问的难度的结果可能是多样的,在不同的情景下,最佳的提问难度可能不同.如在教授复杂任务或需要鼓励学生概括、评价、以及应用他们的学习的情况下,问题的难度就应当提高或是具有答案不唯一的特点.
简评:Rowan, et.al(2002)[15]指出对于教学过程的非直接的、可能相对粗糙的测量(measure)是否具有足够的效度和信度,是后续研究需要关注的问题.当然,即使是直接的对于教师教学的观察也可能是效度不高的,进而减弱对于教师影响的估计[16].设计相应的测量工具(如录像分析量表)需要理论与实践的支撑,也成为这类研究的难点[17].
这类研究起始于20世纪60年代,主要分析对于课堂教学过程的观察结果(如教学评价分数等)与学生成就测量结果之间(如学生成绩)的关系[18],虽然在多个方面受到了种种批判(参见Gage, et.al, 1989的综述),但仍然是一种值得鼓励的基本研究方式(Gage, et al, 1989)[18].
既有研究曾经使用多种表征学生数学学习成就的变量作为产出变量,在此基础上反映教师对于学生数学学习的影响.
2.2.1 表征学生学业成就的数据源
按照数据的获得方式、样本以及数据的分析方式可归纳为:国际大尺度标准化学业成就测验的数据(如TIMSS研究的数)和国家层面的大尺度标准化学业成就测验的数据等(如NAEP数据等);中等尺度标准化学业成就测验数据(如美国某些州的标准化测验数据);小尺度的自编测验的成绩,还有研究从非智力因素的角度讨论数学学习[19].
值得关注的是,Xin, Xu & Tatsuoka(2004)[20]对于TIMSS数据,利用认知诊断理论获得了对于学生数学学业成就的一个多维成绩,进而深入、细致地解析了教师对于学生数学学习的不同方面的影响.
2.2.2 简评与未来发展方向
许多学者质疑已有的被用来描述教育产出的变量仅仅是更为本质的教育产出变量的简单代表(proxies)[21](Hanushek, 1986)学生的未来发展才是真正实质的教育产出.Gage & Needels(1986)[18]强调适用于过程——结果研究的学业成就数据应当与课程相契合、关注高认知水平的学业成就目标、关注有关创造性的学业成就成果、不应局限于选择题的形式.Lockwood, et.al(2007)[22]基于美国数据的实证研究表明,不同的测验可能带来对于教师影响估计的不同结果.
特别需要关注:Shavelson, Webb & Burstein(1986)[23]提出充分利用来自认知心理学和心理测量学的方法代替单一的概括性分数将会为教师影响研究提供更好的基础,如基于认知诊断和TIMSS数据的研究可以解释美国成绩不佳的原因[24].但通过文献可以看到,有关研究数量有限(e.g. Xin,et.al(2004)[20],王立东(2012)[25]),这也将是未来教师影响研究中的一个十分重要的发展方向.
既有研究应用了多种统计学方法来估计教师影响的大小并解析教师影响的结构.
2.3.1 被应用于教师影响研究中的统计学方法
基于自然状态下教学的无干预的调查研究和有针对性设计的教学实验研究都被应用于该类研究.实验研究会更好的反应变量间的因果关系,如Decker & Mayer(2002)[26]的基于一个教师培训项目的实验研究.实验研究受到样本量等资源的限制,不易取得普遍适用性的成果,分析、检验的变量也有局限性.因此,倡导采用大样本调查研究获得基础性成果,在其基础上,设计相应的教学实验,获得更为深刻的结论.
在这样的背景下,多个统计模型被应用,如(多元)回归模型(包括方差分解模型(variance decomposition models)),因素分析与路径分析模型等.
其中回归模式是主流的统计分析工具[21]
Hanushek(1986)[21],Raudenbush & Bryk(1986)[27]质疑简单的回归模型会造成“影响”估计的偏差,进而提出应基于当时已经得到发展多水平模型(Multilevel Model)的使用.随着统计理论的进一步发展,特别是方便的统计软件的开发(如HLM系列软件),为HLM在教师影响研究中的流行地位奠定了基础.
增值模型(Value-added Model: VAM)是这类研究的一个基本模型.增值特指通过学生在一定阶段的知识增长来评价学校或教师(如:可以简单地用期末成绩与期初成绩的差值来估计教师对于学生在该学期学习的影响),也可泛指所有利用学生先前的知识或能力进行矫正(adjust)的模型(Roth, Ariet, Fisher & Resnick, 2004)[28].
增值模型为教师影响研究提供了精确地从学生的学习成就中剥离出教师影响的统计技术(即排除其他学业成就影响因素的技术).这类模型的重要特征是实现教师与学生的对应,即将特定的教师与特定的学生在特定阶段,特定科目的学习联系起来,并为其负责,从而获得更为合理、精确的分析结果.VAM模型在美国教育界得到广泛的关注,特别是在No Child Left Behind(NCLB)法案强调学生学业成就的达成背景下[22].
需要注意的是,并非所有的研究都依赖于探讨能够测量的教师变量作为前变量与过程变量(这类变量的获取往往需要花费大量的人力物力),统计上的方法提供了仅使用学生学习成就数据和学生社会经济背景数据,整体地分离出教师影响方法,如方差分解模型.
Rowan, et.al(2002)[15]利用方差分解的技术,结合增值模型获得的结果是:在无控制变量的前提下,18%—28%的学生在数学成就上的变异可以被课堂层面解释(因年级的不同而不同),转换成d-type的影响尺度大约为0.42到0.53(教师的水平提高一个标准差,学生的数学学业成就可提高0.42到0.53个标准差),而在考虑学生增值的背景(以往成绩作为协变量,将学生已有的基础和分配的非随机性考虑进来),以及家庭和社会背景后,结果变为 8—18%,换算成d-type的影响尺度约为0.28到0.42.
2.3.2 简 评
有研究指出[29]增值模型也存在一些不足,特别是在对于教师进行评价并进行高风险决策(high-stake)的情况下.
Raudenbush(2004)[30]从理论层面针对教师影响(包括学校影响)进行了一定的讨论,给出了利用不同类型的学校变量信息的不同类型的影响:TypeA和TypeB.
其中,TypeA:Aij=Pij+Cij包括学校(班级)环境(组织效应与同伴效应等)(C)和实践(P)的影响;主要关注实践的(P)影响.
特别强调的是对于学校和教师实践的 TypeB影响不易从其他的影响中剥离出来,更可能估计的是 TypeA类型的影响.因此,利用VAM的结果做出影响实践或改变实践的教育决策是需要小心的,不易仅依据VAM的结果就直接做出决策.
教师影响研究对于数据的要求较高,如需要教师数据以及与其对应的学生数据,或者是需要纵向数据等,因而获得数据所消耗的人力物力资源也较多,使得许多研究因采用现有可获得的“方便数据”而受到很大的限制.许多研究的变量选择更多的是由于数据的可得性决定的,而非是理论讨论的结果[21],从而使得研究缺乏系统性.
对于该类的另一个不可忽视的问题是对于统计数据的分析过程与结果的理解.除了由于统计方法、抽样方法、系统误差等原因引发的结果差异以外,更重要的是认识到统计结果不能完全代替教育研究的结论,特别是大样本的推断统计不易保证研究结论的深刻性,统计结果产生背后的深层次原因不易直接由统计结论显现,需要在一定的教育理论下给予对于统计结论的教育学解释,同时也需要质性研究结论的补充.
已有研究的不足,就是未来研究的方向,从这个意义上讲,未来该类研究的一个重要发展方向应当是努力从已有的理论框架出发,有针对性地搜集相应的高质量数据,运用合理的统计方法,结合质性推理以获得对于教师影响全面、深刻的刻画.
此外,中国数学教育界基于中国文化背景的、基于大样本数据、运用量化研究方法的教师影响研究的数量较为有限,鉴于该类研究对于教育理论与实践发挥的积极作用,研究者提倡广泛开展该类研究.
[1]Carter J P. Defining Teacher Quality: An Examination of the Relationship between Measures of Teachers’ Instructional Behaviors and Measures of Their Students’ Academic Progress [D]. Unpublished Doctoral Dissertation of University of North Carolina at Chapel Hill, 2008.
[2]Hill H, Rowan B, Ball D. Effects of Teachers’ Mathematical Knowledge [J]. American Educational Research Journal,2005, (2): 371-406.
[3]薛海平.学生成绩提高的原理与策略[M].北京:北京大学出版社,2011.
[4]丁延庆,薛海平.从效率视角对我国基础教育阶段公办学校分层的审视——基于对昆明市公办高中的教育生产函数研究[J].北京大学教育评论,2009,(4):35-49.
[5]Coleman J S, Campbel E Q, Hobson C J, et al. Equality of Educational Opportunity [R]. Washington DC: U.S.Government Printing Office, 1966.
[6]Campbell R J, Kyriakides L, Muijs R D, et al. Differential Teacher Effectiveness: Towards a Model for Research and Teacher Appraisal [J]. Oxford Review of Education, 2003, 29(3): 347-362.
[7]谢敏,辛涛,李大伟.教师资格和职业发展因素对学生数学成绩的影响:一个跨文化比较[J].心理与行为研究,2008,(2):124–129.
[8]Wayne A J, Youngs P. Teacher Characteristics And Student Achievement Gains: A Review [J]. Review of Educational Research, 2003, 73(1): 89–122.
[9]Graber C R. Factors That Are predictive of Student Achievement Outcomes And an Analysis of These Factors in High-Poverty Schools Versus Low-Poverty Schools [D]. Unpublished Doctoral Dissertation, Lindenwood University,2009.
[10]Rivkin S G, Hanushek E A, Kain J F. Teachers, Schools, and Academic Achievement [J]. Econometrica, 2005, 73(2):417-458.
[11]李琼,倪玉菁,萧宁波.小学数学教师的学科教学知识:表现特点及其关系的研究[J].教育学报,2006,(4):58-64.
[12]曾小平,刘效丽,涂荣豹,等.教师数学修养对数学教学的影响研究[J].数学教育学报,2010,19(2):42–46.
[13]黄慧静,辛涛.教师课堂教学行为对学生学业成绩的影响:一个跨文化研究[J].心理发展与教育,2007,(4):57-62.
[14]Brophy J, Good T L. Teacher Behavior And Student Achievement [A]. Chapter in Wittrock, M. C. (Eds). Handbook of Research on Teaching (Third Edition) [C]. New York: Macmillan, 1986.
[15]Rowan B, Correnti R, Miller R J. What Large-Scale Survey Research Tells Us about Teacher Effects on Student Achievement: Insights from the Prospects Study of elementary schools [J]. Teachers College Record, 2002, 104(8):152-156.
[16]Konstantopoulos S, Sun M. Is the Persistence of Teacher Effects in Early Grades Larger for Lower-Performing Students[J]. American Journal of Education, 2012, (4): 34.
[17]王立东,王西辞,曹一鸣.数学课堂教学中的学生评价研究[J].数学教育学报,2011,20(5):37–40.
[18]Gage N L, Needels M C. Process-Product Research on Teaching: A Review of Criticisms [J]. The Elementary School Journal, 1989, 89(3): 253-300.
[19]皮磊,闫振荣.教师期望对数学学习中习得性无助感的影响[J].数学教育学报,2010,19(1):44–47.
[20]Xin T, Xu Z, Tatsuoka K. Linkage between Teacher Quality, Student Achievement, and Cognitive Skills: A Rule-Space Model [J]. Studies in Educational Evaluation, 2004, (30): 205–223.
[21]Hanushek A E. The Economics of Schooling: Production and Efficiency in Public Schools [J]. Journal of Economic Literature, 1986, 24(3): 1 141-1 177.
[22]Lockwood J R, McCaffrey D F, Hamilton L S, et al. The Sensitivity of Value-Added Teacher Effect Estimates to Different Mathematics Achievement Measures [J]. Journal of Educational Measurement, 2007, 44(1): 47–67.
[23]Shavelson R J, Webb N M, Burstein L. Measurement of Teaching [A]. Chapter in Wittrock, M.C. (Eds), Handbook of Research on Teaching (Third Edition) [C]. New York: Macmillan, 1986.
[24]Chen Y H, Gorin J S, Thompson M S. et al. Cross-Cultural Validity of the TIMSS-1999 Mathematics Test: Verification of a Cognitive Model [J]. International Journal of Testing, 2008, (8): 251–271.
[25]王立东.数学教师对学生学业成就的影响研究[D].北京师范大学,2012.
[26]Decker Paul T, Daniel P. Mayer and Steven Glazerman. The Effects of Teach For America on Students: Findings from a National Evaluation [R]. Mathematical Policy Research Report No. 8 792-750, June 9, 2004.
[27]Raudenbush S W, Bryk A S. A Hierarchical Model of Studying School Effects [J]. Sociology of Education, 1986, 59(1):1-17.
[28]Roth J, Ariet M, Fisher T, et al. An Empirical Comparison of Statistical Model for Value-Added Assessment of School Performance [J]. Journal of Educational and Behavioral Statistics, 2004, 29(1): 11-35.
[29]Newton X, Darling-Hammond, Haertel E, et al. Value-Added Modeling of Teacher Effectiveness: An Exploration of Stability Across Models and Contexts [J]. Educational Policy Analysis Archives, 2010, 18(23):30-48.
[30]Raudenbush S W. What Are Value-Added Models Estimating and What Does This Imply for Statistical Practice [J].Journal of Educational and Behavioral Statistics, 2004, 29(1): 121-129.