黄正正 郭亚歌
学校因素对学生数学素养成绩影响的跨文化比较
——基于PISA2012多水平分析的结果
黄正正 郭亚歌
本研究采用PISA2012的数据,使用多水平线性模型方法,比较中国上海地区、美国、芬兰、日本四个国家(地区)的学校客观特征因素和校长领导力对学生数学素养成绩的预测效应。结果发现:学校的客观特征变量在不同国家对学生数学素养的影响不尽相同;学生层面和学校层面的社会经济文化水平指标对数学素养有着正向的预测效果;在控制学生背景变量的情况下,学校层面的校长领导力指标对数学素养无显著预测作用。
学校因素;数学素养;多水平分析;PISA2012
自从学校成为制度化教育组织以来,人们一直都认为学生的学业成就与学校的领导与管理因素存在着密不可分的联系。校长是学校教育教学和质量管理的第一责任人,校长对教育教学的领导是影响学校教育质量的关键。20世纪70年代,美国兴起了“有效学校运动”。学者在对有效学校的研究中发现,“强有力的领导”被证实为有效学校的重要特征,并由此成为学校效能研究中的过程变量,而学生学业成就则常常被视为客观而重要的结果变量。很多研究结果显示:校长的领导力对学生的学业成绩有重要影响(Witziers,Bosker&Kruger,2003;Leithwood,Karen&Steohen,2004)。Kaplan、Owings和Nunnery(2005)发现在学校领导标准中评比较高的校长,其学生成就也较高;Cotton(2003)也指出校长领导和学生学业成就之间具有正相关。Leithwood和Jantzi(2000)认为校长领导对学生学习的影响占了学校层面影响的四分之一以上。
但随着研究的深入,学者们对校长领导与学生成就的关系有了不同的发现。近年来,国际上发展出了多种跨国家、大规模的标准化学生成就测试,主要有:由经济合作与发展组织(The Organization for Economic Co-operation and Development,OECD)举办的PISA项目;由国际教育成就评价协会(Inter⁃national Association for the Evaluation of Achieve⁃ment)举办的国际数学与科学成就趋势调查(Trends for International Mathematics and Science Study)和国际学生阅读素养进展调查(Progress in International Reading Literacy Study)等。在经历过去十年的多轮测验后,学生在学科领域的表现得到评估并公之于众。基于这些数据,产生了大量探索学生成就影响因素的研究。这些研究的结果促使教育界人士改变现有的学校政策或者制定新的教育措施以提高学生成绩。但是,学者们经过研究发现,对于校长领导力和学生成就之间的关系却常常相互矛盾。
Shin和Slater(2010)通过分析TIMSS数据库8个国家的数据发现,很少有一致的数据证明校长领导力和学生数学成绩的关系,这项研究发现很难建立起校长领导力和学生成绩之间的关系。同时,以往的大多数跨国大规模教育评价的数据调查,也发现校长领导力和学生的成绩之间没有显著的关系(Backhoff,Andrade,Bouzas,Santos del Real,2009)。Charles L.Slater和Backhoff(2013)通过分析美国、韩国、墨西哥三国的PISA2009的数学成绩发现,校长知觉的领导力和对学生成绩的预测效应差异很大,在文章里作者也很难解释差异产生的原因。
纵观以往有关校长领导和学生成就之间关系的研究发现,很多研究或者在单一水平上考察两者之间的关系,而没有考虑数据的嵌套结构;或者数据样本量有限,代表性不足;而且众多历史研究得到的结论并不统一。因此,本研究采用PISA 2012的数据,试图从国际比较(美国、芬兰、日本和上海地区)的视角在考虑数据嵌套结构的情况下,使用两水平线性模型(two-level linear model)的方法,探讨在学校层面,学校管理和校长领导因素在美国、芬兰、日本和中国上海这四个国家/地区对学生数学素养成绩的预测效应,为我国基础教育未来的改革与发展提供参考建议。
PISA是OECD于1997年发起的为OECD成员国协作监控教育成效的评价项目。PISA应用现代教育测量理论测试发达国家或地区义务教育结束阶段15岁学生在阅读、数学、科学领域的发展水平,配套调查问卷进而评价各参与国家或地区的教育成效,进行国际比较,是世界上颇具影响的国际教育评价项目之一。
该项目自2000年开始每隔三年实施一次,评价领域包括数学、阅读和科学素养,每次侧重一个领域,依据评价年命名。PISA2012的主评价领域是数学素养,其将数学素养界定为:数学素养是个体在各种情境中进行数学表述、数学运用和数学阐释的能力,它包含数学推理,运用数学概念、数学步骤、数学事实和数学工具来描述、解释和预测数学现象。它帮助个体认识数学在现实世界中所起到的作用,作出有根据的判断和决策,以成为具有建设性、参与意识和反思能力的公民(OECD,2013)。
除对三个科目的测评外,PISA 2012同时通过问卷调查的方式来收集学生和学校的背景信息,从学生、教师、学校等层面来分析成绩的影响因素。为保证测试工具的科学性,PISA从检测工具开发、检测标准设定、检测数据处理到检测结果判断等各环节的操作都严密可行、规范有效。同时由于PISA采用量表化技术,不同轮次研究得到的评价结果可以直接进行数值上的比较。因此,PISA的结果是有效且高度可信的(OECD,2013)。
本研究所用的数据均来自PISA官方网站(http://www.pisa.oecd.org)。
本研究选取了PISA2012数据库中中国上海地区和美国、芬兰、日本四个国家/地区的数据。选取这四个国家/地区首先是由于他们数学素养成绩的代表性,上海地区数学素养均分为613分位列第一,芬兰和日本的数学素养均分(519分和536分)都高于OECD均值484分,美国的数学素养均分(481分)低于OECD均值。另外在跨文化研究中,美国以其强大的国家实力往往作为国际比较研究的基准;芬兰则在PISA的既往测试中保持了很高的教育水平和教育公平性;日本是亚洲的发达国家,同时也是东亚文化圈的代表,与我国具有文化传统上的相似性。
表1 被试量的描述统计
表1为剔除相应变量缺失值后四个国家参与研究的学生和学校数量,共计23 543名15岁在校学生和766所学校被纳入了本文的研究,各个国家的男女学生比例都接近1∶1。
本研究从PISA2012学生问卷和学校问卷数据所构成的嵌套关系中,在控制其他学生水平变量和学校水平变量的基础上,考察校长知觉的领导力对数学素养成绩的影响。因变量是学生的数学素养成绩,自变量则分为两层:第一层是学生水平变量,包括学生性别和其家庭社会经济文化水平(在PISA中简称为ESCS)(OECD,2012);第二层是学校水平变量,合计为10个变量。包括PISA2012校长问卷中呈现的四种校长领导力,分别是教学领导力(In⁃structional leadership)、构建传达教学目标和课程发展(Framing and communicating the school’s goals and curricular development)、促进教学改善和专业发展(Promoting instructional improvements and profes⁃sional development)、教师参与(teach participation)(OECD,2013)。此外还有6个学校客观特征变量,包括学校类型、学校规模、班级规模、生师比、学校教育资源质量和学校ESCS均值。自变量的说明与计分方式见表2。
表2 自变量的说明及计分方式
本研究采用多水平线性模型方法对数据进行分析。使用SPSS20.0进行数据的整理与转换;使用HLM6.08实现对学生样本的加权和对似真值(Plau⁃sible Value)的计算,并对处理过的数据进行多水平分析。
从表1和表3可以看出:
(1)学生水平变量中,上海地区学生的数学素养成绩最高,其次是日本和芬兰,美国学生的数学素养成绩最低;学生的ESCS水平从高到低依次为芬兰、美国、日本和上海。
(2)学校水平变量中,上海地区的学校规模和班级规模均为最大,而芬兰的学校规模和班级规模都是最小的;生师比方面美国在17左右,上海地区、芬兰和日本则都在12左右;学校教育资源质量方面日本和美国的情况较好,芬兰和上海地区则相对较差;四种校长领导力上的表现也各不相同,美国的四种校长领导力分值均较高,上海地区和芬兰的四种校长领导力均较低,日本则是除了LEADINST以外得分都很低。
表3 四个国家学生变量和学校变量描述统计(均值/标准差)
表4 学生的数学素养成绩变异在学校间和学校内的估计
根据多水平线性模型的统计原理,以学生的数学素养成绩为因变量,将影响学生数学素养成绩的变量分为两层,第一层为学生水平变量,第二层为学校水平变量。首先建立不加入任何预测变量的零模型,考察学校间变异和学校内变异对学生成绩总变异的贡献。具体模型为:
表4为四个国家学生的数学素养成绩变异在学校间和学校内的估计,学校间变异与学校内变异之和为学生成绩的总变异。对表中数据进行运算可知,美国、芬兰、日本和上海地区的组内相关系数(ICC)分别为0.25、0.12、0.54和0.47。ICC代表了群组内的相似性程度,Cohen(1988)认为当ICC大于0.059时就不能忽略群组内相似性的存在,而必须考虑采用多水平分析Bryk&Rauden bush(1992)和Verbek&Molen berghs(2000)也认为如果此时使用传统的多元回归,发生I型错误的概率会大幅增加。另外从各国不同的组内相关系数,也可以看出日本和上海地区的学校间变异所占的比重较大,说明这两个国家的学生成绩差异可以更多的由学校间因素解释;芬兰和美国的学校间变异所占的比重要小一些,尤以芬兰为最,这表明学校内的变量,例如学生的自身因素,更能解释这两个国家内的学生成绩差异,这也表明芬兰和美国具有更好的教育公平性和均衡性。这些结论与之前PI⁃SA多次评测的结果也是一致的(OECD,2007;OECD,2010)。
表5 学生数学素养成绩影响因素的多层线性回归分析
将学生背景变量和学校层面变量加入到模型中建立完整模型,考察两个水平的变量对学生数学素养成绩的影响。这里仅考察随机截距模型的情况。各个变量对学生数学素养成绩的影响如表5。具体模型如下:
(1)完整模型中学生水平变量的结果分析
从表4和表5可以看出,学生水平变量的加入解释了一部分学校内变异。美国、芬兰、日本和上海地区学生数学素养成绩的学校内变异分别下降的百分比是6.88%、7.98%、1.41%和1.91%。
由表5可以看出,美国(=7.90)、日本(=16.45)和上海地区(=14.08)的数学素养成绩都存在显著的性别差异,男生比女生的成绩表现要好;芬兰(=0.45)在数学素养成绩上则不存在性别差异。
学生的ESCS水平对四个国家学生的数学素养成绩都有显著的正向预测作用,即学生的ESCS水平越高,取得的数学素养成绩也越高。由该变量对数学成绩影响的系数可以发现,美国和芬兰学生受家庭社会经济文化地位的影响最大,学生的ESCS水平每提高一单位,数学素养成绩增加分别达到了24.08分和29.86分;日本和上海地区学生受家庭社会经济文化地位的影响则较小,学生的ESCS水平每提高一单位,数学素养成绩增加分数分别为3.92分和9.27分。
(2)完整模型中学校水平变量的结果分析
加入第二层学校水平变量后,四个国家的学校间变异也都有不同程度的下降。美国、芬兰、日本和上海地区学校间变异分别下降了65.42%、45.84%、75.31%和66.58%,表明第二层变量解释了四个国家较大一部分学校间变异。
从表5我们可以发现,在控制学生背景变量的情况下,只有学校ESCS均值这个变量对四个国家都具有显著的正向预测作用,其他变量的效果则不尽相同。
具体而言,对美国来说学校类型(=-29.94)对学生数学素养成绩有着显著的负向预测作用,即公立学校的学生比私立学校的学生平均成绩要低29.94;学校ESCS均值(=43.89)对学生数学素养成绩有显著的正向预测作用,学校ESCS均值上升1个单位,学生数学素养成绩上升43.89分。对芬兰来说,班级规模(=2.34)和学校ESCS均值(=22.06)对学生数学素养成绩都有着显著的正向预测作用。对日本来说,学校类型(=-42.37)对学生数学素养成绩有着显著的负向预测作用;班级规模(=1.37)和学校ESCS均值(156.43)对学生数学素养成绩有着显著的正向预测作用。上海地区只有学校ESCS均值对学生数学素养成绩有着显著的正向预测作用。
PISA2012中新增加的四个校长领导力指标,对本研究中的四个国家都没有显著的预测作用。
许多以往的研究都表明男生在数学成绩上要高于女生,本研究中的美国、日本和上海地区也都表现出了这一特点:在控制了其他变量之后,这三个国家的男生数学素养成绩仍然显著优于女生。但是值得指出的是,在PISA2012中,芬兰的男女生数学素养成绩并无显著差异。而在PISA2006中,芬兰的男生数学成绩是显著高于女生的。这表明男女生之间的数学成绩差异并非一定存在或者无法克服的。
PISA经过多年的研究发现,学生表现的性别差异可以大幅缩小,因为所有国家(地区)的男女生都显示他们能在所有三个领域上取得成功。男生和女生在数学、阅读和科学上的表现水平不同,但同一性别内的表现差异显著大于不同性别间的差异。在许多国家(地区),数学表现上性别差异很大——男生高于女生,但有很多例外,差别的程度也不一样。PISA2012研究发现,一些国家成功地缩小了数学表现上的性别差异。与此同时,有证据显示,在许多国家(地区),最低表现的学生中的男生比女生多,其中一些国家(地区)需要在提高男生的数学参与度方面做更多。(OECD,2013)。
自从20世纪60年代《科尔曼报告》发布之后,学生的家庭社会经济文化地位对成绩的影响开始被广泛关注,尽管大家对这一变量的具体定义和测量方法会有所出入,但是大量的研究都表明这种影响是存在且深刻的。本研究的结果再次印证了这一点:对不同文化背景的国家来说,学生的家庭社会经济文化地位对数学成绩的影响都有着正向的预测作用。
本研究在学校水平选取了6个学校客观特征变量:学校类型、学校规模、班级规模、生师比、学校教育资源质量和学校ESCS均值。通过多水平分析我们发现,在控制了学生水平变量之后,这些学校客观特征变量对不同国家学生数学素养成绩的影响差异较大,但也表现出了一些共同之处。
首先,学校类型对学生数学素养成绩的影响方向是一致的,其中美国、日本的私立学校数学素养成绩显著高于公立学校,且幅度较大;但在上海地区和教育均衡性最优的芬兰,学校类型造成的学生素养差异并不显著,表明公办教育也可以取得与私立学校相近的成绩。
其次,学校ESCS均值对学生数学素养成绩都有着显著的正向预测作用。通常而言,学校ESCS均值较高表明学校所在地区经济较为发达,或者学校吸纳了其所在地区内社会经济文化地位较高的那部分学生。实际上也就是学校变得“强者愈强”。
PISA经过多年的研究发现,社会经济背景会影响到学校的布局和学生特征,造成一定的“马太效应”。世界上其他国家为消除教育的区域、城乡和校际差异,充分利用政策杠杆调整学校的布局,通过学校合并、建立新校(如磁石学校和教育行动区)减少社会经济背景对于学生成绩的影响。当前,教育部门应该充分利用学龄人口变化的有利时机,调整学校布局,削弱社会经济背景对于学校和学生成绩差异的影响。PISA全球趋势报告显示,“学校的质量不会超越其教师和校长的质量”,所有高表现的国家无一例外地制定了提高教师队伍质量的政策,并确保将教师分配到他们能做出最大改变的学校和学生中去。
本研究的结果表明PISA2012提出的四种校长领导力,对学生数学素养成绩都无显著预测效果。
这可能是由于PISA的抽样只涉及学校中的校长和学生两类群体,而关于校长领导力等因素来说,校长或许并不是最合适的信息提供者。校长问卷属于自陈量表,表面效度过高,降低了结果的有效性。以往的研究表明,从教师视角收集的校长领导力问卷提供的数据最有效。如Hallinger开发的校长教学领导力测量问卷分为三个平行的版本,校长自我评估版本,教师版本和督学版本。三个版本的题目完全相同,只是填写问卷的群体是不一样的。早期的研究发现,不同群体间的看法存在显著差异(Hallinger&Murphy,1985;Krug,1986)。在美国进行的验证研究表明,教师视角的PIMRS版本在三个版本中提供了最有效的数据(Hallinger,2011)。教师是学校中对校长最为了解的群体,校长自评的分数往往是不太客观的,而督学对校长的了解比较少,在这种情况下,教师版的PIMRS是最为合适的。
而且,校长领导力是通过教师、学校气氛等中介变量对学生学习成就产生影响,可能正由于这种中介作用,导致变量间的相互作用变得复杂而交错。另外,根据OECD的报告(OECD,2013),PISA呈现的四种校长领导力之间具有高度的相关性,这可能会导致共线性问题(collinearity),从而产生更大的II型错误,从而导致最后的结果不佳。
PISA2012年美国、芬兰、日本和上海地区的数据结果表明:
(1)在控制学生背景变量和学校社会经济文化水平之后,学校层面变量对学生数学素养成绩的关系在四个国家之间存在差异:学校类型与美国学生数学素养成绩存在显著的负向关系;班级规模与芬兰学生数学素养成绩存在显著的正向关系;学校类型与日本学生数学素养成绩存在显著的负向关系,班级规模则与日本学生数学素养成绩存在显著的正向关系。
(2)在控制学生背景变量后,PISA2012中的四种校长领导力指标对四个国家的学生数学素养成绩均无显著预测力。这一事实背后可能存在更深刻的原因:“校长领导力”是一个宽泛的概念,PISA问卷对它的界定尚不够精确,是否可以分为四种校长领导力仍然值得商榷;另外对于校长领导力这样的指标,采用自陈量表的方式可能并不太妥当,使用教师问卷这样的他评量表来进行测量会更加合理。
[1]Backhoff,E.,Andrade,A.,Bouzas,R.,Santos del Real,A.,&San⁃tibanezL..Teaching andLearning International Survey(TALIS)[M].Mexico City,Mexico:Secretaria de EducacionPublica,2009.
[2]Bryk,A.S.,&Raudenbush,S.W..Hierarchical linear models[M].Newbury Park,CA:Sage,1992.
[3]Beretvas,N..Hierarchical Linear Modeling.IN J.P.Stevens(Eds.),Applied Multivariate Statistics for the Social Sciences[M].New York,NY:Routledge,2009:505-536.
[4]Cotton,K..Principals and student achievement:What the research says[M].Alexandria,VA:Association for Supervision and Curricu⁃lum Development,2003.
[5]Cohen,J..Statistical power analysis for the behavioral sciences[M].Hillsdale,NJ:Eribaum,1988.
[6]Hallinger,P..A Review of Three Decades of Doctoral Studies Using the Principal Instructional Management Rating Scale:A Lens on Methodological Progress in Educational Leadership[J].Educational⁃Administration Quarterly,2011,47(2):271-306.
[7]Hallinger,P.,&Murphy,J..Assessing the instructional leadership behavior of principals[J].Elementary School Journal,1985,86(2):217-248.
[8]Kaplan,L.S.,Owings,W.A.,&Nunnery,J..Principal quality:A Virginia study connecting interstate school leaders licensure consor⁃tium standards with student achievement[J]NASSP Bulletin,2005,89(643):28-44.
[9]Krug,F..The relationship between the instructional management be⁃havior of elementary school principals and student achievement[D].Retrieved from ERIC database.(ED8722942).
[10]Leithwood,K.,&Jantzi,D..The effects of transformation leadership on student engagement with school[J].Journal of Educational Ad⁃ministration,2000,38(2):112-129.
[11]Leithwood,Kenneth,Karen Seashore Louis,Stephen Anderson,and Kyla Wahlstrom.Review of research:How leadership influences student learning[R].New York:The Wallace Foundation.2004.
[12]OECD.PISA 2012 Results:What Makes Schools Successful?Re⁃sources,Policies and Practices(Volume IV)[M].PISA,OECD Pub⁃lishing,2013.
[13]OECD.PISA 2009 Technical Report[M].PISA,OECD Publishing,2012.
[14]OECD.PISA 2009Results:Overcoming Social Background Equity in Learning Opportunities and Outcomes(Volume II)[M].PISA,OECD Publishing,2010.
[15]OECD.PISA 2006 Results:Science competencies for tomorrow’s world(Volume I:Analysis)[M].PISA,OECD Publishing,2007.
[16]Charles L.Slater&Seon-Hi Shin,Backhoff.Principal Perceptions and Student Achievement in Reading in Korea,Mexico,and the United States:Educational Leadership,School Autonomy,and Use of Test Results[J].Educational Administration Quarterly,2013,49(3):489-527.
[17]Shin,S.,&Slater,C.L..Principal leadership and mathematics achievement:An international comparative study[J].School Leader⁃ship&Management,2010,30(4):317-334.
[18]Verbeke,G.,&Molenberghs,G..Springer series in statistics:Linear mixed models for longitudinal data[M].New York,NY:Springer-Verlag,2000.
[19]Witziers,B.,Bosker,R.J.&Kruger.M.L..Educational leadership and student achievement:The elusive search for an association[J].Educational Administration Quarterly,2003,39,(3):398-425.
(责任编辑 吴四伍)
Cross-cultural Comparison of School Factors Affecting Students’Achievement in Mathematical Literacy:Based on the Multilevel Analysis of PISA2012
HUANG Zhengzheng and GUO Yage
This study investigated the predictive effect of school objective factors and principal leadership on students’achievement in mathematical literacy by employing two-level Linear Models from an international comparison perspective.Four countries/regions including shanghai-China,United States,Finland and Japan were selected from the international PISA 2012 database.The findings indicated that:The Influence of the objective variables of school on students’mathematical achievement is not the same in different countries;The indicator of socio-economic and cultural at the student’s and school’s level has positive predictive effect on mathematical literacy;With students’background controlled,the indicator of principal leadership at the school level has no significant predictive effect on mathematical literacy.
School Factors;Mathematical Achievement;Hierarchical Linear Model;PISA 2012
G405
A
1005-8427(2014)10-0047-9
本文系国家教育体制改革领导小组研究项目“研提OECD组织PISA测试项目经验启示”的研究成果之一。
黄正正,男,湖北中医药大学人文学院,助教(武汉 430065)
郭亚歌,女,北京师范大学,硕士研究生(北京 100875)