教育机会不平等: 来自CEPS 的新证据

2020-10-14 00:30江求川
南开经济研究 2020年4期
关键词:教育资源机会分数

江求川 任 洁

一、引 言

教育是民族振兴和社会进步的重要基石,教育公平是社会公平的重要基础,关系到国家的经济繁荣和社会进步。《国家中长期教育改革和发展规划纲要(2010—2020年)》指出,要把促进公平作为国家基本教育政策。十九大报告也提出“努力让每个孩子都能享有公平而有质量的教育”。可见教育公平问题的重要性与紧迫性。

“公平”的要义在于为人们提供“平等的竞技场”或平等的机会(equality of opportunity),而不是平等的结果(equality of outcomes)(Roemer 和Trannoy,2016)。结果不平等(inequality of outcomes)不一定是不公平,因为结果差异①后文用“结果差异”替代“结果不平等”(inequality of outcomes)。的背后可能是人们在公平的竞争中付出了不同的努力。但是,当人们付出了相同的努力,却因为家庭背景、社会地位、城乡等个人无法控制的外在因素导致教育结果不同时,这就是教育的机会不平等或教育不公平的表现。按照Roemer(1998)的做法,我们将那些影响教育结果且个人无法控制的外在因素统称为环境变量。教育机会不平等可定义为环境变量导致的教育结果差异。

从机会不平等的内涵可以看出,本文所指的教育机会不平等,与大量研究升学机会差异的文献中提到的“机会不平等”并不完全相同。现有文献中的“升学机会差异”大多指的是“升学几率”“升学概率”或“升学可能性”的差异。升学概率的差异有可能来自学生面临的外在环境变量的影响,也有可能是学生自身的努力程度差异。所以,现有文献中所指的“升学机会(几率)差异”并不一定是教育不公平的表现。不过,长期以来,国内外关于教育公平的研究大多遵循了机会平等的思想。例如,在相关的研究中,学者们比较关心的是,伴随着经济社会的发展和教育资源的扩张,那些来自低社会阶层和弱势家庭中的孩子是否更加平等地享有了教育资源(吴晓刚,2016)。这里的“低社会阶层和弱势家庭”就是环境变量。

然而,现有研究关注的重点是高等教育升学机会的差异,鲜有研究关注基础教育阶段的机会不平等。探讨基础教育阶段的机会不平等有两个方面的重要意义。第一,基础教育阶段的机会不平等会延续到后续教育阶段,探究源头的机会不平等更为重要;第二,从政策角度来看,对教育的干预越早,效果越好(Barnett,2011;Heckman,2006),而成人以后的教育结果差异却很难再改变,或改变的成本很高。所以,有必要对早期教育阶段的不平等因素进行分析。

本文从机会平等视角探讨中国初中阶段的教育公平问题,在以下三方面做出了边际贡献。首先,基础教育的机会不平等本身就是中国教育公平问题的一部分,本文的研究为洞察中国教育机会不平等的全貌提供了依据。其次,大量关于中国高等教育不平等的研究表明,高等教育的差距源自本科以前的教育差距。本文为理解中国教育不平等中的高等教育阶段机会不平等提供了新思路。最后,现有的教育不平等研究大多使用教育年限或是否考入大学反映教育结果差异,但升学和教育年限都很难反映教育质量的差异,而对基础教育阶段而言,更重要的是“质量上的均等化”(罗楚亮和刘晓霞,2018)。本文使用中国教育追踪调查数据中的学生测试成绩作为教育结果的度量指标,能够更加精确地捕捉教育质量差异的信息。

二、文献回顾

教育不平等一直是经济学和社会学研究中的重点话题。经济学中关于教育不平等的早期研究借鉴了收入不平等的研究思路,利用基尼系数测度教育年限分布的不平等程度(Castelló 和Doménech,2002;Christian 和Fabrice,2010;Thomas 等,2001)。然而,在Roemer(1998)将机会平等的哲学观点引入经济学领域以后,经济学家们对不平等问题的研究逐渐由关注结果差异转向关注机会不平等(Roemer 和Trannoy,2016)。

学者们对于中国的教育资源扩张是否促进了教育机会平等存在很大争议。始于20世纪末的高等教育资源扩张更是激起了一场关于“无声的革命”和“寒门难出贵子”的激烈讨论(李春玲,2010、2014b;梁晨等,2012;吴晓刚,2016;应星和刘云杉,2015)。李春玲(2010)认为,高等教育扩张并没有减弱社会阶层、民族和性别等个体不可控的因素对教育机会差异的影响,反而加剧了城乡间的教育不平等。梁晨等(2012)通过分析北京大学和苏州大学1952—2002 年间的招生数据指出,这两所学校中来自工农家庭的学生比例呈现出明显上升趋势。然而,更多的经验研究发现,大学扩招以后,家庭背景、城乡等环境因素对学生获得教育资源的影响更加重要了(李春玲,2014b;李代,2017;邵宜航和徐菁,2017;吴晓刚,2016;吴晓刚和李忠路,2017;杨奇明和林坚,2014;应星和刘云杉,2015)。不少学者对这一现象背后的机制进行了考察。研究者们发现,高等教育资源扩张之所以没有明显改善甚至加剧了不同社会阶层间的高等教育机会不平等,可能是基础教育不平等的延续(戴思源,2018;李春玲,2014a;罗楚亮和刘晓霞,2018;孟凡强等,2017;庞圣民,2016;唐俊超,2015;王威海和顾源,2012;吴愈晓,2013a、2013b;叶晓阳和丁延庆,2015)。

除了研究对象集中于高等教育机会不平等以外,上述文献并没有真正意义上对中国的教育机会不平等进行测量。上述研究在探讨高等教育的机会不平等时,大多通过估计教育结果决定方程并分析某些特定的因素(如家庭背景)是否对教育结果有显著影响。因此,现有的研究大多是从不同角度反映了机会不平等的存在,而不是对教育机会不平等的直接测度。

综上所述,本文试图探讨基础教育阶段的机会不平等问题,对机会不平等的程度进行更加直接的测算,而不是单纯地考察某些具体的环境变量是否显著影响教育结果。为此,本文利用Bourguignon 等(2007)的方法和中国教育追踪调查中的学生测试成绩数据测算中国初中阶段的教育结果差异和教育机会不平等。使用学业成绩研究基础教育阶段的机会不平等是较为理想的做法,也是国际研究中通用的做法。原因是基础教育阶段往往在升学率上没有太大差异,而学业成绩能比较好地捕捉到教育质量(包括家庭内部的教育质量和学校教育质量)的差异。Ferreira 和Gignoux(2014)、Gamboa 和Waltenberg(2012、2015)均使用国际学生评价方案(Programme for International Student Assessment,PISA)对跨国的教育机会不平等进行了估算和对比。Salehi- Isfahani 等(2014)用国际数学和科学评测趋势(Trends in Mathematics and Science Study,TIMSS)数据测算了中东和南非一些国家的教育机会不平等。PISA 和TIMSS 都是针对初中阶段学生的数学和阅读能力的测试,数据的优点是可以进行跨国对比,从而为研究教育机会不平等和国家政策的关系提供了支撑①PISA 的调查对象为15 岁在校生,大约相当于中国初三年级的学生;TIMSS 的调查对象主要是四年级和八年级学生,相当于中国小学四年级和初二年级的学生。。另一些研究则提供了单一国家内部的教育机会不平等经验证据。Contreras 和Puentes(2017)使用智利学龄前孩子的词汇领会能力测试分析了家庭背景因素导致的教育机会不平等。Madden(2018)、 Junior 和Paese(2019)分别用爱尔兰和巴西的小学生数学和阅读测试成绩测算两个国家的教育机会不平等。所有这些研究都发现,教育机会不平等是普遍存在的现象。近年来,直接利用机会平等的思想研究中国教育公平问题受到了重视。Golley 和Kong (2018)利用中国家庭追踪调查数据中的成人教育年限数据作为教育结果变量考察了户口、父母教育和政治身份等不可控因素导致的教育机会不平等。靳振忠等(2018)、邹薇和马占利(2019)使用是否上大学作为教育结果,在升学方程的估计中仅控制了环境变量,预测出环境变量导致的升学概率差异,从而估算出上大学的机会不平等。相比较而言,学者们对中国基础教育阶段机会不平等的研究要远少于对高等教育机会不平等的研究。这与学者们对基础教育阶段不平等重要性的广泛认同形成了反差。刘精明(2008)用1982 年、1990 年和2000 年的三次中国人口普查数据研究了家庭资源对基础教育入学率和升学率的影响,从而在一定程度上反映了基础教育阶段的机会不平等。这些研究为认识中国的教育机会不平等提供了有价值的信息,但如前文所述,这些研究还存在进一步完善的空间。首先,研究中使用的教育年限和是否升学信息很难精确地反映教育质量差异;其次,研究内容仅仅反映了机会不平等的一个侧面,而不是对机会不平等的直接测度;最后,对基础教育阶段的机会不平等关注较少。

三、数 据

本文使用的数据来自中国教育追踪调查(China Education Panel Survey,CEPS)中的2013—2014 学年基线调查数据。该项调查由中国人民大学中国调查与数据中心设计与实施,在全国范围内抽取112 所学校,438 个班级,约2 万名学生作为调查样本,调查对象包括学生、家长、教师及校领导。CEPS 旨在揭示家庭、学校、社区以及宏观社会结构对于个人教育产出的影响。因此,这套数据比较适用于研究基础教育阶段的教育机会不平等。

CEPS 的基线调查数据包含10279 名七年级学生和9028 名九年级学生。调查针对两个年级的学生分别设计了相应阶段的认知能力测试题,测试内容包括语言类测试、图形和空间类测试以及计算与逻辑类测试。这一测试结果有两个优点:一是统一的测试题保证了测试分数在同一年级的不同学校间是可比的;二是测试内容与PISA 等国际性测试一样,重在考查学生的逻辑思维与问题解决能力,而非简单的课程内容测试。

CEPS 的另一大优点是提供了非常详细的家庭背景信息和学校信息。这些信息反映的是学生面临的外部不可控的环境差异,是研究教育机会不平等的关键。就本文而言,重要的家庭背景信息包括父母亲的受教育程度、父母陪伴学生时间、家庭社会经济地位等。学校信息包括语文、数学和英语三门课程的教师年龄、受教育程度和职称、是不是公立学校、学校在本县区内的排名等。除了上述环境变量外,学生自身的特征和努力程度也是影响其教育结果的关键。CEPS 也提供了比较详细的学生个人特征信息,包括年龄、性别、身高、自评努力程度、悲观程度以及参加辅导班、体育运动、读课外书、看电视和玩游戏的时间等信息。

表1 是本文的主要变量描述性统计。剔除该表中核心变量缺失的观测值以后,我们最终得到8779 个七年级学生观测值和8307 个九年级学生观测值。七年级学生中有34.4%来自农村家庭,九年级学生中有37.5%来自农村家庭。93%的学生来自公立学校,81.5%的学生来自在当地排名中等及以上的学校。

表1 主要变量统计描述

续表1

图1 绘制了家庭经济水平、父母受教育程度、学校排名和城乡这四种比较重要的环境变量和学生测试分数的关系。可以看到,无论是七年级还是九年级学生的测试分数,都表现出随着家庭经济情况的改善而上升的趋势。父母受教育程度与学生测试分数的关系也非常明显,随着父母受最高教育程度的提升,学生的测试分数也不断上升。学校排名中等以上的学生测试分数要高于学校排名低的学生测试分数。来自农村家庭的学生的测试分数也没有来自城镇家庭的学生测试分数高。这些差异比较直观地体现 了环境变量与学生教育结果的重要关系,初步呈现了中国基础教育阶段存在教育机会不平等的可能性。接下来,我们将利用机会不平等的研究方法更严谨地判断教育机会不平等的存在及其程度。

图1 环境变量与测试分数的关系

四、分析方法

本文的分析方法来自Bourguignon 等(2007)关于收入机会不平等测度的研究,是Bourguignon 等(2007)的测度方法在教育机会不平等中的直接应用。相对于其他机会不平等测度方法,Bourguignon 等(2007)的方法具有可分解的性质,这使得本文可以更深入地探讨每种教育机会不平等来源贡献率的大小。按照机会不平等的研究思路,我们假定决定学生测试分数的因素分为不可控的环境变量C 和学生自身可控的变量E(如努力程度)以及其他未观察到的变量u。用s 表示学生的测试分数,并假定它由如下方程决定:

根据环境变量的定义可知,变量C 是外生变量,并且学生自身可控的变量可能受到环境变量的影响。例如,学生的努力程度、学习时间安排以及性格特征等可能受到环境变量的影响。为此,我们进一步把方程(1)改写为:

式(2)表明,环境因素有可能通过两种途径影响教育结果:一是对教育结果的直接影响,即直接效应∂f (C , E , u )∂C ;二是通过影响一部分可控的变量E 进而影响教育结果,即间接效应∂f ( C , E , u )∂E ⋅∂E ∂ C 。机会平等意味着环境变量对教育结果不产生影响,即环境变量的直接效应和间接效应都应该等于0。

机会不平等测算的关键是构建反事实的结果。我们用 s˜i表示所有个体面临相同环境变量情况下的反事实测试分数,其定义如下:

由于 s˜i中不存在环境变量的差异,所以 s˜i的差异不是机会不平等导致的。为此,我们可以定义如下机会不平等度量指标:

其中,I (⋅)表示不平等度量指标,如基尼系数、广义熵指数等。当不存在机会不平等时,环境变量C 与测试分数s 无关,所以s = s˜,故 I ( s ) = I ( s˜ ),I OPI= 0。当s 中的差异全部由环境变量导致的时候,s˜中没有变异,故 I ( s˜ ) =0,I OPI= 1。

式(3)中,环境变量的直接效应和间接效应均被平滑掉,因此式(4)度量的是机会不平等的总效应。我们也可以忽略环境变量对学生努力程度、学习方式等变量的间接影响,仅考察机会不平等的直接效应。用sˆ 表示环境变量的直接效应平滑后的分数,其定义如下:

机会不平等直接效应度量指标的定义方式和式(4)相同。需要说明的是,并不能从理论上保证机会不平等的直接效应小于总效应。例如,家庭经济资源对学生的教育结果可能有正向的影响,但经济资源对某些学生的努力程度可能有负向的影响,因而间接效应会抵消一定程度的直接效应,导致总效应小于直接效应。

为了便于实证分析,我们参照Bourguignon 等(2007)的做法将方程 f ( C , E , u )和E ( C , v )设定为如下参数形式:

根据式(6)和式(7),可以得到分数决定方程的简约形式:

五、经验结果

(一)机会不平等的直接效应

我们首先忽略环境变量对学生测试成绩的间接影响,通过估计式(6)测算机会不平等的直接效应。与研究高等教育结果差异的文献类似,通过估计式(6)我们发现①限于篇幅,我们未在文中汇报式(6)估计的详细结果,如有需要可与作者联系索取。,家庭背景和学校特征这两类环境变量对初中阶段的教育结果差异有显著影响。这也进一步印证了图1 的结果。

式(6)的估计结果虽然表明环境变量与教育结果之间有非常显著的相关性,但我们并不能通过这一结果判断环境变量导致的教育机会不平等程度到底有多高。为此,我们在表2 中汇报了机会不平等直接效应的估计结果。

表2 机会不平等直接效应

我们选用基尼系数(Gini)、泰尔指数(Theil)和参数为-1 的广义熵指数(GE(-1))这三种比较常用的不平等测量指标。这三种指标对学生分数分布的不同位置的变化反应敏感程度不同,能够提高结果的稳健性。从估计结果上看,每种不平等指标都表明学生的分数分布存在比较显著的不平等,并且九年级学生的教育结果差异问题更加严重,这可能是不平等延续和积累的一种表现。由于新的知识技能的学习依赖于前期知识技能的储备(Barnett,2011;Heckman,2006),所以教育结果的差异有可能会持续下去并不断扩大。为了观察不同类型的环境变量对教育机会不平等的影响以及保证估计结果的稳健性,我们在控制个体可控变量的基础上,逐步加入不可控的个体特征、家庭背景和学校特征这三类环境变量。I ()表示按照式(5)将环境变量平滑后的反事实分布对应的不平等程度,其估计结果表明,随着环境变量的不断增加,环境变量解释的分数差异部分越来越大,平滑后的分数分布对应的不平等程度也不断下降。IOP 是按照式(4)的思路计算的机会不平等指标。当环境变量仅包含不可控的个人特征时,七年级和九年级的机会不平等程度都相对较低,七年级学生的教育结果差异中大约只有不到5%的部分是机会不平等导致,九年级学生教育机会不平等占结果差异的比例也不到10%。但不可控的个人特征仅仅是环境变量中的一部分,我们比较关心的是学校特征和家庭背景这些环境变量。加入这些变量以后,七年级学生的教育机会不平等达到6%~11%,而九年级学生的教育机会不平等在8%~22%。虽然在基础教育阶段来自不同地区和社会阶层的孩子在入学的机会上没有太大差异(数量上的均等),但我们的估计结果表明这些孩子在教育结果的差异上有明显的机会不平等。

(二)机会不平等总效应估计

在表2 的估计中,我们忽略了环境变量通过影响学生学习行为和习惯等途径对教育结果的间接影响。接下来,我们利用式(8)估计环境变量的总影响。由于无法判断各个环境变量对学生学习时间安排、努力程度和性格的具体影响方向,所以事先很难判断机会不平等的总效应和直接效应的大小关系。例如,家庭经济好的孩子可能会得到更好的教育资源进而对教育有正向的直接影响,但经济条件好也有可能对孩子的学习动力和学习习惯产生负面影响,这很难判断家庭经济条件导致的教育机会不平等总效应是否会大于直接效应。表3 汇报了机会不平等总效应的估计结果。机会不平等总效应的估计呈现出的特点和直接效应估计结果类似,随着环境变量的增加,教育机会不平等严重程度提高,且九年级的教育机会不平等要大于七年级的教育机会不平等。控制了全部环境变量以后,七年级的教育机会不平等仍然为6%~11%,九年级的教育机会不平等依然维持于8%~22%。通过对比表2 和表3 可以发现,机会不平等总效应和直接效应之间并没有非常明显的差异,这表明环境变量对教育结果的间接影响比较小。直观上来看,其原因可能是环境变量对学生学习努力程度没有系统性的影响。那些面临不利环境的学生有可能为了摆脱命运而更加努力,也有可能因不利的环境而自卑和气馁。同样,那些面临优越环境的学生有可能因缺乏动力而不努力,也有可能因受到良好的熏陶而努力。

表3 机会不平等总效应

那么,8%~22%的机会不平等是否很严重呢?由于不同的研究使用的指标尤其是选取环境变量不同,所以很难进行对比。为了尽可能提高可比性,我们将本文的相关结果与 Gamboa 和 Waltenberg(2012)的相关结果进行对比。首先,Gamboa 和Waltenberg(2012)使用的是PISA 数据,样本中的学生年龄是15 岁,这与本文九年级学生的年龄比较接近。其次,Gamboa 和Waltenberg(2012)使用的环境变量包括父母亲的教育和学校类型,这也与本文的环境变量类似。最后,Gamboa 和Waltenberg(2012)的不平等测度指标为广义熵指数,这与本文使用的测度指标也可比。Gamboa 和Waltenberg(2012)分别测算了美国、加拿大、德国、西班牙、韩国、日本以及六个拉美国家(阿根廷、巴西、智利、哥伦比亚、墨西哥和乌拉圭)的教育机会不平等程度。他们的估计结果表明,拉美国家的基础教育机会不平等占教育不平等的比例大约为15%~25%,而其他六个国家的教育机会不平等占比大约为5%~12%。与本文九年级的估计结果对比可知,中国初中阶段的教育机会不平等大约和一些拉美国家的水平相当,高于部分发达国家的教育机会不平等的水平。当然,导致本文估计的机会不平等水平较高的原因也有可能是本文的环境变量更为全面和细致。例如,Gamboa 和Waltenberg (2012)的学校特征仅包含是否为公立学校,而本文的学校特征还包含了大量教师信息。

(三)机会不平等分城乡估计

在前面的机会不平等估计中,我们将城乡作为环境变量之一控制在分数方程中。中国的教育资源在城市和农村的分布有很大差异。一般而言,城市拥有更多更优质的教育资源,并且除了公共教育资源外,城市家庭还可以从市场上购买大量私人提供的优质教育资源;而农村的教育资源主要是政府提供的公共教育资源。因此,家庭背景因素对学生教育结果的影响在城市和农村可能会有所不同,并且很可能是城市中的家庭背景对学生教育结果的影响更大,即城市学生面临的教育机会不平等可能更加严重。接下来我们将城乡样本分开,分别估计城乡内部的机会不平等程度,考察城乡内部的机会不平等是否存在差异。

表4 是教育机会不平等分城乡估计的结果。我们看到的第一个重要特点是农村内部的教育结果差异比城市内部的教育结果差异更加严重。根据我们的模型设定可知,教育结果差异来自环境变量差异和学生自身可控的变量差异两部分。因此,农村内部更严重的教育结果差异有可能是因为农村学生面临的机会不平等情况更加严重,也有可能是农村内部的学生在学习时间安排、学习习惯等行为上有更大的差异导致的。平滑了环境变量以后的城市学生教育不平等仍然小于农村学生教育不平等。如果将 I()视为学生自身因素导致的教育不平等,上述结果说明农村内部的教育不平等主要由学生自身可控因素导致。进一步看,通过对比城乡内部的教育机会不平等可以发现,城市七年级的教育机会不平等占教育结果差异的比例大约为4.7%~9.8%,农村七年级的教育机会不平等占教育结果差异的比例大约为3.5%~7.5%;城市九年级的教育机会不平等占教育结果差异的比例大约为5.0%~22.1%,农村九年级的教育机会不平等占教育结果差异的比例大约为4.6%~15.7%。可见,城市内部的教育机会不平等要比农村内部的教育机会不平等更严重。这是符合我们推测的。这一结论也说明,在市场化的教育资源可能导致更严重的教育机会不平等时,公共教育资源(尤其是优质的公共教育资源)在促进教育公平中的“兜底”作用将更加重要。

表4 机会不平等总效应分城乡估计

(四)机会不平等分解

图2 机会不平等分解

本文使用的环境变量可分为不可控个人特征、家庭背景和学校特征三类变量。我们分别考察这三类环境变量导致的教育机会不平等。具体而言,可以根据式(6)估计分数决定方程,但在构造反事实分数时仅平滑三类环境变量中的一类。图2 绘制了每一类环境变量导致的教育机会不平等程度高低的情形。从全国范围内的教育机会不平等来看,学校特征和家庭背景都是比较重要的教育机会不平等诱导因素。对城市的学生而言,大部分估计结果都表明学校特征依然是比较重要的教育机会不平等来源,家庭特征和学生自身不可控的特征对机会不平等的影响比较接近。这一结果和我们的直观感知是相符合的。虽然家庭内部教育资源和市场教育资源都存在,但学校的教育资源仍然是最关键的教育资源,并且不同学校在教育资源的数量和质量上往往有很大差异。具有优越教育资源的学校不仅对学生能力有直接的影响,还会通过聚集优质生源使得学生之间产生正的外部影响。社会上常见的学区房现象和其他择校现象也印证了这一点。对于农村学生而言,学校特征和学生自身的不可控特征是比较重要的教育机会不平等来源。与城市不同,家庭背景对农村教育机会不平等的作用相对较小。其原 因可能有以下三方面:首先,城市拥有大量优质的市场化教育资源,良好的家庭背景为获得这些优质市场化教育资源提供了可能;而农村往往没有丰富的市场教育资源,就算学生有比较好的家庭经济条件,也未必就可以获取学校以外的教育资源,这会导致农村家庭的经济条件对学生能力的影响程度较小。其次,农村家庭中父母受教育程度相对较低且不同家庭间父母受教育程度差异相对小,这会导致农村家庭的父母受教育程度对学生能力的影响程度也较小。最后,农村家庭还有可能因父母外出务工和缺乏教育意识等因素导致家庭背景对学生能力影响小。我们的数据也支持了上述猜想,例如,农村样本中只有18%的学生上课外辅导班,而城市学生上课外辅导班的比例为42%;农村样本中学生父亲受教育程度均值为2.01,标准差为0.68,而城市样本对应的数值是2.58 和0.97;农村样本中学生父母均在家的比例为70%,而城市样本中学生父母均在家的比例为81%。我们也估计了每类环境因素的机会不平等总效应,估计结果与图2 类似。这些结果表明,学校特征的差异对全国、城市内部和农村内部的教育机会不平等都有相对重要的影响。本文使用的学校特征主要是和学校教育质量有关的特征。因此,促进基础教育阶段“教育质量均等化”将是保障我国教育公平的重中之重。

(五)稳健性分析

为了检验上述结果的可靠性,我们从两个方面进行稳健性分析:一是使用CEPS提供的标准化测试分数重新估计;二是对可能存在的遗漏变量问题导致的估计偏误进行稳健性检验。

1. 用标准化分数

在前面的估计中我们使用的是学生测试的原始分,使用这一分数的一个潜在问题是不同的测试题有不同的难度系数,不同的测试题学生猜对答案的可能性也不同。因此,直接使用原始分有可能无法精确地反映学生的真实能力。CEPS 除了提供学生测试的原始分以外,还提供了使用项目反应理论(Item Response Theory,IRT)估计的标准化分数。标准化分数的优点是可以反映不同题目间的难度、区分度和猜测系数等差异,因而可以更好地反映学生的真实学习情况①七年级和九年级的标准化分数和原始分的 Pearson 相关系数都在0.95 左右。。不过标准化分数有大量负值,这将导致大多数不平等测度指标无法使用。为此,我们参照Ferreira 和Gignoux(2014)的方法将标准化分数进行如下转换:

其中,irts 、irtμ 和irtσ 分别表示标准化分数的分值、均值和标准差,0μ 和0σ 分别表示原始分的均值和标准差。

表5 是利用转换后的标准化分数估计得到的机会不平等总效应。从全国范围看,七年级的教育机会不平等为6.2%~13.1%,这和我们用原始分得到的结果比较接近。九年级的教育机会不平等为6.4%~19%,略低于利用原始分得到的全国九年级的教育机会不平等程度。城市和农村内部的机会不平等程度也大多数略低于利用原始分得到的机会不平等程度,但所有结果都表明仍然存在显著的教育机会不平等。更重要的是,利用标准化分数得到的结果仍然表明农村学生的教育结果差异大于城市学生的教育结果差异,但城市内部的教育机会不平等问题比农村内部的教育机会不平等问题更加严重。这些结果都表明本文的结论是比较可靠的。

表5 用标准化分数估计机会不平等总效应

2. 模拟估计偏差

本文的机会不平等估计依赖于分数方程式(6)或式(8)的估计。因此,式(6)和式(8)的潜在内生性问题有可能会影响本文结果的可靠性。影响学生教育结果的环境变量有很多,并且不同环境变量之间可能是相关的,所以式(6)和式(8)可能存在遗漏变量问题,进而导致估计结果是有偏的。同理,虽然我们控制了相对丰富的学生特征变量,但仍然有可能遗漏一些学生自身可控的且影响教育结果的变量。然而,由于环境变量通常不随时间变化、缺乏足够多有效的工具变量等原因,常规的内生性解决方案不适用于解决机会不平等估计中的偏误问题。为此,我们借鉴Bourguignon 等(2007)的思路来考察本文估计结果的可靠性。具体而言,Bourguignon 等(2007)提供了一种估计机会不平等上下界的思路。以式(6)为例,我们将其改写为如下形式: 其中,Xi= (1, Ci, Ei)是个体i 的解释变量构成的行向量(含常数),ψ =(α0,αT, βT)T是系数列向量。 X= ( X1T,…, Xn

T

)T是所有观测值的解释变量所构成的矩阵,而u=(u1,… , un)T表示所有观测值的误差项构成的列向量。用ψˆ 表示方程(10)中系数的OLS 估计值,则估计偏差Bias 计算方法如下: 结果是无偏的。如果存在遗漏的环境变量或学生特征变量与解释变量相关,估计结果将有偏。我们按照Bourguignon 等(2007)的思路利用蒙特-卡罗方法模拟解释变量与误差项存在不同程度相关性情况下的估计偏差Bias 大小,进而计算估计系数的上下界和机会不平等的上下界。

我们用1000 次模拟的系数组合得到的机会不平等估计值中的最大值和最小值分别作为教育机会不平等的上界和下界。表6 汇报了全国范围内、城市内部、农村内部的教育机会不平等总效应和直接效应的上下界。从其估计结果来看,每个估计结果的上界与下界偏离都不多,而且都与前面的估计结果偏离不大。这进一步说明本文的估计结果是比较稳健的①由于模拟过程比较耗时,所以在上下界的估计中我们没有用自抽样方法估计标准误。。

式(11)只是估计偏差的理论值,当解释变量与误差项不相关时,E ( XTu) =0,估计

表6 机会不平等上下界估计

六、研究结论和政策建议

教育公平是社会公平的基础,是促进社会流动的关键。20 世纪末以来,中国的高等教育扩张激发了研究部门对教育公平问题的广泛关注,其背后的一个根本原因是社会大众在高等教育扩张的过程中并没有明显感知到高等教育的机会平等情况得到改善,相反越来越多的人提出“寒门再难出贵子”的论点,对教育公平的呼声也越来越大。大量学术研究对这一现象进行了严谨的分析。有关高等教育机会平等的研究确实表明,高等教育资源的扩张并没给低社会阶层和弱势家庭带来更大的收益,相反高等教育阶段的机会不平等程度有上升的趋势。不少学者认为,高等教育阶段的机会不平等可能是基础教育阶段机会不平等的延续。然而,鲜有研究严谨地分析基础教育阶段的机会不平等问题。本文利用中国教育追踪调查数据对初中阶段的教育机会不平等进行了测算,为更加全面地了解中国的教育机会不平等问题提供了新证据。

研究基础教育阶段教育机会不平等与研究高等教育阶段教育机会不平等的最大差别是,基础教育阶段并没有太大的升学几率差异。因此,用是否升学作为基础教育阶段的教育结果变量并不合适。换言之,基础教育阶段的教育机会不平等主要体现在教育质量上的机会不平等。为此,教育结果变量的选择要尽可能反映教育质量的差异。中国教育追踪调查为研究这一问题提供了比较合适的数据基础。这套数据中的学生认知能力测试提供了可比的测试分数,利用这一数据能够更好地捕捉学生的教育质量差异信息,从而更精确地反映出基础教育阶段的教育机会不平等情况。

本文的研究结果表明,初中阶段的学生确实存在非常显著的教育结果差异,并且高年级的教育结果差异问题更加严重。通过教育机会不平等的测算我们发现,七年级的学生教育结果差异中有6%~11%是教育机会不平等导致的,而九年级学生的教育结果差异中有8%~22%是教育机会不平等导致的;农村学生的教育结果差异问题比城市学生这一问题更加严重,但是城市学生则面临比农村学生更加严重的教育机会不平等问题。通过对教育机会不平等各类环境变量的分解估计我们发现,学校特征(学校质量)依然是导致教育机会不平等的最关键因素。

从政策角度来看,本文给出了基础教育阶段存在教育机会不平等的直接证据,并证实学校差异是基础教育阶段教育机会不平等的最关键因素。因此,促进基础教育阶段的“质量均等化”将对保障中国教育公平有非常重要的意义。对农村而言,由于家庭背景对教育机会不平等的影响相对较小,所以政策的重点是提供优质的公共教育资源,提高办学质量。对城市而言,学校虽然也是影响教育机会不平等的最重要部分,但家庭背景的影响也不容忽视。所以,提供优质公共教育只是政策的一方面,还需要进一步规范市场上提供的大量教育资源。

猜你喜欢
教育资源机会分数
给进步一个机会
育见未来共创美好——2019未来学校行业年会暨教育资源交流会圆满落幕
一种快速比较分数大小的方法
把握物理难点,分数更上一步
给彼此多一次相爱的机会
没机会下手
吸收社会教育资源,创新法制教育方式
“多校划片”:治标还需治本
……的近似分数的若干美妙性质
奇妙分数与特殊数列自动生成