王 彩 勤,秦 昆,2*,卢 宾 宾,蒋 亚 丽
(1.武汉大学遥感信息工程学院,湖北 武汉 430079;2.地球空间信息技术协同创新中心,湖北 武汉 430079;3.武汉大学社会学系,湖北 武汉 430079)
教育及其代际流动的空间分布研究
王 彩 勤1,秦 昆1,2*,卢 宾 宾1,蒋 亚 丽3
(1.武汉大学遥感信息工程学院,湖北 武汉 430079;2.地球空间信息技术协同创新中心,湖北 武汉 430079;3.武汉大学社会学系,湖北 武汉 430079)
教育及其代际流动是社会科学领域的重要问题,社会调查与分析是其重要研究手段,传统方法主要利用一般统计分析方法,缺乏有效的地理空间分析技术的支持。该文以武汉市社会调查数据为例,研究了地理空间分析技术支持的教育及其代际流动的空间分异规律,利用Logistic回归分析方法探索了子女与父辈接受高等教育情况的关系,利用地理加权回归分析方法研究了代际流动效应的空间分布。研究结果表明:父辈受过高等教育的子女受高等教育的可能性更大;子女受教育的时间会随父辈受教育时间的增加而增加,教育体现出封闭性,代际流动性不明显;武汉市东北和中部区域的地理加权回归系数较西南区域小,体现了较为明显的区域代际流动性。
教育;代际流动;Logistic回归;地理加权回归;空间分布
代际流动是指同一家庭中两代人之间社会地位的变动。一般以职业、教育程度等作为地位特征,对比子女与父母的情况,观察社会地位有无变化或提高[1]。在一个封闭固化的社会环境里,代际流动很少,大多数个体出生就注定子承父业,其地位获得与其父代地位相关;而如果这种相关性较小或者没有显著关联,则代表这个社会公平开放程度较高,每个阶层的大门是开放的,代际流动必然增多[2,3]。美国社会学家布劳与邓肯提出的地位模型指出,几乎所有国家的实证研究都验证了教育在代际流动中发挥了重要作用,而教育的代际流动现状是父母对子女受教育程度的影响非常大[4,5]。
教育公平一直是中国关注的焦点,教育及其代际流动也一直是社会学等领域的研究热点。国内外关于教育及代际流动的研究很多。Bloome等分别考虑不同种族不同时代背景的两代人的收入及教育代际流动,发现在不同年龄组和不同种族中,子女与父母的受教育程度均呈正相关[6]。Blau等在研究职业代际流动时发现,在美国,职业的代际流动明显,父亲对儿子的影响在很大程度上是通过教育实现的[7]。Walpole发现大学生的社会地位起源(父母决定)会影响其学校生活和成就。相对其父母,低社会地位学生的社会地位会向上流动,但是高社会地位家庭出身的学生依旧占据优势。相比于处于高社会地位的同龄人,低社会地位出身的学生受教育程度更低[8]。刘志民和杨春华等在研究家庭资本对社会地位获得的影响时,指出具备优势地位的家庭会将家庭资本转化为教育机会的优势,而农村家庭由于资本的匮乏,会采用各种方式弥补这种欠缺,他们用一种无形文化资本换取文化资本,扩展了家庭文化资本的范畴[9,10]。王晓焘指出家庭规模对子女教育的获得存在负向影响[11]。
综上发现,现有研究主要从社会学等角度出发,主要探索代际流动的规律及其成因,较少考虑教育代际流动的空间特征及其量化。本文不仅采用Logistic回归分析方法对高等教育的代际流动进行分析,而且将空间异质性特征纳入研究,在不同空间尺度上利用地理加权回归模型(GWR)对教育的代际流动进行分析,能够得到不同空间位置上教育的代际流动情况,发现代际流动的空间分布规律,这是传统方法无法比拟的。地理加权回归假定回归系数是观测点地理位置的函数,将数据的空间特性纳入到模型中,在空间上考察多个因素的相关关系。目前关于地理加权回归的研究很多,如张耀军等利用GWR对山区人口分布的影响因素进行研究,发现社会经济因素对人口分布的影响大于自然因素[12];庞瑞秋等基于GWR分析人口普查和统计年鉴相关数据,发现吉林省人口城镇化动力机制及其空间分布规律[13];吕萍、汤庆园等利用GWR探索影响城市住宅用地价格和房价的因素及其空间分布规律[14,15]。但是将GWR用于教育代际流动分析的研究较少。
1.1 研究区域
武汉市是全国重要的科教基地,作为拥有全国高校数量最多的城市,武汉市人口的受教育程度较高。根据2014年武汉市社会综合状况调查结果,2014年武汉市大学生比例为22.5%,远远高于全国的平均值,研究生的比例达到3.3%。本研究涉及武汉市12个辖区,不仅考虑7个主城区,还将黄陂区、蔡甸区等近郊区划入研究范围内,以期在最大程度上考虑武汉市家庭教育在空间上的分异。
1.2 数据来源及处理
本研究实验数据来自2014年武汉大学社会调查中心发起的覆盖整个武汉市的社会综合状况调查项目,调查的对象为武汉市居民,采用多层次随机抽样调查法。表1为调查问卷部分示例数据,主要为住户成员情况。分析数据发现父母受教育时间存在一定共线性,因此研究中父代只考虑父亲。选取父亲和子女的教育数据为主要研究数据,通过父亲和子女在教育上的关联程度反映代际流动性的优劣。本实验中受教育年限代表受教育的时间长短,研究对象中的子女年龄最小值设定为18岁。对于父亲年龄缺失的情况,取子女年龄相同的样本的父亲年龄的算术平均值作为缺失组的父亲年龄;如果父亲的受教育程度缺失,则用母亲的受教育程度补全缺失值。由于东西湖区的调查数据不完整,实验不考虑东西湖区。最后保留1 239份样本,图1为样本点的空间分布图。由于对居委会的抽样是按照多层随机抽样进行,即根据各区人口数首先确定各区要抽取的街道办数量,再按照人口数确定每个街道办要抽取的居委会数量,因此居委会样点在空间上具备和武汉市人口相似的分布特点:中心区域密集,周边地区稀疏,空间上分布不均匀。
表1 住户成员情况
利用算术平均法计算一个区或居委会内所有受访家庭的父亲平均年龄、父亲平均受教育年限、子女平均受教育年限和子女平均年龄,处理后得到12个区、59个居委会的数据。
注:因为一个居委会内存在多个样本数,故最终显示在地图上的点只有59个(居委会数量)。
图1 样本点分布
Fig.1 The distribution of sample points
1.3 研究方法
1.3.1 二元Logistic模型回归 采用二元Logistic模型回归研究子女与父亲接受高等教育状况的关系。二元Logistic回归主要用于因变量是二分类变量的回归分析,即Y只取0和1两个值的回归模型,分别对应子女不接受大学教育和接受大学教育。设有k个影响因素影响Y的值,则二元Logistic总体回归形式为:
(1)
式中:P为事件发生的概率;βi表示因素Xi改变一个单位时,事件发生与不发生的概率之比的对数变化值,即子女接受高等教育和不接受高等教育的概率之比的对数变化值。
1.3.2 地理加权回归 采用地理加权回归分析不同空间位置上父亲与子女之间受教育时间的相关性。地理加权回归能够弥补普通最小二乘法(OLS)不考虑空间非平稳性的缺点,将样点数据的位置信息嵌入到回归参数之中,得到的回归参数不再是全局参数而是局部参数估计[15]。GWR的基本模型为[16]:
(2)
式中:yi是第i个采样点处的因变量;βi0是位置i处的截距; βik是第i个采样点上的第k个回归参数,是地理位置的函数;xik是位置i处的第k个自变量;m是自变量的个数;εi是第i个采样点的随机误差,εi~N(0,σ2)。
根据问卷计算每个区受访对象的大学生比例,结果如表2。发现在武汉市中心区域,受过高等教育的采访对象的比率大于30%,高于武汉市大学生比例(22.5%);而在黄陂区等近郊区域,受过高等教育的采访对象所占比率均不到10%,差距明显。
表2 2014年武汉市各区大学生比例
此次调查结果显示,在武汉市子女的平均受教育时间为12.58 a。武昌区平均受教育时间最长,为14.05 a,与武昌区地处文化中心的事实契合;最短的是地处郊区的蔡甸区,为10.12 a。如图2a(彩图见封2),处于市中心区域的子女平均受教育时间明显长于郊区的子女平均受教育时间,越是地处市中心区域,子女的平均受教育时间越长。说明在空间上,处于武汉市中心地区的家庭的子女受教育程度更高。
以居委会为研究单位,分析武汉市各居委会子女平均受教育时间(图2b,彩图见封2)。珈智居委会中子女平均受教育时间最长,为16.54 a,平均学历为大学本科;而群力村子女的平均受教育时间为9.21 a,基本维持在九年义务教育的水平。受教育程度较高的居委会集中在武汉市区,说明市中心的居民接受更高教育的机会更多,或者接受更高教育的人口更倾向于向市中心流动。
综上发现,来自武汉市中心地区家庭的子代更有可能接受更高的教育。这种空间分布的形成是否受到父亲受教育程度的影响、这种影响是正向还是负向以及这种影响在不同地区有多大,都是本文将探究的问题。研究父亲与子女在教育方面的联系,进而发现武汉市教育的代际流动情况。
图2 子女平均受教育时间
由于不同区域之间的经济发展水平、人口数量及综合素质等因素不同,教育的代际流动效应在不同的区域体现了一些差别。常用的统计方法忽略了空间维度,不能从空间的角度揭示现象在空间上的分布情况。本文首先用Logistic回归模型对代际流动进行研究,然后利用地理加权回归模型对代际流动的空间分布进行分析。
3.1 Logistic回归模型分析
选用二元Logistic回归模型研究子女与父亲在接受高等教育方面的相关关系。根据子女是否受过高等教育(CHE)将子女受教育程度进行二分类,定义为二元Logistic回归的因变量,CHE=1代表受过高等教育,CHE=0则表示未接受高等教育;模型的自变量为父亲是否受过高等教育(FHE)、父亲年龄(FA)、子女年龄(CA)及其性别(CG)。FHE的编码同CHE的编码;父亲及子女年龄均为2014与各自出生年份的差值;子女性别(CG)的编码为:男性对应CG=1,女性对应CG=0,得到模型的指标体系如表3。
根据表3及二元Logistic回归模型,建立回归方程如式(3):
(3)
式中:P为子女受过高等教育的概率;βi表示对应自变量改变一个单位时,子女接受高等教育和不接受高等教育的概率之比的对数变化值。
表3 模型指标体系
运行模型得到的实验结果如表4。其中,B代表式(3)中的βi,即得到的偏回归系数;S.E为标准误差,其值越小越好;Wals为卡方值,用来检验自变量对因变量是否有影响,其值越大,或者说它对应的Sig.越小,则影响越显著;df为自由度;Sig.为显著度,一般小于0.05代表有意义,模型中Sig.=0,代表都通过了显著性检验;Exp(B)为优势比,即相比于父亲没有受过高等教育的子女,父亲受过高等教育的子女接受高等教育的概率是前者的Exp(B)倍。
表4 方程中的变量
表4显示模型最终包含父亲是否受过高等教育(FHE)和子女年龄(CG)两个自变量,得到回归方程:
(4)
可以看到,父亲年龄和子女性别对子女是否接受高等教育没有影响;FHE的回归系数为正数,说明父亲是否受过高等教育对子女是否接受高等教育存在正向影响。相比于父亲没有受过高等教育的子女,父亲受过高等教育的子女接受高等教育的概率是前者的13.659倍(e2.614倍,Sig.=0.000)[17],其接受高等教育的机会更大,教育体现出了封闭性,与代际流动相违背。子女年龄的回归系数为负数,说明年龄越大,受过高等教育的概率越低。这说明,年轻一代的子女接受高等教育的概率更大,这也反映了社会的进步:随着时间推移,高等教育在普及面上更加开放公平。
3.2 地理加权回归模型分析
应用地理加权回归的前提是数据具有空间相关性,本文采用Moran′sI指数探测空间相关性。以区为研究单位,子女平均受教育时间全局相关性为0.54,Z得分为4.89,子女平均受教育时间表现出强烈而显著的空间正相关性;以居委会为研究单位,子女平均受教育时间的全局相关性为0.41,Z得分为6.04,同样也表现出强烈而显著的空间正相关性。
在地理加权回归模型的设计中,模型的因变量为子女平均受教育时间(childedu),自变量为父亲平均受教育时间(fatheredu),设第i(i=1,2,…,n)个研究对象(辖区或居委会)的地理中心坐标为(ui,vi),根据上述设定的变量关系,构建地理加权回归模型:
childedui=βi0(ui,vi)+βi(ui,vi)fatheredui+εi
(5)
利用R软件中GWmodel包进行地理加权回归模型的计算[18],对于带宽的选择,以区为研究单位时,选用固定带宽,运行GWmodel函数bw.gwr,并根据AICc(校正后的赤池信息指数)最小原则,得到最优带宽为0.952;以居委会为研究单位时,选用自适应带宽,同样运行函数bw.gwr并根据AICc最小原则,发现当N(最近邻点的数量)=35时得到最优带宽。表5是以区和居委会为研究单位,应用GWR模型得到的诊断结果。
表5 GWR的诊断信息
表5显示,GWR拟合效果非常显著。以区为单位时,模型可以解释子女平均受教育时间空间总异变的92.2%,以居委会为单位时,模型的解释能力也可以达到76.3%。根据表6显示结果,两次模拟得到的估计参数均能通过显著性检验,其系数在 95% 置信度上具有统计显著性。表5和表6共同说明了两次GWR拟合实验的可靠性。
表6 GWR模型的F检验
应用GWR模型,可得每一个空间单元的回归系数。两次实验的结果如表7,可以看出,在区和居委会两个研究尺度内,父亲平均受教育时间对子女的平均受教育时间的影响都是正向的,且在空间上波动比较平稳,回归系数在较小的范围内波动。根据实验数据,在一个区内,如果父亲的平均受教育时间增加1 a,则子女的平均受教育时间增加1.018~1.254 a;而在一个居委会内,则会增加0.447~1.314 a。结果说明,父亲受教育时间增加1 a,则子女受教育时间会增加1 a左右。
表7 GWR的估计参数统计
从表5中还可以发现,研究尺度越大,AICc值越小,地理加权回归模型的拟合程度越好[19]。可能的解释是大尺度是以平滑近邻空间的细节差异来提高模型的拟合度,但这并不利于反映研究区域的真实情况。图3是两次地理加权回归实验的回归系数的空间分布。对比图3中的两个尺度的结果发现,大尺度更利于宏观了解武汉市教育的代际流动效应,小尺度则能够在居委会尺度上提供更详细的信息,结合两个尺度能够更好地反映研究区域的信息。
图3 父亲受教育时间回归系数分布
以辖区为单位时(图3a),从西南至东北方向回归系数呈递减趋势;以居委会为单位时(图3b),中心地区回归系数小于近邻空间的回归系数,形成了低谷值。图3b能够更好地展现回归系数在空间变化的细节。同时,两个尺度下得到的回归系数在空间上均存在西南方向回归系数比东北方向回归系数大的现象,中心地区回归系数较小,南北部回归系数大小相当。说明在西南区域,父亲的平均受教育程度对子女的平均受教育程度的影响比东北区域稍大,东北区域的教育代际流动比西南地区显著。此现象的原因可能是东北地区靠近洪山、武昌等文化中心地区,综合环境较好,教育的代际流动较西南地区明显。结合武汉市家庭受教育程度的空间特征分析发现,回归系数的分布趋势与子女平均受教育时间的分布趋势相反。子女平均受教育时间表现为中心地区的平均受教育时间长;但中心区域的回归系数偏小,代际流动作用比郊区明显。此现象的原因可能是在一个社会环境中,人口的整体受教育程度对代际流动存在影响。
本文以武汉市为例,基于二元Logistic回归分析与地理加权回归分析方法研究了教育代际流动及其空间分布,结论如下:
父辈接受高等教育的状况与子女接受高等教育的状况具有显著的正相关关系,即:如果父辈受过高等教育,则子女接受高等教育的可能性更大;子女年龄与其接受高等教育的状况呈负相关关系,说明年轻一代的子女接受高等教育的概率更大,我国高等教育的普及面逐步扩大,高等教育逐步开放公平。子女接受教育时间随父辈接受教育时间的增加而增加;地理加权回归系数从武汉市西南到东北呈大致递减趋势,中心地区回归系数较小。说明武汉市中心及东北区域的教育代际流动比西南地区显著,社会环境更加开放。总体而言,在武汉市,父辈的受教育程度一定程度上影响了子女的受教育程度,代与代之间的教育出现了一定程度上的延续性,尤其是地处武汉市郊区的各个辖区,有待进一步提高人口的平均受教育程度,并弱化代际传递效应。
本文对GIS空间分析支持下的教育代际流动及其空间分布进行了探索,还需要从以下几方面进一步研究。1)社会调查数据还需进一步丰富,如需补充东西湖区的教育状况调查数据;2)对研究对象的年龄设置还需进一步探讨,从而避免研究对象年龄跨度过大的现象;3)对利用地理加权回归模型得出的教育代际流动的空间分布差异的原因还需深入分析;4)本文探索了两代人在教育上的联系,得出父辈受教育程度对子女受教育程度的影响,但是子女受教育程度还与父辈职业和家庭经济条件等因素存在较大关系,因此,对子女受教育程度影响因素的探索将是需要深入研究的方向。
[1] 廖盖隆.马克思主义百科要览[M].北京:人民日报出版社,1993.
[2] 赵淑亮.凝固与流动:清至民国西藏城市社会流动研究[J].西藏大学学报(社会科学版),2014,29(01):165-173.
[3] 王甫勤,时怡雯.家庭背景、教育期望与大学教育获得基于上海市调查数据的实证研究[J].社会,2014,34(01):175-195.
[4] 张翼.家庭背景影响了人们教育和社会阶层地位的获得[J].中国社会科学院研究生院学报,2010,178(04):82-92.
[5] 王处辉,朱焱龙.高等教育获得与代际流动:机制、变迁及现实[J].中南大学学报(社会科学版),2015,21(02):174-181.
[6] BLOOME D,WESTERN B.Cohort change and racial differences in educational and income mobility[J].Social Forces,2011,90(2):375-395.
[7] BLAU P M,DUNCAN O D.Some preliminary findings on social stratification in the United States[J].Acta Sociologica,1966,9(1-2):4-24.
[8] WALPOLE M B.Socioeconomic status and college:How SES affects college experiences and outcomes[J].Review of Higher Education,2003,27(1):45-73.
[9] 刘志民,高耀.家庭资本、社会分层与高等教育获得--基于江苏省的经验研究[J].高等教育研究,2011,32(12):18-27.
[10] 杨春华.“无形文化资本”与农村家庭社会地位的获得:基于对农村调查的思考[J].山东社会科学,2014,228(08):87-92.
[11] 王晓焘.城市青年独生子女与非独生子女的教育获得[J].广西民族大学学报(哲学社会科学版),2011,33(05):28-34.
[12] 张耀军,任正委.基于地理加权回归的山区人口分布影响因素实证研究--以贵州省毕节地区为例[J].人口研究,2012,36(04):53-63.
[13] 庞瑞秋,腾飞,魏冶.基于地理加权回归的吉林省人口城镇化动力机制分析[J].地理科学,2014,34(10):1210-1217.
[14] 吕萍,甄辉.基于GWR模型的北京市住宅用地价格影响因素及其空间规律研究[J].经济地理,2010,30(03):472-478.
[15] 汤庆园,徐伟,艾福利.基于地理加权回归的上海市房价空间分异及其影响因子研究[J].经济地理,2012,32(02):52-58.
[16] LU B B,HARRIS P,Charlton M,et al.The GW model R package:Further topics for exploring spatial heterogeneity using geographically weighted models[J].Geo-spatial Information Science,2014,17(2):85-101.
[17] 梁辰,王诺.基于Logistic回归的沿海经济区建设用地演变驱动因素研究--以大连市新市区为例[J].地理科学,2014,34(05):556-562.
[18] GOLLINI I,LU B B,CHARLTON M,et al.GWmodel:An R package for exploring spatial heterogeneity using geographically weighted models[J].Journal of Statistical Software,2015,63(17):1-50.
[19] 宁秀红,郭龙,张海涛.基于空间自回归和地理加权回归模型的不同尺度下土地利用程度研究[J].华中农业大学学报,2013,32(04):48-54.
Spatial Distribution Analysis of Education and Its Intergenerational Mobility
WANG Cai-qin1,QIN Kun1,2,LU Bin-bin1,JIANG Ya-li3
(1.SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,Wuhan430079;2.CollaborativeInnovationCenterofGeospatialTechnology,Wuhan430079;3.DepartmentofSociology,WuhanUniversity,Wuhan430079,China)
Intergenerational mobility of education,which is essential for sociology and education,is analyzed by using social survey methods.Traditionally,it focused on common statistical methods,neglecting geospatial analysis.This paper explores the spatial heterogeneity of education and its intergenerational mobility based on geospatial analysis techniques by using the social survey data in Wuhan.Firstly,it applies Logistic regression model to analyze the effect of whether fathers accept higher education on the rates in higher education for their offspring,and then it introduces geographical weighted regression to study the spatial distribution of intergenerational mobility.The following results are obtained:1) Children with highly educated father seem to be more likely to accept higher education and the correlation between the education of two generations is positive.In other words,it presents the closure in education and its weak intergenerational mobility.2) The regression coefficients obtained by geographical weighted regression,which are smaller in the central and northeastern regions of Wuhan,reveal relatively stronger intergenerational mobility in these areas than that in southwestern regions.This paper can be further studied as follows:1) The reasons for this spatial pattern need to be further excavated.2) More factors affecting children′s education can be taken into consideration.
education;intergenerational mobility;Logistic regression;geographical weighted regression;spatial distribution
2016-08-23;
2016-10-21
国家自然科学基金项目(41471326);中央高校基本科研业务费专项资金项目(2042015kf0183)
王彩勤(1990-),女,硕士研究生,研究方向为空间数据分析与挖掘。*通讯作者E-mail:qink@whu.edu.cn
10.3969/j.issn.1672-0504.2016.06.010
G526.5;O212.1
A
1672-0504(2016)06-0057-06