刘 晗
中国教育回报率的分布特征及地区差异
——基于中国社会综合调查(CGSS)2013年数据的实证分析
刘 晗
基于中国社会综合调查(CGSS)2013年的数据,分别使用最小二乘法(OLS)和分位数回归法(QR)估算不同收入水平和教育层次下的教育回报率,并分析其对收入差距的影响。研究发现:教育回报率随着收入的增加而递减,教育对缩小收入差距有正向影响。各教育层次的教育回报率分布情况不同。对于初等、中等教育层次,其回报率同上述一致。对高等教育层次,高收入群体的教育回报率更高。若一味的发展高等教育,必将导致“马太效应”。教育回报率还存在显著的地区差异,东、西部地区的收入差距存在进一步扩大的趋势,对于西部偏远地区,完善基础教育的同时鼓励职业教育对调节居民间收入差距更为有效。
教育回报率;分位数回归;收入差距
近年来,多项研究表明:我国的人口红利已经消失,经济增长主要依靠科技发展和制度创新。因此,加快从人口红利向人才红利过渡才能保证国家经济实现可持续稳态增长。提高教育水平是实现国家人才红利的基础,也是解决贫困代际传递的有力手段。
随着我国教育事业的发展,教育经费也逐年提升。提高教育水平对不同收入、不同性别、不同地区的个人收入是否有影响,教育能否缩小收入差距等成为研究热点。部分学者开展了基于教育回报率的测度分析实证研究。李雪松等人运用2000年微观数据估计20世纪末中国的教育回报,指出我国教育回报率显著提高,教育和劳动力对市场经济的发展起到重要作用[1]。张车伟指出教育回报率存在随收入增加而上升的趋势,即教育在一定程度上会导致居民收入差距扩大的“马太效应”[2]。刘生龙基于分位数回归和审查分位数回归对我国教育回报率进行实证研究,结果表明,教育对于中国居民的收入有正向促进作用,在各分位点教育对女性居民收入的回报高于男性[3]。徐舒通过考察技术进步、教育收益与收入不平等之间的关系,认为教育拉大了居民间收入的不平等,这与张车伟的研究结果一致[4]。刘生龙等人利用2007—2009年中国城镇住户调查数据,基于断点回归方法研究义务教育法的实施对个体受教育年限和教育回报率的影响,进一步论证了高收入群体教育回报率要高于低收入群体这一结果[5]。大部分学者对教育回报率的考察主要侧重不同时期不同地区的教育回报率的变化,并未对各教育层次上不同收入水平的教育回报率进行考察研究。笔者利用CGSS2013年调查数据,基于分位数回归对教育回报率的分布、地区差异及不同教育阶段的回报率进行实证研究,在此基础上分析教育对收入差距的影响。
(一)计量模型
Mincer考察人力资本对收入的影响,将工资收入表示为受教育年限、工作经验的函数,推导出明瑟模型,被广泛应用于探讨人力资本对收入回报的研究中。明瑟方程的函数形式如下:
式中:y是收入变量;x指影响收入的因素,一般为受教育年限、工作经验、性别、地区、职业等。
经典的明瑟方程只考察教育和工作经验对收入的影响,其具体形式为:
式中:ln(wage)为工资的对数;Sch指受教育年限;Exp为工作年限,代表经验变量;Exp2测度工作经验的非线性影响;β1的估计值即为教育的收益率。
经典的明瑟方程是完全竞争市场的教育纯收益。考虑到劳动力的市场分割,个人收入同时受性别、职业、地区等因素影响,笔者对变量进行调整,得到模型:
模型中新加入ΣλiXi为性别、地区的综合影响。由于教育质量与个人能力难以测度,故研究不考虑其影响。
(二)指标与数据
研究数据来源于中国社会综合调查(以下简称CGSS)2013年的调查结果。CGSS始于2003年,2013年数据调查涵盖了除港澳台与新疆、西藏和海南外的全国28个省、市、自治区,调查内容包括居民生活状态、教育、健康、职业、社会关系等各方面的信息,适合做教育回报率的研究。笔者主要选取被调查者出生年份、最高受教育程度、受教育状态(辍学、退学、肄业、毕业)、2012年全年总收入、职业性质、性别、所在地区、城市或农村8个变量估测教育回报率。
样本选择上,由于考察教育收益率,故只选取收入为正的样本,并排除年龄在60岁以上和16岁以下的样本。筛选后得到的有效样本为6 071个。
模型中被解释变量为工资。考虑到数据的可获得性,笔者选取2012年全年总收入变量来衡量居民收入。由于居民收入水平呈明显右偏态分布,故对其取自然对数,以减弱离群值和极端值的影响。采用对数处理后居民收入分布近似服从正态分布。
模型的解释变量设为居民的受教育年限Sch、工作经验 Exp、地区X1、性别 X2、城市或乡村X35个变量。其中,Sch由最高受教育程度和受教育状态决定。受教育程度被划分为未受教育、小学(包括私塾)、初中、普通高中、职业高中或技校(包括中专)、大学专科、大学本科、研究生及以上8个等级,其教育年限分别为 0、6、9、12、12、15、16 和 19 年。考虑受教育状态,对于未完成学业的样本,其教育年限为上层次学历年限加上未完成层次年限的一半。Exp由工作年限衡量,由年龄-受教育年限-6年的计算方式确定。 X1、X2、X3为虚拟变量,其取值为:东部地区 X1=1,中西部地区X1=0;男性 X2=1,女性 X2=0;城市X3=1,农村X3=0。
(三)计量方法
已有研究多使用最小二乘回归对教育回报率进行估计。但是,最小二乘估计有以下几方面的不足:一是最小二乘估计更容易受异常值影响,导致回归结果不精确;二是存在内生性问题,如个人能力变量不可获得,故模型将其归为扰动项使得扰动项与解释变量相关,从而导致最小二乘回归结果不具有一致性,通常使用工具变量法解决此类问题;三是最小二乘回归要求严格,研究实际问题时难以满足,从而使得回归结果不稳健。
分位数回归的基本思路是寻求使得残差绝对值的加权平均最小的系数估计值β^,即若对样本做q分位数回归,其目标函数为:
分位数回归计量结果不受极端值影响,较为稳健。
分位数回归可以对不同分位点的教育回报率进行测度,反应不同收入水平的教育回报率的差异,便于我们考察其分布特征。对不同收入水平的分位数回归在一定程度上解决内生性问题。并且,分位数回归对研究总体的分布无严格要求。因此,笔者使用分位数回归法考察我国的教育回报率。
笔者分别使用最小二乘回归(OLS)和分位数回归(QR)2种方法对教育回报率进行估测。
(一)数据的描述性统计
选取CGSS2013年中所需变量,进行数据筛选处理后得到607 1个有效样本。变量的描述性统计见表1。
从表1中可以看出,2012年我国平均受教育年限约为9.5年,学历高于初中的人数占比超过50%。从样本分布来看,中西部地区样本量比较多;从性别来看,男性占比较高;从城乡看,城镇居民比重较大。
(二)最小二乘估计
首先运用Stata对式(2)即经典的明瑟方程做最小二乘估计,结果如下:
以上各变量系数估计值均在5%显著性水平下显著,收入与教育年限、工作经验正相关,调整的可决系数R2的值为0.306 9,可以认为模型拟合效果较好。从估计结果看,不考虑地区等因素的影响,2012年我国教育回报率大致为10.97%。考虑地区、性别和城乡因素的影响,最小二乘回归结果为:
调整后模型的可决系数为0.441 4,说明加入虚拟变量后,模型的拟合度变得更好,同时各系数均显著。从回归结果看,教育对收入的影响明显降低,教育回报率约为5.57%,几乎是教育纯收益的一半,这说明教育的收入效应在很大程度上受地区、性别、城乡等因素的影响。在其他条件不变时,东部地区居民的收入比中西部高52.88%,这也解释了当前劳动力向东部发达地区流动这一现象。在其他条件不变时,男性收入比女性高42.37%,而城市居民收入比农村的高47.75%,地区、性别和城乡等因素均对居民收入有显著影响。
(三)分位数回归估计(QR)
对调整的明瑟方程做分位数回归,分别选取0.1、0.2、…、0.9共9个分位点,并将结果与OLS回归进行比较,回归结果见表2。
表1 变量的描述性统计
根据回归结果可以看出,由于异常值等因素的影响,OLS回归系数略低于QR回归,通过Stata中Test检验得到拒绝各分位点回归系数相等的假设,且教育回报率随着分位点的逐渐提高而降低。回归结果表明教育回报并不会导致“马太效应”,而低收入家庭可通过接受教育使得自身收入提高,缩小与高收入家庭的差距,此种差异可能源于数据或所选变量的不同。工作经验对收入的影响在各分位点无明显变化趋势。地区差异对工资的影响随着收入增加呈现递减的趋势。在0.1分位点上,其他因素不变时,东部地区居民的工资收入比中西部地区的高65.9%;随着分位点的增大,系数逐渐减小;在0.9分位点,这一差距为45.1%。性别与城乡差异对工资的影响同地区类似,也是随着分位点增大逐渐递减。但是,回归中的常数项呈现出随着收入增大而逐渐增加,在其他因素均为零时,收入最高的10%群体的工资是收入最低的10%群体的工资的2倍多。
(四)不同教育层次教育回报率的比较
1.各教育层次数据的描述性统计
为了便于相互比较不同受教育的程度,笔者将其分为小学、初中、高中、职业教育(包括职业高中或技校或中专)、高等教育(大专及以上)5个层次。各层次样本量分别为 1 183、1 947、771、515 和 1 281。 各教育层次数据的描述性统计见表3。
根据描述性统计结果可以看出,随着教育层次的提高,居民的工资收入明显提升,标准差逐渐减小,工资收入分布越来越集中。在小学、初中、高中和职业教育层次上,收入的中位数均高于其均值,收入分布呈左偏态分布,即有低收入极端值存在。在大专及以上的教育层次上,收入的中位数低于均值,说明其呈右偏态分布,即有收入很高的极端值存在。在各教育层次样本中,男性均多于女性,城市居民多于农村居民,且随着教育层次的提高,东部发达地区样本量占比上升。大专及以上的教育层次中,57.97%的样本来自东部发达地区。城乡间差异与地区间一致,数据表明接受过高等教育的人中有95.47%的人居住在城市,进一步反映东西部地区教育水平存在差距,且劳动力的地区迁移与受教育水平和收入水平有关。
表3 各教育层次数据的描述性统计
2.回归结果分析
利用分位数回归对0.1~0.9分位点进行估计,回归结果显示小学教育仅仅对收入水平最低的10%样本有显著影响。不同教育层次分位数回归结果见图1。
图1 不同教育层次分位数回归结果
分析图1可得,从整体上看,大专及以上教育层次的教育回报率最高,其次是职业教育。在不同教育层次,教育回报率在不同分为点的变化趋势不一致。具体来看,大专及以上教育层次的回报率随着收入的增加而上升;职业教育层次回报率随收入增加呈先增后减的倒“U”型;中学阶段教育回报率随收入增加而下降。在低分位点上,高中教育的回报率最高;在20%~35%分位点,职业教育的收益率最高;在高分位点,高等教育回报率最高。一般认为高等教育门槛高,限制低收入群体接受高等教育的机会,从而会扩大收入差距。从研究实证结果看,即使降低高等教育门槛,也难以缩小收入差距。对于低收入地区或群体,保障其完成中学教育,鼓励职业教育对缩小差距更加行之有效。
3.教育回报率的地区差异
分析东部发达地区和中西部欠发达地区教育回报率的差异,不同地区教育回报率的回归结果见图2。
图2 不同地区教育回报率的回归结果
东部地区教育回报率随着分位点的增大呈先减后增趋势;中西部地区教育回报率随着分位点的升高而降低;东部地区明显高于西部地区且差异呈扩大趋势。教育回报率差异不仅源于教育年限不同,还有教育质量差异。东部发达地区具有优越的地理位置、经济条件和教育资源,即使接受同样年限的教育,其教育质量也要普遍高于经济不发达地区。随着收入的提高,地区间收入差距随着教育回报差距的增大而增大,鼓励劳动力向高回报地区流动,摒除劳动力流动壁垒,才能有效缩小居民收入差距。
笔者基于CGSS2013年的调查数据,分别利用OLS和QR方法对我国教育回报率及其分布情况、层次地区差异进行考察,得到以下5点结论。第一,完全竞争市场的教育回报率(教育纯收益)远远高于不完全竞争市场,地区、性别、城乡均对收入有显著影响,说明劳动力市场存在严重分割,教育对收入的影响效应很大程度上是通过就业途径实现的。第二,随着分位点的上升,教育回报率呈下降趋势,说明低收入家庭可以通过接受教育缩小与高收入家庭的差距,教育不会导致“马太效应”。第三,不同教育层次的回报率差异明显,整体上看,教育回报率从高到低的顺序依次为大专及大专以上教育层次、职业教育层次、初中和高中教育层次,在低分位点上职业教育回报率最高,高分位点上大专及以上的高等教育回报率最高。第四,不同教育层次的回报率随收入的变动呈不同变动趋势。整体上看,大专及以上的高等教育层次回报率随着收入的增加而上升,职业教育层次的回报率随收入增加呈先增后减的倒“U”型,中学阶段教育层次的回报率随收入增加而下降。第五,我国教育回报率存在较大的地区差异。东部地区的教育回报率远远高于中西部地区,且差距有扩大趋势。东部地区教育回报率随着分位点的提高呈先降后升的“U”型趋势,中西部地区总体呈下降趋势。
基于以上结论得出如下政策建议。第一,完善基础教育。初等教育是教育的基础,尤其对于西部欠发达地区,其初等教育收益率最高,故应加大投入力度,保证全民完成义务教育。第二,发展职业教育。近年来国家大力支持高等教育,忽视职业教育,然而从实证结果看,高等教育回报率随着收入的增加而增加,若一味发展高等教育必然导致收入差距扩大的“马太效应”。对于低收入家庭,接受职业教育是其缩小收入差距的最优选择。第三,加大对低收入家庭的扶持力度。低收入群体教育收益率普遍高于高收入群体,扶持低收入群体接受更多教育会得到更高的回报,故应该加大对低收入家庭的教育辅助。第四,完善劳动力市场。劳动力的市场分割会降低教育回报率,故应完善劳动力市场,实现人才自由地向高回报率地区、部门流动,实现人力资源的最优配置。
[1]李雪松,詹姆斯·赫克曼.选择偏差、比较优势与教育的异质性回报:基于中国微观数据的实证研究[J].经济研究,2004(4).
[2]张车伟.人力资本回报率变化与收入差距:“马太效应”及其政策含义[J].经济研究,2006(12).
[3]刘生龙.教育和经验对中国居民收入的影响:基于分位数回归和审查分位数回归的实证研究[J].数量经济技术经济研究,2008(4).
[4]徐舒.技术进步、教育收益与收入不平等[J].经济研究,2010(9).
[5]刘生龙,周绍杰,胡鞍钢.义务教育法与中国城镇教育回报率:基于断点回归设计[J].经济研究,2016(2).
(编辑:唐龙)
F014.32
A
1673-1999(2017)08-0059-05
刘晗(1994—),安徽财经大学统计与应用数学学院统计学专业2016级硕士研究生,研究方向为经济统计。
2017-06-05