方宇惟
非农就业就是在农业部门以外的部门就业并领取工资。在传统的城乡分隔的中国,户口与就业紧密相连,农村户口的农民从事农业生产活动,城市户口的居民居住在城市,从事工业生产和三产服务。然而随着城乡联系的强化,对中国就业人口结构再做这样的理解是不符合经济发展实践的。越来越多的农民涌向城市,也有越来越多的工厂进驻农村,越来越多的农民像工人一样,工资成为了他们家庭收入的重大来源。
与此相关的是关于非农就业内部的工资收入不平等问题。长久以来,收入差异不仅仅是一个经济学问题,同时也是一个社会问题,不仅不同国家、不同地域之间存在收入差异,相同国家、相同地域的不同部门间也存在收入差异,即使是来自相同地域、相同部门和相同生产岗位的劳动者,其收入也表现出极大的差异性。如果把劳动者自身素质以外的因素看做是引起个体收入差异的随机因素,那么,劳动者本身的素质就应该能够解释收入差异的大部分。然而,实证研究的结果并非如此。
明瑟在1970年代提出了一个至今仍被广泛使用的工资方程,该方程在度量工资收入和教育回报领域的研究非常普遍。与本文主题相关的研究教育对中国工资的贡献率的文献也可谓汗牛充栋,研究结果也各异。如李晓飞(2010)的研究结果印证了农村教育回报率上升的趋势,徐舒(2010)则认为教育的回报扩大了工资收入的不平等,而何亦名(2009)则认为高等教育的收益率呈现上升趋势,同时在劳动力市场上出现了高学历对低学历的替代现象。在对教育收益率的估算上,除了罗楚亮(2007)等少量研究得到教育收益率随着教育程度的提高而下降之外,其他大部分的研究认为教育收益率随着教育程度的提高而上升。
如果说工资差异随着教育收益率的提高而提高,那么工资收入不平等的问题也就随之而来。但是,如果观测到了数据表现出来的非农工资收入不平等问题,是否就能简单地认为这就是因为教育收益率的提高带来的呢?这样的判断显然是比较武断的。首先,教育收益率的提高并不直接带来工资收入不平等的扩大,这和经济增长与收入不平等的关系类似,但是更加复杂。在经济增长与收入不平等问题上,库兹涅茨在1950年代提出了倒U假说,然而在教育率的提高与工资收入不平等方面,并没有类似的猜想。教育收益率的提高在不同教育层次和不同个体上都有差别,而这种差别很有可能是由个体特征决定的,因此,教育收益率在不同教育层次和不同个体上的不同表现,很有可能是一个自选择的过程。其次,明瑟方程的总体解释力度是比较低的,在本文的数据拟合中,在没有控制变量的情况下仅有10%。因此能够推断,仅有教育和经验的明瑟方程并不能很好地解释工资来源,因而教育收益率以及经验对工资的贡献率也有待进一步验证。20世纪后期,Juhn、Murphy和Pierce提出了对工资不平等的JMP分解方法,这种方法认为残差能够解释工资收入的大部分。其中,残差被分解为不可观测的技能以及对不可观测技能的回报。JMP得出的结论是工资不平等主要来自于对不可观测技能的回报的提高。Lemieux在JMP方法的基础上考察了工资不平等的结构效应,即对技能要求的提高和技能回报的提高是一种引起残差工资不平等增加的结构效应,即DFL方法。Machado和Mata基于边际工资分布重新构造了度量工资不平等的变量,他们分别构造了代表工人特征变化的变量和代表特征回报变化的变量,即MM方法。
本文对工资不平等的研究跟随MM方法的思路,构造了代表不平等程度的变量,不同的是,本文并不是基于残差进行构造,而是对总体数据,包括对解释变量和被解释变量都进行相同思路的转换,然后使用转换后的变量进行回归,希望得出一种比较直接的判定教育对工资收入不平等影响程度的方法。
本文使用的数据来自中国健康与营养调查CHNS(China Health and Nutrition Survey)的中国家庭入户调查数据(删除了没有工资收入以及工资收入为负的观测)。劳动者年收入都以2009年的CPI进行了调整(见表1)。数据样本既包括城市样本,也包括农村样本,因为不仅城市劳动者,而且越来越多的农村劳动者也成为非农就业者。据国家统计局农民工调查检测数据显示,2011年全国农民工总量达25278万人,因此综合考察城市户口和农村户口的劳动者工资收入会更有意义。
数据中的工资不平等信息见表2。从基尼系数来看,1990年代之前工资不平等有下降的趋势,这可能是因为从1980年代前期开始的改革开放和有限的自由市场开放使得人们有更多就业机会,各部门的工资也处于比较平稳的起步阶段,因此人们的工资收入也趋向于平等。1990年代初期有一个工资不平等的扩大,然后在整个1990年代都比较稳定。工资不平等程度的巨大变化出现在2004年到2006年再到2009年间,基尼系数从0.373增加到了0.491,再增加到了0.512。这种特征也同样表现在工资方差和由高分位与低分位之比衡量的总体不平等程度上。但是,总体不平等差距的扩大,主要源于低工资组内不平等差距的扩大。
表1 1989年~2009年数据信息
表2 各年工资收入不平等程度表现
明瑟方程(如下)或者是加入更多控制变量的扩展的明瑟方程是研究工资收入最为著名的经验性模型。
被解释变量为工资自然对数,解释变量分别为:教育年限、经验以及经验的平方。回归结果见表3,教育回报率在2.1%~7%,与其他文献结果比较,处于比较低的水平。用如此低的教育回报率来解释工资不平等程度并不十分令人信服。
本文构建了一个相对差距即个体变量对样本均值的离差与样本均值之比来度量个体对平均值的偏离:
工资相对差距(工资差/工资均值)it=αit+教育年限相对差距(教育年限离差/平均教育年限)itβ1+工作经验相对差距(工作经验/平均工作经验)itβ2+工作经验相对差距平方项(工作经验/平均工作经验)it2β3+μit
下标i表示个体,t表示时间,μit为白噪音,μit~N(0,σu2)。均值为样本均值离差模型估计结果见表4。首先,离差模型总体解释力与未经过变换前的模型解释力度类似。其次,在没有控制时间时,教育年限相对差距每提高1个百分点,就能引起工资相对差距提高115~117个百分点,效应非常明显。固定效应估计的教育年限相对差距对工资相对差距的影响更大,达到189个百分点。工作经验相对差距每提高1个百分点,能够引起工资相对差距提高约15个百分点。在控制时间以后,教育年限相对差距每提高1个百分点,就能引起工资相对差距提高55~58个百分点。工作经验相对差距每提高1个百分点,能够引起工资相对差距提高约3.6~3.9个百分点。从结果看,教育年限相对差距对工资相对差距的影响力在不同估计方式下差异较大。可能是因为:第一,固定效应模型是组内估计量,并没有运用到组间信息,因此其估计的系数可能会比运用到离散程度更高的组间估计量更大,但是其总体解释力会降低。第二,工资不平等程度在不同的部门和不同的地区之间的表现和趋势不相同。因此,对这些不同部门和不同地区的数据给予相同的权重进行简单的回归得到的结果可能并不准确。第三,不同收入组别的人群中,工资不平等的表现和趋势不相同,因此不区分收入组别的简单回归也可能得到不一致的结果,对这一问题的解决方案是使用分位数回归。
表3 明瑟方程估计系数比较
表4 相对离差模型的估计系数比较
传统的回归模型都是对数据平均效应的回归,并不区分数据不同分布点上可能存在的不同的边际效应。在本数据中,低工资组对平均工资的偏离差距并不大,但高工资组中对平均工资偏离的差距就比较大。
从结果看,控制时间和地区变量后(表5的Panel A),教育收益率随着工资的增加而递减,从十分位的3.3%减少到九十分位的1.3%,而之前的混合最小二乘回归的估计系数为2.1%,也就是说混合最小二乘估计倾向于低估低工资组的教育收益率,同时高估高工资组的教育收益率。
如果教育收益率在高工资组更高、低工资组更低,那么教育收益率就倾向于扩大组间工资差异,但是却倾向于扩大高工资组的组内差异,而缩小低工资组的组内差异。相反的,如果教育收益率在高工资组要低于低工资组,那么可能会倾向于缩小组间工资差异,也就是说低工资组的成员可以预期通过接受更多的教育来提高自己的工资收入。但是,低工资组内部的工资差异会扩大,高工资组内的组内差距会缩小。结合数据集中工资差异的表现(见表2),总体的工资不平等程度主要来自于低工资组内的工资不平等,高工资组和低工资组的组间不平等在较长时间内都维持较高水平上的不变,在2004年以后两者的差距才扩大。
表5 分位数回归下明瑟方程估计系数
表5的Panel B为离差模型系数,控制时间和地区后,教育相对离差对工资相对离差的解释力度在十分位上为0.177,九十分位为0.395。即随着工资对平均工资的偏离越大,教育对平均教育程度的偏离对工资的这种偏离的解释力度也就越高。也就是说,在两个极端分布上,可以判断那些工资太低和工资太高的个体,很有可能是因为他们的教育程度太低或者太高。这样的结论是比较符合社会经济实践的。考虑到本数据的基本特征是工资相对差异的分布不均衡,低工资组对平均工资的偏离差距并不大,但是在高工资组这种对平均工资偏离的差距比较大,因此,教育的偏离能解释的工资的偏离部分似乎更能解释高工资组的工资差距。这可能是因为,虽然低工资组中的教育收益率要高于高工资组中的教育收益率,但是低工资组中的教育相对差距较小,而高工资组中的教育相对差距较大。因此在解释工资的相对差异上,低工资组的工资相对差异并不能由低工资组有限的教育相对差异来解释,而在高工资组,教育相对差异的解释力度会更大。
本文主要研究了两个问题:一是教育收益率在不同人群中是否有差异,二是教育差距是否能够解释非农就业工资收入不平等。
从数据估计结果看,教育收益率在不同工资组中确实存在差异。低工资组人群的教育收益率要高于高工资组中的教育收益率。因此,通过对低工资组人群的教育投入,能够对缩小组间不平等起到一定的作用。但是,低工资组中较高的教育收益率也可能倾向于扩大组内工资不平等程度。同时,低工资组中的经验贡献度也高于高工资组中的经验贡献度。
离差模型的回归结果显示,虽然低工资组中的教育收益率要高于高工资组中的教育收益率,但是低工资组中的教育相对差距也比较小,而高工资组中的教育相对差距比较大。因此在解释工资的相对差异上,低工资组的工资相对差异并不能由低工资组有限的教育相对差异来解释;而在高工资组,教育相对差异的解释力度会更大。综上所述,本文得出以下结论:
第一,教育越多越好可能具有一定的误导性。教育收益率在高工资组并不很大。因此,如果是已经接受了比较好的高等教育,为了得到更高的工资收入,继续深造可能并不是一个很好的选择,因为此时教育的边际收益率已经趋于下降。而除了教育和经验,还存在很多其他的因素能够给这部分人群带来更高的收入,譬如个人习惯、待人处事的方法等。
第二,对低收入组的职业培训、技能培训确实能够在很大程度上提高这部分人的工资,因为教育在低收入组中的边际收益率比较大。同时也对缩小组间收入差距起到了非常积极的作用。但是,这种培训更要注重在低收入组中的公平获得性,因为低收入组中不平等的教育倾向于扩大其组内的收入不平等差距。
第三,关于工资收入的不平等程度,仅仅使用教育的不平等和工作经验的差异来解释是很不充分的,特别是在低收入组,两者的解释力度都很低。在高收入组,虽然两者都有一定的解释力,但是也偏低。
总的来说,本文最重要的结论是:虽然教育能够提高低收入群体的工资收入,但是教育差距并不能很好地解释收入不平等的扩大。