姚 琛
(中南财经政法大学,湖北 武汉 430073)
推进城镇化的首要任务是促使有能力在城镇稳定就业和生活的常住人口有序实现市民化。“有序”一词体现了“市民化”的阶段性,要优先解决“存量”,即优先考虑进城常住就业的农民工群体。从既有研究来看,影响农民工市民化的因素有很多,其中能否获得稳定且可靠的收入是影响和制约市民化进程的关键因素。如何有效提升农民工工资,帮助其“有能力、有意愿”在城市永久定居是农民工市民化过程中的关键问题。
根据国家统计局发布的《2017年农民工监测调查报告》[1]显示,截至2017年农民工总量达到28652万人,比上年增加481万人,我国农民工约有72.6%为初中及初中以下学历,接受过非农职业技能培训的仅占30.6%。对于农民工而言,学校教育、健康状况等属于人力资本存量,已经确定或短期难以改变,通过培训提高人力资本增量进而增加工资收入是可行的吗?假设培训对增加农民工工资收入是有影响的,那么会产生多大的影响?培训对其工资收入的影响是否会因为农民工群体在性别、代际等方面的差异而不同?本文拟通过中山大学“2016年中国劳动力动态调查”数据①,运用Heckman Correction方法来估计培训对农民工工资收入的影响,并就其异质特征进行分组讨论,以寻求上述问题的可能答案。
人力资本理论认为人力资本水平是影响收入水平的重要因素,拥有较高人力资本的劳动者往往拥有更高的劳动生产率,因此更容易获得较好的就业机会和更高的收入。我国农民工的人力资本呈现整体水平较低、接受非农技能培训比重低且行业职业间农民工人力资本水平差异明显的特点。[2]对农民工进行有针对性的人力资本投资对增加农民工收入,推进市民化以帮助其更好地进行社会融合,拉动内需,促进经济增长等方面有着重要意义。[3]一般认为人力资本投资的方式包括学校教育、培训、健康改善、社会能力提升、迁移等。由于农民工的人力资本积累(基础教育)在进入劳动力市场前已经完成且再接受教育的机会成本持续增加[4],健康状况、社会能力以及迁移等受现实因素影响短期内改善较为困难,因此培训成为当前提升农民工人力资本的有效方式。
从目前研究来看,培训对于农民工工资收入的影响已经得到学者们的广泛关注,部分学者认为培训的工资效应并不明显[5][6],也有学者认为培训对工资有显著的促进作用,并考察性别、年龄差异以及技能分化、工作时间等异质的情况下培训对农民工收入的影响。[7][8]从既有研究方法来看,多数研究采用Jacob Mincer关于人力资本投资对个人收入分配作用研究中的人力资本挣得函数来构建模型(Mincer, 1974),并采取了如最小二乘法(OLS)、工具变量法(IV)、倾向得分匹配(PSM)等在内的多种计量方式来分析培训的收入效应。[5][9][10]由于时间、抽样偏差以及计量方式的差异,部分研究结论中尚存矛盾性差异,因此本文利用CLDS2016年个体问卷数据对培训对于农民工收入的影响进行再估计。同时为了克服样本选择偏差以及在分析过程中由于农民工自我选择导致的实证结果偏误问题,本文采取赫克曼矫正法来矫正自选择问题,以期准确估计培训与农民工工资的有效关系。
基于文献回顾与已有研究成果,本文提出如下研究假设:
H1:培训对于农民工工资收入有显著影响。
H2:教育、培训等人力资本因素对于农民工的工资有显著正向效应。
H3:培训对于在不同性别、代际、行业的农民工的工资回报率存在显著差异。具体而言,
H3.1:男性农民工的培训回报率高于女性;
H3.2:新生代农民工的培训回报率高于老一代农民工;
H3.3:第二产业农民工的培训回报率高于其他产业农民工。
沿袭以往实证研究中采用Mincer人力资本挣得函数研究人力资本对于个人收入影响的方法,本文将农民工是否参与培训、教育年限与工作经历等因素纳入方程,在控制性别、婚姻状况、健康程度、工作满意度以及家庭经济状况认知等因素后,测量培训对于农民工工资收入的影响。具体模型设定如下:
W=Ln(wage)i=β0+β1traini+β2edui+β3expi2+β4expi2+δCV+εi
(1)
其中,被解释变量W为月平均工资性收入的自然对数,traini表示个体i的培训情况,edui表示个体i的受教育程度,通过受教育年限来表征;expi表示个体i的工作经验,通过“exp=2016-从事当前工作开始的年份”衡量;expi2为工作经验年限的平方;β0为常数项,培训对农民工的工资收入回报通过β1反映,β2为教育回报率,β3与β4为工作经验系数,β4一般小于零,表示劳动者工龄与工资收入增长之间呈“倒U型”曲线关系;CV是控制变量,δ是控制变量的系数,εi为随机误差项。模型在控制教育和工作经验等人力资本因素及其他控制变量对工资的影响下估计培训对于农民工工资净效应,并对教育与工作经验对于农民工工资的收入效应进行检验。
在具体的估计方式上,本文首先采用多元线性回归模型对于培训的工资回报进行直接估计,然后采用Heckman Correction模型对方程进行进一步估计和校验,主要目的在于检验是否存在样本选择偏误与个体“自选择”问题导致的内生性问题。一般而言,人们选择是否到劳动力市场上工作取决于实际可得工资与期望工资的差距,当可得工资低于期望工资时,人们可能选择不进入劳动力市场,对于这部分农民工我们无法获得其真实的工资情况,如果存在样本选择偏误,则利用已知工资情况的农民工样本进行估计的结果并不准确。另外,经济个体的自我决策可能会影响到随机抽样过程,使得样本不能有效代表总体,则估计出的结果的信度令人怀疑。因此本文借鉴Heckman Correction模型来解决样本选择偏差和自选择问题,具体原理如下:
假定需要估计的农民工工资方程模型为:
Wi=x1iβ1+ε1i
(2)
Zi*=x2iβ2+ε2i
(3)
其中,x2i是影响个体是否进入选择方程的因素,β2是其系数。假设E(ε1i)=0,E(ε2i)=0,两者相关系数corr(ε1i,ε2i)=ρ。因为ε2i服从正态分布,故Zi*服从Probit概率模型。从而,P(Zi=1|W)=φ(x2iβ2)。那么,工资已知的农民工样本的条件期望:
E(Wi|Wi已知)=E(Wi|Zi*≥0)=E(x1iβ1+ε1i|x2iβ2+ε2i≥0)
=E(x1iβ1+ε1i|ε2i≥-x2iβ2)
=x1iβ1+E(ε1i|ε2i≥-x2iβ2)
=x1iβ1+ρσ1λ(-x2iβ2)
(4)
考虑到以往文献提及在两阶段修正模型中,第一步的误差被代入第二步,使效率降低的问题,因此本文还将采用同时MLE的整体估计方法,克服在误差联合正态性下造成的有效性损失,同时对模型进行稳健性检验。
表1 变量设置与样本基本情况
本文使用数据来自中山大学社会科学调查中心开展的“中国劳动力动态调查”(CLDS)2016年数据。CLDS聚焦中国劳动力的现状与变迁,内容涵盖教育、工作、经济活动等众多研究议题,采用多阶段、多层次与劳动力规模成比例的概率抽样方法,覆盖了中国29个省市(除港澳台、西藏、海南外),调查对象为样本家庭户中的全部劳动力,CLDS个人问卷数据中未将调查范围限制在劳动力年龄范围,对于超过劳动年龄但仍在劳动状态的家庭成员也进行了调查,这与本文界定吻合,2016年中国劳动力动态调查数据劳动力个体问卷共201 086份。根据研究需要,本文首先根据户口、年龄和工作状况筛选再剔除关键变量缺失和异常值后最终获得5 379个有效个体样本。
参考国家统计局关于农民工的界定“户籍仍在农村,在本地从事非农产业或外出从业6个月及以上的劳动者”,本文利用农村户籍,年龄在15周岁以上目前正在从事非农工作或有过外出务工6个月以上等条件对样本进行筛选,同时对教育程度、培训情况、年龄、婚姻状况、行业类型、地区分布与月收入等变量进行了重新生成和处理。本文的变量设置与样本基本情况如表1所示。
本文实证分析主要包含两部分:一是培训对农民工工资收入回报的估计结果,如表2所示。二是在培训回报率矫正的基础上对农民工进行分组回归分析,讨论培训对于性别、代际和行业异质情况下的农民工工资收入贡献是否存在差异。
多元线性回归显示,在控制性别、健康、婚姻、工作满意度和家庭经济状况认知等因素下(囿于篇幅限制,不再报告控制变量系数),培训对于工资有着显著正向效应,接受过专业培训的农民工比没有接受过培训的农民工的月工资收益率高11.3%。受教育程度每增长一年,能够给农民工工资带来5.1%的正向回报。工作经验每增长一年的工资回报为2.3%,相对较低,这可能与农民工长期以来从事的多为重复性低水平工作有关。工作经验平方的系数为负,与以往研究的“倒U型”关系相符。全部已知工资的农民工数为2064个。
为检验是否存在样本选择偏误和自选择问题,使用Heckman Correction模型进行检验,估计结果如表2所示。利用全样本(5379个样本量)进行回归显示,IMR比率在1%的统计水平上显著,Probit概率模型显示教育程度、有无其他收入、性别、健康状况以及有无工伤保险对于农民工是否选择进入劳动力市场有显著影响,即如果不对样本选择问题进行处理会导致严重的内生性问题。因此,利用Heckman Correction模型处理样本选择偏误,将IMR比率代入第二阶段作为一个解释变量与其他因素一同解决自选择问题是适当的。Heckman-twostep结果显示,将IMR比率代入工资方程后教育、培训与工作经验对于农民工月收入增长依然有着显著作用。其中,与未接受过培训的农民工相比,培训给农民工的工资带来了12.3%的回报,教育每增加一年对月工资的贡献率在4.5%,工作经验的回报率为2.3%。与OLS的回归结果相比,教育的回报率降低,说明选择性样本中受教育年限相对较长的农民工更有可能进入劳动市场工作,其工资信息容易获得,将全样本纳入方程进行估计可以看出,培训带来的工资回报增加,且在1%的水平上显著,对于农民工而言,培训是增加农民工收入更为有效的方式。
为了进一步验证估计结果,本文采用Heckman极大似然法进行整体估计,并且克服两步法误差代入的效率损耗,MLE结果显示自变量系数基本无差异,进一步证明了教育与培训对于农民工工资的显著正向促进作用的研究假设,同时也对两阶段模型的结果进行稳定验证。
表2 农民工培训工资回报估计
注:括号内的数值为t值,*p<0.05,**p<0.01,***p<0.001.
表3反映了在矫正结果下,不同性别、代际和行业农民工培训的工资回报情况。从性别来看,培训回报率在不同性别间存在显著差异。男性农民工培训的工资回报为21.4%,在1%水平上显著,而女性的回报率为负但并不显著,工作经验对于女性农民工的作用更为明显。已婚的农民工月工资较未婚者高,国外已有研究的结论类似,已婚男性也显著高于已婚女性。男性农民工在受教育水平、培训参与率及体力等方面高于女性(受教育年限差值1.18年、培训参与率差值7.7%),且由于生育和照顾家庭等因素,女性农民工在劳动力市场上不具有竞争性。自评为非常健康的男性农民工工资水平显著高于自评健康一般和比较不健康的男性,工作满意度和家庭经济状况对不同性别农民工的影响并不显著,表中不再报告具体系数。
表3农民工培训工资回报的分组回归
性别差异 男性 女性 代际差异 新生代 老生代 行业差异 第一产业 第二产业 第三产业 培训0.214∗∗∗(0.054)-0.035(0.076)0.102∗(0.062)0.145∗∗(0.064)0.005(0.232)0.160∗∗(0.067)0.110(0.068)教育程度0.049∗∗∗(0.008)0.044∗∗∗(0.009)0.043∗∗∗(0.010)0.045∗∗∗(0.008)0.037(0.028)0.049∗∗∗(0.009)0.031∗∗∗(0.009)工作经验0.019∗∗∗(0.006)0.034∗∗∗(0.011)0.072∗∗∗(0.015)0.019∗∗∗(0.006)-0.008(0.018)0.018∗∗(0.008)0.025∗∗(0.010)工作经验平方-0.001∗∗∗(0.000)-0.001∗∗∗(0.000)-0.004∗∗∗(0.001)-0.001∗∗∗(0.000)-0.000(0.000)-0.000∗(0.000)-0.001∗∗(0.000)部分控制变量-------已婚0.224∗∗∗0.124∗0.213∗∗∗0.1390.1750.193∗∗∗0.160∗∗(参照未婚)(0.056)(0.075)(0.058)(0.093)(0.241)(0.063)(0.072)男性--0.391∗∗∗0.294∗∗∗0.1880.299∗∗∗0.397∗∗∗(参照女性)--(0.056)(0.051)(0.182)(0.054)(0.061)IMR-0.296∗∗∗(0.047)-0.339∗∗∗(0.056)-0.353∗∗∗(0.068)-0.279∗∗∗(0.042)-0.140(0.107)-0.293∗∗∗(0.056)-0.369∗∗∗(0.062)_cons7.259∗∗∗(0.144)7.023∗∗∗(0.183)6.847∗∗∗(0.188)7.155∗∗∗(0.158)7.091∗∗∗(0.464)7.040∗∗∗(0.181)7.091∗∗∗(0.178)N12148509881076161872790adj.R20.1450.1140.1490.1820.1120.1890.147
注:括号内的数值为t值,*p<0.1,**p<0.05,***p<0.01.
从代际来看,培训的回报率给两代农民工均带来了积极的工资回报:老一代农民工的培训回报率为14.5%且在1%水平上显著;新生代农民工回报率为10.2%,在10%水平上显著。由于老一代农民工的教育水平相对较低,因此培训对其工资的边际效用更为明显,对于新生代农民工而言,增加一单位工作经验对于其工资的边际效用明显。由于年龄差异,多数老一代农民工已婚,因此其工资对于婚姻状况的反映并不明显,不同代际男性农民工工资显著高于女性,农民工就业中的性别歧视问题需引起重视。
从行业差异③来看,培训对不同行业的农民工的收入均有促进作用,第二产业培训回报率最高为15.9%,且在5%的水准下显著。第二产业多为制造业、建筑行业等工业,从业技能是农民工工作门槛或岗位硬性要求,因此用人单位和农民工倾向于主动培训,培训可及性高,针对性强,因此回报率也比较高。培训对于第一、第三产业农民工的收入也有正向作用但并不显著,可能与培训可及性不高,相关技术的习得与资格认定难度较大或费用较高有关。性别、婚姻状况在第一产业农民工中系数为正但并不显著,但二、三产业男性农民工的工资回报高于女性,已婚农民工的工资显著高于未婚,这为前文观点提供佐证。
研究结果表明,培训、教育和工作经验对农民工工资收入有显著的正向影响。其中,参加过专业技术培训的农民工比未参加过培训的农民工工资收入高约12.3%,每增加一年受教育年限的工资回报约为4.4%左右。农民工培训的工资回报在性别、代际和行业间存在差异,男性农民工培训的回报率高于女性,培训对老一代农民工边际回报率更为显著,第二产业农民工的工资回报显著高于其他产业。
十九大报告指出,就业是最大的民生,要大规模开展职业技能培训,促进农民工多渠道就业。但从实际来看,我国农民工参与培训的比重还较低。一方面要提高农民工主动参与培训的意识,另一方面增强培训的可及性,通过降低过高的培训费和技能鉴定费用,改善供给结构不合理的问题,使得农民工都有机会参与技能培训。同时还应该注意农民工群体内部的分化,目前学界对于农民工内部的分化研究已有不少,但现实中针对不同农民工群体的培训还是空白,培训内容与农民工自身情况、市场与岗位需求的有效对接还有待加强。最后,一定法律常识和“市民化”教育使农民工的业务技术和生存能力相互匹配、同步提高,帮助农民工在城市体面地生产和生活。
注 释:
①数据来自中山大学社会科学调查中心开展的“中国劳动力动态调查”(CLDS)。如需了解有关此数据的更多信息,请登录http://css.sysu.edu.c.
②Probit就业概率模型的因变量为是否参与工作,自变量包括受教育程度、健康状况、是否有工伤保险、是否有工资以外收入、性别,回归结果见表2.
③产业分类参照《国民经济行业分类》GB/T 4754-2017进行分类,第一产业包括农、林、牧、渔业。第二产业是指采矿业,制造业,电力、热力、燃气及水的生产和供应业,建筑业。第三产业是指除第一、二产业以外的其他行业,主要包括:批发和零售业,交通运输、仓储和邮电业,住宿餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务行业,教育、卫生和社会工作、文化、体育和娱乐业,公共管理、社会保障和社会组织国际组织.