毛宇飞,胡文馨,曾湘泉
(1.首都经济贸易大学劳动经济学院,北京 100070;2.北京石油化工学院经济管理学院,北京 102617;3.中国人民大学劳动人事学院,北京 100872)
随着“宽带中国”“数字中国”等国家战略相继实施,信息通信技术的重要性日益彰显。作为信息技术的重要载体,互联网已逐渐渗透到社会经济的各个领域。然而,从现实来看,当前中国仍存在明显的城乡“二元结构”现象,不仅体现在传统的社会经济领域,在互联网领域也较为明显。第45次CNNIC(中国互联网络信息中心)的报告显示,截至2020年3月,我国网民规模达9.04亿人,农村和城镇的网民占比分别为28.2%、71.8%。从互联网使用现状来看,农村网络普及率为46.2%,明显低于城镇的76.5%,且农村网民在网络技能、网络应用及上网时长等数字素养方面均明显落后于城镇网民。这种城乡间“数字鸿沟”的长期存在可能进一步加深“二元”分化,对城乡居民的收入分配产生重大影响。
农民工与城镇职工的户籍工资差距是收入分配领域的重要议题。农民工作为从事非农工作却未改变农民身份的特殊群体,工资收入是构成其总收入的重要来源。国家统计局的《2019年农民工监测报告》显示,当前我国农民工规模已达2.91亿人,其月均收入为3962元,仅占同期城镇职工平均工资的52.5%。户籍工资差距不仅阻碍农民工顺利融入城市,影响城镇化进程和质量,也导致社会冲突加剧,对居民获得感和幸福感带来不利影响[1]。已有研究对户籍工资差距的原因进行了解释,主要从个人特征差异、劳动力市场分割及户籍歧视等视角展开,还有研究分析了教育培训、行业职业及产业结构等因素的影响[2][3]。近年来,学界开始关注互联网使用带来的收入分配变化[4][5],最新的研究还利用宏观数据分析互联网对城乡居民收入差距的影响[6],但探讨互联网与户籍工资差距关系的文献仍然较少。随着我国城镇化和信息化不断推进,互联网对农民工和城镇职工的工资收入带来何种影响?该影响是扩大抑或缩小两者的工资差距?本文将重点回答这些问题。
首先,本文结合相关理论阐述互联网影响工资收入及工资差距的理论机制。其次,利用2010~2015年的中国社会综合调查(CGSS)数据,实证检验互联网对不同户籍就业者工资收入的影响,并进行稳健性检验和异质性分析。最后,运用非条件分位数回归分解法,探讨互联网对户籍工资差距的影响。研究发现,使用互联网能带来明显的工资溢价,对城镇职工的影响大于农民工,可能造成户籍工资差距的进一步扩大;网络信息渠道对城镇职工工资的影响更明显,互联网的溢价效应在“新生代”和高学历就业者中更显著;互联网对户籍工资差距的扩大效应随着农民工网络技能及社会经济地位的提升而逐渐缩小。本文的边际贡献在于:第一,不同于从宏观层面探讨互联网与城乡收入差距关系的已有研究,本文从微观视角检验互联网对不同户籍就业者工资收入及工资差距的影响,丰富了相关领域的研究;第二,传统研究大多使用Oaxaca-Blinder分解法探讨工资差距的原因,本文则使用非条件分位数回归分解法进行分析,并利用替换变量、倾向得分匹配及工具变量法检验互联网对工资收入影响效应的稳健性;第三,有别于探讨整体互联网使用与工资差距关系的文献[7],本文将互联网接入机会和使用回报率的差异加以区分,分别对应互联网的特征效应和参数效应,以识别不同层面的“数字鸿沟”对工资差距的影响。
关于技术进步与收入分配关系的讨论,历来是劳动经济领域的重要话题。以互联网为代表的新技术革命,不仅有利于企业提高生产效率和节约成本,而且由此产生的扩散效应和溢出效应会对个人收入产生影响。效率工资理论认为,组织为员工支付的工资报酬与其生产效率呈正相关,而技术创新则是提高工作效率的关键要素。针对互联网与工资收入关系的文献可追溯至早期计算机使用产生的收入效应,研究发现将计算机应用于工作场所中能提高效率,进而促进工资增长[8]。随着网络设施完善、宽带速度提升和移动设备普及,学界开始聚焦互联网对收入的影响[9]。不同于计算机对工作辅助性作用的特点,互联网更侧重于强调节约工作时间、打破空间距离,以较低成本获取信息和整合资源,进而对个人收入产生积极作用。一方面,互联网使信息分享和交流更加及时,有利于提高办公效率,促进人们从事更具创新性的工作[10];另一方面,使用互联网有助于人力资本和社会资本的积累,个人通过网络获取信息、在线学习、工作搜寻和拓宽人脉等在就业市场中形成核心竞争力[11]。
技能偏向型理论认为,并非所有的技术创新都能产生同质性效果,高技能偏向型技术进步更有利于高技能者提高边际产出和收入水平,反之亦然[12]。大量研究证实,以互联网为代表的信息技术进步属于高技能偏向型,实际上更有利于增加高技能者的用工需求及工资收入,而对低技能者带来不利影响[13][14]。这是因为高技能者大多从事信息密集、分析判断及战略决策类的非常规性工作,互联网技术与此类工作为互补关系,有助于提高工作效率;而对低技能者的常规性工作,互联网技术的影响不明显,且可能存在替代效应而产生负向影响[15][16]。结合现实来看,在不同户籍就业者中,农民工受教育程度普遍偏低,大多从事生产操作及基础服务类工作,其入职门槛较低,工作性质和内容单一,属于低技能群体;而城镇职工整体教育水平相对较高,多数从事专业技术或管理类工作,属于高技能群体[17]。与城镇职工相比,在互联网发展初期,农民工掌握和使用互联网技术均受到一定限制,尤其在信息鉴别、利用及加工等方面处于劣势[6],由此造成农民工使用互联网带来的工资溢价低于城镇职工,进一步加大两者的工资差距。鉴于此,本文提出假说1:互联网对城镇职工工资的影响大于农民工,可能进一步扩大户籍工资差距。
在现实中,由于个人接入互联网的机会及网络使用技能存在差异,使互联网的工资溢价也不尽相同。尽管在短期内不同户籍就业者之间的“数字鸿沟”可能造成工资差距不断扩大,但从长期来看,互联网具有普惠效应和溢出效应,对农民工工资收入的正向作用正逐渐增强。自我决定理论认为,个体会结合内外部环境及动机,在充分认识自我需要和环境信息的基础上对学习行动做出自主选择[18]。随着网络技术和智能手机的快速发展与普及,以农民工为主的低技能者通过线上教育和技能培训等途径提高网络技能。同时,互联网促进了城乡要素的配置和流动,农民工利用互联网可拓宽信息渠道,更加及时、有效、低成本地获取信息,增进自身的人力资本和社会资本积累[19]。农民工使用互联网促进工资增长的后发优势可能对户籍工资差距产生抑制效应。鉴于此,本文提出假说2:互联网对户籍工资差距的扩大效应不会一直增加,而是随着农民工网络技能及社会经济地位的提升日益缩小。
本文数据来自2010、2012、2013和2015年的CGSS,主要是基于以下的考虑:首先,该数据中有涉及互联网的相关变量,囊括个人特征、工资收入和工作特征等信息,与本文的研究内容相符;其次,该数据采用分层抽样设计,覆盖全国31个省份,在以往的相关研究中也经常被用到,具有较高的权威性和代表性;最后,选取4年数据构成混合截面数据,可扩大样本容量、提高研究的可信度。
表1为本文的主要研究变量及其解释。关于被解释变量工资收入,在研究工资收入或工资差距的影响因素时,由于个体工作时间的长短可能引起收入水平的差异,使用月度或年度的工资收入无法排除工作时间因素的干扰,因而已有文献通常采用小时工资来进行测量[3][17]。本文利用问卷中平均月收入除以月工作小时数得到小时工资,以衡量农民工和城镇职工的工资收入。关于核心解释变量互联网,本文利用问卷中“过去一年互联网媒体使用情况”的提问来反映个人互联网使用的情况,设定使用过的为1、从未使用的为0。对于网络使用频率,按照上网情况分为未上网、很少上网、有时上网、偶尔上网和经常上网5类;对于网络信息渠道,以“主要信息来源是否为互联网”的问题来衡量使用网络获取信息的情况,回答“是”的设置为1,否为0。关于控制变量,本文参照已有文献控制个人特征、人力资本、工作特征、省份及数据年份等变量。
表1 变量及说明
1.基准模型。本文参照Krueger(1993)的互联网与工资收入关系的计量方程[8],构建如下的基准模型:
lnwage=α+βInternet+γX1+λX2+φX3+ηX4+ε
(1)
其中,被解释变量lnwage为小时工资对数,核心解释变量Internet表示互联网使用,Xi表示个人特征、人力资本和工作特征等控制变量,待估系数β表示互联网对工资收入的影响并在分析中具体区分全样本和分户籍样本的异质性效果。考虑到互联网对工资收入的影响可能存在因样本选择偏差、反向因果和遗漏变量等引起的内生性问题,本文利用三种方法对此进行稳健性检验:首先,以“网络使用频率”替换基准模型中“是否使用互联网”,检验不同网络使用频率的影响效应;其次,利用倾向得分匹配法寻找两组其他条件相同、仅互联网使用不同的就业者进行匹配,比较这两组样本的工资差距;第三,选取个体所在社区或农村层面的互联网普及率作为互联网使用的工具变量进行回归结果的再估计[5][20]。
2.网络信息渠道的作用。由CGSS的“媒体使用情况”可知,互联网作为信息时代的重要媒介,在农民工和城镇职工中的使用情况有所差异。为进一步识别网络信息渠道Itsource对工资收入的影响,本文在基准模型中引入交互项并构建模型(如式(2)所示)。其中,β2表示信息渠道对工资收入的影响,β1表示在控制信息渠道后互联网其他应用的影响效果。
lnwage=α+β1Internet+β2Internet×Itsource+γX1+λX2+φX3+ηX4+ε
(2)
3.互联网影响的异质性。前文的分样本回归仅考虑互联网对不同户籍就业者工资影响的组间差异。事实上,农民工和城镇职工群体内部的个体特征差异也会导致互联网的影响效应不尽相同。特别是出生于1980年以后的“新生代”群体,也是伴随互联网成长的一代,与老一代相比,他们在接受新事物、学习新知识和掌握新技术等方面具有一定优势,互联网对其工资收入造成的影响可能更大[21]。另外,互联网属于技能偏向型技术进步,对不同学历就业者的工资收入影响也有所区别。本文依据出生年代和教育程度两个维度来考察互联网影响效应的异质性并构建模型(如式(3)所示)。其中,characteri表示个体出生年代及教育程度,βi表示互联网对该特征群体工资收入的影响系数。
lnwage=α+β1Internet+βiInternet×characteri+γX1+λX2+φX3+ηX4+ε
(3)
本文的研究对象为目前从事非农工作的受雇就业者,在剔除缺失关键变量信息和自雇工作的样本后,得到有效样本10500个。其中,农民工占比35.7%,城镇职工占比64.3%。表2报告了主要变量的描述性统计结果,并对不同户籍就业者的特征变量进行差异性检验。
从表2的结果来看,在工资收入方面,农民工小时工资明显低于城镇职工;在互联网方面,农民工使用互联网的比例为54.4%,低于城镇职工26.5个百分点,且其利用网络获取信息的比例也相对较低;在个人特征方面,农民工中男性占比更多、平均年龄更小、中共党员比例更少、教育程度更低、健康状况更好,而民族和婚姻状况与城镇职工无明显差异;在工作特征方面,农民工中工会成员及签订合同的比例相对较低,大多从事销售服务、技工操作和初级岗位等工作,而城镇职工一般从事管理、专业技术和办公文职等工作。
本文按照全样本和分户籍样本对互联网影响工资收入的效应进行估计。表3报告了主要特征变量的估计结果。在第(1)列的全样本中,互联网的系数为0.226且在1%的水平上显著,即控制其他因素后使用互联网对工资收入具有显著的正向影响。第(2)、(3)列的分户籍样本的估计结果显示,互联网的系数分别为0.194和0.226且均在1%的水平上显著,表明互联网使用对不同户籍就业者均能带来明显的工资溢价,从系数的大小来看,互联网对城镇职工小时工资影响的平均效应大于农民工。第(4)列在第(1)列的基础上加入互联网与农民工的交互项,其系数为-0.057且在10%的水平上显著,表明互联网对农民工小时工资的影响效应低于城镇职工。以上结果意味着互联网对不同户籍就业者的工资收入均具有明显的促进作用,且对城镇职工的影响更大,因而可能进一步扩大两者的工资差距,即假说1得到验证。
表3 基准模型的回归结果
为验证互联网对不同户籍就业者工资收入的影响是否稳健,本文分别使用替换变量、倾向得分匹配和工具变量法进行检验。表4的结果显示,无论在全样本还是分户籍样本中,将未上网作为参照组,很少上网、有时上网、偶尔上网和经常上网对应的系数依次增大,不同网络使用频率的系数均显著为正且在1%的水平上显著,意味着随着网络使用频率的提高,其对工资收入的促进作用也在增强。从分户籍样本的估计结果来看,城镇职工的系数均大于农民工,表明以网络使用频率作为代理变量后仍能得到与基准模型相一致的结论。
表4 网络使用频率的检验结果
表5为使用倾向得分匹配法(PSM)得到的估计结果。PSM是互联网研究中常用的稳健性检验方法之一[7],在使用该方法前,本文对上网与未上网的两组样本进行平衡性检验,发现经匹配后大部分变量的偏误比例降至10%以下且特征变量无显著差异,表明符合平衡性要求。表5汇报了核匹配、半径匹配和卡尺内k近邻匹配三种方法的估计结果,得到互联网影响工资收入的平均处理效应(ATT)较为接近。以核匹配为例,互联网对农民工工资收入的影响系数为0.184,小于城镇职工的0.342,尽管采用PSM得到的系数略高于基准模型的估计结果,但从作用方向上来看仍能得到与前文一致的结论。
表5 倾向得分匹配法的检验结果
表6为工具变量法的检验结果。本文选取个人所在社区或农村层面的互联网普及率作为工具变量,主要有两个方面的原因:其一,邻近居民的互联网使用情况能反映当地的网络基础设施现状,且可通过“同群效应”影响个体网络使用,符合相关性条件;其二,地区网络普及率不会直接影响个体工资,符合外生性条件。表6的第一阶段回归以互联网普及率作为解释变量,以个体互联网使用作为被解释变量,得到的估计系数在全样本及分户籍样本中均显著为正且F值大于10,表明不存在弱工具变量问题。第二阶段使用工具变量法得到互联网在农民工和城镇职工样本中的系数分别为0.517和0.559且均在1%的水平下显著,大于基准模型的系数值,即内生性使互联网对工资收入的影响效应被低估。但从作用方向上来看,互联网对工资收入的影响显著为正且对城镇职工的影响效应大于农民工的结论具有稳健性。
表6 工具变量法的检验结果
表7为主要考察互联网影响效应的异质性的估计结果。为避免内生性,本文使用工具变量法进行估计。模型(1)的结果显示,互联网与网络信息渠道的交互项对城镇职工具有显著的正向影响,但对农民工的影响不显著,表明互联网的信息渠道功能更有利于城镇职工工资收入的增加。同时,在控制信息渠道后,互联网其他应用对不同户籍就业者的工资收入均具有正向影响。结合2010~2015年的CNNIC报告可知,除网络信息渠道外,网络交流沟通也是互联网的主要应用,意味着使用互联网进行交流沟通同样有助于工资收入的提高。模型(2)的结果显示,互联网与“新生代”的交互项系数在农民工和城镇职工中均显著为正且分别为0.083和0.109,表明互联网对“新生代”农民工工资收入的影响大于老一代农民工。其原因在于:与老一代农民工相比,“新生代”农民工对新事物充满好奇心,更乐于学习新知识且接触网络的机会较多,因而互联网对其工资收入的影响也更大。另外,结合系数的大小可知,“新生代”城镇职工的互联网工资溢价效应也大于“新生代”农民工。模型(3)以高中以下学历为参照组,得到互联网与各类教育程度的交互项系数均显著为正且在城镇职工中相对更高,表明与高中以下学历的就业者相比,互联网带来的工资溢价对高学历城镇职工的影响效应更明显。
表7 互联网影响效应异质性的工具变量法估计结果
前文验证了互联网对不同户籍就业者的工资收入均具有显著的正向影响且对城镇职工的影响效应更大。那么,互联网使用是扩大抑或缩小户籍工资差距呢?随着农民工网络技能及社会经济地位的提升,该影响效应是否发生变化?下文展开进一步的分析。
关于户籍工资差距分解,本文借鉴Firpo(2009)等提出的非条件分位数回归分解法进行分析[22]。该方法基于RIF(Re-centered Influence Function)回归对各分位数上的工资差距分解,得到任意分位数上特征变量对工资差距的影响效应。位于Qr分位数工资收入的RIF回归方程可简写为式(4)。其中,Xi和βi分别表示解释变量及其系数。
RIF(lnwage,Qr)=βiXi+ε
(4)
RIF回归分解一般包括分位数回归、工资分布函数、反事实分析和工资分解等步骤。在式(5)中,lnwu和lnwr分别表示城镇职工和农民工的小时工资对数。首先,本文利用农民工特征变量和城镇职工的估计系数构建反事实工资收入lnwc,即农民工特征变量的回报率与城镇职工相同时对应的工资分布函数。其次,将城镇职工和农民工的工资差距分解为特征效应和参数效应两部分。在式(6)中,右边第一项表示不同户籍就业者的特征变量差异造成的工资差距,即特征效应;第二项表示特征变量相同时因回报率不同而造成的工资差距,即参数效应。对互联网变量而言,右边第一项表示不同户籍就业者的互联网使用比例差异引起的工资差距,第二项则表示互联网使用回报率差异对工资差距的影响。
Qr(lnwu)-Qr(lnwr)=[Qr(lnwu)-Qr(lnwc)]+[Qr(lnwc)-Qr(lnwr)]
(5)
Qr(lnwu)-Qr(lnwr)=[(Xu-Xr)βu+εuc]+[(βu-βr)Xr+εcr]
(6)
基于上述原理,本文运用RIF回归分解法探讨户籍工资差距的影响因素。表8报告了25、50和75分位上各变量的回归系数及贡献度。其中,25分位上特征效应对户籍工资差距的贡献度合计为108.1%,而参数效应为-8.1%,表明此时的特征效应“过度解释”了工资差距,即不同户籍就业者在特征变量相同的情况下,回报率差异对工资差距产生负向影响。在50和75分位上,特征效应的贡献度合计分别为83.8%和93.1%,表明此时的特征差异是造成户籍工资差距的主要原因,而参数效应对工资差距的解释力度较小。
表8 利用RIF回归分解法对户籍工资差距的分解结果
从表8中互联网的影响系数来看,在特征效应方面,互联网在25、50和75分位上的贡献度均为正且数值依次减小,表明不同户籍就业者的互联网使用比例差异造成工资差距的进一步扩大,但随着工资分位数的提高,该影响效应也在逐渐下降。在参数效应方面,互联网的系数在25分位上为正,但在50和75分位上为负,意味着对低收入等级的就业者而言,农民工和城镇职工的互联网使用回报率差异扩大了工资差距;但对高收入等级的就业者而言,农民工使用互联网的回报率的后发优势逐渐显现,有利于缩小户籍工资差距。
为详细观测互联网对户籍工资差距的影响,本文绘制不同分位数上互联网整体及其特征效应和参数效应对户籍工资差距的贡献度。图1显示,随着分位数的提高,互联网整体对工资差距的贡献度在逐渐减小,且在60分位前后贡献度数值由正转负,意味着对低收入等级的就业者而言,互联网使用可能引起户籍工资差距的进一步扩大,但该“扩大效应”不会一直存在,而是随着收入等级的提升转为“抑制效应”,此时互联网缩小户籍工资差距,即验证了假说2。从特征效应来看,互联网的贡献度始终为正且随着分位数提高呈平稳下降趋势,表明不同户籍就业者在互联网使用比例方面的差异会进一步扩大户籍工资差距,但随着收入等级的提升,该影响效应在逐渐减小。从参数效应来看,互联网对户籍工资差距的贡献度与整体效应趋势相似,但由正转负的临界点出现在40分位左右。以上结果表明,对低收入等级的就业者而言,互联网使用回报率差异会扩大户籍工资差距,但随着农民工网络使用技能和社会经济地位的提升,其回报率也在不断增加甚至超过城镇职工,此时使用互联网对工资差距具有“抑制效应”,有利于缩小户籍工资差距。
图1 不同分位数上互联网对户籍工资差距的贡献度
基于已有文献和相关理论,本文利用CGSS数据实证检验互联网对不同户籍就业者工资收入及工资差距的影响。研究结果表明,互联网使用对农民工和城镇职工的工资收入均具有显著的正向影响,且对城镇职工的影响效应更大,进一步扩大了户籍工资差距,经检验后该结论具有稳健性;网络信息渠道功能对城镇职工工资收入的影响效应更明显,而网络交流沟通类应用有助于提高不同户籍就业者的工资收入;互联网对不同特征就业者工资收入的影响存在异质性,对“新生代”的影响大于老一代,对学历较高者的影响大于学历较低者;不同户籍就业者的互联网使用比例及回报率差异均对工资差距产生影响,但互联网对户籍工资差距的扩大效应不会一直增加,而是随着农民工网络技能及社会经济地位的提升日益缩校结合前文可知,考虑到城乡“二元结构”的现实状况,当前农民工与城镇职工之间的“数字鸿沟”仍然存在。近年来,尽管我国农村网民规模在持续扩大,但城乡之间的互联网普及率仍相差30%左右,意味着加快网络基础设施建设、提高网络普及率和提速降费仍是未来亟需关注的重点问题。此外,农村网民与城镇网民在即时通信和网络娱乐等基础应用方面使用比例相当,但在商务交易和网络金融等高级应用方面仍处于劣势,而农民工自身特质、上网意愿、网络技能和城乡间互联网发展差异是造成这种“数字鸿沟”的主要原因。据此,本文提出如下的三点建议:首先,完善网络基础设施,降低上网资费和提升上网速度,为农民工接入互联网创造有利条件;其次,通过职业技能培训和在线教育等手段提高农民工的网络使用技能,使其拥有较好的信息接收、识别和处理能力,进而促进人力资本和社会资本的积累;最后,健全法律体系,完善收入分配制度和社会福利政策,为提高农民工收入待遇和缩小户籍工资差距提供有利保障。