分层异质视角下流动人口收入决定研究
——基于分层线性模型的实证分析

2018-04-11 03:04阳玉香唐成千
财经理论与实践 2018年2期
关键词:流动人口斜率分层

莫 旋,阳玉香,唐成千

(1.上海财经大学 经济学院,上海 200433; 2.衡阳师范学院 经济与管理学院,湖南 衡阳 421008)*

一、引 言

随着中国经济高速发展、工业化和城镇化快速推进,在城乡之间、地区之间出现了大规模的人口流动,根据《中国流动人口发展报告(2016)》显示,中国流动人口规模高达2.47亿,约占人口总数的18%[1]。目前,中国经济社会发展进入新阶段,大规模的人口流动已成为推动经济社会结构变迁和利益分配格局调整的重要因素,但流动人口在促进经济社会发展与城市化进程的同时,也给社会已有的利益分配格局调整带来了巨大挑战和冲击,突出的问题是,如何让流动人口更好地共享改革发展成果,使经济社会发展更平衡、更充分。习近平总书记在党的十九大报告中指出:“中国特色社会主义进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。”这一重大的政治论断,深刻揭示了我国社会矛盾运动的新变化和新特点。让人们过上更美好的生活是我们一切工作的出发点和落脚点,因此,政府和学界对流动人口在流入地的生存与发展状况高度关注,而收入水平是流动人口在流入地得以立足的经济基础,也是个体社会经济地位的重要标志,自然成为大家关注的焦点。

流动人口收入水平是由其个体特征、社会制度安排、劳动力市场结构等多种因素综合作用的结果。流动人口的个体特征是流动人口收入决定的关键性因素。甄小鹏(2017)[2]认为,由于年龄、性别和教育等个体特征不同,导致流动人口之间存在巨大的收入差异。邓曲恒(2007)[3]认为教育对流动人口收入提升作用巨大,但其效果也因人而异。郑猛(2017)[4]认为教育能够提升流动人口收入的整体水平。赵延东(2002)[5]认为流动人口的社会网络与社会资本对其经济地位的获得具有重要作用。影响流动人口收入的其他个体特征,比如婚姻与健康状况、外出务工时间、流动范围等,一般都认为与流动人口的收入水平紧密相关。影响流动人口收入的制度安排,主要以户籍制度这一因素的研究为主,杨菊华(2011)[6]研究指出,在探讨流动人口收入时必须区分其户籍身份,户籍制度引发流动人口收入分化,城-城流动人口的收入明显高于乡-城流动人口,得出类似结论的还有章莉(2014)[7]等。劳动力市场结构也是影响流动人口收入的重要因素,阳玉香(2017)[8]研究表明,在流动人口劳动力市场,雇主拥有强势地位,从而压低雇员的工资水平。

现有文献对流动人口收入问题进行了深入研究,为如何提高其收入水平提供了参考和借鉴[9]。但是,现有的研究仍存在以下不足:一是研究较多关注流动人口和流入地城镇居民之间的收入差异,却忽略流动人口本身收入水平是如何决定;二是利用流动人口数据研究流动人口收入问题时,普遍忽视数据的分层聚类性;三是现有文献研究流动人口收入时,忽视了异质性作用与不同层次因素之间的互动。分层线性模型考虑了数据的分层聚类性,将个体因素对流动人口收入的影响从群体因素中分解出来,并从跨层角度分析不同层次因素之间的互动关系,从而可获得较可靠的参数估计和假设检验,并且还能够回答一些具有实际意义而传统模型无法回答的问题[10]。目前国内利用分层线性模型分析流动人口数据的文献不多,主要是从社会融合角度进行研究,如薛燕(2016)[11]和李含伟(2017)[12]。值得注意的是,利用分层线性模型分析中国流动人口收入决定问题的研究尚未见于国内文献。基于此,本文利用中国流动人口动态监测数据,采用分层线性模型,从分层异质视角研究流动人口收入的决定,为相关研究提供一个全新的视角。

二、数据与方法

(一)数据来源

本文所使用的数据来自2014年中国流动人口动态监测数据。该数据以山东省青岛市、浙江省嘉兴市、福建省厦门市、广东省深圳市和中山市、河南省郑州市、四川省成都市、北京市朝阳区八市(区)为调查地点;抽样方法按照多阶段、分层、与规模成比例的PPS方法进行;该数据的调查对象为在流入地居住一个月以上、非本市(区)户口、且年龄在16~60岁的流入人口;删掉流动人口小时收入变量数据缺失的样本,并剔除处于第1百分位数以下和第99百分位数以上的极端值;同时删除其它变量观察值缺失的样本,最终获得样本数为14255。

(二)研究方法

数据分析的方法包括描述性分析与模型分析。首先从流动人口的社区特征和个体特征视角对流动人口收入作描述性统计,分析流动人口收入的异质性。然后对流动人口收入的决定作模型分析,模型的选取取决于数据结构,由于流动人口数据包括社区层次和个体层次资料,具有明显的分层聚类性,不满足OLS分析中方差齐次性及个体间随机误差相互独立的假设,这可能导致参数与标准误估计的偏误,采用分层模型来处理数据分层聚类性,参数估计更为准确,假设检验更为保守和恰当,从而降低犯第I类错误的可能性,提高模型的适应性[13];由于流动人口收入是连续变量,因此,我们采用分层线性模型进行模型分析。根据研究的需要,将流动人口收入数据分为社区和个体两个层次,分别采用分层线性模型中的无条件平均模型、随机截距模型、随机截距与随机斜率模型对流动人口收入决定进行实证分析。为节约篇幅,我们只简要介绍随机截距与随机斜率模型,并利用该模型分析不同层次因素之间的互动。

随机截距与随机斜率模型不仅允许回归截距因社区而异,而且允许个体层次因素对流动人口收入的影响随社区层次因素而不同。其方程式为:

yij=β0j+β1jx1ij+εij

(1)

其中,yij表示社区j中个体i的收入,x1ij表示个体特征变量,β1j是x1ij的系数,反映社区j内个体层面因素对流动人口收入的影响,下标j表示个体特征变量因社区而异。由于个体生活于不同的社区,而社区特征又反作用于个体,因此,β0j和β1j都可能因社区而异,为随机变量,是社区特征变量G1j的函数。

β0j=γ00+γ01G1j+δ0j

(2)

β1j=γ10+γ11G1j+δ1j

(3)

式(2)和式(3)是对回归系数的回归,个体层次模型的截距和斜率,在社区层次模型中成为被解释变量,每个社区的系数都取决于社区特征。将式(2)和式(3)代入式(1),可以得到随机截距与随机斜率模型的完整表达式:

yij=(γ00+γ01G1j+γ10x1ij+γ11G1jx1ij)+(δoj+δ1jx1ij+εij)

(4)

三、变量选取与描述性分析

(一)变量选取

1.收入。流动人口动态调查问卷中提供了流动人口的月收入,包括工资、奖金、津贴、加班费和单位包吃住折算的金额,但月收入没有考虑个体工作时间上的差异,因此,小时收入更为合理,但调查问卷中没有小时收入,我们采用4乘以周工作小时数来估计月工作小时数,小时收入即为月收入除以月工作小时数。

2.社区特征。影响流动人口收入的社区特征变量包括社区类型和社区所在的城市变量。(1)社区类型。问卷中有流动人口目前居住的社区信息,居住在别墅区或商品房社区取值为1,表示高档社区;其他取值为0,表示普通社区。(2)城市。构造城市虚拟变量,以北京市为对照组,反映区域经济发展不平衡导致的流动人口收入差异。

3.个体特征。影响流动人口收入的个体特征变量主要有:(1)性别。设定虚拟变量,男性取1,女性取0。(2)户籍身份。设定虚拟变量,城-城流动人口取1,乡-城流动人口取0。(3)年龄。一般认为劳动者的收入水平与年龄呈倒“U”型变化,加入年龄的平方项以考察收入水平与年龄之间的非线性关系。(4)受教育程度。设定虚拟变量,初中及以下教育程度者取值为0,表示接受初等教育;高中教育程度者取值为1,表示接受中等教育;大专及以上教育程度者取值为2,表示接受高等教育。(5)婚姻状况。设定虚拟变量,在婚者取值为1,其它取值为0。(6)外出务工时间。外出务工时间用第一次离开户籍地到本次调查的年限表示,即2014减去第一次外出务工的年份。(7)流动范围。设定虚拟变量,取0表示市内跨县流动,取1表示省内跨市流动,取2表示跨省流动。(8)健康状况。问卷中流动人口对自己身体健康状况有一个主观评价,健康状况差取0;健康状况一般取1;健康状况好取2;健康状况很好取3;健康状况非常好取4。(9)社会资本。用流动人口在本地参加社会组织的数量作为其社会资本的代理变量,没有参加任何社会组织者取0,表示其社会资本较少;参加1个社会组织者取1,表示其社会资本中等;参加2个及以上社会组织者取2,表示社会资本较多。

(二)流动人口收入异质性

表1从社区特征和个体特征视角分析流动人口收入异质性。流动人口平均小时收入为17.44元,其中,居住于高档社区流动人口的小时收入为21.56元,较居住于普通社区流动人口的小时收入16.62元,高出29.72%,流动人口收入的社区差异非常明显。这表明流动人口的收入与其所居住的社区有明显的关联,流动人口的收入随社区而异。

表1 流动人口收入异质性

注:表中分别是流动人口小时收入和样本量,括号内分别为其标准差和样本占比。

流动人口包括乡-城流动人口和城-城流动人口,他们在人力资本、社会资本、户籍及其衍生因素方面存在明显差异,因此,有必要从户籍角度分析流动人口收入差异。城-城流动人口的小时收入为23.87元,较乡-城流动人口的小时收入16.42元,高出45.37%。从户籍身份和社区类型的交叉表可知,居住于普通社区的乡-城流动人口占比最大,为73.93%,但收入最低,小时收入仅为15.94元;居住于普通社区的城-城流动人口收入明显高于居住于高档社区的乡-城流动人口;居住于高档社区的城-城流动人口占比最少,仅占流动人口总数的3.98%,但收入水平最高,小时收入高达28.75元。

从流动人口的受教育程度来看,受教育程度越高者,其收入水平越高,接受高等教育者的平均小时收入为24.91元,较接受初等教育者的平均小时收入15.15元,高出64.42%,这表明流动人口的受教育程度对其收入的决定有重要影响。从受教育程度和社区类型的交叉表可知,居住于普通社区接受初等教育者占比最大,为52.77%,但收入最低,小时收入仅为14.89元;居住于高档社区接受高等教育者占比最小,为4.17%,但收入最高,小时收入高达29.43元;而且发现,居住于普通社区接受高等教育者收入高于居住于高档社区接受中等教育者,居住于普通社区接受中等教育者收入高于居住于高档社区接受初等教育者,这可能意味着受教育程度对流动人口收入的提升作用较社区更大,教育是流动人口收入决定的关键性因素。

从流动人口的社会资本来看,社会关系网络越广,社会资本越多,其收入水平越高。拥有较多社会资本者的平均小时收入为21.77元,较拥有较少社会资本者的平均小时收入16.75元,高出29.97%,这表明社会资本对流动人口收入的决定有重要影响。从社会资本和社区类型的交叉表可知,居住于普通社区拥有较少社会资本者占比最高,为60.81%,但收入最低,小时收入仅为16.11元;居住于高档社区拥有较多社会资本者占比最小,仅为1.89%,但收入最高,小时收入高达28.34元;而且发现,居住于高档社区拥有较少社会资本者的收入高于居住于普通社区拥有中等社会资本者,居住于高档社区拥有中等社会资本者的收入高于居住于普通社区拥有较多社会资本者,这可能意味着,在流动人口收入的决定中,社区因素的作用要超过社会资本。

流动人口收入异质性表明,流动人口的收入不仅受其个体特征的影响,还会受其所处社区环境的影响,样本的分层聚类性质非常明显。但户籍身份、受教育程度和社会资本三类个体特征在不同的社区环境下,对流动人口收入的影响有所不同。上述判断是基于社区类型和相应个体特征变量而言,并没有控制其他因素,流动人口的收入还受到许多其他个体特征和社区特征变量的影响,在研究流动人口收入决定时,需对这些变量加以控制。因此,还需通过更为严谨的实证分析来处理数据的分层聚类性,以得到较为精准可靠的分析结论。

四、流动人口收入的分层线性模型分析

本文采用stata软件,基于分层线性模型对流动人口收入的决定进行实证分析,包括无条件模型、随机截距模型、随机截距与随机斜率模型,并对流动人口收入不同层次因素之间的互动进行分析。

(一) 无条件平均模型

无条件平均模型即空模型,是指模型中只有被解释变量,没有指定任何一个解释变量。对数据进行无条件平均模型分析,可以确定社区层次因素对流动人口收入影响的程度,从而决定是否需要采用分层模型技术。因此,无条件平均模型实际上是一个诊断模型。

表2 流动人口收入无条件平均模型分析结果

注:***、**、*分别表示在0.1%、1%和5%水平上显著。

根据随机效果中群间变异和群内变异值的大小,可以计算出社区间关联度系数:

该数值表示,流动人口收入的变异性中有40%来自于社区因素(即群间变异),60%来自于个体因素(即群内变异)。因此,社区因素和个体因素对流动人口收入的决定都具有重要的作用,但个体本身的特征要更重要一些。

(二)随机截距模型

将社区特征变量和个体特征变量纳入模型之中,以分析社区层次因素和个体层次因素对流动人口收入决定的影响。随机截距模型假定,流动人口收入变异都源于社区层次和个体层次因素,且个体特征对流动人口收入的影响不因社区而异。

从表3模型2可知,社区特征变量与流动人口收入水平显著相关。在其他条件给定的情况下,居住在高档社区流动人口的小时收入比普通社区平均高出3.16元;流动人口收入的城际差异也十分明显,与对照组北京市相比,其他城市流动人口的收入水平明显偏低,其中,成都市最低,深圳市相对较高。个体特征变量对流动人口收入水平的影响也非常显著,男性小时收入平均比女性高出3.28元,工资性别差异十分明显;城-城流动人口较乡-城流动人口小时收入平均高2.05元,户籍身份是影响流动人口收入的重要因素;年龄与收入水平的关系呈倒U字型,流动人口小时收入在35岁左右最高;流动人口小时收入与受教育程度呈正向关系,受教育程度越高,收入水平越高;在婚者小时收入较其他群体高1.81元;流动人口在外务工时间越长,收入水平越高,外出务工时间每增长1年,小时收入提高0.05元;流动人口的流动范围越远,其收入水平越高;健康状况越好者,其收入水平越高;社会资本对流动人口收入的提升作用也非常明显。

就随机参数而言,社区层次随机变量的变异值,在无条件平均模型中为5.87,在随机截距模型中仅为3.93,通过比较两个模型中社区层次随机变量的变异值,发现社区特征变量对流动人口收入在社区层次变异的解释度为33.05%;而个体层面随机变量的变异值仍然较大,仅从原来的8.93,下降到8.40,个体特征变量对流动人口收入在个体层次变异的解释能力较低,约为5.9%。因此,随机截距模型中社区特征变量对流动人口收入的解释能力远高于个体特征变量。但是,随机截距模型中社区层次和个体层次随机变量的变异值都非常显著,这表明仍有一些重要的、未被观测到的社区层次因素和个体层次因素影响流动人口的收入,这可为调查问卷设计的完善提供一定的参考依据。

(三)随机截距与随机斜率模型

随机截距模型可纠正聚类而引起的样本间不独立问题,并能分析分层数据的群间变异与群内变异,但是,该模型假定个体特征对流动人口收入的影响在不同的社区之间是恒定的。事实上,在流动人口收入的决定中,个体特征对流动人口收入的影响可能随社区而异。随机截距与随机斜率模型既可分析不同社区拥有不同的截距,又可分析不同社区拥有不同的斜率,并能够分析社区层次变量和个体层次变量之间的互动关系。下面我们利用随机截距与随机斜率模型,分别考虑户籍身份、受教育程度和社会资本三类个体特征变量对流动人口收入的影响,并分别加入其与社区类型变量的交互项,从跨层的角度来研究流动人口收入的决定。

首先,分析流动人口收入决定中是否需要加入随机斜率项,从表3的随机截距与随机斜率模型可知,虽然截距与斜率协方差成分的变异不显著,但随机斜率都非常显著。因此,模型中加入随机斜率项,可在一定程度上提高模型的适应性,从而获得更为精确的参数估计。如果随机斜率、截距与斜率协方差成分的变异均不显著的话,采用随机截距模型即可[14]。

表3 流动人口收入决定的分层线性模型分析

注:***、**、*分别表示在0.1%、1%和5%水平上显著。

在随机截距与随机斜率模型中加入户籍身份与社区类型的交互项,以考察不同层次因素之间互动对流动人口收入的影响。在控制其他个体特征变量和城市变量后,相对于乡-城流动人口,城-城流动人口的小时收入高1.48元,相对于普通社区,居住于高档社区流动人口的小时收入高3.09元,二者均很显著,户籍身份与社区类型交互项的系数为1.93,也非常显著。这表明户籍身份和社区类型变量对流动人口收入的提升作用,很大部分通过户籍身份与社区类型交互项来体现。

在模型中加入受教育程度与社区类型的交互项,以全面考察受教育程度对流动人口收入决定的作用。在控制其他因素后,受教育程度与社区类型变量的系数分别为2.56和2.93,受教育程度与社区类型交互项的系数为0.74,三者均非常显著。这表明受教育程度是影响流动人口收入的关键性因素,且受教育程度对流动人口收入的提升作用较社区更大;同时,受教育程度对流动人口收入的提升作用还取决于社区类型,受教育程度对居住于高档社区流动人口收入提升效果更明显。

在模型中加入社会资本与社区类型的交互项,以全面考察社会资本对流动人口收入提升的影响。在控制其他因素后,社会资本与社区类型变量的系数分别为1.10和2.76,社会资本与社区类型交互项的系数为1.75,三者均非常显著。这表明社会资本对流动人口收入的决定有重要作用,但社区对流动人口收入的提升作用较社会资本更大;社会资本对流动人口收入的提升作用,很大部分通过社会资本与社区类型交互项来体现。

流动人口收入决定中不同层次因素之间存在互动关系,部分社区层次因素对流动人口收入的影响通过个体层次因素体现,而部分个体层次因素对流动人口收入的影响,是通过社区层次因素来体现。在随机截距与随机斜率模型中,考虑不同层次因素之间的互动,能够更好地反映流动人口收入的决定过程。

五、研究结论与政策启示

本文基于分层线性模型,利用中国流动人口动态监测数据,从分层异质视角研究流动人口收入的决定。主要研究结论如下:

一是流动人口的收入具有明显的分层聚类性,社区层次因素和个体层次因素对流动人口收入的决定都具有重要影响,将流动人口收入的变异分解到社区层次因素和个体层次因素,研究发现,流动人口收入的变异性中有40%可由社区层次因素来解释,剩余的60%来自于个体层次因素,个体层次因素对流动人口收入决定的作用要更重要些。

二是通过分层线性模型,区分不同层次解释变量对流动人口收入决定的解释能力。研究发现,流动人口收入在社区层次变异的1/3可由社区特征变量来解释,但个体特征变量能解释流动人口收入在个体层次变异中的比例不足10%。这表明受制于模型数据的可获得性,模型中遗漏了一些对流动人口收入决定至关重要的个体特征变量,同样,即使社区特征变量的解释能力较强,但社区层次随机因素的变异仍非常显著,这表明还需进一步考虑其他重要的社区因素,这些研究结果可为调查问卷设计的完善、研究理论与模型的发展提供相关参考依据。

三是流动人口的个体特征和社区特征对其收入水平的影响非常显著,我们着重考虑户籍身份、受教育程度和社会资本三类个体特征变量对流动人口收入的影响,城-城流动人口的收入高于乡-城流动人口,受教育程度和社会资本均能显著提升流动人口的收入水平。在模型中加入个体特征变量与社区类型变量的交互项,研究发现,个体层次因素对流动人口收入的影响,部分通过社区层次因素来体现,而社区层次因素对流动人口收入的影响,部分通过个体层次因素来体现,不同层次因素之间存在互动,从而能够更好地反映流动人口收入的决定过程。

当前,中国特色社会主义进入新时代,提升流动人口的收入,让流动人口能够更好地共享改革发展成果,促进经济社会平衡充分发展,已成为我国经济社会发展进程中不容忽视的重大战略性问题。因此,研究流动人口的收入决定问题恰逢其时。本文的研究可为新时代下经济社会平衡充分发展提供一些政策启示:一是积极推进户籍制度改革,缩小城乡差距,让流动人口能与本地居民享有同等的公共服务与社会福利,为流动人口融入城市创造良好的环境,从而提高城镇化的质量。二是加大对流动人口的教育投入力度,提高流动人口的整体受教育水平,进而提升其学历与技能。三是政府要采取各种措施鼓励流动人口参与各种社团活动,为流动人口进行社会资本的个人投资与积累创造条件,同时,要为流动人口提供一个基于城市生活的社会网络,促进流动人口社会资本的转化。

参考文献:

[1]国家卫生和计划生育委员会流动人口司.中国流动人口发展报告[M].北京:中国人口出版社,2016:3-4.

[2]甄小鹏,凌晨.农村劳动力流动对农村收入及收入差距的影响[J].经济学(季刊),2017(4):1073-1096.

[3]邓曲恒. 城镇居民与流动人口的收入差异[J].中国人口科学,2017(2):8-16.

[4]郑猛. 教育扩张能否改善收入差距[J].科学决策,2017(7):26-49.

[5]赵延东,王奋宇. 城乡流动人口的经济地位获得及决定因素[J].中国人口科学,2002(4):8-15.

[6]杨菊华.城乡分割、经济发展与乡-城流动人口的收入融合研究[J].人口学刊,2011(5):3-15.

[7]章莉,李实,William A, Darity Jr.中国劳动力市场上工资收入的户籍歧视[J].管理世界,2014(11):35-46.

[8]阳玉香.流动人口获得了公平的劳动收入吗?[J].华东经济管理,2017(6):31-37.

[9]王赞新.论中国特色收入分配制度的现代化转型[J].湖湘论坛,2016(6):76-80.

[10] 杨菊华.多层模型在社会科学领域的应用[J].中国人口科学,2006(3):44-51.

[11] 薛艳.基于分层线性模型的流动人口社会融合影响因素研究[J].人口与经济,2016(3):62-72.

[12] 李含伟,王贤斌,刘丽.流动人口居住与住房视角下的社会融合问题研究[J].南方人口,2017(5):38-47.

[13] Teachman J, Crowder K. Multilevel models in family research: some conceptual and methodological issues[J].Journal of Marriage and Family,2002,64(2):280-294.

[14] 杨菊华.数据管理与模型分析:STATA软件应用[M].北京:中国人民大学出版社,2012. 332-372.

猜你喜欢
流动人口斜率分层
物理图像斜率的变化探讨
一种沉降环可准确就位的分层沉降仪
雨林的分层
漫画
求斜率型分式的取值范围
数说流动人口
数说流动人口
基于子孔径斜率离散采样的波前重构
MMC-MTDC输电系统新型直流电压斜率控制策略
给流动人口更多关注目光