朱火弟,黄 瑞
(重庆理工大学经济与贸易学院,重庆 400054)
流动人口数量的急剧增加已引起广泛的关注。从流动人口的组成来看,我国主要以农村剩余劳动力外出务工和城镇失业人口异地谋生为主,此外,刚从学校毕业的待业人员以及一些单位长期外派的工作人员也构成流动人口的一部分。根据2010年第六次全国人口普查数据公报,2010年我国流动人口达到2.61亿,占全国人口总量的16.5%,同2000年第五次人口普查相比,流动人口增加了1.17亿,增长了81%。从影响因素来看,一些学者从经济、社会等各个方面解释了人口迁移的原因。其中,最朴实的人口迁移理论——推—拉理论认为人口迁移的原因主要是迁出地的推力因素和迁入地的拉力因素共同作用的结果,舒尔茨的成本—收益理论认为个人迁移行为主要取决于迁移成本和收益的对比结果,而刘易斯模型则从二元经济结构方面解释了劳动力迁移的原因;Goldscheider从人口迁移与社会结构、制度结构发展演变的关系角度解释人口的流动迁移[1];也有学者认为城乡收入的差距[2]、打工收入相对较高或家乡就业地区生活水平的差距[3],都是导致人口流动的原因;还有学者从户籍制度方面着手进行研究,认为户籍制度的存在使得流动人口的城乡迁移行为在一定程度上从一个边缘社会(农村边缘)进入另一个边缘社会(城市边缘)[4]。从总体上看,对流动人口的影响因素的研究多限于定性分析,定量分析较少,而将两种方法结合在一起进行研究的更少。因此,本文结合陕西省流动人口影响因素的定量分析方法,在已有研究的基础上,对全国31个省(市、区)流动人口的影响因素进行定量分析(社会经济因素方面)和定性分析(其他因素方面),从而为今后预测流动人口以及加强流动人口管理提供参考。
由于流动人口的界定问题本身比较复杂,不同学者在不同时期对流动人口的界定都有所不同。本文中的流动人口是指居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口,数据主要来源于《中国城市统计年鉴2011》《中国统计年鉴2011》以及2010年第六次全国人口普查数据,所有指标数据均采用2010年各省(市、区)的数据。
在研究方法上,主要采用定量分析与定性分析相结合的方法。由于社会经济因素方面的数据比较容易收集,因此对这部分数据采用定量分析方法,其他影响因素则采用定性分析。在定量分析中,首先运用SPSS17.0软件进行相关分析,计算出全国各省(市、区)的流动人口与选取的指标因子之间的相关系数;然后对所有指标因子进行因子分析,并根据特征值的贡献率选取主成分,得到主成分与各项指标因子之间的关系;最后,借助主成分分析中的新变量与流动人口进行回归分析,从而得出流动人口与各项指标因子之间的定量关系。
对陕西省流动人口影响因素的定量分析选取了16项指标因子,对全国城市流动人口影响因素的定量研究选取了17项指标因子。在此基础上,本文结合实际情况选取14项社会经济因素指标因子,分别是:地区人口、全省(市、区)非农业人口、全省(市、区)从业人口、全省(市、区)个体从业人员、全省(市、区)GDP、全省(市、区)第二产业占GDP比重、全省(市、区)第三产业占GDP比重、全省(市、区)工业总产值、全省(市、区)利润总额、全省(市、区)社会固定资产投资总额、全省(市、区)社会消费品零售总额、全省(市、区)实际使用外资金额、全省(市、区)职工年平均工资和全省(市、区)客运总量。这14项社会经济因素指标更能反映流动人口的情况,与之前的研究有所不同。
1.相关分析
采用SPSS17.0对各省(市、区)流动人口与14项社会经济因素指标因子进行相关分析,并取0.01的检验水平进行双侧检验,得到相关系数检验结果如表1所示。
从表1可以看出,全国各省(市、区)流动人口与14项指标因子之间都呈现出正相关关系,但与全省(市、区)第二三产业占GDP比重以及全省(市、区)职工年平均工资之间的相关关系不显著,而与其他11项指标因子都呈现出显著的正相关关系。其中,流动人口与全省(市、区)社会消费品零售总额的相关系数最大,达到0.91。此外,流动人口与全省(市、区)客运总量的相关系数达到0.88,由于交通便利的地区会减少人们因流动所支付的成本,人们的外出意识也相对较强,客运总量在一定程度上反映了一个省(市、区)的交通便捷程度,因此,流动人口与客运总量呈现出较强的正相关关系。
表1 全国31个省(市、区)流动人口与社会经济因素相关分析结果
在分析全国各省(市、区)流动人口与14项指标因子之间的相关关系时,还发现有些自变量之间存在较高的相关性。比如:全省(市、区)社会消费品零售总额与个体从业人员、从业人口以及GDP之间的相关系数值达到0.90以上,因此,他们之间可能存在严重的多重共线性。为了避免直接使用回归分析产生回归系数不精确或者回归系数与现实意义不符等情况,本文先采用因子分析方法选出主成分,再对形成主成分的新数据和流动人口进行回归分析。
2.因子分析
由于各个变量的度量尺度不统一,因此,在做因子分析之前要对变量进行标准化处理。对标准化处理后的变量进行因子分析,可得到KMO检验和Bartlett球形检验的结果如表2。
从表2中可以看出KMO的统计量为0.845,通过因子分析并从所得到的特征值矩阵可知:前两个特征值的贡献率分别是66.90%和19.67%,累计贡献率达到86.57%,符合选取主成分个数指标的“≥85%”原则,已经能够代表所有特征,因此,可选择两个主成分做因子分析。运用SPSS17.0对14项社会经济因素指标进行主成分分析,可得到如下成分矩阵:
表2 KMO和Bartlett球形检验
本文采用的“旋转成分矩阵”是经过具有Kaiser标准比较旋转法旋转后的因子载荷矩阵,比未旋转时更能解释各因子的意义,而因子载荷是变量与公共因子的相关系数,对一个变量来说,载荷绝对值较大的因子与它的关系更密切。从表3旋转成分矩阵可以看出,除全省(市、区)第三产业占GDP比重、职工年平均工资、第二产业占GDP比重这三项指标因子外,其余11项指标因子均与第一主成分有较高的载荷,而这3项指标因子与第二主成分有密切关系。
表3 旋转成分矩阵
从表4成分转换矩阵也可看出,第一主成分更能代表全省(市、区)GDP、社会消费品零售总额等11项指标因子,第二主成分则较好地代表了全省(市、区)第三产业占 GDP比重等3项指标因子,说明提取两个主成分能反映指标的全部信息,可以用两个新变量来代替原来的14项指标因子。根据各个变量的特点,可以把第一主成分解释为经济社会发展的综合水平,第二主成分解释为全省(市、区)第三产业占GDP比重、职工年平均工资和第二产业占GDP比重。
表4 成分转换矩阵
对14项指标因子进行主成分分析后,可得到因子得分系数矩阵,见表5。
表5 因子得分系数矩阵
由于两个主成分能代表所有指标情况,因此用Z1表示第一主成分,Z2表示第二主成分。根据因子得分系数矩阵,可以将两个主成分与14项指标因子之间的关系表示如下:
其中,X1-X14是经过标准化处理的14项社会经济因素指标。
全国31个省(市、区)的上述指标经过因子分析后,各省(市、区)的两个主成分得分便由SPSS17.0自动计算出来。其中,广东省和江苏省的第一主成分得分最高,分别为2.76和2.50,表明其在经济社会发展水平中处于领先位置,而广东省和江苏省的流动人口分别排在第一位和第三位,远远领先于其他城市,这与前面的相关分析吻合。与此相反,北京和上海的情况则不同,二者的第一主成分得分不高,但流动人口的数量处于全国领先位置,与第二主成分的得分一致,其第二主成分得分分别是3.48和2.33,代表了全市第三产业占GDP比重、职工年平均工资和第二产业占GDP比重。从前面的相关分析可知,这三项指标与流动人口呈现较弱的正相关,尽管北京和上海的人口规模、从业人员以及GDP等指标都不如广东和江苏两个大省,但这两个直辖市作为全国的经济中心,第三产业的发展以及职工年平均工资都处于全国领先地位,因此,主要是这两个因素吸引了全国其他省(市、区)的人口向其流动。
3.回归分析
前面的因子分析将原先的14项变量减至2项,从而简化了回归分析。首先将已标准化后各变量的值代入两个主成分变量Z1和Z2表达式中,得到一个新的数据矩阵,再将标准化后的流动人口数据和两个主成分形成的新数据进行回归分析,得到如下线性回归方程:
不难看出,模型的拟合优度比较高,并且回归方程在1%的显著水平下通过了F检验,各指标的回归系数也通过了T检验,因此,回归效果比较显著,流动人口与14项社会经济因素指标因子之间的线性关系比较明确。在已知这些指标因子数据的前提下,将其标准化代入方程(1)就可得到流动人口的数据,从而为今后预测流动人口的数量以及从哪些方面加强流动人口管理提供了依据。
第一,制度尤其是户籍制度的影响。随着改革开放的发展,户籍政策逐步在放宽,但由于长期以来心理上的惯性作用,户籍仍然有巨大的心理限制效应,特别是在一些比较发达的大城市户籍仍然是主要的制度障碍。虽然目前人口流动总体上是自由的,但由于受到户籍的限制以及就业机会、子女入学、社会保障等的不平等在一定程度上阻碍了人口流动。
第二,信息的影响。由于当前市场就业体系不完善,流动人口就业信息大部分来自于亲戚、朋友等社会网络,而超越省(市、区)的流动人口社会关系往往大大减少,因此,在其他条件相同的情况下,信息越充分越可获得,人们就越有可能在不同产业和地区之间进行比较,从而有效地决定是否流动或者流向何处。
第三,宗教和文化的影响。主要针对少数民族的人口迁移而言,一个城市的宗教文化和生活习惯都会影响人们做出的迁移决定,通常大多数人会选择天气、饮食、城市文化跟自身条件比较适合的城市。
(1)全国31个省(市、区)流动人口的规模与其GDP、工业总产值、社会消费品零售总额、客运总量等11项社会经济因素指标因子有显著的正相关关系,与全省(市、区)第二三产业占GDP比重和职工年平均工资之间的相关关系不显著。
(2)通过因子主成分分析可知,广东省和江苏省的第一主成分得分最高,与流动人口的分布比较一致,表明流动人口大都集中流向这些经济比较发达的省份;而北京和上海的第一主成分得分不高,而第二主成分得分较高,这两个直辖市吸引人口流动的主要因素不是综合社会经济发展水平而是职工年平均工资和第三产业占GDP的比重。
(3)全国31个省(市、区)流动人口的数量与14项社会经济因素指标因子之间的定量关系可以用回归方程和两个主成分的表达式计算得出。回归方程为:Y=0.890Z1+0.121Z2,其中 Z1、Z2表示第一主成分、第二主成分。在已知这些指标因子数据的前提下,将其标准化代入回归方程就可得到流动人口的数据,从而为今后预测流动人口的数量和加强流动人口管理提供依据。
(4)影响我国流动人口的主要因素是社会经济因素,但也不能忽略制度、信息和宗教文化等的影响。政府的宏观行为对流动人口的引导和管理具有重大作用,因此,政府必须从各个方面入手,在促进各省(市、区)经济发展的同时,还要在户籍、就业、子女教育、社会保险、信息获取等方面进一步完善相关制度和政策,保障流动人口在异地也能得到相对公平的待遇和服务。
[1]Goldscheider C.Migration and Social Structure:Analydcal Issues and Comparative Perspectives in Devdoping Nations[J].Sociologlcal Forum Special Issue,1987(S):674-696.
[2]高洪.地区发展差距拉动:我国人口流动的成因分析[J].上海经济研究,2003(2):38 -46.
[3]栾敬东.流动人口的社会特征及其收入影响因素分析[J].中国人口科学,2003(3):66 -71.
[4]王春光.新生代农村流动人口的社会认同与城乡融合的关系[J].社会学研究,2001(3):63-76.
[5]段晶晶,李同升.陕西省城市流动人口影响因素的定量分析[J].西北大学学报,2010(4):327-331.
[6]段平忠.我国流动人口行为的影响因素分析[J].中国地质大学学报,2008(1):70-75.
[7]朱传耿,顾朝林,张伟.中国城市流动人口影响因素的定量分析[J].人口学刊,2002(2):9-12.
(责任编辑 邓成超)