人口流动分析中的两类偏差:基础数据与分析视角

2019-07-28 05:12
社会科学辑刊 2019年6期
关键词:常住人口流动人口流动

袁 红 清

一、引言

人口问题,关系到乡村振兴、精准扶贫、新型城镇化、重点区域经济发展等一系列国家与地区重大战略。人口流动,也因随着人口红利的逐渐消失、长期低生育率、老龄化加速等问题变得异常突出。2017 年3 月以来,席卷全国一线、二线50 多个城市的人才争夺大战更是把这一问题推向争论的焦点。近40 年来,人口机会窗口为经济社会发展创造了良好的人口基础,改革开放和人口流动又充分释放了人口机会的优势和潜能,使我国成功收获了人口红利,创造了中国经济奇迹。劳动力的转移是影响经济增长的基础性因素之一,转移的持续时间和转移后劳动力边际产出的变化,决定了地区经济可持续发展的时间和空间。〔1〕有学者经测算发现,流动人口每增加1%会带来地区GDP 增长0.54%,而地区GDP 每增长1%也会促进区域内流动人口增加0.52%。〔2〕当前人口流动出现了许多新的变化,国家卫健委发布的《中国流动人口发展报告2018》称:流动人口规模进入调整期,2010—2015 年流动人口增长速度明显下降,2015—2017 年则出现数量逐年下降,流动人口中减少的人群将聚集在45 岁以上人口,超七成返迁人口不愿再外出。〔3〕而按照蔡昉提出的“劳动力迁移的两个过程”的观点,对于流动人口而言,“从迁出地转移出来”的“一次迁移”目标已经达成,“在迁入地定居下来”的“二次迁移”(永久迁移)过程则尚未完成。〔4〕

今后流动人口会出现怎样的变化?又会对地区经济和社会产生怎样的影响?大规模流动还能否继续,是回流、摆动还是融入城市?部分学者认为,大规模的候鸟式的人口流动是农村劳动力向城市转移的特殊方式。从历史进程来看,农村人口外出就业的意义远大于回流。〔5〕且我国城镇化进程中的大量劳动力流动没有缩小收入差距,而造成这一“迁移谜题”的原因是附着在转移劳动力身上的人力资本量流出较多,应对外流的人力资本进行补偿。〔6〕

当前我国人口发展正处在关键的转折期,在今后若干年,我国人口在数量、素质、结构、分布和流动等方面都将持续发生深刻改变,也涉及城市规划、住房、教育、医疗卫生、社区治理等诸多经济、社会民生问题。要准确分析并有效解决人口发展中的问题,必须首先避免两类偏差:一是基础数据偏差。人口统计中,即便是1%的人口抽样调查和人口普查都存在诸多数据甄别困难,尤其是针对面广量大的流动人口,在大数据技术有效利用之前,几乎不存在准确的常规办法。二是分析视角偏差。不同的分析视角存在本位主义,普遍存在过分夸大本部门问题的重要性、轻视其他利益相关者诉求的现象,导致调研的样本、采集的数据、处理的方法、提出的对策缺乏全面性和全局性。因此,本文将基于2017—2018 年各类人口统计数据和全国流动人口卫生计生动态监测数据及第三方机构相关大数据,从流出地、流入地、流动人口自身三个角度对流动人口涉及的外出、就业、返乡、融合等几个核心问题进行梳理,从而为进一步深入研究新时代流动人口发展趋势提供一个有益的分析思路。

二、人口流动分析中的数据偏差

(一)人口普查和抽样调查存在的偏差问题

人口普查能获得全面、完整、详实的人口数据,其数据具有区域性强、层次多、内在规律强等特点。在普查年份能满足对全面人口数据的需求,但在非普查年份,靠年度人口变动情况抽样调查无法满足省级以下区域人口数据的需求。除人口普查年份外,目前全国地级和县级单位还没有统一口径的年度常住人口数据。现有的对流动人口的监测方法主要是政府统计部门、公安部门、卫健委部门等实施的10 年一次的全国人口普查(逢0 年份如1990、2000、2010、2020)、5 年一次的 1%人口抽样调查、5‰人口变动抽样调查以及部分城市对流动人口的不定期专项调查。由于在时间、地点、人物三者的结合上无法满足时效性,以上方法也只能勾勒出流动人口及常住人口的基本轮廓。广东、北京、上海、浙江等地是人口统计最困难的地方,因为人口变动太过频繁,而且北上广深拥有巨量的、经常性的访客人口,让统计变得更为复杂,此外,普查未能与日常人口行政记录有效结合,存在着主观和客观的偏差。

依靠人口变动情况抽样调查的局限性也非常突出,120 万样本人口在全国分布明显不足。尽管近年来,全国半数省份扩大了样本量,部分地区的人口变动调查形成了国家点、省点、市点、县点相互叠加的状况,但是随着样本量的扩大,需要更多的调查员。长期以来,人口变动调查没有国家直接管理的调查员队伍,地方临时调查员的业务能力和调查质量不能保证,势必会影响调查数据的质量。

人口统计是一件非常困难的事情,户籍人口的统计相对简单,流动人口基本上靠估算。一方面,频繁的人口流动本身给普查登记带来了难度,极易出现重复登和漏登的问题。另一方面,受部门利益驱动的影响,一些企业和单位故意少报瞒报外来人口,甚至拒绝调查,主要为了逃避监管部门针对临时用工不规范的管控。此外,随着社会利益群体日趋多元化,社会各种矛盾错综复杂,调查户的就业情况、婚姻状况、生育及劳动收入等隐私不想被外人知道。这样,外来人口调查中就容易出现瞒报、漏报、误报、拒报等现象。

对于人口流出的地区,人口(尤其常住人口)统计也同样存在困难和偏差。一是传统观念难以改变,户口观念根深蒂固。改革开放以来,人户分离状况非常普遍,为准确反映人口实际分布,统计指标从单一的总人口调整区分为户籍人口和常住人口。但由于人们户籍观念根深蒂固,担心漏登户籍人口会剥夺其权益,而多登了外来人口会侵占原户籍人口利益,导致常住人口难以获得准确数字。二是习惯上我们把农业户口人员不加区分地全部称为农民。这样会导致农业从业人数量庞大,二、三产业从业人员相对偏少,也使得农业从业人员出现诸如教育程度虚高、年龄结构失真等问题。

另外,抽样方法推广运用与设计能力不足的矛盾也较为突出,包括对调查主要指标的抽样误差重视不够,调查样本推算总体比较随意和简单,过分夸大人口抽样调查的作用,盲目地用抽样调查代替全面调查。

(二)大数据技术测量的总体一致性

随着大数据在智慧城市管理中的逐步应用,人口流动问题也找到了更为直观的分析和解读的工具和方法。其中的方法主要利用手机信令数据和地图平台的人口迁徙数据。手机信令(signaling)是手机用户与发射基站(微站)之间的通信数据,只要手机开机,接收到运营商(中国移动、中国联通、中国电信)的信号,就会产生信令数据,而数据字段中始终会带有时间和位置等信息。手机信令数据被动提供连续、动态的位置信息,是典型的大数据。地图平台迁徙数据主要有百度慧眼和腾讯位置大数据,迁徙数据是基于定位服务技术(LBS),通过手机用户的定位信息获得人口流动的轨迹。百度和腾讯公司的位置服务开放平台为数十万款手机应用程序(APP)提供定位服务,覆盖数亿手机用户,为人口分布、人群迁徙、职住分析提供了实测数据支撑。

根据腾讯地图、腾讯位置服务发布的《2019 春节出行预测大数据报告》①资料来源:腾讯地图、腾讯位置服务:《2019 春节出行预测大数据报告》,2019 年2 月7 日,https://cloud.tencent.com/developer/news/393324,2019 年 6 月 1 日。,春节“空城”指数最高的十大城市,分别是深圳、东莞、北京、上海、苏州、广州、杭州、郑州、成都、佛山。这十大城市全部位列城市地区生产总值(GDP)排名前20 位,除东莞外,全部属于万亿俱乐部成员。其中有4 个城市位于珠三角,有3 个城市位于长三角,另外还有京津冀区域的北京,中部区域的郑州,西部区域的成都。这种格局,与人口流动的大趋势相互契合,与中国的区域经济格局也相互照映。而根据高德地图发布《2019年春节出行报告》②资料来源:高德地图:《2019 年春节出行报告》,2019 年 1 月 29 日,http://www.199it.com/archives/825506.html,2019 年 5 月17 日。,从 1 月 28 日(小年)开始至 2月 4 日(年三十),深圳、北京、上海、广州、东莞、成都、苏州、郑州、杭州、佛山10 个城市人员流出最多,成为“春节空城”。周口、阜阳、商丘、茂名、徐州、南充、宿州、黄冈、信阳、南阳10 个城市人员流入最多,成为“春节团圆地”。

对比2019 年国家卫健委发布的流动人口数据③资料来源:国家卫健委:《流动人口社会融合蓝皮书:中国城市流动人口社会融合评估报告No.1》,2019 年1 月29 日,http://www.bjnews.com.cn/news/2019/01/29/543912.html,2019 年 4 月 23 日。,常住流动人口数量超过400 万以及常住流动人口比例超过35%的有两组城市与腾讯、高德大数据测算的“春节空城”也基本一致。另外根据国家卫健委发布的《中国流动人口发展报告2018》④资料来源:流动人口数据平台:《〈中国流动人口发展报告 2018〉 内容概要》,2018 年 12 月 25 日,http://www.199it.com/archives/813002.html,2019 年 4 月 23 日。,中国三大城市群的人口流动各具特征,这与百度地图慧眼《2018 年度中国城市活力研究报告》①资料来源:百度地图慧眼:《2018 第四季度&年度中国城市活力研究报告》,2019 年1 月31 日,http://jiaotong.baidu.com/landings/2018nianduchengshi.html,2019 年 5 月 17 日。中主要城市人口吸引力排行以及春运迁徙流向基本一致。

图1 百度大数据下的春运迁徙图与人口吸引力指数

(三)大数据技术测量的细节偏差性

以2018 年杭州市统计局公布的《2018 年杭州统计年鉴》中有关人口数据作为传统统计方法获得的数据样本,比较百度地图慧眼与同济大学建筑与城市规划学院空间分析和决策支持实验室联合研究发布的《杭州常住人口究竟有多少?——基于时空大数据测算结果的比较与讨论》②资料来源:百度地图慧眼:《杭州常住人口究竟有多少?——基于时空大数据测算结果的比较与讨论》,2019 年1 月28日,https://new.qq.com/omn/20190509/20190509A05VQ5.html,2019 年 4 月 23 日。,可以看出两者的偏差,数据对比如表1 所示。

统计局数据来自2017 年5‰人口变动情况抽样调查,杭州市抽中158 个样本小区,以2017 年11月1 日零时为标准时点进行入户登记。根据抽样调查结果推算,2017 年末,杭州市常住人口总数为946.8 万人,比2016 年末增加28.0 万人(位列2017年主要城市常住人口增长排行榜第三,仅次于深圳的62 万人和广州的45 万人)。③资料来源:中商产业研究院大数据库:《2017 年主要城市人口增量排行榜》,2018 年 3 月 21 日,http://www.askci.com/news/finance/20180320/145650120130.shtml,2019 年 3 月 9 日。基于百度原始设备数扩样后的2018 年杭州市常住人口规模推测值为1269.2 万人。作为参照,按照浙江移动提供的2017年4 月整月的手机信令时空大数据进行杭州常住人口测算,推算出杭州市常住人口为1209.8 万人。明显看出,两种方法获得的基础人口数据偏差巨大。

特大城市发展的一般规律表明,中心城区的周边区(城郊区)是吸引外来就业人员的首要区域。这一圈层区域一般集中了城市主要的产业园区,是吸引外来务工人员的主要就业区域。同时,以外来务工人员为主的常住人口主要选择中心城区的城郊区居住,这一圈层区域既保障了邻近就业岗位的短距离通勤需要,又具有相对中心城区较低房租、房价的住房选择优势。通过百度慧眼数据、手机信令数据、传统调查数据结果的横向比较,可以初步判断,基于百度地图慧眼大数据所识别的杭州常住人口与基于手机信令数据所识别的杭州常住人口在各区空间统计单元上呈现较为相似的特征。大数据识别的人口数普遍超出传统调查人口数,比率全在125%以上。这种识别率差异特征与杭州市区县的空间区位特征较为吻合,与杭州市的城市发展圈层结构一致。

表1 杭州市传统调查数据、百度慧眼时空大数据、手机信令数据所识别常住人口汇总

根据深圳市统计局《深圳统计年鉴2018》数据,2017 年末深圳全市共有常住人口1252.83 万人(2016 年末为1190.84 万人),其中常住户籍人口为434.72 万人,常住非户籍人口818.11 万人。而根据广东移动大数据创新中心2017 年12 月公布的《基于移动大数据的深圳市人口统计研究报告》①资料来源:广东移动大数据创新中心:《基于移动大数据的深圳市人口统计研究报告》,2017 年12 月,https://www.sohu.com/a/258072385_100012548,2019 年 6 月 20 日。,2017年11 月,每天生活在深圳的人数都超过2500 万人,平均达到了2567.2 万人。这其中包括了每天在深圳停留小于等于3 小时的“过客人口”的94.2 万人,以及每天停留超过3 小时,但每月在深圳停留不超过23 天的“访客人口”的288.4 万人。即便全部扣除以上两类人口,深圳日常住人口也有2184.6 万人,这比统计局公布的人口数据多了931.77 万人。

三、分析视角偏差

第二类偏差来源于人口流动分析涉及学科和分析视角的不同,导致提出的对策和建议差异较大甚至相互矛盾。从百度学术查询到的主题为“人口流动”的文献共11.8 万篇,其中2010 年后约有2.9万篇。文献研究领域涉及最多的是社会学(1.3 万篇),其次为公共卫生与预防医学、应用经济学、民族学、农林经济管理、理论经济学、法学等。从中国知网可以查询到主题为“人口流动”的文献25549篇,相关主题主要有:人口流动、劳务输出、劳动力流动、农民工、城镇化、流动人口管理、财政管理、户籍制度、计划生育等。

(一)基于推拉理论的分析框架

根据经典的人口迁移推拉理论,人口流动的目的是为了改善生活条件,目的地(流入地)的那些有利于改善生活条件的因素就成为拉力,而原住地(流出地)的不利的生活条件就是推力,人口流动由这两股力量前拉后推所决定。E.S.Lee 将影响人口流动的因素归纳成四种:迁出地因素、迁入地因素、中间障碍因素、流动人口自身因素。〔7〕首先,在关于我国人口流动的探讨中,迁入地经济发展水平、收入及就业因素常常被看作人口迁移的最主要动力。强大的经济驱动力是促使农民工大规模外出的主要动力,城乡之间巨大的经济收入差异是人口向城市流动的最主要原因。〔8〕总体上,中国人口省际迁移流动受迁出地推力作用弱于迁入地的拉力作用,表明人口迁移更多是出于对迁入地的“美好预期”,而非对迁出地的“过度抱怨”〔9〕。其次,是中间障碍因素。与国际相比,最主要的差异是中国的户籍因素,户籍制度是中国城乡人口流动最突出的制度障碍。“农村流动人口”是一种社会标签,依据的是城乡分割制度把我国人口划分为城镇居民与农村居民。〔10〕户籍制度以及附属的地方保护政策被认为是流动人口社会融入的最大障碍。〔11〕再次,是流动人口自身因素。流动人口外出就业及收入与其自身个体特征、人力资本有关,其中,提高受教育年限对乡城流动人口中高收入及以上阶层的影响比较大。〔12〕

不同的分析视角,尤其是“利为谁谋”决定了对策建议的立场。在推拉理论中至少涉及原住地、目的地、流动人口三方利益,如图2 所示。首先,对于原住地,青壮年劳动力人口净流出的省份会产生诸多不利,如人口负担增加、婚姻家庭不稳定、高端人才流失、产业难以培育、财税收入下滑、教育投资的财政外溢、没有足够的财力改善民生、发展缺乏后劲等。当然也存在一定的积极性,如缓解就业压力、增加流动人口家庭收入、增加对外交流联系、提高家庭保障等。如果回流,还会有人力资本的积累,甚至回乡带动投资创业。一般而言,持续人口流出对原住地存在较大伤害。基于原住地考虑的核心利益为稳住本地人口,若流动,则希望成功后回流返乡或在本地区流动。其次,对于目的地,大量人口的流入,弥补了人才及劳动力短缺,改善营商环境,形成优势产业,增加社会投资和消费,增加财税收入,改善民生和福利,提升城市和都市圈影响力,等等。潜在的不利面主要是社会治安、城市管理及大城市病以及部分本地人的抱怨等。显然,人口流入的有利面是主要的,但是要实现长期留居尤其是户籍转换,是存在许多中间障碍因素的,特别是一、二线大城市。一个核心的掣肘因素是以教育、医疗和养老为主的社会公共福利的短缺。基于目的地考虑的核心利益为鼓励人口流动,一般劳动力长期居住不必转换户籍和融合,而要尽可能去吸引优秀人才融入本地。再次,对于流动人员自身及家庭,迁移的根本目的是获得好的就业收入、提升个人人力资本、过上舒适方便的生活、提高家庭及子女教育的保障等。而忍受的痛苦主要有家庭的暂时分离、社会融合的困难。诸多调查研究表明,当前的流动人口对于融入本地、实现二次迁移,尤其是户籍转换的能力和意愿都是严重不足的。基于流动人口考虑的核心利益为鼓励人口流动,长期居住;基于个体差异和家庭理性选择可摆动流动,回乡创业,也可选择迁徙融入。

图2 基于推拉理论的流动人口二次迁移

(二)分析视角所带来的对策偏差

基于流出地(原住地)、流入地(目的地)和流动人口自身三方中的任何一方分析,所提出的建议和对策通常难以兼顾其他两方利益,甚至存在诸多的矛盾和冲突,如表2 所示,其中的一致性判断为本方(分析视角)的建议和对策与本方的核心利益以及其他两方基本利益是否存在冲突,尤其是否存在一方的利益微小增加或假想增加,而对另外两方的利益带来极大损害或实质损害。〔13〕

从表2 所列示的三方视角主要观点和对策建议看,普遍存在与己方核心利益以及其他两方利益的冲突,所使用的数据获取方法包括统计年鉴、人口普查、人口调查和调查问卷。调查问卷因为涉及更细节化的数据、提出相对微观个性化的对策而使得利益冲突大为减少。但是调查问卷的样本量普遍比较小,所得到的结论和提出的对策缺乏足够的说服力和推广价值。尤其是通过宏观数据的调查分析,得到的有些结论和提出的对策与微观个体真实意愿明显不符,也与其他利益相关体的核心利益相违背。

基于原住地(流出地)视角分析,无论鼓励全家迁移还是就近就地就业都不是一个能够得到流动人口普遍认可的建议,这既不符合流动人口外出的收益原则,也不符合城市生活的成本原则。基于目的地(流入地)视角分析,提出的公共服务均等化或城乡保障一体化均会遇到供给能力不足的问题,尤其是优质教育与医疗。而基于流动人口自身视角分析,有些看似在替流动人口考虑的对策和建议与流动人口真实意图和基本利益并不吻合,比如一些城市人口融合的建议,既夸大了现有城市对外来流动人口的隔离程度,也与外来人口长期居留利益相悖。大量已有调查表明,有关流动人口的诸多方面,如流动目的、流动形式、寻职渠道、就业类型、收入状况、留居意愿以及社会融合等方面的状况,普遍已经发生了明显的分化,很难通过人口普查、人口调查或传统统计数据对此进行统一的分析和判断。

表2 基于三方分析视角的对策建议和一致性

四、结论和建议

人口是国家发展的基础性、全局性、长期性和战略性要素,是国家的根本,人口数据是政府治理的重要依据。虚假的人口统计和离谱的人口预测会严重影响政府决策并威胁国家的长治久安。当前人口发展的历史进程已经从以出生、死亡以及由其决定的自然变动为主导的阶段转向以人口流动迁移为主导的阶段。因此,在人口发展战略研究、规划安排、政策制定中,一定要避免基础数据和分析视角的偏差。

首先,当今社会对人口统计数据已形成了宏观、微观、多层次、多样化、实时性的需求。不仅需要年度的全国及分省份常住人口和流动人口数据,还需要分地市、县、街道社区和乡村等小区域的年度数据。人口普查和抽样调查方法作为获得这些数据的传统方法已凸显其局限性。应当以2020 年人口普查为契机,建立以人口普查数据为基础、社区网格化管理年度更新为主体,以人口抽样调查为辅助、人口相关大数据分析等为补充的多种方法综合运用的调查方法体系。尽管目前运用时空大数据调查流动人口的方法仍需不断地进行算法优化与实际检验,但无疑是对传统人口调查动态跟踪局限性的一种有效的弥补手段。

其次,在不同的视角分析上,基于推拉理论的原住地、目的地和流动人员三者视角,已有流动人口分析文献明显存在诸多不一致情况。要站在全局和战略高度来认识人口流动迁移问题,而且必须要有长远视角、系统优化观点,应坚决摒弃在人口流动迁移问题上的本位主义、地方保护、部门至上、短视化、碎片化等倾向。不能为解决某一问题而产生更多派生问题,避免推荐的对策给其他利益相关者带来明显的利益损失或冲突,甚至于己方的核心利益也不顾。

最后,只有基于精准的基础数据上,采用系统整体优化的思路,尊重各方的理性选择和市场调节力量提出的对策和建议,才能真实反映我国人口流动迁移的基本特征和趋势,才能提出不误判形势、不阻碍改革的建议和对策。

猜你喜欢
常住人口流动人口流动
2021 年内蒙古自治区常住人口主要数据公报
流动的光
北京城市副中心:常住人口控制在130万以内
数说流动人口
数说流动人口
为什么海水会流动
2015年上海市常住人口首现负增长
流动人口二孩可在居住地登记
给流动人口更多关注目光
上海2008年常住人口1888万多人