人口常态化统计方法初探

2015-10-14 01:18樊佳佳
统计科学与实践 2015年8期
关键词:人口统计户籍人口

樊佳佳

(上海市统计局,上海 200003)

人口常态化统计方法初探

樊佳佳

(上海市统计局,上海 200003)

当前,人口问题已成为影响上海这个特大型城市经济社会发展的关键因素。对人口统计来说,现有人口统计制度框架下的人口统计成果已不能满足现实需要。探索研究人口常态化统计,研究建立一套科学、完整的市区两级常态化人口统计制度的可行性,以及探索完善人口数据评估方法,对跟踪监测人口总量和分布、及时反映人口变化趋势具有重要的现实意义。

人口管理;人口统计;常态化

人口是一个国家的最基本国情国力信息,世界各国都把掌握准确的人口数量、人口素质、人口结构和人口分布等情况,作为科学治国和宏观决策的基础。不同时期和不同地区有不同的人口问题①《转型时期的中国社会人口》,黄荣清等,辽宁教育出版社。,为了保障人的生存和促进人的发展,实现人口和资源环境以及社会经济协调发展,则必须有研究人口的科学,称之为“人口学”。

人口统计学的研究是人口学的重要组成部分,主要是研究人口变动及其发展规律的,包括两个基本方面的内容:一是人口变动,包括人口总量、出生、死亡和迁移的变动,也包括人口的性别、年龄的自然结构变动以及城乡、地域、文化、民族、职业、婚姻和家庭等非自然结构变动;二是人口发展,即人口在与资源、环境、经济和社会的相互作用下的发展。对上海这样一个特大型城市来说,做好人口统计工作显得尤为重要。

一、人口统计工作对上海社会经济发展的意义

上海是全国人口最密集的城市。一直以来,上海的人口统计工作适时为全市提供人口统计数据。通过十年一次的人口普查、每十年一次的1%人口抽样调查、其他年份的人口变动抽样调查,提供上海人口总量、结构、分布等各方面的信息,为制定正确的经济社会发展规划和人口综合管理政策起到了积极的作用。

随着外来人口的成倍增长,上海人口规模在不断扩大。户籍人口人户分离现象的日益突出,户籍人口老龄化与外来人口老少人口的增长不断冲击着上海市“人口红利”,上海市的人口问题越来越复杂。人口与资源环境、公共服务配置的矛盾、人口对城市承载力的压力、人口未来发展等一系列的问题也越来越受到外界各方普遍的关注、关心与重视,对上海的人口统计工作也提出了更高的要求。

二、上海人口统计面临的问题

国际上,各国进行人口统计同样采取人口普查与其他人口调查相结合的方式。如美国的人口统计调查就由十年一次的人口普查、每年开展的社区人口调查和其他人口专项调查组成。我国尽管现行的人口统计制度已基本与国际接轨,但由于户籍二元体制、信息共享与安全性等因素影响,使得人口统计难度远高于美国等其他国家。

(一)入户调查的难度不断增加

1.被调查户的配合程度不断下降。进入市场经济时代后,政府干预力量退居幕后,居民保护个人隐私的意识不断加强,市场各类商业调查扰民甚至冒用调查名义实施违法犯罪的活动时有发生,因此,居民对入户调查的配合程度逐年下降。这是一定经济发展时期的普遍现象。以美国的人口普查为例,1970年大约78%的家庭户回复了调查问卷,1980年为75%,1990年为65%,2000年则下降为61%左右。

2.被调查户的流动性不断加大。具体表现为,一是户籍人口人户分离现象愈加严重,二是外来人口的流动特别频繁。根据2010年第六次人口普查资料分析,上海户籍常住人口共1404.71万,按乡镇街道计算的人户分离比例已达到了27.4%。根据现行的人口统计原则,被抽中调查的小区内的调查对象无论是户口还是人口均要进行调查。因此,对那些长期人户分离的人口的“户口所在地”进行入户调查填表,难度相当大。对外来人口来说,上海在近十年里增加了近600万人,相当于一个中等城市的人口规模,2013年末,外来常住人口总量更达到了990万人。而相当一部分外来人口的最大特点是居住地和工作岗位不稳定,入户访问遇到的难度很大,不易查准。

(二)非普查年份的抽样调查对细分结构的数据代表性不足

虽然我国在两次普查之间的间隔年份中,开展1%或1‰人口抽样调查进行补充,但是无法取得与人口普查一样完整的人口总量与结构数据。每年的1‰人口变动抽样调查结合多种人口数据评估手段,基本满足推算全市常住人口总量和几个主要人口指标的要求。但受样本规模大小的制约,其他细分结构数据如分年龄、分教育程度等人口结构,以及分区县人口主要数据等信息,1‰人口变动抽样调查样本代表性不足。而每十年一次的1%人口抽样调查的抽样比虽更高些,但也是作为普查间隔年中五年的数据补充,只能基本满足每五年人口结构数据的要求,无法得到连续年份的人口结构数据。因此无法满足市政府开展人口管理工作中对各区县人口匡算和分配提出的更密集、更精准的数据要求,无法实现人口统计科学、持续的结构数据服务的要求。

(三)人口统计基础力量比较薄弱

1.受制于区县及基层统计力量的薄弱等因素的影响,不少区县对这项工作的重视程度不高,投入的人力精力有所欠缺,数据评估能力和水平提升不快。

2.通过评估虽然能较好地掌握全市人口总量,但由于外来人口的流动性较大,上海市户籍居民的人户分离现象日趋普遍,区县统计局人口评估工作能力尚不足,对区县人口的准确性缺乏把握,对乡(镇、街道)乃至村(居)委会人口的准确掌握更加薄弱。

3.数据评估主要依靠每年末开展的人口变动抽样调查结果和相关部门的数据资料,由于调查汇总结果和统计报表的时间周期较长,所以在反映上海市人口总量等数据的频率和时效性上存在明显的不足,尚不能做到类似行政记录一样的即时反馈。

三、建立上海人口常态化统计制度的设想

人口常态化统计,是指形成人口数据常规化统计制度,提供数据发布更频繁、数据内容更丰富、数据实用性更强的人口数据。这其中,包含了人口统计调查、人口数据评估以及人口数据战略分析的整体概念,在人口数据的广度、深度、频度等各个层次突破现有人口统计的瓶颈。

(一)进一步完善现有的人口统计制度

每一次的人口普查均会经历很长一段时间的社会各界的经验反馈与方案制定上的商讨,对于普查的更新,主要由国家统计局主导。对上海来说,更多的可发挥的是非普查年份的人口抽样调查,建议从改变调查制度和调查方式入手。一是使调查问卷设计更简洁,包括姓名、性别、年龄、受教育程度、地址、就业情况等主要人口指标,尽量减少涉及个人隐私的问题;二是革新传统入户调查方式,使用电话访问、网络调查、自愿填写问卷邮寄等多种方式相结合,来提高调查的成功率。除此之外,从提高数据质量和增强数据的衔接性方面提出两点建议,一是不断改进数据采集与录入方式,降低调查误差、提高调查效率;二是注重普查方案的可持续性,为历史数据衔接与对比提供基础。

(二)提高人口抽样调查的代表性

目前,普查间隔年份开展的人口变动抽样调查主要是为了推算全市人口总量服务的,而人口常态化统计的主要目的是为了取得每年度的全市人口结构数据与分区县的人口数据。因此,在兼顾科学性与可操作性的原则下,我们必须对人口变动抽样调查进行适当的扩样处理。

考虑到调查数据结果的科学性,在现今调查经费制约条件下,我们对调查的目标指标、置信区间、允许误差进行计算,根据上海的实际情况,我们主要的目标指标是分区县户籍常住人口与分区县外来常住人口,样本拟分布所有乡镇街道,涉及全市20%左右的村(居)委会。因此,针对不同区县的户籍常住人口的人户分离情况与外来常住人口比重来计算抽样方案。通过计算,当全市各区县常住人口总量的相对误差控制在5%左右,调查的把握程度为95%(t=1.96),共需要调查样本量71万人左右。这意味着,要将平常年份的人口变动抽样调查1.5‰的抽样比提高至3%左右。

扩样抽样调查虽然是目前公认最科学地获取人口数据的统计手段,但对非普查年份的人口变动抽样调查进行扩样,每年需要付出大量的人力、物力和财力。在统计基层力量比较薄弱、入户调查环境比较严峻的形势下,进行大样本抽样调查的工作压力相对较大。

(三)完善大数据平台进行人口数据评估

由于人口的流动性与不可预测性,人口统计的难度远大于经济统计。人口总量的变动与人口结构的变化受到政治、社会、经济和文化等各方面因素的影响,上海的人口数据不仅需要从抽样调查结果中进行科学测算,也需要利用更多与人口相关信息资源对数据结果进行科学严谨的深入分析与评估。

设想通过完善现有的人口数据平台,充分利用与人口相关的各类大数据对现有数据资源进行评估,一方面包括官方人口数据,另一方面包括社会各领域的人口大数据信息,进一步整合两方面的大数据资源,在抽样调查结果的基础上,通过信息数据评估手段来实现人口常态化统计,具体思路如下图所示。

图1 建立大数据平台的思路示意图

四、整合、评估与发布人口数据的具体设想

(一)整合官方人口数据资源,增加人口数据发布频率、丰富数据内容

目前来看,全市各委办部门涉及人口数据的口径繁多,数出多门,主要包括公安系统的“两个实有”人口信息管理系统、卫计委的流动人口动态监测、疾控中心的生命统计数据、老龄委的老年人口监测、出入境管理部门的境外人口数据、教育部门的学前及学籍人口数据等。这些分散在各委办部门的相关人口数据,一直以来都是市统计局每半年对全市人口总量进行评估时参考的重要资料。但是,由于缺乏牵头部门进行统一整合利用,这些政府部门的人口数据资源目前还处于指标口径不统一,统计时间不固定、统计范围不一致、数据库无法共享的阶段,对人口统计数据的评估带来一定的难度。

在加强人口管理的大背景下,我们需要对各方人口信息进行整理规范,并对数据统计发布与数据共享进行统一。但是,官方人口数据库的建立与维护是项庞大的工程,需要由市政府出面,确定牵头单位,整合各相关部门共同开展。

根据现行政策要求,所有数据必须由统计局进行发布,故统计部门必须承担起对人口数据库进行系统、规范、大规模的数据整合的责任,主要包括:

1.整合现有部门人口数据。目前,上海各委办部门的人口数据虽然看上去种类繁多、数据丰富,但由于指标口径、统计时间、登记范围等因素的影响,数据并不能通用,需要对各部门数据进行整合(表1)。

表1 各部门人口指标比对表

比如,公安部门的“实有人口”数据涵盖了全市所有区域的实际居住人口,是个非常有价值的人口数据信息库。自2009年开始建立“实有人口”信息系统以来,该系统通过全市1.4万名人口协管员的实地监测,打通户籍与非户籍之分,不仅包括了实有房屋和实有人口的数据,更将所有持有居住证与临时证件的外来人口全部登记在内,使得上海的人口管理实现完全信息化。但是,由于实有人口信息库中判定外来人口的依据主要是以居住证为主,对那些持临时证件或未持证的外来人员,则以“居住在上海时间超过一天”为标准。因此与统计口径“常住人口”的“离开户籍地半年”判断标准无法吻合,这就造成了两家数据“名称相似、口径不同”的局面,使得外来人口这一数据的相互校核与分析上产生了问题。

对此,可以通过在实有人口登记表上增设“离开户籍地半年与否”的指标来解决这一问题,从而解决数据整合分析上的困难。

又如,早在2009年市统计局就提出过利用社保卡信息进行数据校核与评估的办法。社保卡的优势在于,一是人口覆盖率高,二是数据信息丰富。自1999年发放至今,全市社保卡发卡数量已达1400余万张,户籍人口基本人手一卡,卡内收集包含了姓名、性别、受教育情况、婚姻情况、就业情况等基本人口信息。但是,它也存在先天缺陷,即信息更新不够快。对户籍人口来说,如果没有就学、就业、就医等行为,那么卡内信息就基本维持在登记开户时的内容,这使受教育情况、婚姻状况、就业情况等信息有所滞后。

对此,建议将社保卡信息与公安部门的户籍人口信息进行整合,再辅以人口普查的户籍人口信息库进行补充,基本可以掌握实时的户籍人口基本结构状况。

2.评估部门数据后进行常态化发布。一部分数据经过整合与综合评估后,可以每月发布,比如:户籍人口的自然变动情况(出生人数、死亡人数)、户籍人口迁移情况(户籍迁入迁出人数)、常住人口婚姻生育情况(结婚、离婚人数与生育数据)、出入境数据等。

另一部分数据可以按季度发布,比如:户籍人口就业情况(就业人员数、新增就业人数、失业率)、分年龄户籍人口数等。

更多的详细数据按年度发布,比如:全市常住人口总量、人口主要结构(户籍人口、外来人口等)、人口区域分布(分区县常住人口总量、户籍人口与外来人口分布)、人口年龄结构(各主要年龄段人口、老龄化率、户籍人口与外来人口年龄分布、社会抚养比)、城镇化率(质量评价体系)、劳动力数据(就业人口、失业率)等。

基于官方数据建立的人口统计数据评估平台,将成为最权威的人口统计数据发布和各部门人口数据共享互利的平台,这是实现全市人口数据常态化统计的重要基础。

(二)创建社会各领域的人口数据平台

随着社会发展速度不断加快,社会各类信息愈加丰富,更多的与人口相关的影响因素也在不断增加。充分利用社会各界与人口相关的数据资源,建立一个“人口大数据平台”通过对大数据的时点跟踪分析,对人口数据趋势进行研判,使其成为人口评估的重要手段。与其他城市相比,上海在人口大数据的建立上已具有一定实力与基础。

1.搜集社会领域人口数据创建平台。近两年来,除了依靠对官方人口行政记录的整合分析进行人口数据评估,更多的在通过市、区、街(镇)、居(村)委多级统计力量在做基础资料的搜集与分析。每半年,市统计局都会根据评估数据的要求,从统计局层面进行经济类数据、社会保障类数据的整理,从街镇层面进行各区域的影响人口变动因素的数据的收集(表2)。

表2 现有人口数据评估数据体系表

2.把握“智慧城市”的契机创建平台。上海的诚信体系建设相对比较完善。通信业、银行业、房地产业以及公共资源服务提供领域,都建立了相对比较完善可信的用户数据库。上海产业界各类数据资源积累非常丰富,仅以全市通信基础设施来看,目前全市光纤接入使用用户超过320万户,全市家庭宽带普及率超过60%,WLAN覆盖场所总量已达1.8万处,完成全部456处场所i-Shanghai建设并投入试运行,4G建设完成TD-LTE网络800个宏基站和300个室内覆盖站点建设。此外,上海近年来重点推进云计算、物联网、移动互联网产业的发展,这些都为大数据应用提供了基础性条件。我们可以充分利用这些产业界的积累资源来进行人口数据的分析。

3.更多的有实用性的目标数据资源。

(1)移动、电信等手机用户信息。由于上海的手机普及率相当高,通过对手机持有人规模、变动等信息的分析,可以对全市及各区域人口结构、迁移情况进行校核。

(2)居民用水电煤用量等居民日常生活消耗信息。人口消耗的日常品数据是判断人口规模变动趋势的重要信息,通过跟踪比对居民用水电煤、盐等有关数据,可以获取全市及各区域的人口变动趋势。

(3)房地产行业的用地情况、房屋售卖与空置情况等。人口与土地的关系是众多超大型城市研究的课题,分析上海土地与人口关系,有助于评价全市人口总量及城市人口承载力发展的趋势。

(4)公共服务资源类信息,包括交通、就学、就医、买房等各类信息。跟踪比对此类信息也可起到对人口总量校核的作用。

五、值得关注的问题

目前,建立“人口大数据平台”还只是设想,平台的建立需要进行综合全面的分析与研究,如何在浩瀚繁杂的人口数据信息中选择实用性强、代表性强、操作简便且数据指向性意义高的内容进行整理与分析,是一项严峻的课题。

首先,要明确所需人口资料的来源,主要是搜集相关产业的各类人口资源,并对数据资料进行科学性与可操作性的分析判断。

其次,要进行数据处理的“统计化”处理,也就是将各类不合规范、无法统一使用的数据进行规范化处理,包括统计口径的规范化处理,数据代表性不足的结构性补充等。

另外,还需要提供强大的数据信息处理后台服务。所谓“大数据”(Big Data)就是指需要新的处理模式、能够具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。从技术上看,大数据必须依靠云计算进行分布式架构的数据挖掘、云存储与虚拟化技术。因此,有了软实力上的数据需求分析,也需要硬实力上的服务器支持与云计算分析。

以此为基础,随着不断充实与更新不同渠道、资源的人口信息,滴水穿石、累沙成丘。建立起海量人口类数据平台后,经过多样化的信息处理与数据挖掘,我们就能突破以往的单纯依靠抽样调查进行数据发布的旧模式,向数据发布更频繁、数据内容更丰富、数据实用性更强的新模式转变。

[参考资料]

[1]转型时期的中国社会人口,黄荣清等,2004年,辽宁教育出版社;

[2]从美国社区调查看美国人口统计方法制度的改革,胡英,2004年,市场与人口分析;

[3]美国人口普查局网:http://www.census.gov/。

(责任编辑:曹家乐)

猜你喜欢
人口统计户籍人口
《世界人口日》
人口转型为何在加速 精读
当前经济形势下人口统计存在的问题及对策分析
大数据时代下人口统计存在的问题及对策研究
人口最少的国家
1723 万人,我国人口数据下滑引关注
征婚信息
保定地区人口统计调查报告
户籍改革:社会变革带来大机遇
户籍改革倒逼医保改革