辜子寅
(1.中南财经政法大学 统计与数学学院,武汉430073;2.常熟理工学院 数学与统计学院,江苏 常熟 215500)
若通过调查直接估算总和生育率,调查内容涉及到15-49岁每一年龄段的育龄妇女人数及其当年生育子女数。在我国,非普查年份,根据人口变动情况抽样调查的样本数据进行估算,大多数年份抽样比略低于1‰。即使在人口普查年份,对育龄妇女生育状况的调查也没有进行全面调查,而是按10%的抽样比例将调查结果在长表中公布。我国一直实行计划生育基本国策,政绩考核时实施计划生育一票否决制,基于利益考虑,出生人数不可避免存在漏报、瞒报。2010年第六次人口普查显示,我国总和生育率低至1.18,郭志刚(2012)[1]基于“六普”数据,认为我国以往生育水平存在高估。但也有不少学者对“六普”结果提出质疑,国家人口计生委认为我国总和生育率已经达到1.8左右,王广州的研究表明实际生育水平应该在1.5左右(王广州等,2013)[2]。我国总和生育率究竟有多高?这是政策制定者及学者们关注及争论的焦点,只有正确认识我国目前的真实生育水平,才能实行适当的生育政策,以促进未来的人口发展与经济增长。
除了直接调查这一方法以外,众多学者对如何依据其他辅助信息重新估计总和生育率进行了积极的探讨。王金营等(2004)[3]考虑出生漏报人数,对省级生育水平重新评估,认为2000年13个地区总和生育率超过更替水平。张青(2006)[4]通过对生育率指标的改进重新估计了我国总和生育率,得到2004年达到1.62的结论。杨新平等(2010)[5]通过构建自回归分布滞后模型,对我国总和生育率进行了重新估算。王广州和胡耀岭(2011)[6]从方法上进行了改进,提出真实队列年龄别生育率测算法研究生育水平。本文通过探索总和生育率与一般生育率的数量关系,对我国2000~2012年的生育水平进行了重新估计,并研究了其对出生人数变动的影响,预测了未来人口规模与结构。
全国总和生育率处于较低水平,波动中略有上升。通过人口普查及非普查年份的抽样调查,我国2000~2012年总和生育率见表1所示。2000年以来,我国总和生育率在1.04~1.47之间波动,其中,2000~2004年、2005~2008年两个阶段呈现稳步小幅提升的特征,2008年达到最大值1.47。此后,2009~2011年总和生育率大幅下降,2011年降到最小值1.04,2012年回升至1.26,略高于2000年1.22的平均水平。
总和生育率地区差异显著。2000、2005、2010年我国31个地区总和生育率抽样调查结果见表2所示。从地区差异来看,北京、上海、辽宁、黑龙江、吉林和天津的总和生育率非常低,三次调查均低于1,其中北京最低,2010年仅为0.71。而广西、贵州、新疆和海南的生育水平相对较高,总和生育率一直高于1.5,其中广西最高,2010年达到1.79。从区域层面来看,2010年,东部地区总和生育率最低,仅为1.06;其次为中部地区,总和生育率为1.25;西部地区总和生育率最高,达到1.33。2010年全国总和生育率1.18,相比2000年下降了3.04%。这一下降趋势主要来自西藏、辽宁、山西、云南和贵州的贡献,这些地区2010年总和生育率比2000年下降幅度均超过20%,西藏降幅最大,下降了43.38%。总和生育率逆势上升的地区中,湖北、广西、广东、安徽和湖南提高幅度较大,均超10%,其中湖北升幅最大,提高了26.12%。
全国年龄别生育率峰值下降,峰值生育年龄后移。我国育龄妇女年龄别生育率变化状况见图1所示。从中可以看出,2000~2012年,全国生育率峰值年龄由24岁推迟到26岁,峰值水平由2000年的145.69‰不断下滑,2012年达到110.29‰,共下降了35.40个千分点。其中,19-25岁育龄妇女生育率大幅下降,26岁及以上的生育率则呈现上升趋势,从队列角度来看,2000~2012年期间,育龄妇女完成生育过程的速度呈现减慢的趋势。
表1 2000~2012年我国总和生育率及分孩次总和生育率 (单位:‰)
表2 2000、2005、2010年我国各地区总和生育率 (单位:‰)
从分孩次总和生育率来看(见表1),2000~2012年期间,一孩总和生育率波动中略有下降,2012年达到0.81,下降了5.99%;二孩总和生育率呈现上升趋势,2012年达到0.39,提高了33.98%;三孩及以上总和生育率则相对稳定,2012年达到0.06。
从分孩次年龄别生育率来看(见图2~4),我国人口以一孩生育为主,一孩生育率峰值年龄稳定在23~24岁,峰值水平显著下降,2012年达到83.34‰,较2000年下降了34.20%。全国一孩总和生育率的下降主要由于19~25岁年龄段的生育率大幅下降所导致,而26岁及以上一孩生育率均呈现上升趋势。二孩各年龄生育率明显提高,峰值年龄稳定在28~29岁,峰值水平上升,2012年达到31.36‰,较2000年提高了12.16%。同时,31岁及以后二孩生育率超过一孩生育率。三孩及以上生育率峰值年龄不断后移,由28岁推迟到32岁,峰值水平略有下降,2012年达到4.97‰,较2000年下降了6.05%。
图1 我国育龄妇女年龄别生育率变化图
图2 我国育龄妇女一孩年龄别生育率
图3 我国育龄妇女二孩年龄别生育率
图4 我国育龄妇女三孩及以上年龄别生育率
Smith(1992)[7]的研究表明,总和生育率(TFR)与一般生育率(GFR)存在近似的线性关系,即:TFR≈30×GFR。但由于各国国情和生育政策的不同,在生育研究中,这一线性关系未必适用于所有地区,其应用受到一定的限制。本文通过我国各地区两次人口普查及一次抽样调查的详细数据资料,探索我国总和生育率和一般生育率的数量关系,并基于此数量关系,对全国及31个地区的总和生育率重新进行测算。
基于2000年第五次人口普查、2005年全国1%人口抽样调查及2010年第六次人口普查资料,根据此三次调查中我国31个地区总和生育率与一般生育率的统计数据,以总和生育率为因变量(用TFR表示),一般生育率为自变量(用GFR表示),进行面板数据回归分析。
表3 回归方程中的ci
通过对面板数据进行F检验,得到F=2.506>F0.05(30,61)=1.646(相伴概率 P=0.001<0.05),表明混合模型与个体固定效应模型比较,建立个体固定效应模型更适合。然后通过Hausman检验,相伴概率P=0.003<0.05,表明个体固定效应模型与个体随机效应模型比较,建立个体固定效应模型更适合。因此,对此面板数据建立个体固定效应回归模型,得到F=28.413,=0.902,可见模型拟合优度较高,总和生育率与一般生育率存在显著的线性关系。
2.2.1 一般生育率估计
根据历年《中国统计年鉴》中年末人口数及出生率,推算2000~2012年全国及31个地区的出生人数。
出生人数=出生率×(上一年年末人口数+当年年末人口数)/2
以第六次人口普查中,2010年各地区各年龄段平均女性人数为基础数据,假设各年龄段死亡率保持相对稳定,按队列方法推算2000~2012年各地区15~49岁育龄妇女总人数。根据第六次人口普查,2010年全国15~49岁育龄妇女总人数为37893.22万,由此推算得到2000年15~49岁育龄妇女总人数为34883.55万,这与第五次人口普查时得到的34835.50万十分接近,表明育龄妇女数据质量比较高,此推算方法具有合理性。
根据以上估算的出生人数和15~49岁育龄妇女总人数,即可得到2000~2012年各地区一般生育率估计值。一般生育率=出生人数/15~49岁育龄妇女总人数
2.2.2 总和生育率的回归估计
将一般生育率估计值代入回归方程,即可得到总和生育率估计结果,见表4所示。
表4 2000~2012年全国及各地区总和生育率估计结果(单位:‰)
全国总和生育率估计值有两个,差别在于出生人数统计口径有两个。口径1中,全国出生人数为31个地区出生人数之和,由于与各地区出生人数统计口径一致,因此,全国总和生育率的这一估计更适合进行横向比较。而口径2中,出生人数是用全国年末人数及出生率推算,此口径全国总人口包括了现役军人数,且根据抽样误差和调查误差进行了修正,而分地区数据中未包括现役军人且未作相应的修正。所以,全国总和生育率的这一估计更为真实,也更适合进行动态分析。因此下文的分析中,总和生育率进行横向比较则用口径1,而进行动态比较及人口预测则用口径2。
基于本文估计结果,从时间序列角度来看,2000~2012年期间全国总和生育率(口径2)呈现明显下降趋势,2012年达到1.43,较2000年下降了10.57%。其中,在2000~2006年期间表现为大幅下降的变动特征,2006年总和生育率为1.42,较2000年下降了11.14%;而在2006~2012年期间表现为波动中略有上升的变动特征,2012年比2006年提高了0.64%。在31个地区中,共10个地区的总和生育率在2000~2012年期间呈现出逆势上升的趋势,包括8个东部地区(北京、天津、河北、上海、江苏、浙江、福建和山东)和2个中部地区(湖北和湖南)。
从总和生育率的地区差异来看,2012年,共13个地区总和生育率低于全国1.36(口径1)的平均水平,包括8个东部地区(北京、天津、辽宁、上海、江苏、浙江、福建和广东)、3个中部地区(山西、吉林和黑龙江)和2个西部地区(内蒙古和陕西)。其中,吉林、辽宁、北京、黑龙江和上海总和生育率非常低,仍低于1,吉林最低,仅为0.79。2012年共12个地区总和生育率超过1.5,包括2个东部地区(河北和海南)、3个中部地区(安徽、江西和湖南)和7个西部地区(广西、贵州、云南、西藏、青海、宁夏和新疆)。其中,贵州和广西生育水平相对较高,总和生育率分别达到1.86和1.83。
统计口径2中总和生育率估计值明显高于统计口径1中的估计值,平均高6.69%。与国家统计局公布的全国总和生育率官方统计结果相比,统计口径1中,2000~2012年期间,本文估计值与官方统计结果相差幅度平均来看大约为7.82%。其中,2002~2004年、2006~2009年两个阶段,估计值略低于官方统计结果,平均低4%。其他年份的估计值则高于官方统计结果,平均高12%。统计口径2中,本文估计值与官方统计结果相差幅度平均来看大约为10.78%,仅在2004、2007、2008三个年份估计值略低于官方统计结果。由于口径2的总和生育率更为真实,官方估计结果或许存在一定程度的低估。
与“六普”结果相比,基于本文估计方法,2010年全国总和生育率已经达到1.34(口径1)/1.41(口径2),均明显高于“六普”时1.18的平均水平。并且,31个地区估计的总和生育率均高于普查数值,其中山西、辽宁、吉林、黑龙江、江西、山东、四川、西藏八省总和生育率估计值与普查数值相差幅度较大,估计值高于普查数值20%以上;而北京、上海、湖北、广东、广西五省总和生育率估计值与普查数值非常接近,估计值高于普查数值的幅度控制在5%以内。第六次人口普查按10%抽样比例得到的总和生育率或许存在低估的可能,原因可能有两方面,一方面,样本的代表性或许还有待商榷,另一方面,出生人口存在一定程度的漏报。
一个地区出生人数(用Y表示)的变化由两个因素引起,一个是育龄妇女的生育率(用P表示),另一个是育龄妇女的规模和年龄结构(用Q表示)。本文通过指数体系的构建,对影响出生人数变化的因素进行指数分解,探讨生育率对出生人数变化的影响。该指数体系可表示为:
从出生人数及总和生育率的变动规律来看,在2000~2012年期间总的来看均表现为小幅下降的变动特征,其中2000~2006年期间大幅下降,2006~2012年期间出现反弹,呈现上升趋势。
从育龄妇女的规模和年龄结构来看,2000~2012年15~49岁育龄妇女人数逐年稳定上升。其中,20~29岁生育旺盛期育龄妇女人数及所占比重均经历了先下降(2000~2006年)后上升(2006~2012年)的变化过程。
基于出生人数、生育率、育龄妇女规模和年龄结构的变动规律,以下的指数分解按时间段分三步完成:2000~2006年、2006~2012年、2000~2012年。利用2000、2006、2012三次人口抽样调查中育龄妇女分年龄生育状况的结构信息,假设各年龄育龄妇女生育结构与当年抽样结果保持一致,则可依据总和生育率(口径2)推算出育龄妇女年龄别生育率。指数分解结果见表5所示。
2000~2006年,出生人数减少了258.30万,这源于育龄妇女生育率、育龄妇女规模和年龄结构的共同作用,其中生育率的影响高于育龄妇女规模和年龄结构的影响。具体来看,总和生育率由1.59下降到1.42,其影响使出生人数减少163.13万,贡献率为63.15%;育龄妇女总量虽然提高了6.90%,但20~29岁生育旺盛期育龄妇女人数却下降了8.82%,最终,育龄妇女规模和年龄结构变化的影响使出生人数减少95.17万,贡献率为36.85%。
2006~2012年,出生人数出现小幅反弹,增加了114.18万,这主要源于育龄妇女规模和年龄结构的影响。具体来看,总和生育率波动幅度较小,对出生人数变化的贡献率为-17.52%;育龄妇女总量提高了2.09%,20~29岁生育旺盛期育龄妇女人数提高了15.70%,育龄妇女规模和年龄结构变化的影响使出生人数增加134.18万,贡献率为117.52%。
2000~2012年总的来看,育龄妇女规模和年龄结构的影响使出生人数增加,而育龄妇女生育率的影响则恰恰相反,最终,育龄妇女生育率的影响更大,出生人数减少了144.13万。具体来看,总和生育率下降了168.51个千分点,使出生人数减少259.14万,贡献率为179.80%;育龄妇女总量提高了9.14%,其中生育旺盛期育龄人数提高了5.49%,使出生人数增长115.01万,贡献率为-79.80%。
表5 指数分解结果
基于“六普”资料,以2010年各地区各年龄平均女性人数为基础数据,假设女性分年龄死亡率在2011~2020年期间比较稳定,采用队列法对全国2011~2020年育龄妇女人数及结构进行预测。并重点关注其中两个年龄段的育龄妇女人数:第一,20~29岁,此年龄段生育率较高,其规模对整个生育数量的变化起着决定性的影响;第二,35岁以上,主要因为医学上把35岁以上的孕妇定义为高龄孕妇,高龄妇女妊娠,出生婴儿缺陷率相对较高。预测结果见图5~6。
根据2013~2020年预测结果,第一,15~49岁育龄妇女年均规模达到3.51亿,呈现明显下降趋势,年均下降速度为1.59%,2020年将降到3.35亿。第二,20~29岁生育旺盛期育龄妇女规模及其占比呈现明显下降趋势。平均规模为1.02亿,由2013年的1.14亿持续下降到2020年的0.86亿,年均下降速度为3.90%,快于全部育龄妇女降速。所占比重平均值为29.21%,于2015年达到峰值30.78%后逐年大幅下降,2020年降到25.62%。第三,35岁以上育龄妇女规模下降趋势明显,占比相对稳定。平均规模为1.52亿,以1.55%的速度下降,2020年达到1.46亿。所占比重维持在43%~44%之间,平均值为43.37%,波动较小。
图5 2013~2020年全国育龄妇女规模预测结果
图6 2013~2020年全国育龄妇女结构预测结果
假设总和生育率维持2012年本文估计值1.43这一水平相对稳定,育龄妇女年龄别生育率的结构与2012年国家抽样调查结果保持一致,则可重新估计得到各年龄别生育水平。结合育龄妇女规模与结构,运用队列法预测2013~2020年我国出生人数、各年龄段人口数及人口总量,见表6所示。
根据预测结果,第一,从出生人数来看,呈现明显下降趋势,年均下降速度达到2.00%,2020年出生人数降至1372.19万。第二,从人口总量来看,总人口以0.39%的年均速度稳步增长,2020年我国人口总规模可能达到13.91亿。第三,从人口年龄结构来看,0~14岁人口数以0.17%的年均速度缓慢增长,于2019年达到峰值2.27亿,15-64岁人口数呈现出下滑态势,65岁及以上人口数则加速增长。因此,少儿抚养比由2013年的22.35%稳步增长到2020年的23.02%,而老年抚养比由13.12%大幅提高到18.67%,总抚养比于2020年将达到41.69%,由此可见,年龄结构的变化使得我国抚养压力增大。
表6 2013~2020年全国人口预测结果
本文通过探索总和生育率与一般生育率的数量关系,重新估计了我国2000~2012年总和生育率,认为我国“六普”总和生育率或许存在低估的风险,2012年我国总和生育率达到1.43。通过指数分解,发现2000~2006年生育率对出生人数变动的影响较大,2006~2012年育龄妇女规模与结构对出生人数变动的影响较大。人口模拟分析表明,2013~2020年期间,我国生育旺盛期育龄妇女规模及其占比呈现明显下降趋势,且未来抚养压力较大。本文研究为逐步完善人口生育政策提供了一定指引。
[1]郭志刚.重新认识中国的人口形势[J].国际经济评论,2012,(1).
[2]王广州,胡耀岭,张丽萍.中国生育政策调整[M].北京:社会科学文献出版社,2013.
[3]王金营,何云艳,王志成,段成荣.中国省级2000年育龄妇女总和生育率评估[J].人口研究,2004,(2).
[4]张青.总和生育率的测算及分析[J].中国人口科学,2006,(4).
[5]杨新平,梁林,常燕,童绍玉.中国总和生育率自回归分布滞后模型的构建[J].统计与决策,2010,(7).
[6]王广州,胡耀岭.真实队列年龄别生育率估算方法与应用研究[J].人口研究,2011,(4).
[7]David P.Smith.Formal Demography[M].New York:Plenum Press,1992.