吕盛鸽 徐 祎 (杭州电子科技大学,浙江 杭州 310018)
基于VAR模型的上海市老龄化系数预测
吕盛鸽 徐 祎 (杭州电子科技大学,浙江 杭州 310018)
目的 掌握上海市老龄化发展进程及变动趋势。方法 以上海市1978~2010年户籍人口数据为样本,利用格兰杰因果检验和协整分析,选取对总人数和老年人数有显著影响的序列,确定一个稳定的人口系统,构建老年人数预测值满足上海市老年人口峰值期的向量自回归模型。在设定省际净迁移人数序列及低、中、高总和生育率方案下,利用模型预测上海市2011~2050年的总人数、老年人数和老龄化系数。结果 在低、中、高方案下,老龄化系数分别在2034、2032和2032年达到峰值22.25%、21.80%和21.40%,到2050年分别下降至21.58%、20.85%和20.25%。结论 高总和生育率方案能有效延缓上海市人口老龄化进程,有利于逐步优化上海市人口年龄结构。
户籍人口;老龄化系数;老年人口峰值期;VAR模型
预测一个地区的老龄化系数,一般是通过预测该地区的总人数和老年人数来实现。总人数和老年人数发展的内在规律表现在人口序列的自相关性和不同人口序列的互相关性上,向量自回归模型(VAR)能较好地反映这种关系。本文利用上海市户籍人口数据建立VAR模型,在一定的约束条件下预测2011~2050年上海市的总人数和老年人数,分析上海市老龄化系数的变动趋势。
1.1 指标选取 根据人口统计学原理,生育、死亡和迁移是引起人口变动的三大基本要素,为预测上海市户籍总人数和老年人数,初步选取总人数、老年人数、男女性别比、总和生育率、死亡率、平均预期寿命及省际净迁入人数7个指标序列。为方便起见,将这 7 个序列依次记为 y1t、y2t、y3t、y4t、y5t、y6t、y7t,并用 yit-i表示 yit的 i阶阶滞后期(j=1,2,…,7)。
1.2 数据说明 采用上海市1978~2010年户籍人口数据(见表1)。总人数、男女性别比、死亡率、平均预期寿命和省际净迁移人数的数据均来自于《上海市统计年鉴》;1978~1999年和2000~2010年的总和生育率分别来自《上海市人口与计划生育统计资料汇编》和上海市人口计生委统计报表;1996~2010年老年人口数据来源于上海市老龄科学研究中心公布的《上海市老年人口和老龄事业监测统计信息》,1982、1987及1990年老年人数分别由当年的人口普查或1%人口抽样调查数据计算得到,1978~1980年、1986和1989年老年人数分别来自文章《2000年上海人口老龄化趋势分析》、《1986年上海老年人口调查报告》及《试析上海人口老龄化与就业之关系》。
2.1 格兰杰(Granger)因果检验 利用表1中的数据,对序列y1t,y2t,…y7t,两两进行格兰杰因果检验,找出对 y1t和 y2t有显著影响的序列,在现有样本条件下,对可能的滞后期都进行检验,取相伴概率最小的。由表2可见,在8%的显著性水平下,y1t和y2t存在双向因果关系,y3t、y4t、y6t、y7t均是 y1t和 y2t的格兰杰原因,y5t不是y1t和y2t的格兰杰原因。实际上,上海市人口死亡率y5t近25年一直在常数7.20‰附近波动,人口系统可以不考虑几乎是常数的y5t。
表1 1978~2010年上海市户籍人口数据
表2 格兰杰因果检验结果
2.2 协整分析 原始的格兰杰因果检验并没有要求被检验的序列是平稳的,不过对非平稳序列进行格兰杰因果检验,其结果的可信度不高。下面通过协整分析来提升格兰杰因果检验结论的可信度。用 ADF检验方法分别对序列 y1t、y2t、y3t、y4t、y6t和y7t及各序列的一阶差分进行平稳性检验。检验结果显示,在5%的显著性水平下,序列y7t平稳,其余变量均不平稳,一阶差分 Vy1t、y2t、y3t、Vy4t和 y6t均为平稳序列,即序列 y1t、y2t、y3t、y4t和y6t同为一阶单整。对 y1t、y2t、y3t、y4t和 y6t进行约翰森(Johansen)协整检验,在1%的显著性水平下,取两个线性无关的协整关系,它们的数学表达式分别为(1)y1t=-1 449.13-16.56×y3t+285.79×y4t+53.36×y6t+Vecm1t和(2)y2t-188.20+0.11×y3t+61.64×y4t+5.09×y6t+Vecm3t;式(1)和式(2)中误差修正项Vecm1t和Vecm2t在5%显著性水平下均是0附近波动的平稳序列,说明序列 y1t、y2t、y3t、y4t、y6t存在着长期稳定的均衡关系,即 y3t、y4t、y6t对 y1t和 y2t存在长期稳定的线性影响关系。对 y1t、y2t-1、y3t、y4t和 y6t进行约翰森协整检验,在 5% 的显著性水平下,取一个协整关系,其数学表达式为(3)y1t=-781.64+0.59×y2t-1-1.57×y3t+206.70×y4t+25.00×y6t+Vecm3t;同理可得y2t、y1t-1、y3t、y4t和y6t5%显著性水平下的协整关系数学表达式(4)y2t= -1 160.25-1.26×y1t-1-5.35×y3t-219.20×y4t-24.08×y6t+Vecm4t;式(3)和式(4)中误差修正项Vecm3t和Vecm4t在5%显著性水平下均是0附近波动的平稳序列,说明序列 y1t、y2t-1、y3t、y4t和 y6t(y2t、y1t-1、y3t、y4t和 y6t)存在着长期稳定的均衡关系,由此可见y2,t-1(y1t-1)对y1t(y2t)存在长期稳定的线性影响关系,即y1t与y2t互为线性影响关系。Vecm1t(Vecm2t)和y7t同为零阶单整,对 Vecm1t(Vecm2t)和 y7t作EG(Engle&Granger)协整检验,结果显示Vecm1t(Vecm2t)与y7t之间存在着长期稳定的均衡关系,为此,认为y7t对y1t(y2t)存在着长期稳定的线性影响关系。
综上,协整检验结果与格兰杰因果检验结论一致,即y3t、y4t、y6t和y7t对y1t和y2t有显著影响,这一结论有一定可信度,因此,最终将 y1t、y2t、y3t、y4t、y6t和 y7t看成一个人口系统。
3.1 选择模型标准 同时有两个或两个以上模型可供选择时,选取总人数(老年人数)的预测值与实际值的平均绝对百分误差(MAPE)较小的模型;选取以总人数(老年人数)为被解释变量的方程Ⅰ(Ⅱ)的调整决定系数较接近于1者;针对VAR系统整体而言,选择赤池信息量(AIC)和施瓦兹信息量(SC)较小者;在模型拟合精度和预测精度大致相同的情况下,尽可能选择待估参数较少的模型。
3.2 模型约束条件 1982年进行的全国第三次人口普查数据显示,上海市人口密度最大的年龄段是18~28岁,1984年以前上海市每年的常住人口数与户籍人口数几乎相等,说明1982年上海市常住人口和户籍人口中密度最大的年龄段均是18~28岁。由表1可见,1982~2000年户籍总人数增长缓慢,这段时间人口密度最大年龄段应由1982年的18~28岁移至2000年的36~46岁,2000年进行的全国第五次人口普查数据显示,上海市常住人口密度最大的年龄段也是36~46岁,由此说明,上海的净外来人口对户籍人口的年龄移动趋势的影响不明显,即对老年人口峰值期的影响不大。综上,在《上海市老年人口峰值期预测》一文中得到的结论“上海市常住人口老年人数峰值在2030年前后出现”,仍可作为户籍老年人口的峰值期,因此,本文在选择模型进行预测时,将以“上海市户籍老年人口峰值期在2030年前后出现”为约束条件。
3.3 向量自回归模型
3.3.1 模型的建立 在上海市人口系统中,平均预期寿命y6t将参考联合国有关机构对日本人口平均预期寿命预测的数据确定,总和生育率y4t由计划生育部门控制,省际净迁入人数y7t随着国家产业政策、发展战略逐步变化,可认为由决策部门掌握,男女性别比y3t可由政府相关部门采取适当措施调节,因此,y3t、y4t、y6t和 y7t应是 VAR 模型中的纯解释变量(或称外生变量);待预测的总人数y1t和老年人数y2t应是VAR模型中的被解释变量(或称内生变量)。综上分析,考虑建立被解释变量为y1t和y2t的两类VAR模型:①第一类:自回归部分包括y1t和y2t,y4t、y6t和 y7t及其滞后期为纯解释变量,记为〔y1t,y2t(p);y4t(r),y6t(s),y7t(w)〕; ②第二类:自回归部分包括 y1t和 y2t,y3t、y4t、y6t和 y7t及其滞后期为纯解释变量,记为〔y1t,y2t(p);y3t(q),y4t(r),y6t(s),y7t(w)〕;其中正整数p为自回归阶数,非负整数q、r、s和 w 依次是 y3t、y4t、y6t和 y7t的最大滞后期。利用表1 中数据,综合格兰杰因果检验和协整分析的结果,从两类VAR模型中选取了192个模型,根据选择模型准则,最终确定3个备选模型:①模型一:〔y1t,y2t(2);y4t(1),y6t(1),y7t(2)〕;②模型二:〔y1t,y2t(3);y4t(2),y6t(0),y7t(0)〕;③模型三:〔y1t,y2t(2);y3t(2),y4t(1),y6t(1),y7t(2)〕。
表3 备选模型检验结果
3.3.2 设定预测参数 ①设定平均预期寿命。随着净外来人口的比重增加,上海市常住人口平均预期寿命与户籍人口差异逐步扩大,2011~2050年户籍人口平均预期寿命应高于《上海市老年人口峰值期预测》一文中设定的常住人口平均预期寿命。联合国有关机构2007年对日本2007~2050年人口平均预期寿命作出预测:当平均预期寿命达到80.00~82.50岁时,每年增长0.230岁;达到82.50~85.00岁时,每年增长0.141岁;超过85.00岁后每年增长0.093岁。上海与日本同属亚洲,地理纬度差异较小,且经济平均发展水平与生活水平相差不大,参考联合国对日本平均预期寿命的预测数据,设定上海市2011~2050年户籍人口平均预期寿命为:当平均预期寿命达到80.00~82.50岁时,每年增长0.229岁;达到82.50~85.00岁时,每年增长0.140岁;超过85.00岁后每年增长0.092岁。②设定省际净迁移人数。随着西部大开发、中部崛起和区域振兴等战略实施,劳动密集型产业逐步往中西部转移,预计未来上海省际净迁移人数将呈现先增后减的趋势。具体迁移方案设定如下:2011~2015年,每年省际净迁移人数较上一年增加0.4万,2016~2025年每年较上一年减少1.2万,2025年起,省际净迁移人数为0。③设定总和生育率。根据欧美、日本等发达国家或地区生育率下降的经验,上海未来即使放宽生育政策,其总和生育率也不太可能出现较大的提高。但考虑到上海过去生育高峰的惯性影响和未来计划生育政策的逐步调整,总和生育率可能出现一定程度的提高。综合上述分析,本文设定如表4所示的低、中、高三个总和生育率方案。
3.3.3 老龄化系数预测 在低方案下,基于模型一用静态预测方法进行一步外推,得到2011年总人数和老年人数置信度95% 的预 测 区 间〔1 421.276,1 425.369〕和〔226.853,234.049〕,分别从预测区间内选取值1 422.42万人和231.87万人,依次作为2011年总人数和老年人数的实际值,并与人口系统中样本数据一起重新建立类似模型一的表达式,再用静态预测方法进行一步外推,…直到2014年为止,最后用动态方法估算2015~2050年总人数和老年人数的预测值,由此求得2011~2050年各年老龄化系数预测值。其中2011~2014年从静态区间内选取的总人数和老年人数预测值,是以老年人数预测值满足约束条件“上海市户籍老年人口峰值期在2030年前后出现”确定的。中方案和高方案预测过程与低方案过程雷同。三个不同方案下总人数、老年人数和老龄化系数的主要预测值见表5。
表4 总和生育率方案设定
表5 低、中、高方案下总人数、老年人数和老龄化系数的主要预测值
3.3.4 预测结果分析 ①上海市未来总人数大体呈现先增后减再小幅反弹的趋势。在低、中、高方案下,总人数分别在2019、2020和2020年达到峰值1 473.96万人、1 489.11万人和1 505.73万人,又分别在2043、2040和2039年出现小幅反弹。统计资料显示1981~1989年期间上海出现过一次小的生育高峰,按照上海妇女目前平均初育年龄28.20岁计算,该期间出生的女孩将于2009~2017年到达初育年龄,2009~2017年出生的女孩又将于2038~2046年进入初育年龄,因此总人数在2040年前后出现小幅反弹。到2050年末,在低、中、高方案下总人数分别反弹至1 362.66万人、1 404.35万人和1 439.82万人。②老年人数在2011~2050年内不受生育水平变动的影响,且在2046年前后出现反弹。在三种方案下老年人口峰值期均在2030年,满足“上海市户籍老年人口峰值期在2030年前后出现”的约束条件。不同方案下老年人口峰值均在306万左右,这是由于新出生的人口要在65年后才会进入老年群体,因而老年人数预测值在预测期内不受生育水平变动的影响。在低、中、高三个方案下老年人数分别在2047、2046和2046年出现反弹,这是由于在1981~1989年生育高峰出生的人口将于2046~2054年进入老年群体,因此老年人数在2046年前后出现反弹,不过至2050年老年人数仍低于峰值306万人。③上海市未来老龄化系数呈先增后减的趋势,老龄化形势十分严峻。无论何种方案,上海市老龄化系数都呈现先增后减的变化趋势。在低、中、高三个方案下,老龄化系数分别在2034、2032和2032年达到峰值22.25%、21.80%和21.40%,虽然到2050年分别下降至21.58%、20.85%和20.25%,但仍高于20%,上海将长期处在重度老龄化阶段。
本文针对上海市1970年以来总和生育率迅速下降、1949年以来平均预期寿命不断增长的实际情况,将建立人口数量模型的思维视角由注重拟合样本精度扩展到满足“上海市户籍老年人口峰值期在2030年出现”的约束条件,我们认为通过拟合样本精度高且满足约束条件的VAR模型进行预测,有助于提高总人数、老年人数以及老龄化系数中长期预测值的精度。若文中设定的净迁移人数与平均预期寿命符合上海市的实际,由预测结果可见,上海市未来人口老龄化问题十分严峻。为了提前应对老年人口高峰期到来,可以考虑在控制上海人口总量增长的前提下,逐步放开生育政策。虽然高方案下老龄化程度可以得到一定的缓解,但总和生育率越高的方案,总人数达到峰值后人口数量下降越慢,越不利于缓解人口总量规模对上海经济发展带来的压力,因此,建议采用中方案的生育政策。
1 徐 祎,吕盛鸽.上海市老年人口峰值期预测〔J〕.中国老年学杂志,2011;31(24):4973-6.
2 李永胜.人口统计学〔M〕.成都:西南财经大学出版社,2002:105-247.
3 骆 勇,赵明强.上海市人口老龄化:现状、影响以及对策思考〔J〕.西北人口,2009;30(6):72-6.
4 曹永福.格兰杰因果检验评述〔J〕.数量经济技术经济研究,2006;23(1):155-60.
5 王桂新,魏 星.上海老龄化高峰期预测及对策研究〔J〕.科学发展,2009;27(10):38-57.
6 World Population Prospects The 2007 Revision.http://esa.un.org/unpd/wpp/index.htm.
C921
A
1005-9202(2012)07-1455-04;
10.3969/j.issn.1005-9202.2012.07.060
国家社会科学基金项目(09BTJ005)
徐 祎(1987-),女,在读硕士,主要从事人口统计学研究。
吕盛鸽(1953-),男,教授,主要从事人口统计学研究。
〔2011-08-08收稿 2011-11-03修回〕
(编辑 张 慧)