基于Lee-Cater模型的我国死亡率预测

2018-05-22 13:17
统计与决策 2018年9期
关键词:生育率高龄死亡率

曹 园

(中国人民大学 统计学院,北京100872)

0 引言

根据《中国人口统计年鉴》及《中国人口和就业统计年鉴》整理各年男性及女性分年龄死亡率数据可看到我国死亡率水平随时间呈下降趋势。死亡率改善不仅会延长人口预期寿命,还会改变人口结构、增加老年抚养比。我国目前已成为人口老龄化发展速度最快的国家之一,且是世界上老年人口最多的国家,即我国人口老龄化进入快速发展阶段的同时,还伴随着高龄化的快速推进。人口老龄化以及人口老化势必对经济社会各个方面产生影响。Ashgar Zaidi(2012)[1]认为人口老龄化的挑战可以看作是老龄化相关的政府支出的增加,特别是养老金支出的增加,使现行的养老保险制度不可持续。因此对死亡率改善程度的准确预判,有助于决策层制定符合未来人口特征的人口政策、经济政策以及养老政策等。

Lee和Carter(1992)[2]提出了预测死亡率的随机方法,将影响对数中心死亡率的因素分解为时间和年龄因素,建立了由对数表达式和ARIMA模型构成的预测死亡率的外推模型,计算相对方便简单。目前很多国内外学者都采用此方法进行死亡率的预测。Girosi和King(2007)[3]详细分析了Lee-Carter模型,并将其与一般的随机游走模型进行对比,认为该模型是一个更为简单的,可以减少偏差的带漂移随机游走模型的特例。Koissi等(2006)[4]运用Lee-Carter模型对北欧国家的死亡率进行预测,通过奇异值分解法、加权最小二乘法以及极大似然法估计参数,认为极大似然法具有更好的拟合效果。李南和胡华清(1998)[5]全面介绍了Lee-Carter模型,并应用该方法首次完成了中国随机人口预测。李志生和刘恒甲(2010)[6]介绍了Lee-Carter模型参数估计的四种方法,分别是:奇异值分解法(SVD)、最小二乘法(OLS)、加权最小二乘法(WLS)、极大似然法(MLE)。但是当数据缺失时,随机模型的预测精度下降。对于有限数据,Li等(2004)[7]令k的表达式服从带漂移的随机游走模型,并证明如果k服从严格的随机游走假设,则若数据的时间跨度足够大只需要3年的数据就可以准确预测模型的参数及死亡率。韩猛和王晓军(2010)[8]也采用了类似的方法对Lee-Carter模型进行了改进,通过对Lee-Carter模型中的时间项建立一个双随机过程减小因样本量不足对预测结果的影响。

以上文献主要存在以下两个问题。第一,研究发现高龄人口死亡概率已不再呈指数增长,而是在某一水平上下波动,具有很强的线性趋势。因此,运用Lee-Carter模型预对高龄人口死亡率结果预测将存在较大的偏差。J.M.Robine等(2007)[9]分别采用了Gompertz、Weibull、Heligman and Pollard、Quadratic、Logistic和Kannisto模型拟合对高龄死亡率数据进行拟合和预测,通过对比分析,认为Kannisto模型对高龄死亡率的模拟效果优于其他几个模型。安平(2010)[10]选用Gompertz函数、Coale-Kisker是方法是以及极值理论方法对高龄人口死亡数据进行拟合,并通过加权最小平方法进行比较,认为Coale-Kisker方法是对高龄死亡率扩展的最佳方法。第二,文献中对死亡率数据以每5岁的年龄来分组进行参数估计及预测。然而这种分年龄组处理的方法会造成预测结果出现一定偏差,显然一组内各年龄的死亡率是不同的。

因此,本文将做以下改进:首先,因个别年龄死亡率缺失或为零,不能对这些死亡率数据取对数,因此无法使用矩阵奇异值分解法进行参数估计。为了提高预测精度,本文采用加入数据存在或缺失权重的极大似然估计法处理缺失数据。其次,通过对比Kannisto模型及Coale-Kisker方法可知,后者操作性更强,因此本文通过Coale-Kisker方法扩展高龄死亡率,提高死亡率预测精度。最后,本文不对死亡率进行分组处理,直接运用分年龄数据对分年龄分性别死亡率进行预测。

1 基本模型

本文对死亡率的预测主要分以下几个步骤:

第一步,建立对数中心死亡率模型,并通过过去数据估计模型参数。模型基本公式为:

其中,mx,t为t年度x岁人的中心死亡率;αx为影响死亡率的年龄因素,其值为各年龄死亡率按时间统算出的基数,即为影响死亡率的时间因素,表示t年度死亡率水平的变化;βx为各年龄别死亡率的偏差情况;ξx,t为误差项,其均值为0,标准差为σ。

由模型可知,运用任意常数c对参数进行转换都可以使原模型保持不变,例如可将参数变换成:

因此本文对参数增加约束条件即使参数标准化,取值唯一确定。模型参数可由不同方法估计。

第二步,预测κt。运用时间序列模型对κt进行估计,进而根据死亡率模型推估未来死亡率。本文采用参数估计方法。该方法下假设死亡人数可通过参数为λx,t的泊松分布进行模拟,即dx,t~Poisson(Ex,tmx,t)

其中为 t年度 x岁的死亡人数,Ex,t为t年度x岁人的死亡风险暴露数。极大似然函数表达式为(Natacha Brouhns,2002):

其中C为常数,由不受参数λ的影响项构成。运用牛顿迭代公式,根据约束条件,本文参考李志生和刘恒甲(2010)[6]的初始值选定方案从参数初始值=0、=1和=0开始,按以下步骤更新参数:

其中第v次更新需满足条件设置迭代更新的停止条件,例如当参数更新使式(2)的增加量很小时(如小于10-6)停止迭代,得到参数估计值。

第三步,对高龄死亡率进行扩展。

由于《中国人口统计年鉴》以及《中国人口和就业统计年鉴》中只有0~89岁的分年龄死亡率数据,90岁以上分年龄死亡率数据缺失,本文通过Coale-Kisker方法对各年份高龄死亡率数据进行扩展。该方法假设死亡率以一个变化的、线性的速率递增,从提出至今被广泛使用于高龄人口死亡率的扩展。在实际操作中,一般假设从85岁开始使用该方法。具体模型如下:

其中k(x)=ln(mx/mx-1),R为k(x)与k(x-1)的线性差额。由于我国《中国人寿保险业经验生命表(2000—2003)》将终极年龄设为105岁,因此本文假设m105=1。由此,可得:

为减小个别数据的波动对模型整体的影响,可以选用从82~86岁中心死亡率的算术平均值代替上式的m84,用[ln(m87/m80)]/7代替上式的k(84)。

2 参数估计及死亡率预测

由《中国人口统计年鉴》及《中国人口和就业统计年鉴》,可得1995—2015年分年龄、性别死亡率数据,其中2000年和2010年分年龄、性别死亡率数据缺失,总共19年的样本数据。1996年数据为0~84岁分年龄、性别死亡率数据以及85岁以上分性别总体死亡率数据,其余各年份数据为0~89岁分年龄、性别死亡率数据以及90岁以上分性别总体死亡率数据。将1996年85~89岁分年龄、性别死亡率数据视为缺失数据。同时,2005年人口数据为百分之一抽样,其余各年人口数据为千分之一抽样。因此将2005年抽样分年龄、性别人口数和抽样分年龄、性别死亡人口数除以10,使其与其他各年数据保持相同数量集。

2.1 Lee-Carter模型参数估计结果

本文根据加入权重的极大似然参数估计方法估计男性、女性死亡率模型参数。结果见下页表1、表2及图1、图2。

图1 男性、女性死亡率模型参数ax的估计值变动趋势

由表1、图1可知,男性及女性死亡率随着年龄增加先减小后增大,且男性死亡率高于女性死亡率。

图2 男性、女性死亡率模型参数kt的估计值变动趋势

由表2、图2可知,死亡率随着时间推移整体呈下降趋势,且女性死亡率改善速度快于男性。

表1 死亡率模型参数αx、βx的估计值

表2 死亡率模型参数κt的估计值

2.2 预测

基于参数估计,运用ARIMA模型,根据kt的估计值对未来κt的值进行预测,令缺失的2000年及2010年数据为前后两年κt估计值的算数平均值。分别对ARIMA(2,1,1)、ARIMA(0,1,1)以及ARIMA(1,1,1)模型进行拟合检验,根据lnL准则①lnL是衡量统计模型拟合优良性的一种标准,数值越大拟合效果越好。lnL=(2k-AIC)/2,其中AIC=2k+nln(RSS/n),k是参数的数量,假设模型的误差项服从独立正态分布,n为观察数,RSS为剩余残差平方和。以及t统计量进行检验。lnL数值越大拟合效果越好,t统计量越大参数越显著。综合考虑InL检验以及t统计量,对于男性及女性均选用ARIMA(1,1,1)模型对参数κt进行预测。可计算男性、女性死亡率模型参数κt的预测表达式分别为:

根据预测的kt值,预测未来死亡率。

2.3 高龄死亡率扩展

在参数估计及预测kt的基础上对未来各年男性、女性0~89岁分年龄死亡率进行预测,预测区间为20年。其次运用Coale~Kisker方法预测未来各年85岁以上高龄人口分年龄、性别的死亡率,并用该方法预测的未来各年85~89岁分年龄、性别死亡率替代运用Lee-Cater模型预测的未来各年85~89岁分年龄、性别死亡率。

根据以上方法预测的未来各年分年龄、性别死亡率见下页表3(由于篇幅限制,本文展示、2020年、2025年、2030年以及2035年分年龄、性别死亡率数据,且只列示部分年龄数据)。

由表3预测结果可以看出我国死亡率水平将持续改善。

3 死亡率改善的影响

3.1 对预期寿命的影响

x岁人的预期剩余寿命计算公式为:

其中Kx(t)为x岁的人预期寿命的整数部分。根据公式(1)及预测的死亡率,对预期寿命进行预测,结果见下页表4(表中仅展示部分年份)。

由表4可知我国预期寿命将不断延长。

3.2 对未来抚养比的影响

根据2033年死亡率数据计算,2033年我国男性、女性预期寿命分别为81岁和86岁。此预期寿命水平与2015年日本预期寿命水平基本持平(男性平均寿命80岁,女性平均寿命86岁)。考虑到日本是世界上最长寿的国家以及我国与日本经济生活水平的差距,因此本文假定死亡率收敛于2033年的水平,2033年后分年龄、性别死亡率将维持2033年的水平不变。

忽略人口迁移因素,考虑未来死亡率及生育率对未来分年龄、性别人口进行预测。我国总和生育率水平在1996—2003年间约为1.4,最近几年略有所回升,但大概也只有1.5左右的水平。由于我国逐渐实行宽松的人口政策,因此将2016及以后生育率水平设定为1.55。

表3 分性别、年龄死亡率预测结果

表4 未来人口预期寿命

令hx,t表示标准化生育模式,将2015年底的生育模式设为标准化生育模式,有:

可见hx,t实际上是分摊总和生育率形成分年龄生育率的分年系数。当其不随时间变化时,可以用未来总和生育率和稳定的生育率模式预测未来的分年龄生育率。则可通过式(4)计算总和生育率为1.55时,未来各年分年龄的生育率水平为:fx,t=hx,2015·1.55 。

由《中国人口和就业统计年鉴》可知2015年底0~94岁分年龄、性别人口占比,对于95岁以上分年龄人口占比可根据扩展的跟年龄死亡率进行推估,并推出95岁分年龄人口占比。以2015年底总人数及人口占比为基数,基于未来死亡率、生育率预测值,忽略人口迁移因素,预测我国未来分年龄、分性别人口数,并计算老年抚养比。老年抚养比=(65岁以上人口数/15~64岁人口数)×100%,见表5。

表5 未来老年抚养比

由表5可知,我国未来老年抚养比不断上升,到2070年将高达84.01%,即平均每10个年轻人会供养8.4个老年人。

通过对死亡率的预测,以及推估的人口预期寿命和老年抚养比,如此快的老龄化进程势必给我国经济社会各方面产生影响,特别是加重我国养老负担,给养老保险的持续发展提出挑战,对死亡率及人口结构的准确预测,有助于决策层制定符合未来人口特征的人口政策、经济政策以及养老政策等,弱化人口老龄化带来的负面影响。

参考文献:

[1] Zaidi A.Population Aging and Financial and Social Sustainability Challenges of Pension Systems in Europe:A Cross-national Perspec⁃tive[M].London:Cambridge University Press,2012.

[2] Lee R D,Cater L R.Modeling and Forecasting US Mortality[J].Jour⁃nal of the American Statistical Association,1992,(89).

[3] Girosi F,King G.Understanding the Lee-Carter Mortality Forecasting Method.Technical Report,2007.

[4] Koissi M C,et al.Evaluating and Extending the Lee-Carter Model for Mortality Forecasting:Bootstrap Confidence Interval[J].Insurance:Mathematics and Economics,2006,(38).

[5] 李南,胡华清.中国随机人口预测[J].中国人口科学,1998,(1).

[6] 李志生,刘恒甲.Lee-Carter死亡率模型的估计与应用——基于中国人口数据的分析[J].中国人口科学,2010,(3).

[7] Li N,Lee R,Tuljapurkar S.Using the Lee-Carter Method to Forecast Mortality for Populations With Limited Data[J].International Statisti⁃cal Review,2004,(1).

[8] 韩猛,王晓军.Lee-Carter模型在中国城市人口死亡率预测中的应用与改进[J].保险研究,2010,(10).

[9] Robine J M,Eileen M,Yi Z,et al.Human Longevity,Individual Life Duration,and the Growth of the Oldest-Old Population[M].Berlin:Springer,2007.

[10] 安平.基于长寿风险的中国人口死亡率扩展方法[J].统计与决策,2010,(24).

猜你喜欢
生育率高龄死亡率
低生育率:怀疑、再调查与重复验证
走路可以降低死亡率
春季养鸡这样降低死亡率
高龄孕妇妊娠中期产前诊断中唐氏筛查的应用
韩国生育率创50年来新低
新冠肺炎的死亡率为何难确定?
急性烂鳃、套肠、败血症…一旦治疗不及时,死亡率或高达90%,叉尾鮰真的值得养吗?
全球生育率,新加坡最低
外籍妈妈提升德国平均生育率
一步法超声引导经皮经肝胆道引流术治疗高龄胆道梗阻的探讨