Elandt-Johnson模型推算完全寿命表方法学原理及其在中国人群寿命表中的应用*

2019-11-12 12:24国家癌症中心国家肿瘤临床医学研究中心中国医学科学院北京协和医学院肿瘤医院100021
中国卫生统计 2019年5期
关键词:年龄组死亡率寿命

国家癌症中心/国家肿瘤临床医学研究中心/中国医学科学院北京协和医学院肿瘤医院(100021)

安 澜 郑荣寿 张思维 杨谨成 孙可欣 曾红梅△

【提 要】 目的 介绍Elandt-Johnson模型法推算完全寿命表的方法学原理,并应用该方法推算中国完全寿命表。方法 以全国第六次人口普查结果2009年11月1日至2010年10月31日分年龄、性别的死亡率为实例构建真实完全寿命表,计算出简略寿命表,然后以简略寿命表为基础数据,采用Elandt-Johnson模型法推算理论完全寿命表,并与真实完全寿命表比较以评估模型拟合效果。结果 采用Elandt-Johnson模型推算出的男女分年龄死亡率与真实死亡率拟合优度良好,决定系数R2分别为0.9966和0.9994。依据理论完全寿命表估算出的预期寿命(男性72.43,女性77.23)与真实完全寿命表计算出的预期寿命非常接近(男性72.38,女性77.30)。结论 Elandt-Johnson模型法可以将简略寿命表推算出较为准确的完全寿命表。

寿命表是根据特定人群的年龄组死亡率编制出的一种统计表,用以说明在特定人群年龄组死亡率条件下人的生命过程[1]。寿命表是社会科学的重要工具、并在科研中广泛运用,是用于计算预期寿命的基础。完全寿命表是按每个年份、一岁一个年龄组和性别来计算死亡概率和死亡率。简略寿命表习惯以5岁一组,由于0~岁组婴儿死亡率对寿命表的影响相当大,简略寿命表将0~4岁拆分为0~,1~岁组。在很多情况下,简略寿命表因其构造简单被广泛运用[2]。一方面是因为简略寿命表是按照5岁年龄组划分而计算的死亡率,数据相对稳定;另一方面由于各地区全死因登记数据质量问题,在无法获得稳定而完整的完全寿命表资料时,死因数据结果常以简略寿命表资料呈现。在计算人群癌症相对生存率时,我们需要根据完全寿命表计算分年龄、性别和时期的预期生存概率[3]。由于从我国部分肿瘤登记地区难以获得精准的完全寿命表资料,部分死因监测地区仅提供简略寿命表数据[4],因此需要在缺乏完全寿命表的情况下,采用科学的方法将简略寿命表资料推算成完全寿命表。

本文介绍Elandt-Johnson模型法将简略寿命表推算至完全寿命表的原理,并根据用漏报方法调整的我国第六次全国人口普查数据建立简略寿命表和完全寿命表,运用该方法将简略寿命表推算出完全寿命表,将推算出的完全寿命表与真实完全寿命表进行比较,评价Elandt-Johnson模型推算完全寿命表的效果。

数据来源和方法

1.数据来源

本研究使用2009年11月1日至2010年10月31日全国分性别1岁一个年龄组的死亡率数据。数据来源于国家统计局公布的2010年第六次全国人口普查资料各地区分年龄、性别死亡人口状况(2009年11月1日-2010年10月31日)[5]。采用国家统计局公布的死亡人口漏报率调整年龄别死亡率[6]。

2.预期寿命计算方法

本研究利用寿命表法,利用第六次人口普查数据库中提供的分年龄组平均人口数、实际死亡人数,计算各年龄组死亡率。采用黄荣清[7]等人的婴儿死亡率估计值(男性为16.85‰,女性为17.69‰)修正0岁组死亡率,使用国家统计局公布的死亡人口漏报率18.4%修正其他年龄别死亡率,得出调整年龄别死亡率和死亡概率[6]。假设0岁组人数为10万人,以调整年龄别死亡率计算各年龄组死亡人数、生存人数、生存人年数和累积生存总人年数,最后算得各年龄组预期寿命。

(1)年龄分组nx:简略寿命表分为0岁组(x=0,n=1),1~4岁(x=1,n=4),5~9岁(x=5,n=5),10~14,…,95+;完全寿命表1岁一组(n=1)。

(1)

(2)

(4)年龄组死亡概率nqx:

nqx=1-e-nx×nMx’

(3)

(5)x岁年龄组总死亡人数dx:

dx=lx×qx

(4)

(6)x岁年龄组总生存人数lx:

令l0=100000,lx+1=lx-dx

(5)

(7)生存人年数Lx:

(6)

(8)x岁年龄组生存总人年数Tx:

(7)

(9)x岁年龄组的预期寿命ex:

(8)

3.Elandt-Johnson模型推算法

Elandt-Johnson模型推算法是利用三个不同年龄段所对应的三种插值函数与平滑公式,将简略寿命表资料推算至完全寿命表[8]。推算过程是先由简略寿命表中的生存人数AlX推算完全寿命表中的生存人数ClX,进而推算出完全寿命中各年龄组死亡率。生存人数的计算根据年龄分为三组:

(1)0~9岁组:采用六点拉格朗日内插公式进行推算。对于简略寿命表中的Alx将使用表1的系数推算完全寿命表中的Clx(x<10)[8],即我们用l1、l5、l10、l15、l20和l25的数值进行线性内插计算。线性内插法可以确保在推算出的完全寿命表中保留了简略寿命表中的原始数据[9]。举例如下:

Cl2=0.562030l1+0.717600l5-0.478400l10+0.282886l15-0.100716l20+0.015600l25

(2)10~74岁组:采用六点拉格朗日内插公式进行推算。对于10岁~74岁年龄组的系数,将使用表2的系数进行线性内插计算[8]。举例如下:

Cl11=0.008064l0-0.073920l5+0.887040l10+0.221760l15-0.049280l20+0006336l25

(3)75岁及以上组:75岁及以上人群推算采用龚帕兹Gomepertz生存曲线拟合法估计[10-11]。

表1 计算完全寿命表Cl2-Cl9的系数

表2 计算完全寿命表Cl11-Cl74的系数

*:m=2时,可计算Cl11-Cl14;m=3时,可计算Cl16-Cl19;以此类推,m=14时,可计算Cl71-Cl74。

龚帕兹生存公式为:

(9)

x1和x1+5成为lx两个接点可得出,

(10)

代入(9)公式计算得出

lx1=b1-cx1,lx1+5=b1-cx1+5

同样,对于x2和x2+5

(11)

(12)

结合公式(10)

(13)

用公式(12)和(13)得出各年龄x的参数b和c(参数a和R的函数)。再结合公式(9)计算出各年龄组生存人数lx:

4.应用软件

应用SAS 9.2软件编制寿命表计算预期寿命,应用STATA 13.0软件实现Elandt-Johnson模型推算,采用Excel软件绘图并计算推算出的完全寿命表数据与真实完全寿命表数据的拟合程度。

结 果

表3以全国各年龄组平均人口数和漏报调整死亡人数为例,展示了2010年中国分性别简略寿命表的基本指标,根据寿命表法计算的分性别、分年龄组死亡概率、预期寿命见表3。

表3 2010年中国分性别简略寿命表

表4给出完全寿命表及Elandt-Johnson模型推算出的完全寿命表中的死亡率、死亡概率以及预期寿命。完全寿命表结果显示2010年中国男性预期寿命为72.38岁,Elandt-Johnson模型推算结果为72.43岁;中国女性预期寿命为77.30岁,Elandt-Johnson模型推算结果为77.23岁。各指标值见表4。

表4 2010年中国分性别完全寿命表及Elandt-Johnson模型推算出的完全寿命表

续表4

续表4

图1表示2010年中国男性与女性真实死亡率与拟合死亡率的相关程度,分别采用线性回归模型和二次多项式回归模型计算拟合死亡率与真实死亡率间的拟合优度,结果显示男性拟合死亡率与真实死亡率间决定系数R2为0.9966,女性R2为0.9994,均优于线性拟合曲线R2,二次多项式模型为最优拟合模型。图2为2010年中国两性各年龄组死亡率与推算出完全寿命表中拟估计年龄组死亡率的半对数线图。可以看出0~10岁死亡率呈现下降趋势,表示该年龄段的死亡率相对水平在逐步下降,其中0岁组死亡率最高,符合寿命表年龄组死亡率的特点,10岁以上年龄组死亡率呈现上升趋势。各年龄组死亡率与推算出的年龄组死亡率曲线拟合效果良好。图3表示2010年中国分性别分年龄生存人数与推算出的拟估计生存人数的拟合程度。可以看出各年龄组生存人数基本上与推算出的年龄组生存人数的曲线贴合,且该曲线的曲度、高度符合一般规律,即0~65岁年龄段曲线较平缓,生存人数减少较慢,65岁之后曲线较陡峭,生存人数减少较快,死亡概率较高。从图中可以看出,女性各年龄段生存人数均高于男性,可解释女性预期寿命高于男性。

图1 2010年中国分性别分年龄真实死亡率与模型推算出死亡率的拟合曲线

图2 2010年中国分性别分年龄死亡率与模型推算出死亡率的拟合曲线

图3 2010年中国分性别分年龄生存人数与模型推算出生存人数的拟合程度

讨 论

寿命表是评价地区人口健康状况的综合性指标[12],它可以提供不同人群完整的死亡信息[13],且其在时间、空间的纵横比较上具有良好的可比性[14]。寿命表提供的预期寿命指标是衡量国家或地区社会发展的重要指标[15]。编制完全寿命表时,观察人数要足够多,因为完全寿命表分组细,各年龄组死亡率又低,在某些人口较少地区因为观察人数不够多,容易出现年龄组死亡率不够稳定的现象;简略寿命表年龄分组少,每个年龄组人数较多,年龄组死亡率比较稳定,因此人口较少的地区简略寿命表较为常见。简略寿命表只能提供有限的死亡信息,有时难以满足精细化的分析需求,如何科学地依据简略寿命表构建完全寿命表就显得尤为重要[16]。

Elandt-Johnson模型法是依据简略寿命表推算出完全寿命表的一种常见方法,自20世纪80年代起由美国Elandt-Johnson教授提出并广为使用[8,17]。本研究详细阐述了该模型的方法学原理并用于中国人群寿命表的推算。结果显示采用Elandt-Johnson模型推算出的年龄别死亡率和生存人数都与真实指标值拟合程度较好。同时推算出的寿命表计算出的预期寿命与实际完全寿命表计算出的预期寿命非常接近。依据寿命表中的年龄组死亡概率,可计算出分年龄、性别和时期的期望生存概率,而期望生存概率是计算人群相对生存率的关键指标之一。精确的完全寿命表信息可协助提供特定人群中的期望生存概率,在计算人群癌症相对生存率中,期望生存概率作为分母调整人群背景死亡概率。在计算我国2003-2015年人群癌症相对生存率时,由于肿瘤登记地区上报的均为简略寿命表数据,本研究团队[4,18]即采用Elandt-Johnson模型法推算出每个肿瘤登记地区分年龄、性别和年份的完全寿命表,后续用于癌症相对生存率计算。国际癌症生存分析团队CONCORD[16]、欧洲人群癌症生存分析研究协作组EUROCARE[3]也都采用这一方法推算出完全寿命表。有研究表明[19],针对完全寿命表的推算,Elandt-Johnson模型法较其他完全寿命表推算法推导20~99岁年龄段人口的完全寿命表效果最好。本研究通过实例验证Elandt-Johnson模型法可以将简略寿命表推算出较为准确的完全寿命表。

猜你喜欢
年龄组死亡率寿命
人类寿命极限应在120~150岁之间
走路可以降低死亡率
春季养鸡这样降低死亡率
新冠肺炎的死亡率为何难确定?
仓鼠的寿命知多少
不同年龄芦苇繁殖特征研究
急性烂鳃、套肠、败血症…一旦治疗不及时,死亡率或高达90%,叉尾鮰真的值得养吗?
马烈光养生之悟 自静其心延寿命
2005年与2010年河北省经济较好与经济一般城市成年女子健身程度的比较与分析
人类正常寿命为175岁