侯雅文 陈慧林 陈 征△
【提 要】 目的 研究传染性疾病致命性参数病死率的估计,特别是有多个风险因素存在时,不同分组下的病死率估计以及风险因素筛选问题。方法 基于竞争风险理论建立病死率估计回归模型,通过轮廓似然等技术估计模型参数。结果 将该回归模型应用于2013年H7N9禽流感数据分析,估计不同风险因素下的病死率,并通过BICcr准则发现性别间没有差异,而高年龄(60岁为界)组是一个有意义的风险因素。结论 本文介绍的病死率估计回归模型除了可以直接估计病死率值外,也能进行相关风险因素的甄别。
近十几年,SARS、甲型H1N1流感、人感染H7N9禽流感和埃博拉等,新型或再发严重传染病对全球社会产生严重影响。在传染病爆发的初期,公众和管理者迫切需要知道的问题是:这种疾病是否严重?哪类人群被传染后危险性更大?等等。对于像上述大范围流行的传染病,体现它们致命程度最直接的一个数量指标就是病死率(case fatality risk)[1-2]。哪些人群是易感人群或者患病后危险性更大,通过对影响病死率的危险因素(协变量)的分析均可发现[3]。当像SARS、H7N9这样的传染性疾病处在疫情的初期时,我们对它几乎一无所知,但如果能根据有限的不完整数据,去评估它的病死率及其危险因素,可为公共安全策略的制定、医疗救治工作的调整以及卫生资源的分配等提供有力的科学信息和帮助,从而及时、有效地控制疫情的发展。
在疫情初期病死率的研究中,根据数据类型的不同将方法分为两大类,一种是基于汇总数据,朱亚楠[4]和Lu[2]对该类方法进行了系统的综合分析,此类方法的优点之一是数据获得快捷、简单,结果估计也较精确,但无法发现其相应的危险因素。另外一种是包含患者生存时间、一些协变量(在这里可作为疾病的危险因素处理)的个体数据(individual data),如Jewell等的研究[5-6],但它们均未将协变量直接纳入到模型中。本研究根据陈征[7]和韩栋[8]的方法,基于个体型数据,将协变量纳入模型,给出一种带有协变量的病死率估计回归模型。
假设H7N9患者在某个时间点t有三种可能的结果:由H7N9导致死亡、治愈康复和继续接受治疗(持续发病中)。其中,死亡和治愈可以被考虑作为两个竞争风险(competing risks)型终点事件[10],而继续接受治疗的患者可以被当做右删失。令J是一个二元随机变量:J=1表示死亡和J=2表示治愈。Tj(≥0),j=1或2,指直到j型终点事件发生的生存时间,C为右删失时间,则T=min(T1,T2,C)被定义为生存时间。对于个体型数据,假定每日的记录为一个结点,则本研究将组建一个离散的生存时间模型。令ti为离散的生存时间,t1 在时间点t的总生存率和第j型风险率函数分别被定义为S(t,Z)=Pr(T≥t|Z)和 hj(t,Z)=Pr(T=t,J=j|T≥t,Z),j=1,2, (1) H(t,Z)=h2(t,Z)/h1(t,Z) (2) 根据Chen[9]、Lam[10]和Tuite[6]等的研究,假如比率H(t,Z)是一个与时间独立的量,也就是H(t,Z)≡H(Z),然后带有协变量的病死率计算式可写为p1(Z)=(1+H(Z))-1。 数式(1)对应的原因别风险率回归模型为: (3) 对于进入观察的每一名患者(如第k个患者),都有以下信息被记录:(τk,δk,jk,Zk), 其中τk表示从进入观察到事件或右删失发生的时间;jk表示事件的类型或右删失(jk=1为死亡,2为康复,0为右删失);Zk表示协变量向量;令δ1k=I[jk=1],δ2k=I[jk=2],这里假如“[ ]”内为真时,I[ ]值为1,否则为0。第k个患者的似然Lk是:假如jk=j≠ 0,Lk=fj(τk,Zk),假如jk= 0,Lk=S(τk,Zk),然后总的似然L为: 改变累乘的方式,由患者个体k(k= 1, 2, …,n)到离散时间i(i= 1, 2, …,s), 其中Rji={k|τk=ti,δjk=1}表示在ti时刻发生j型终点事件的个体集合,Ri表示在ti时刻被观察个体(at risk)的集合,Δji表示Rji中的患者个数,j=1,2,i=1,…,s。 将h10(ti)记为h10i,然后有 (4) 为了方便计算,令β0=logH0,然后 利用上述模型分析2013年春季在中国大陆爆发的人感染H7N9禽流感,本研究收集到疫情初期,经过确诊的103例患者生存数据,包含年龄和性别信息(表1),截止2013年5月22日由H7N9禽流感导致死亡者数为23例,治愈者数为30例,其余50例继续接受治疗,即右删失(删失率48.54%)。首先,将年龄和性别两个风险因素同时纳入模型得到四个分组的病死率估计值(表2);其次,通过竞争风险下的BIC(BICcr)准则[11]对两个变量筛选后,只保留年龄分组;最后,仅对年龄作分析,得到两个年龄组分别的病死率估计值(表3),发现相对年龄大于60岁是一个危险因素。 表1 H7N9患者的年龄和性别基本信息 表2 同时纳入年龄和性别的协变量病死率估计值 表3 仅纳入年龄的病死率估计值 无论是前面介绍的基于汇总数据还是个体性数据的病死率估计方法,均是针对一个总人群的。众所周知,即使是同一个疫情,不同的人群(比如年龄)的病死率也可能不同,若只是拿总体的一个数值来衡量未必能准确反映疫情状况,另外鉴别或找出有意义的风险因素也是重要的研究任务。针对H7N9的疫情数据分析,结合BICcr准则和本文的方法发现性别因素对病死率的结果影响不大,而年龄因素对病死率的结果有较大的影响(小于60岁病死率大于30%,而大于等于60岁病死率高于60%)。该结果说明疫情策略制定时,不能只是根据一个整体的病死率来采取相同的措施,应该针对不同的人群采取不同的措施,达到方案最优化,避免造成资源的浪费以及不必要的人员伤害。表3中不同协变量下的病死率95%可信区间(CI)范围较大,其原因可能是由于本实例分析中样本量较小以及在计算95%CI时假设服从正态分布进行求解的。实例分析
讨 论