张 岚 钱夕元△ 阮 彤
【提 要】 目的 用统计学方法来分析采用中西医结合治疗与仅采用西医治疗的心衰住院病人的费用与疗效对比。方法 结合Lasso方法对2414条样本数据进行成本效果分析消除多变量混淆以及协变量众多造成的影响。结果 利用R中hdm程序包的rlasso函数得到:全体患者(不区分治疗手段)与采用中西医结合治疗方案患者的平均医疗费用分别为3910元和4395元;以生存时长作为观测目标,入院治疗即平均延长2.808天,其中中西医结合治疗平均延长的生存时间为3.740天,都具有统计学意义;进一步进行成本—效果分析,比值分别为1392和1175(中西医结合)。结论 中西医结合治疗能够延长慢性心力衰竭患者生命,作用优于纯西医治疗,相对于纯西医治疗更值得推荐。
慢性心力衰竭(congestive heart failure,CHF)又称慢性充血性心力衰竭,是由心肌梗死、血流动力学负荷过重等原因引起的心肌损伤而导致心室充盈和摄血功能受损。慢性心力衰竭过程缓慢,是多数心血管疾病的最终病态,因而有死亡率高、愈合率低的特点。宋远斌等[1]对于中西医的比较和联系进行深入分析,详细地辨析了中西医治疗疗效。对于慢性心力衰竭,赵彦萍等[2]观察中西医结合治疗慢性心衰的临床疗效,发现中西医结合对治疗更有好处。黄东平[3]于2010年发表慢性心力衰竭中西医治疗策略的对比和启示,认为慢性心力衰竭西医治疗策略的改变取决于其病理生理机制的进展。林红等[4]采用倾向匹配得分的方法对慢性心力衰竭患者死亡风险和体质指数进行探索,排除了非随机化带来的混杂干扰。本文结合Belloni等[5-7]对于高维数据的研究与处理方法和Lasso变量筛选,对慢性心力衰竭病人的中西医治疗疗效进行比较研究,探讨中西医结合的治疗手段对于患者治疗的成本效用结果。
数据来源于上海曙光医院2006年至2015年首次收治入院的2414名心衰病人,以EMPI为病人的唯一标识号,剔除了信息缺失的病人数据。观测指标为医疗费用、是否服用中药(zy)、第二次住院时间、死亡时间、180天内是否再入院及天数、年龄、性别、住院收缩压、住院舒张压、脉搏、伴随疾病:高血压、糖尿病、冠心病、房颤、心律失常、肺部感染、慢性心功能不全、慢性支气管炎、慢性肾功能不全、扩张性心肌病、肥厚性心肌病、慢性阻塞性肺病、脑梗塞,基本特征见表1。
表1 2414例心衰患者基本特征与变量赋值
其中D是基于混淆因素X随机指派的值,而由于选择偏差一般为负,导致治疗组与控制组之差低估参与者平均处理效应。Rosenbaum和Rubin提出“可忽略性”或称为“条件独立”假设:给定X,则结果变量Y对于D的影响可以忽略。因此如果个体对D的选择完全取决于可观测的X,在给定X的情况下,潜在结果将独立于D。但如果更关心ATET,只需要Y(0)的均值独立于D,则选择偏差为0,因此将ATET重新定义为E[Y(1)-Y(0)|D=1,X]=E[Y(1)|D=1,X]-E[Y(0)|X]。
ATE和ATET可通过计算下列effect函数的期望得到:
(1)
由于对effect函数中的各期望值的估计需要结合回归模型并验证统计意义,但当协变量个数较大时,会存在变量混淆,导致结果较差,由此,我们借鉴Belloni等人[5-7]基于Lasso的回归方法,通过降维的思想进行变量筛选,消除混淆影响。Lasso的传统定义繁琐,本文中给出基于Lasso的观测变量的干预效果推断模型。基于Lasso给出线性模型:
yi=diα0+g(zi)+εi
(2)
di=m(zi)+ηi
(3)
其中di是处理变量,yi是结果变量,zi是控制变量的集合,εi和ηi是扰动部分,且满足E[εi|di,zi]=0,E[ηi|zi]=0,参数α0是基于给出的适当条件下的平均干预效果[5]。
(2)、(3)中混杂因素zi通过函数m(zi)影响处理变量,g(zi)影响结果变量,用线性的形式xi=P(zi)来近似得到函数g(zi)、m(zi)。
(4)
(5)
为了估计系数α0,首先将(4),(5)改写成:
(6)
(7)
(8)
(9)
βm0可以用单变量选择法得到,但由于(7)中因变量d是二元变量,可以选取logistics回归法,再基于Lasso估计得d与X之间相互依赖的定量关系,在病症诊断上较为普遍。因此公式(7)估计得到的系数表示X对处理变量d的影响程度,且βm0的值(即:E[D|X])在计算ATE和ATET中也起着重要作用。
在得到干预效果后,为了进一步评价干预效果的经济效率,采用成本-效果分析(cost-effectiveness analysis,CEA)[8]。CEA是常用的计量性经济学评价方法,用成本-效果的比值表示被评价项目的经济效率,即各个方案单位投入成本所取得的效果大小。如果药物治疗成本更低,而效果更好,那么就使用该药物的治疗方案。CEA的第一步是进行成本分析,本文采用医院成本,指医院对疾病的治疗成本即医疗费用;第二步为健康生命质量的评价与测度,本文采用生存时间;最后将各个方案的成本和效果取比值,可判别哪一个方案成本较低,而效果较好。
R中hdm程序包的rlasso函数既解决了变量选择问题,也给出了系数α0的估计及其统计意义。本文选取的rlassoATE函数衡量整体平均治疗效果、rlassoATET函数衡量干预组平均治疗效果。d表示干预方案,取值为1表示中西医结合治疗,取值为0表示仅西医治疗;选取医疗费用(money)、生存时间(scsj)作为因变量y,其中生存时间定义为:起点事件是第一次住院,终点事件是第二次住院,访问截止时间是180天。定义180天内没有二次住院且没有死亡的生存时间为180+,在180天外死亡的生存时间也为180+,并定义新的协变量:180天内是否死亡(slm)以区分上述不同情形;若180天内没有二次住院但180天内死亡,则定义生存时间为死亡时间减去第一次住院时间;若在180天内二次住院,则为第二次住院时间减去第一次住院时间。
表2为y取医疗费用(money)的结果;表3为y取生存时间(scsj)的结果。
表2 不同治疗手段对医疗费用的平均效果
*:注:Signif. codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’
表3 不同治疗手段对生存时长的平均效果
*:注:Signif. codes: 0‘***’0.001‘**’0.01‘*’0.05‘.’
在表2中无论ATE还是ATET函数下,P值都小于0.001,统计意义非常显著;ATET下的系数相对于整体ATE下的系数增加约500,原因在于采用中西结合治疗的治疗费用较高(与实际情况相符)。
在表3中,无论是ATE还是ATET函数下,P值小于0.05,统计意义较显著;系数α0都相对较大(整体协变量数量级较小,大部分为0-1变量),且ATET下的系数相对于ATE下的系数增加了0.94,表明患者选择中西医结合的疗效显著,延长了生命。
为了比较两种治疗效果的差异,进一步进行cost-effectiveness分析。C表示治疗花费,E表示不同治疗方案下生存时长的增加,(C/E)ATET=1175,(C/E)ATE=1392。选取比值较小的方案作为更优方案,在单位成本下,中西医结合治疗所获得的治疗效果高于不指定治疗手段的疗效,可以说明在两种治疗手段中,中西医结合治疗带来的效果比纯西医治疗带来的效果好,即中西医结合治疗对心衰病比纯西医治疗更值得推荐。
本文基于Lasso对慢性心衰病人的中西医疗效做对比研究,该分析方法的优势在于可考虑多个协变量在一定筛选后的共同作用。根据历史临床研究,已证明中药对慢性心衰病有一定的缓解作用。结合本文的医院数据进行的实证研究发现其成本-效果分析结果表明中西医结合治疗方案的单位成本所获得效益更高,相对于纯西医治疗更值得推荐。