朱文意 钱夕元△ 王英杰 高 炬
【提 要】 目的 用统计学方法(倾向值匹配法与生存分析)来分析采用中西医结合治疗(干预组)与仅采用西医治疗(对照组)的心衰住院病人的费用与疗效对比。方法 对1038条样本数据进行倾向值匹配,计算平均干预效应,并作出干预组和对照组的Kaplan-Meier曲线,分析协变量中的保护因素。结果 从倾向值匹配后的费用分析来看,采用最近邻匹配一共得到308对匹配样本,干预组的平均费用为18559.76元,对照组的平均治疗费用是18228.2元。疗效分析以心衰病人的再住院率为指标,中西医结合治疗病人180天内再入院率是22.73%,仅用西医治疗的心衰病人180天内再住院率为30.19%。在控制其他变量相同的前提下,男性心衰病人再住院的风险度约是女性心衰病人的1.32倍。对于不同的治疗方法来说,病人采取中西医结合治疗的危险度是只采用西医治疗病人的0.746。结论 中西医结合治疗的平均费用高于仅用西医治疗的平均费用,中西医结合治疗的病人180天内再入院率比仅用西医治疗的病人的再入院率低约9%,差异具有统计学意义。治疗方法、ACEI、ARB药物、β受体阻滞剂、抗血小板药物是心衰病人的保护因素。
心力衰竭(heart failure)简称心衰,主要发生在老年人群中,它并不是一个独立的疾病,而是心血管疾病发展的终末阶段。临床上主要采用利尿剂、血管紧张素转换酶抑制剂 (ACEI)、β受体阻滞剂等西药来进行治疗,也有病人选择中西医结合治疗,在保证吃西药的基础上增加中药汤剂。本文对采取这两种治疗方法的心衰住院病人进行费用分析和疗效分析,为临床医学提供决策支持。
数据来源于上海中医药大学附属曙光医院2006年至2015年间首次收治入院的心衰病人。以EMPI为病人的唯一识别号,剔除信息缺失的病人数据,共得到1038条实例。
伴随疾病:冠心病、糖尿病、高血压、心律失常、慢性支气管炎、房颤,共6种。
西药用药:ACEI、ARB类、倍他受体阻滞剂、洋地黄类药物、硝酸酯类药物、钙离子拮抗剂、利尿剂、醛固酮受体拮抗剂、抗血小板药物,共9类药物。
本研究共纳入住院病人1038例,其中男性511例(占49.2%),平均年龄77.40±10.99岁,选择中西医结合治疗的病人375例(占36.1%),病人死亡289例(占27.8%)。
反事实框架是探究因果关系的一个重要框架,也是倾向值匹配法的逻辑基础,Neyman和Rubin是提出反事实框架的重要贡献者,因而常把反事实框架称为因果关系的Neyman-Rubin反事实框架。该框架认为,被选入干预组或是被选入对照组的个体在两种状态中都有其潜在结果,即它们在其中被观测到的状态和未被观测到的状态。反事实在实际数据中是无法观测到的,因此,评估干预效应的基本任务就在于利用已知信息对一个潜在的、未被观测到的缺失值进行估计。分别用Y0i与Y1i来表示未被干预和干预状态中的潜在结果,令Wi=1表示接受干预,则Wi=0表示未接受干预,Yi表示所观测到的结果变量,那么反事实框架可表述成如下模型:
Yi=WiY1i+(1-Wi)Y0i
观测到的结果取决于二分变量Wi,通俗地说,当Wi=1时,Y1i是观测到的变量,Y0i就是反事实。
用E(Y0|W=0)表示构成对照组的个体的平均结果,E(Y1|W=1)表示构成干预组的个体的平均结果,Neyman-Rubin反事实框架定义了干预效应:
τ=E(Y1|W=1)-E(Y0|W=0)
称此为平均干预效应的标准估计量。可以认为,这是用E(Y0|W=0)来估计反事实E(Y0|W=1)的一次努力。
“倾向值”概念首次出现在统计学家Rosenbaum和Rubin于1983年发表的一篇文章中,将倾向值定义为在给定观测到的协变量情况下接受干预的条件概率,并阐述了观察研究中倾向值匹配、分层、协方差调整三种应用途径。倾向值匹配是将干预组与对照组的个体进行配对,使得匹配起来的个体的倾向值相等或相近,如此,能够使多维的协变量对因变量的影响简化成一维的倾向值,从而能够更简便地估计因果效应。倾向值匹配法的基本思想就是将观测到的协变量纳入logistic回归模型(或probit模型)以产生一个预测个体接受干预的条件概率(即倾向值),再将倾向值相等或者相近的干预组与对照组的个体进行配对,控制选择性偏差,从而保证因果效应结论的可靠性,再使用统计方法对匹配的结果加以分析。
生存分析广泛地应用于医学领域,研究者通过随访等方式获取病人的生存信息,对病人生存时间的分布特征进行描述和比较,对影响生存时间的主要因素进行分析。生存分析的优点在于能够处理删失数据。我们通常绘制Kaplan-Meier曲线来描述病人的生存过程。Cox比例风险模型由英国统计学家 David R.Cox于1972年提出,该模型利用数学模型拟合生存分布与影响因子之间的关系,以评价影响因子对生存函数分布的影响程度,找出危险因素和保护因素。Cox回归方程为h(t,X)=h0(t)·eXβ',其中X为协变量向量,β'是协变量系数变量的转置。
以上海中医药大学附属曙光医院2006年至2015年首次收治的1038位心衰病人为例,干预组与对照组病人的倾向值分布如图1所示。ROC曲线显示AUC值为0.644,具有一定准确性。通过基于最近邻匹配的倾向值匹配,我们得到308对成功匹配的数据,匹配后,干预组与对照组的倾向值分布图如图2所示,很明显可以看出干预组与对照组的倾向值分布基本相同,在统计学上,这意味着干预组和对照组之间的选择偏差得到了控制,此时干预组和对照组之间的因变量差异仅仅是由于干预条件——病人是否吃中药治疗——而导致的。
根据统计结果,对照组的平均费用是18228.2元,干预组的平均治疗费用是18559.76元,单从费用上分析,在心衰的治疗中,干预组病人的花费略高于对照组。
以心衰病人首次住院时间为起点事件,以该病人第二次住院时间为终点事件,研究心衰病人180天再住院率,若病人在180天内出现死亡,则将死亡时间认为是该病人的再住院时间。
图3是匹配后对照组与干预组的心衰病人180天再
住院率对比图,再住院率分别为30.19%和22.73%,治疗过程中结合西药吃中药的病人,其180天再住院率比仅吃西药的心衰病人低了9%左右,两组的再住院率差异具有统计学意义(P=0.0167<0.05)。
图1 匹配前干预组(右)与对照组(左)的倾向值分布直方图
图2 匹配后干预组(左)与对照组(右)的倾向值分布直方图
表2是所有变量的Cox回归分析结果。在5%的显著性水平下,具有统计学意义的变量有:治疗方法、性别、冠心病、ACEI、ARB类药物、β受体阻滞剂、利尿剂、抗血小板药物。对于性别这个变量来说,变量取值为1(病人性别为男)的危险度是变量取值为0(病人性别为女)的1.321倍,即在控制其他变量相同的前提下,男性心衰病人的再住院率高于女性心衰病人。对于伴随疾病和西药用药的二分类变量,如治疗方法来说,变量取值为1(病人采取中西医结合治疗)的危险度是变量取值为0(病人只采用西医治疗)的0.746倍,说明中西医结合的治疗方法要优于仅采用西医治疗。危险度小于1的因素我们称之为保护因素,因此具有统计学意义的保护因素有:治疗方法、ACEI、ARB类药物、β受体阻滞剂、抗血小板药物。
表1 Cox比例风险模型的影响因素分析
***:代表P值介于0~0.001, **:代表P值介于0.001~0.01,*:代表P值介于0.01~0.05,·代表P值介于0.05~0.1。
图3 匹配后对照组与干预组心衰病人180天再住院率对比
用基于反事实框架的倾向值匹配法研究观察数据的因果效应是一个新颖且简便的方法,适用于在随机化无法实现的观察性研究中,可以最大限度地减少偏倚,直接比较协变量在干预组和对照组之间的均衡性以及处理效应,具有十分广泛的应用[6-7]。
本次研究表明,采用倾向值匹配法平衡混杂因素后,对于心衰患者,采用中西医结合治疗的平均费用高于仅用西医治疗的平均费用,中西医结合治疗的病人180天内再入院率比仅用西医治疗的病人的再入院率低约9%,且差异具有统计学意义。