赵晓蒙,李炳海,王素珍#,任艳峰,王小礼
1)潍坊医学院公共卫生学院卫生统计学教研室 潍坊 261053 2)潍坊医学院财务处 潍坊 261053 3)山东省肿瘤医院放疗科 济南 250117
基于倾向指数匹配法的局限期小细胞肺癌的生存分析*
赵晓蒙1),李炳海2),王素珍1)#,任艳峰1),王小礼3)
1)潍坊医学院公共卫生学院卫生统计学教研室 潍坊 261053 2)潍坊医学院财务处 潍坊 261053 3)山东省肿瘤医院放疗科 济南 250117
#通讯作者,女,1967年1月生,博士,教授,研究方向:临床试验设计方法及信息处理,E-mail: wangsz@wfmc.edu.cn
倾向指数;匹配法;局限期小细胞肺癌;生存分析
目的:应用倾向指数匹配法均衡组间的协变量,评价单纯应用放疗(CRT)与三维适形放疗联合化疗(CCRT)对局限期小细胞肺癌(LD-SCLC)的治疗效果。方法LD-SCLC患者224例,其中CRT 109例,CCRT 115例。基线资料包括性别(1=男,0=女)、年龄、吸烟(1=是,2=否)、结核(1=有,2=无)、家族史(1=有,2=无)、TNM分期(1=Ⅰ期,2=Ⅱ期, 3=ⅢA期,4=ⅢB期)、血清神经元特异性烯醇化酶(NSE)水平、KPS评分、肿瘤数量(1=单个,2=多个)等。以分组变量为因变量,以协变量为自变量,建立logistic回归模型,计算倾向指数,然后按照倾向指数进行组间卡钳匹配。分别对匹配前后的数据进行生存分析。结果匹配前CRT组和CCRT组的中位生存期(95%置信区间)分别为2.15(1.96~2.48)和2.37(2.06~2.72) a,1 a生存率分别为82.65%和83.36%,2 a生存率分别为59.02%和64.30%,3 a生存率分别为25.28%和29.34%,两组生存曲线差异无统计学差异(χ2=2.173,P=0.186)。两组共94对匹配成功。匹配后CRT组和CCRT组的中位生存期(95%置信区间)分别为2.14(1.75~2.44)和2.75(2.38~2.92) a,1 a生存率分别为82.24%和85.36%,2 a生存率分别为56.39%和66.20%,3 a生存率分别为23.44%和34.37%,两组生存曲线差异有统计学意义(χ2=11.045,P=0.008)。结论采用倾向指数匹配法能有效降低非随机化临床试验数据的混杂偏倚。
小细胞肺癌(small cell lung cancer, SCLC)占肺癌的15%~20%,其中局限期小细胞肺癌(limited disease SCLC,LD-SCLC)约占SCLC的1/3。尽管LD-SCLC对初始化疗和放疗高度敏感,但因缓解期短、容易局部复发或远处转移,故预后较非小细胞肺癌差。化疗是SCLC的标准治疗方案,而胸部放疗的加入是SCLC治疗史上的里程碑。20世纪90年代进行的几项meta分析数据已证明胸部放疗能将LD-SCLC患者的2 a生存率提高5%~7%,并使局部复发率降低25%~30%[1-2]。但放疗与化疗结合的时机和方式等问题仍有待进一步探讨。倾向指数是Rosenbaum和Rubin[3]于1983年提出的估计不完全随机试验处理效应的一种方法,通过平衡组间的协变量,降低偏倚。作者以从山东省肿瘤医院收集的单纯放疗(CRT)及三维适形放疗联合化疗(CCRT)治疗的LD-SCLC患者的临床随访资料为基础(患者在选择治疗方案时并未经过严格的随机化[4-6]),应用倾向指数匹配法对两个处理组的协变量进行均衡化处理,并对匹配前后的生存情况进行对比分析,评价两种治疗方法的临床疗效。
1.1病例资料病例均来自于2005年至2011年山东省肿瘤医院收治且确诊的LD-SCLC患者,排除恶性胸腔积液患者,患者均无严重的可能影响治疗计划实施的内科疾病、严重的心肝肾等疾病及骨髓功能障碍。其中CRT组109例,CCRT组115例,基线资料包括性别(1=男,0=女)、年龄、吸烟(1=是,2=否)、结核(1=有,2=无)、家族史(1=有,2=无)、TNM分期(1=Ⅰ期,2=Ⅱ期, 3=ⅢA期,4=ⅢB期)、血清神经元特异性烯醇化酶(NSE)水平(u/mL)、KPS评分、肿瘤数量(1=单个,2=多个)等。在山东省肿瘤医院随访科的配合下,通过电话、书信和电子邮件随访获得生存资料,随访时间为5 a。
1.2研究方法倾向指数匹配法是以治疗方式为因变量,以协变量为自变量,建立logistic模型,根据模型计算每个LD-SCLC患者的倾向指数;采用倾向指数最近距离匹配法对组间相同或相近的个体进行配对,并将差值设定在某个范围内,即为卡钳匹配[7-8],该研究中卡钳值设置为0.20[9]。匹配前后,分别对两组间协变量的分布进行比较,定量变量采用两独立样本t检验或者t′检验,定性变量采用χ2检验;采用Kaplan-Meier 法绘制生存曲线,采用log-rank检验比较两组的生存曲线。倾向指数的匹配以及所有的统计分析均采用SAS 9.2编程完成[10-11]。检验水准α=0.05。
2.1匹配之前分析结果原始资料中纳入模型的协变量[7]共有性别、年龄、吸烟、结核、家族史、TNM分期、血清NSE水平、KPS评分、肿瘤数量。采用倾向指数匹配之前, 吸烟、KPS评分、肿瘤数量3个协变量在组间分布不均衡,检验结果见表1;生存分析结果表明两组的生存曲线差异无统计学意义,见表2。
表1 倾向指数匹配前两组患者的协变量分布
表2 倾向指数匹配前两组生存资料的比较
2.2匹配之后分析结果采用倾向指数法对两组数据进行卡钳匹配,共有94对匹配成功。匹配之后,纳入模型的9个协变量组间分布差异均无统计学意义,结果见表3。用匹配之后的94对新样本进行生存分析,结果见表4,从表4可以看出,两组生存曲线差异有统计学意义,CCRT的治疗效果优于CRT。
表3 倾向指数匹配后两组患者的协变量分布
表4 倾向指数匹配后两组生存资料的比较
在非随机化或随机化遭到破坏的医学研究中,两个处理组之间的多个协变量分布往往是不均衡的,要正确评价两种处理的效果,必须考虑处理组之间协变量分布不均衡对结果的影响。在观察性研究及其他非随机化研究中,可以考虑运用倾向指数匹配法平衡协变量。倾向指数匹配法就是调整观测数据中的混杂因素,做类似随机化的均衡处理[8,12-13]。倾向指数匹配法能够减少观察性研究和非随机化研究中的选择性偏倚,该方法易于理解,结果便于解释,研究步骤标准化程度高,不需要构建明确的线性模型,且检验方法简单。Logistic回归分析是非随机化研究中处理二分类资料的常用方法。Logistic回归用于分析结局变量与协变量之间的定量关系,推断的是关联关系,而倾向指数匹配法推断的是因果关系,在因果关系论证强度上大于logistic回归分析。倾向指数匹配法同样适用于混杂因素很多,结局变量发生率很低的情况,而logistic回归法并不适合[14]。由于倾向指数是协变量的一个函数,协变量不论多少都可以综合成为一个倾向得分来表示,实际上起到了降维的作用,而且倾向指数匹配法操作简便,容易理解,能够很好地对结果进行解释。另外,某些非随机化临床试验,如医疗器械的临床评价、Ⅳ期临床试验等,可以通过倾向得分方法进行分析[15]。
该研究中两个处理组多个协变量的组间分布并不均衡,而这些协变量对LD-SCLC患者的生存时间、预后等均有较大影响,忽略这些协变量的影响,生存分析的结果就会有较大的偏倚。通过采用倾向指数匹配法均衡协变量,两组除了处理因素和结果变量分布不同外,其他协变量均衡可比,使数据达到了“接近随机分配数据”的效果[14-17],增强了两组的可比性,消除了混杂因素对结果的影响。生存分析结果表明,化疗联合放疗治疗LD-SCLC,其效果优于单纯放疗。放疗联合化疗的综合治疗可以大大提高LD-SCLC患者的生存期,值得在临床上广泛应用。该研究也表明,在无法实现随机化的临床试验研究中,采用倾向指数匹配法平衡组间协变量的不均衡不失为一种好的方法。
[1]Pignon JP,Arriagada R,Ihde DC,et al.A meta-analysis of thoracic radiotherapy for small-cell lung cancer[J].N Engl J Med,1992,327(23):1618
[2]Warde P,Payne D.Does thoracic irradiation improve survival and local control in limited-stage small-cell carcinoma of the lung:a meta-analysis[J].J Clin Oncol,1992,10(6):890
[3]Rosenbaum PR,Rubin DB.The central role of the propensity score in observational studies for causal effects[J].Biometrika,1983,70(1):41
[4]Hong S,Youn YN,Yi G,et al.Long term results of ST-segment elevation myocardial infarction versus non-ST-segment elevation myocardial infarction after off-pump coronary artery bypass grafting: propensity score matching analysis[J].J Korean Med Sci,2012,27(2):153
[5]Berger JS,Herout PM,Harshaw Q,et al.Bleeding-associated outcomes with preoperative clopidogrel use in on- and off-pump coronary artery bypass[J].J Thromb Thrombolysis,2012,34(1):56
[6]Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma: a propensity score-adjusted SEER analysis[J].Ann Oncol,2012,23(9):2449
[7]Linden A,Adams JL.Combining the regression discontinuity design and propensity score-based weighting to improve causal inference in program evaluation[J].J Eval Clin Pract,2012,18(2):317
[8]Austin PC,Mamdani MM.A comparison of propensity score methods: a case-study estimating the effectiveness of post-AMI statin use[J].Stat Med,2006,25(12):2084
[9]王永吉,蔡宏伟,夏结来,等.倾向指数第二讲:倾向指数常用研究方法[J].中华流行病学杂志,2010,31(5):584
[10]Carpenter A.Carpenter's complete guide to the SAS macro language[M].2nd ed.SAS Institute,2004.
[11]Brookhart MA,Schneeweiss S,Rothman KJ,et al.Variable selection forpropensity score models[J].Am J Epidemiol,2006,163(12):1149
[12]Hullsiek KH,Louis TA.Propensity score modeling strategies for the causal analysis of observational data[J].Biostatistics,2002,3(2):179
[13]Scrutinio D,Passantino A,Catanzaro R,et al.Inpatient cardiac rehabilitation soon after hospitalization for acute decompensated heart failure: a propensity score study[J].J Cardiopulm Rehabil Prev,2012,32(2):71
[14]Foody JM,Cole CR,Blackstone EH,et al.A propensity analysis of cigarette smoking and mortality with consideration of the effects of alcohol[J].Am J Cardiol,2001,87(6):706
[15]Yaginuma K,Kasai T,Miyauchi K,et al.Propensity score analysis of 10-year long-term outcome after bypass surgery or plain old balloon angioplasty in patients with metabolic syndrome[J].Int Heart J,2011,52(6):372
[16]王永吉,蔡宏伟,夏结来,等.倾向指数匹配法与Logistic回归分析方法对比研究[J].现代预防医学,2011,38(12):2217
[17]王永吉,蔡宏伟,夏结来,等.倾向指数第一讲:倾向指数的基本概念和研究步骤[J].中华流行病学杂志,2010,31(3):347
(2013-04-24 收稿 责任编辑 王 曼)
Survival analysis for limited disease small cell lung cancer based on propensity score matching method
ZHAOXiaomeng1),LIBinghai2),WANGSuzhen1),RENYanfeng1),WANGXiaoli3)
1)DepartmentofHealthStatistics,FacultyofPreventativeMedicine,WeifangMedicalCollege,Weifang261053 2)FinancialDepartment,WeifangMedicalCollege,Weifang261053 3)DepartmentofRadiotherapy,TumorHospitalofShandongProvince,Jinan250117
propensity score; matching method; limited disease small cell lung cancer; survival analysis
Aim: To compare the effects of single chemotherapy (CRT) and conformal radiotherapy combined with chemotherapy(CCRT) on limited disease small cell lung cancer(LD-SCLC) patients after balancing the covariates by propensity score. Methods: A total of 224 LD-SCLC patients were subjected,among which,109 accepted CRT, and 115 accepted CCRT. A logistic regression model was established,and the treatment assignment was taken as the dependent variable and the covariates as the independent variables. For each LD-SCLC patient, the propensity score was calculated for caliper matching and a survival analysis of the matched data was carried out.Results: Before matching, the median survival time (95%CI) of CRT and CCRT were 2.15(1.96-2.48) and 2.37(2.06-2.72) years,respectively; one-, two-, and three-year survival rates were 82.65% and 83.36%, 59.02% and 64.30%,25.28% and 29.34%, respectively. There was no significant difference in survival curve between the two groups (χ2=2.173,P=0.186). A total of 94 pairs patients were matched by propensity score. After matching, the median survival time(95%CI) of CRT and CCRT were 2.14(1.75-2.44) and 2.75(2.38-2.92) years; One-, two-, and three-year survival rates were 82.24% and 85.36%, 56.39% and 66.20%, 23.44% and 34.37%, respectively. There was a significant difference in survival curve between the two groups (χ2=11.045,P=0.008). Conclusion: Propensity score matching can effectively reduce the confounding bias of non-randomized clinical observational data.
*国家自然科学基金项目 81141112,81101290;山东省自然科学基金项目 ZR2009CM117
R734.2
10.3969/j.issn.1671-6825.2014.01.017