侯晓铭,戴国华,高武霖,管 慧,孙 聪,任丽丽,刘 璋
中医临床疗效评价是中医药干预措施与临床结局之间因果关系的研究[1]。队列研究贴切“真实世界”,适合中医临床更加复杂、个体化的动态干预特征,提供仅次于随机对照试验的循证医学证据[2]。目前,队列研究中统计学方法的选择是研究中的难点,本研究针对队列研究中统计方法存在的问题,结合中医临床疗效评价的特点,阐明统计学方法的选择及注意事项。
统计学分析分为统计描述和统计推断,前者是利用统计表、统计图、指标等描述研究资料的数量特征和分布规律,后者是利用样本含有的信息对总体做估计和推断,最终两者为研究结论提供依据,以评价因素与终点指标有无相关及相关的强度[3]。不同的研究设计类型需要不同的统计方法。队列研究属于观察性研究设计,不会人为地施加外在干预,且有一定时间的随访观察,进行统计描述及推断时需要考虑非随机化、失访及生存时间的影响[2]。
相较于其他研究,队列研究的统计学方法具有以下特征:①需要考虑组别的非随机化。不同于随机对照试验(RCT),队列研究设定研究对象依据暴露因素进入分组,而不是随机化分配,这使得基线不具备可比性,造成较大的选择性偏倚。为了尽可能缩小这些偏倚,需要统计方法对基线资料均衡。②需要考虑时间的影响。一方面,队列研究重视终点事件,而终点事件的发生需要一定的时间,甚至是数年,在这段时间中研究对象的依从性、社会环境的改变、科学技术的发展等各种方面都会使研究队列发生迁移,产生缺失数据,造成混杂偏倚;另一方面,终点事件的发生和时间有着必然的关系,时间会对最终的结果产生影响。因此,在涉及终点事件的相关因果推断时,需要处理时间因素[4]。③需要处理多种因素。队列研究不是随机化分组,对未来结局有影响的因素众多,因此,其统计学方法不仅需要进行单因素分析,也需要进行多因素分析。④结局指标类型不同,应用统计方法也不同。队列研究可以产生多种结局资料,如有效或无效、指标实验室数值变化等,在选择结局指标后,需要选择合适的统计方法来描述。⑤需要处理较多的样本。样本比较少的队列研究难以验证暴露因素是否具备统计学差异,也有可能会出现假阴性。因而,队列研究的统计方法综合了时间、暴露因素、结局指标等因素来提高结论的可靠性。
2.1 中医临床疗效评价需要队列研究 经过数千年的传承与创新,中医临床实践时,一方面,采用辨证论治的思想,对病人进行个体化的施治,且随着病程的改变而动态变化;另一方面,同时应用针灸、拔罐、按摩等多种治疗手段加强治疗效果。临床疗效是中医存在和发展的根本[5]。所以,如何科学、客观地评价中医临床疗效是中医发展和推广的关键。依据现在的临床评价体系,以人的感觉、症状的改变评价疗效带有个人主观性。虽然RCT遵循了盲法、对照和可重复性的原则,循证医学证据等级最高,但是既往使用RCT进行中医临床研究,一方面,仅能使用一种汤剂或诊疗措施来应对同种疾病的不同证型,违背了中医辨证论治的原则;另一方面,RCT研究时间较短,而中医的许多优势病种在于慢性疾病的诊治上,若使用RCT评价不能体现辨证论治的后续疗效,且随着失访、技术革新等的出现,随访过程中难以确保非研究因素的均衡性,最终的研究结果缺乏临床实践意义,不能体现真实世界的要求。因此,需要选择能够全面展现中医干预措施影响某个疾病或某个证型动态、完整过程的研究设计。队列研究拥有仅次于RCT试验的循证医学等级证据,病人处于自然的暴露状态之下,没有外在的人为干预,而且研究者会对试验观察一定的时间,有的可以长达数年,从而得到病人一个完整的变化[5],了解到暴露因素对疾病发展、转归、预后的影响,适用于研究综合防治措施、评价医疗服务及探索疾病的病因和预后。这些特征可以让其处理RCT难以实现的暴露因素与多种疾病结局的相关强度的研究[6],与中医复杂、个体化的辨证论治核心一致,展现中医临床疗效的特点。例如中国台湾自1995年3月建立的医疗保险数据库资源可用来设计回顾性队列研究,评价中医药的疗效[7]。因此,队列研究适用于中医临床疗效评价。
2.2 统计方法存在的问题 虽然中医临床疗效评价越来越多地应用了队列研究,但使用过程中存在各个方面的问题。统计学是一门单独的学科,医务工作者了解统计方法不够透彻和全面,在研究中应用时会出现错用、滥用、缺失等问题。有研究表明,超过半数的医学期刊论文中有统计学应用的错误和缺陷[8],而中医临床疗效评价队列研究中使用单一统计方法的文献占中文文献的70.80%[9]。
2.2.1 统计方法的盲目使用 对于队列研究,在进行统计方法的选择时,需要考虑数据的类型、模型应用的条件等,中医临床研究中统计方法的实际应用存在问题[10]:①未考虑模型应用的条件。对于定量数据,在未验证正态性、独立性、方差齐性的前提下,全部使用t检验或单因素方差分析等参数检验方法。②不考虑数据的分组。无视数据的分组及组间关系,一律应用t检验,而忽视方差分析。③忽略χ2检验的应用前提。对于定性数据,一律应用χ2检验。④未结合队列研究及中医临床的特点,处理数据时考虑不全面,仅仅应用单一的数据处理方法。
2.2.2 多因素分析前未进行协变量的筛选 队列研究的优势之一在于可以同时探索多个中医预后因素与结局的关联强度,可是研究者进行多因素回归分析时,未对协变量筛选,直接使用Cox或Logistic回归模型得出最终结果,这样会增加因素之间的重叠效应,筛选出的有统计学意义的因素不符合临床实际。
2.2.3 未考虑时间对结局的影响 慢性疾病的队列研究,如中医对癌症、妇科疾病的相关项目,随访会持续较长时间,终点事件的出现与时间呈现一定的关系。对于中医学此类生存资料的分析未考虑时间对结局的影响,直接使用Logistic回归分析。研究显示,Logistic回归及Cox比例风险回归模型的误用和混用在队列研究文献中较严重,在以往929篇研究性队列研究文献中应用了Cox回归的仅占13.0%,且2015年的比例与2014年基本相同(13.1%与13.0%)[11]。
尽管中医临床疗效评价队列研究的统计方法存在问题,然而可资借鉴的方法学文献却不多,且其中有一部分仅仅介绍了队列研究的方法学,或只是浅显的统计方法而没有系统的流程,或单纯描述统计学原理,绝大多数有关中医队列研究的文献为实际应用,而医生不是统计学专业出身,所以有借鉴意义的文章稀少。对于中医临床疗效评价而言,在采用了适合的统计方法的前提下,才能得到可信结论,误用和滥用统计方法,甚至会歪曲研究结果的真实性。现为中医临床疗效评价队列研究统计方法的选择提出几点建议。
统计方法的选择主要从以下几个方面考虑:①研究目的。研究目的是整个试验设计的起点,决定了整体方案的设计,队列研究根据目的决定观察指标,确定资料类型,所以在选择统计方法时应该明确自己的研究目的。②资料类型。每种统计方法都涉及数理统计公式,而数理统计公式是在一定的条件下推导和建立,所以,在使用一种统计方法时应该明确资料类型是否符合应用条件。结局指标的类型也会影响统计方法的选择,处理分类变量和数值变量的统计方法不同。③研究设计是整个试验的核心,设计方案不同,产生的数据也不同,本研究只讨论队列研究设计的统计方法,其特征已在上文描述。④样本含量。在同样的资料类型下,样本含量的多少,对统计方法的需求不一。
3.1 基线资料的处理 基线资料包含人口学特征及其他非暴露因素,在进行统计推断之前,需处理基线资料。一方面,对中医队列研究病人的性别、年龄、既往史等做统计描述,获得基线资料的基本信息;另一方面,处理协变量的分布,均衡队列研究暴露组与对照组之间的混杂因素,达到近似随机化的目的,减少组间差异,尽可能使观察者在相似的基线条件下观察中医暴露因素对结局的影响[12]。
3.1.1 统计描述 基线的描述包括资料集中和离散趋势两方面,以各种指标或图、表的形式展现。中医队列研究统计描述在选择统计方法时与其他研究设计基本相同,主要考虑资料类型,计量资料的集中趋势可以选择均数、中位数或百分位数,离散趋势选择极差、方差、标准差或变异系数;计数资料则选择率、构成比或相对比。
3.1.2 混杂因素的处理 混杂因素在各类试验研究中都无法避免,分为已知的和未观测到或未知的两方面,虽然中医临床疗效评价依据本身特性选择了更适合的队列研究,但是相对也有较多的混杂因素需要处理,队列研究的混杂因素可以出现在分组、随访等多个环节。
3.1.2.1 倾向性评分法 倾向性评分法是应用最广泛的处理混杂因素的统计学方法,是对混杂因素的预处理,适用于混杂因素已知,但是数量较多的情况,不适合样本量较少或混杂因素未知的队列研究。中医临床疗效评价队列研究利用倾向性评分处理混杂因素是近年的热门方法,应用于癌症、中药注射剂等样本量大、混杂因素复杂的研究方向。杜立娟等[13]利用倾向性评分处理使用喜炎平和未使用喜炎平两个组别之间的混杂因素,并比较了Logistic回归、倾向性评分加权Logistic回归、带协变量调整的倾向性评分加权Logistic回归3种方法的估计效果。
3.1.2.2 多因素分析、分层分析 分层分析和多因素分析是传统经典的处理已知混杂因素的方法,也是统计推断常用的方法,使用时优缺点互补。分层分析多处理有不同程度或分级的资料,可以区别处理的因素是混杂因素还是效应修饰,并且得出混杂因素的大小和方向,但是不能处理大量混杂因素,有时会出现过度分层的趋势。部分中医临床疗效评价在应用时将倾向性评分和分层分析结合应用,互相弥补。多因素分析处理混杂因素常用多重线性回归、Logistic回归及Cox回归。依据自变量(相关因素)和因变量(结局指标)类型的不同,选择不同的方法,可以分析相关因素与结局的关系,但是无法区分混杂因素和效应修饰。这两种方法将协变量直接纳入模型中,控制这些协变量会产生风险调整的治疗效果,并消除由这些因素引起的明显的偏见,且都不能处理太多的混杂因素。
中医临床疗效评价利用多因素分析调整混杂因素的研究较为多见。管慧等[14]利用Logistic回归及Cox回归对病例对照研究和队列研究结合的巢式病例对照研究在中医临床疗效评价的使用给出方法学建议。分层分析多使用在西医临床疗效方面,在中医研究方面应用不多。
3.1.2.3 工具变量分析 倾向性评分、分层分析和多因素调整分析只能处理了解到的混杂因素所引起的偏倚,但是在临床中有许多研究者不知道或不确定的混杂因素。这些混杂因素不能使用以上方法均衡,为了解决这类问题,从经济学引入了工具变量分析。工具变量分析是外生一个变量,这个工具变量满足3个关键假设[15]:①工具强烈的预测暴露;②工具不能与结果独立相关;③工具不能与暴露结果关联的任何混杂因素相关[16]。这些假设要求很高,能够得到强预测的工具较难[17],是目前处理混杂因素全面的统计方法,中医临床还未有这种统计方法的实践。
3.2 统计推断 统计推断是研究中至关重要的环节,统计方法的选择关乎疗效评价的正确性及准确性。中医临床疗效评价队列研究因为辨证论治的复杂性及个体化,往往需要处理多种因素,常使用多因素分析方法,多元线性回归有线性关系、因变量为连续变量等要求,泊松回归要求因变量为计数资料,而中医临床疗效评价队列研究往往研究的结局为是或者否的分类变量,Logistic回归及生存分析是其主要方法。
3.2.1 Logistic回归 Logistic回归是研究分类观察结果与一些影响因素之间关系的一种多变量分析方法。其属于非线性回归,因变量要求是二分类或多分类资料,解释变量与因变量的Logistic概率呈线性关系。常用来进行疾病危险因素的分析和筛选、校正混杂因素、预测及判断发病的概率。高翠红[18]应用Logistic回归分析筛选各指标与疾病严重程度的相关性。宋祖玲等[19]联合决策树和组合危险因素Logistic回归区分不同患病风险的危险因素组合,用于构建相对风险预测模型。依据因变量的类型,二分类因变量使用二元Logistic回归,无序多分类因变量使用无序多分类Logistic回归,有序多分类因变量使用有序多分类Logistic回归。
3.2.2 生存分析 生存分析将终点事件出现与否和生存时间结合起来。生存分析有参数法、非参数法和半参数法,其中半参数法应用较多,主要有Log-rank检验、Breslow检验和Cox比例模型分析法;参数法主要用于对生存率的估计,可选用Kaplan-Meier法和寿命表法。
半参数法中应用较多的是Cox回归。该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。其用途和Logistic回归类似,只不过考虑了时间的因素,并且可以分析删除数据。有研究利用临床常规指标构建急性脑卒中病人近期死亡风险模型,为其预后评估和科学救治提供决策依据[20]。戴伟超等[20]采用Cox回归模型探讨影响病人复发的相关因素。
3.2.3 单因素分析 单因素分析在中医临床疗效评价队列研究并不作为主要分析方法,因为仅仅只能处理一种变量,大多在基线资料评估均衡性时使用,或者少数较为简单的队列研究设计。在应用单因素分析方法时有应用的前提条件,在使用时需要检验正态性、独立性等。
t检验应用于符合正态分布的定量资料,为两样本均数的比较;成组t检验还需要检验独立性及方差齐性。方差分析适用于多样本均数的比较,使用前仍需检验正态性及独立性。若误用了t检验会增加Ⅰ类错误的概率。有时依据既往经验,如性别、年龄、体重等的比较,可直接使用t检验,而不必再进行验证。若经过检验,不符合正态分布,可使用秩和检验。χ2检验适用于定性资料,依据行列表的不同类型,选择适合的χ2检验,不应直接使用普通χ2检验。
队列研究是中医临床疗效评价的优质方法,其统计分析方法的选择对于临床研究至关重要,在应用时需依据设计类型、资料特点、研究目的选择适合的方法,统计描述和统计推断中的方法互相包含。混杂因素的处理方法较多,随着医疗大数据的开展,经常将两种方法结合使用。