宋培培
(上海市生物医药技术研究院《中华生殖与避孕杂志》编辑部,上海 200237)
随机对照试验(randomized controlled tiral,RCT)是临床研究中评估干预效果的最佳研究,对临床治疗和医疗保健干预具有更重要和更直接的影响,因此其报告内容必须具备完整性、科学性和透明性。临床试验报告的统一标准(Consolidate Standards of Reporting Trials,CONSORT)声明及其扩展版是目前较为公认的RCT研究报告规范。但是,CONSORT声明在中文医学期刊未获得广泛采纳[1],中文RCT论文的报告质量距离CONSORT声明要求仍有较大的差距[2-3]。中文医学期刊作为记载、传播我国医学临床研究科技信息的主要载体,肩负着为我国各类医疗卫生决策提供证据的重任。因此,提高中文医学期刊RCT报告质量,是中文医学期刊编辑亟须关注的问题。
但是,中文医学期刊编辑对CONSORT声明的知晓率和掌握程度较低[4-5],现有研究多集中在中文RCT的报告执行的评价[6-7],却鲜有研究从编辑角度,总结中文RCT研究报告中编辑审查要点。为此,本研究通过文献调查法对比中英文期刊中RCT报告异同,结合笔者在工作和学习中的体会,浅谈编辑借鉴CONSORT声明对中文医学期刊RCT报告的审查要点,以期为有助于提高中文RCT的报告质量。
在中文医学期刊全文数据库中,检索RCT研究报告。中文文献纳入标准:①28种入选2020年第5届中国精品科技期刊的中华医学会中华系列杂志;②文献类型为随机对照试验原始研究;③发表年份为2019年。在中文医学期刊全文数据库中,运用检索式为(((标题=随机对照) OR关键词=随机对照*) OR 摘要=随机对照) AND 刊名= * AND 出版日期= [2019-01-01 TO 2019-12-31]。排除标准:①随机对照试验的meta分析;②翻译文献;病例对照研究;诊断性试验;通过标准数据库采集临床数据。共检索到22条中文文献。
以NEJM杂志为范本,按照中文文献和英文文献1:3比例收集英文文献。文献检索策略:在“All the words”检索项录入“random”,在“Search within”检索项选择“Full text”,在“Article category”检索项选择“Research”,在“Date”检索项选择“Jan 2019”至“Dec 2019”。排除标准:未提供有关试验设计信息和研究结果的论文。共检索到180篇文献。按照Most cited排序,选择66篇文献。
CONSORT清单共25项条目,若该条目的相关信息大部分或完整呈现定义为“报告”,按照报告率<10%、≥10%且<50%、≥50%且<100%和100%,中英文RCT文献执行CONSORT清单各条目的报告情况如表1所示。
表1 中英文RCT文献CONSORT清单各条目报告情况[n(%)]
CONSORT声明及其扩展版针对特殊研究设计、特殊研究领域及特殊结局限定了报告规范的适用范围。RCT报告需根据设计类型和研究领域选择合适的报告规范予以参考。本次调查中文文献中有1篇整群随机对照试验、1篇非劣效性随机对照试验均未完全借鉴相应的报告规范进行报告。整群对照试验中同一群内个体往往具有一定的相关性(非独立性),如果使用个体随机化的方法分析整群随机化试验将夸大干预效应,出现假阳性的结果。而非劣效性试验的目的是确定一种新的干预是否不劣于阳性药物或者非药物的标准治疗,需要预先指定一个非劣效性差值(Δ)。对于非劣效性试验报告,规范要求需明确非劣效性试验做出合理的假设,需详细说明非劣效性试验的受试者、干预措施、结局指标时是否与确立参照处理优效性的试验中用到的相似或相同,且需要明确采取与传统优效性试验(显著性检验)不同的统计学方法。如果未正确报告此类试验,研究结果将会错误估计疗效,误导读者。因此,如RCT论文未参照合适的CONSORT研究报告规范,可能导致研究内容信息披露不完整或存在偏差。
科研报告的完整性和透明性,是影响研究被转化和利用的重要因素。RCT研究的评价需要从统计方法学和临床医学两方面入手。因此,充分的、完整的方法学介绍,将有助于读者判断一项RCT研究结论在指导临床医生面对个性化患者时应用的可靠性。中英文文献报告率均不足50%的条目有3b(试验开始后方法上的重要改变及原因)、条目6b(试验开始后结局的改变及原因)、条目8b(随机化类型;任何限定情况,如区组和区组大小)、条目9(分配隐藏)、条目10(谁产生分配序列,谁纳入研究对象,谁分配研究对象)、条目11b(组间干预的相似性)。可见,在试验开始后是否有方法学和结局的改变,随机化的方法上,中英文文献在正文中的报告率均较低。中文文献报告率不足50%,但是英文文献报告率较高的条目有条目3a(随机化类型)、条目6a(明确定义主要和次要结局,包括何时、如何评价)、条目7a(样本量如何确定)。
结果部分,本研究中中文RCT文献报告率不超过50%的,但是英文文献报告率较高的条目有13a(各组接受随机分配、接受干预和进入主要结局分析的研究对象数量)、13b(各组随机化之后发生的失访、排除,以及原因)。本研究中文文献的报告中虽然都描述了各组研究对象纳入结果,但是却没有一篇使用流程图介绍入组过程。另外,在结果统计时,在中文文献结果部分,均未能充分重视意向性治疗(intention-to-treat,ITT)分析,全部都是按照符合方案(per protocol,PP)分析。而英文文献都是用ITT分析。所有入选的受试者应该包括在原随机分配的组别中进行分析,如果某些研究对象因脱落或退出未能完成研究,PP分析会导致偏倚的产生,因此,CONSORT声明是推荐使用ITT分析,而目前ITT分析在RCT中文文献应用尚不普遍。
对结局的描述不仅要描述发生/未发生事件的研究对象数量和分母,或结局指标的均值和标准差,还要描述组间比较的情况即效应大小及其置信区间。效应指标及其置信区间应与P值一起描述,但是目前这个要求在RCT中文文献中并未普遍执行,在英文文献中普遍得到执行。
CONSORT清单要求讨论中对该研究的不足、存在问题、试验过程中可能产生的偏倚、报告结果可能潜在的误差和导致原因等方面进行客观阐述。中英文文献均有一半及以上的比例报告了条目20(试验局限性;关注偏倚的来源、不精确度;多重比较问题)。但是,依然可以反映出,作者对原始研究局限性的讨论在报告中常常忽略;另外,在中文文献中常常将“样本量较小”作为试验的局限性。而中文文献中是缺少样本量的估算报告的,因此这个局限性的描述缺乏说服力。
要想依据CONSORT声明准确、充分地报告RCT,首先是寻找到对应的CONSORT声明及扩展版的报告规范。目前,CONSORT声明扩展版有17份(详情可查阅http://www.consort-statement.org/extensions)。编辑部在初审阶段就可以要求作者对缺失条目予以补充,一方面避免试验中确实已经实施的步骤而在报告中遗漏的现象,另一方面也可对未能补充的条目阐明原因,以便在同行评议阶段审稿专家对该试验研究质量进行偏倚评估。在此,笔者呼吁国内期刊重视临床试验的注册并在官网提供查看完整研究方案的路径。编辑在审查时引导作者提高对试验注册的重视,可推动注册的具体实施。应重视对RCT报告声明伦理学的审查,对研究实施过程中是否符合《赫尔辛基宣言》进行审查。
编辑要继续重视RCT研究报告中对随机序列产生的类型、样本量的估算方法、对期中分析的解释和试验终止标准、分配隐藏机制、盲法中的目标人群和实施的报告率。另外,本研究还发现,尽管所有的中文RCT研究均报告了观察指标及其定义,但是未明确定义主要结局指标和次要结局指标。明确定义主要结局是十分必要的,它常用于计算样本量,注意此部分的报告,可以与样本量的报告相呼应,提高样本量的报告率。样本量的确定是RCT研究设计的重要环节。编辑审查工作中,要重视RCT研究报告中详细描述样本量的估算要素,包括:①各组结局指标的估计值或比较组间具有重要临床意义的目标差异,以及对照组结局指标的估计值。②表示I类错误水平的α。③统计学把握度1-β或表示II类错误的β。④对于连续变量,测量值的标准差。
CONSORT清单提供了研究对象的纳入流程图,在没有失访或排除的情况下,文章可以通过文字描述研究对象的流动过程,但是对于研究对象存在未接受所分配的干预、出现失访、因依从性差从分析中被排除的情况时,编辑应该建议作者使用流程图报告患者的纳入情况。
在正规的随机试验中观察到的差异按定义来说都是因机遇产生的,即使差异存在统计学意义,也是由于机会所导致的[8]。在基线特征比较时,中文医学期刊编辑应引导作者正确认识P值的意义,在进行基线特征的假设检验不仅是不必要的,而且还可能是有害的,如果根据基线的统计学显著性检验来考虑组间的可比性,则会导致研究者或者读者忽略具有临床意义的差异对干预效果带来的影响。因此,在实际报告中,连续变量可以通过均数和标准差(正态分布)或中位数与范围(偏态分布),分类变量可以通过各类数量和比例来判断组间相似性。
ITT分析原则在中文RCT论文对结局的报告中未得到广泛的应用。中文医学期刊编辑应引导作者充分重视ITT分析,因为ITT分析可避免由于研究对象非随机因素退出研究而造成的偏倚。而ITT原则主要是要求分配到任一处理组的受试者都应当作该组成员被随访、评估和分析。
CONSORT清单要求结果应报告每个主要和次要结局的结果、效应值和精度(如95%置信区间),二分类变量要同时报告绝对效应和相对效应。在中文RCT报告中较少提及效应值及其置信区间。对于连续性变量来说,效应值通常是均差,对于二分类变量来说,效应指标可能是相对危险度、比值比或率差,对于生存资料而言,效应值是危险比或中位生存时间差。临床试验的结果的判断应从单纯关注差异的统计学意义(P<0.05),扩展到同时关注结果的临床意义和临床效应量的大小[9]。因此,中文医学期刊编辑应引导作者充分报告结果的效应值和其置信区间。
CONSORT清单要求在讨论部分,应结合试验的研究假设、试验的结果、试验的优势与不足对结果进行合理解释。编辑在审查中,应提醒作者对研究的局限性进行说明,并注重审视以下几个方面:一是注意从方法学的角度对研究的缺陷进行评价,但要避免出现文中未报告样本量的计算方法,却在讨论中认定由于样本量较小的情况。二是注意区分统计学上的差异和临床意义的差异。中文RCT报告中,经常遇到作者将一个统计学上不存在显著性的差异,解释为干预效果一样。但是,统计学意义并不完全等于临床意义,因此编辑在审查时应注意避免此类错误。在评价结果的临床意义时,对于某一事件发生率较低的群体中,应特别考虑到是否是由于研究样本量大从而达到了统计学上的显著差异,但其绝对获益很小,临床干预意义并不大;或者应考虑到干预措施在卫生经济学上的合理性,或者实施的可行性和可推广性,是否是最优选择。三是注意谨慎解释亚组分析结果。中文RCT报告常存在对亚组分析结果的误读。编辑在审查时,应提醒作者亚组分析的结果在统计学上有显著性,通常可能仅仅由于机会造成的,多重性分析可以增大假阳性的概率。当亚组分析在满足下列条件时,包括:①亚组分析纳入统计学设计;②亚组检验假说数量少;③亚组差异通过研究内而不是不同研究得出;④亚组间差异大;⑤有不同研究亚组分析结果或外部证据的支持;⑥亚组分析结果符合医学逻辑,才可提高亚组分析的可靠性[10]。
科技期刊编辑既是科研工作成果的把关人,也是指引者。作为临床试验研究领域第一个重要的报告规范,中文医学编辑不仅应充分认识到CONSORT声明的价值,更应根据清单熟练掌握编辑审查的要点,积极向读者和作者宣教,以增加中文RCT研究报告的规范性和效力,提高中文RCT研究报告的刊登质量。综上,建议对于中文RCT报告,应首先逐一对比CONSORT声明中的发表条目,其次进行相应的编辑审查,然后再送外审专家进行同行评议。尽管目前中文RCT研究报告质量距离国际标准还有较大差距,只要国内医学期刊编辑能有效使用CONSORT声明进行规范化要求,在编辑工作中严格履行审查职责,引导临床科研工作者提高对中文RCT研究报告规范性和效力的重视,将有助于提升我国中文RCT研究报告的整体质量。