系统评价再评价优先报告条目解读

2018-08-03 05:05卢存存杨丰文柯立鑫荀杨芹杨克虎

中国循证儿科杂志 2018年3期

卢存存杨丰文柯立鑫杨楠荀杨芹杨克虎

系统评价常用于整合研究结果，被认为是高质量的研究证据[1]。然而，当针对同一研究主题有多个系统评价存在时，临床医生在选择证据时常难以抉择[2]。因此，20世纪末，有学者开始尝试对同类的多个系统评价进行再评价研究[3]，系统评价再评价方法随即诞生。系统评价再评价研究是全面收集针对同一健康问题的病因、诊断、治疗和预后等方面的相关系统评价进行再评价的一种综合研究方法[4]。系统评价再评价从更高的层面对系统评价的证据进行综合，蕴含的信息量更加丰富和全面，临床实用性也更强，但其相关的方法学研究并不成熟，如数据处理和报告形式[2,4]。目前，已有多个系统评价的相关评价工具，如PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)和 AMSTAR-2(A Measurement Tool to Assess Systematic Reviews 2)等[5,6]，但尚未见专门用于规范系统评价再评价质量的工具[7]。系统评价再评价的完整透明报告有助于判断其结论的可信度，其中干预措施的利害关系对于临床应用的选择及证据评价尤为重要。因此，为促进系统评价再评价中干预措施利害关系的完整透明报告，Bougioukas等研发了系统评价再评价优先报告工具PRIO-harms(preferred reporting items for overviews of systematic reviews including harms checklist)[8]。本文以2017年发表在《中国循证医学杂志》的“抗心绞痛类中成药疗效及安全性系统评价的再评价”一文[9]为例，对PRIO-harms进行分析解读，以期为相关研究者提供参考。

1 PRIO-harms简介

PRIO-harms是在PRISMA条目上扩展而成，目的是保证系统评价再评价中干预措施利害关系的完整透明报告。包括标题、摘要、背景、方法、结果、讨论、作者身份和资金8个部分共计27项条目(56项亚条目)组成的评价清单和1个文献筛选流程图。与PRISMA条目相比，增加了4个条目(10、18、25、26)，同时清单中明确列出了专门用于报告干预措施利害关系的条目(1b、2b、3c、6c、8b、15c、16b、21c、23b)。具体评价条目内容及解释见表 1。

表1 系统评价再评价优先报告条目清单

领域和主题亚条目条目清单17系统评价与原始研究的特征17a3)以表格形式呈现纳入系统评价的特征[如题目、作者、检索时间、PICOS、纳入研究的设计和数量、研究对象的数量和范围、干预的剂量或频率、随访时间(治疗持续时间)、系统评价的局限性、结果、结论]和补充纳入原始研究的特征17b报告纳入系统评价使用的语言和发表状态限制18重复18呈现和(或)讨论系统评价中原始研究的重复情况(至少报告以下1种):重复研究的处理方法(如修正重叠区域);列出引文矩阵3);给出索引出版物数量和(或)讨论重复研究6)19方法学和证据质量评价的呈现19以文字或图表3)形式呈现质量评价结果(参见亚条目13a～c):包括纳入系统评价的报告和(或)方法学质量;报告系统评价纳入原始研究的质量(包括序列生成、分配隐藏、盲法、退出、偏倚等)及补充纳入原始研究的质量;证据质量20 Meta偏倚的呈现报告Meta偏倚的评价结果(如发表偏倚、不同研究的选择性报告、ROBIS工具评价结果)21结果综合21a总结和报告系统评价再评价中利害关系的主要结果。如果进行定量合成,则以可信区间和异质性等报告综合结果21b如果进行其他分析(如敏感性分析、亚组分析、Meta回归),应报告相应结果21c分别报告每种干预措施所致不良事件的结果讨论22证据总结22提供主要结局的简要总结及每项主要结局指标的证据优势和局限性23局限性23a讨论系统评价再评价或纳入研究(或两者)的局限性(如不同的文献选择标准、检索的局限性、语言限制、发表偏倚、选择偏倚)23b报告危害性相关系统评价可能的局限性(如数据和信息缺失问题、危害性定义、罕见不良事件)24结论24a提供与系统评价结果相符的一般性解释及对临床实践的影响;同等慎重考虑利害关系及在其他临床背景中的证据选择24b对未来研究的启示作者身份25作者贡献25报告作者贡献26双重作者26局限性或利益声明部分报告双重作者资金27资金及其他支持27a报告系统评价再评价(直接资助)或作者(间接资助)的资金支持和其他支持来源,或报告没有资金支持27b提供系统评价再评价或作者的资助者或赞助商27c如果存在资助,应报告系统评价再评价中资助者、赞助商和(或)机构的作用

注 1)主要适用于关注不良事件的系统评价再评价，可在方法学部分描述；2)语言限制、发表状态和时间限制可在信息来源中报告，参见条目7；3)可以作为补充材料呈现在附件中；4)用于管理和记录数据的软件可在数据收集过程报告，参见条目11；5)评价方法(如评价工具)可在条目19中报告；6)索引出版物是指纳入系统评价中首次出现的原始研究。重复研究可在讨论部分描述

2 PRIO-harms解读

以“抗心绞痛类中成药疗效及安全性系统评价的再评价”一文为例对PRIO-harms进行逐条分析解读，对其报告的完整程度用“符合”、“部分符合”、“不符合”3个等级进行划分，完整报告所有条目内容的判断为“符合”，没有报告任何条目内容的判断为“不符合”，其他情况判断为“部分符合”。

条目 1(标题) 举例文献的标题中明确说明了该研究为系统评价再评价，符合1a；同时提及“安全性”一词，符合1b。故条目1为“符合”。

条目 2(结构式摘要) 举例文献呈现了结构式摘要，包括目的、数据来源、文献选择标准、数据提取、质量评价、结果、结论等内容，但忽视了背景、局限性的报告，故2a为“部分符合”；不良结局报告中，只报告麝香保心丸的不良反应结果，但未具体说明，故2b为“部分符合”。条目2为“部分符合”。

条目3(理论基础) 举例文献简要概述了系统评价再评价的理论基础，如“系统评价是对多个同类研究和大量文献进行综合分析，从而获取、评价和应用最佳证据的重要手段”，但未阐述其应用范围，故3a为“部分符合”；背景部分未明确描述干预措施的潜在利害关系，也未说明哪些事件是不良事件，故3b和3c为“不符合”。条目3为“部分符合”。

条目4 (目的，PICOS) 举例文献说明了研究目的“探索中成药系统评价方法，提高中成药临床研究质量，为中成药的基本药物遴选、中成药上市后再评价等提供证据和方法思路”，但背景部分未以PICOS形式明确说明研究问题，条目4为“部分符合”。

条目5(计划书与注册) 计划书的撰写有利于研究按照既定的方案实施，注册可以减少研究结果的选择性报告。因此，研究者在进行1项系统评价再评价之前应该撰写计划书和注册，应对计划书与注册情况进行详细描述，如提供注册机构(如PROSPERO)。举例文献未说明是否有计划书及注册，也未提供注册机构，故5a和5b均为“不符合”。条目5为“不符合”。

条目6(文献选择标准与结局指标) 系统评价再评价的纳入标准应基于PICOS制定，同时应报告纳入相应研究时采用的限制，如语言限制和发表状态等，还应区分主要与次要结局指标，并对不良结局的严重程度进行分级。举例文献明确提供了文献选择标准，包括PICOS：研究对象(心绞痛患者，心绞痛类型不限)、干预措施(28 种中成药治疗)、对照措施(西药对照或空白对照)、结局指标(总有效率、心电图改善率、不良反应发生率)、研究设计(系统评价/Meta 分析)，故条目6a为“符合”。并对结局指标的主次进行了说明，如① 总有效率(关键指标)；② 心电图改善率(关键指标)；③ 不良反应发生率(重要指标)。纳入不良反应作为重要指标，但未对不良事件的严重程度进行分级。故6b为“符合”，6c为“部分符合”。但未报告语言限制、发表状态等，故6d为“不符合”。条目6为“部分符合”。

条目7(信息来源) 要求详细报告检索情况，包括数据库检索及其他补充检索情况，如搜索引擎、在研研究及灰色文献等。举例文献报告检索3个英文数据库(PubMed、Embase、The Cochrane Library)及3个中文数据库(CNKI、VIP、WanFang Data)，检索日期均为建库至 2015 年 11 月。但未说明是否进行手工搜索、灰色文献等其他补充检索，7a和7c为“符合”，7b为“不符合”。条目7为“部分符合”。

条目8(检索策略) 其中8b专门用于危害性评价的报告。要求应至少详细说明1个数据库的检索方法，包含检索策略和相应的限制，如时间及语言限制等，以便重现检索结果，同时应报告不良事件的检索情况。举例文献详细说明了CNKI的检索方法，但未提供用于识别不良事件的检索过程，8a为“符合”，8b为“不符合”。条目8为“部分符合”。

条目9(数据管理与筛选过程) 文献筛选、信息提取、数据的处理及记录均是制作系统评价再评价的关键步骤。要求报告制作过程中分歧解决方法和数据管理软件，此外，还应对于重复研究的处理过程进行特别说明。举例文献提到用Note Express管理文献、Excel 2007管理数据，并报告筛选过程“由 2 位评价员独立筛选文献、提取资料并交叉核对，如遇分歧，则咨询第三方协助判断，缺乏的资料尽量与作者联系予以补充”，但未说明重复文献的处理方法。9a和9b为“符合”，9c为“不符合”。条目9为“部分符合”。

条目 10(原始研究的补充检索) 新增条目，由于系统评价时效性相对较短，要求报告原始研究的补充检索情况。举例文献未报告是否对原始研究进行补充检索，条目10为“不符合”。

条目11(数据收集过程) 要求详细描述数据提取方法，如背对背或重复提取，及向原始研究或系统评价作者获取缺失数据的过程，可以确保数据的准确性和完整性。举例文献描述提取数据方法：“由2位评价员独立筛选文献、提取资料并交叉核对，如遇分歧，则咨询第三方协助判断”，并说明获取缺失数据的过程：“缺失的资料尽量与作者联系予以补充”，11a和11b均为“符合”，条目11为“符合”。

条目12(数据条目) 该条目要求报告影响研究结果的变量，并在适当时定义变量，此外，还应报告数据转换和简化处理方法，以便其他研究者重复和判断研究结果。举例文献描述了资料提取内容：包括研究题目、第一作者、发表杂志及时间等，但未报告影响研究结果的变量，也未报告数据转换及简化处理方法。条目12为“不符合”。

条目13(方法学与证据质量评价) 要求报告原始研究的质量评价工具(如ROB工具)、系统评价的质量评价工具(如PRISMA条目)和证据分级(GRADE系统)；并报告评价采取的方法，如背对背或独立重复等。举例文献报告应用AMSTAR评价纳入系统评价的方法学质量，同时采用GRADE对纳入研究进行证据质量分级，但未报告纳入系统评价中的原始研究的质量评价情况，也未描述独立、重复等保证质量评价准确性的具体方法。13a和13c为“符合”，13b和13d为“不符合”。条目13为“部分符合”。

条目14(Meta偏倚) 偏倚风险的报告对于研究结果解读影响甚大，因此报告其评价工具和方法利于结果的准确解读。举例文献未报告拟进行的Meta偏倚评价内容，如发表偏倚、选择性报告、偏倚风险工具ROBIS评价等。条目14为“不符合”。

条目15(数据综合) 要求报告数据综合方法(如定性描述、Meta分析、网状Meta分析)及其相关细节。如果进行定量合成，还应报告使用的软件。此外还应报告未发生不良事件研究的处理方法和拟进行的其他分析方法，如亚组分析、敏感性分析、Meta回归等。敏感性分析可以判断结果的稳定性，而Meta回归或亚组分析可以探讨潜在效应修正因子对于结果的影响。举例文献简要描述了数据综合方法及使用的软件：“结局指标进行数据合并时，按照类型不同采用不同效应量及其 95% CI；若原系统评价/Meta 分析未报道结局指标合并结果，则首先考虑根据原始数据使用RevMan 5.2 软件进行合并”，但并未说明具体统计方法，也未报告未发生不良事件研究的处理方法。15a为“部分符合”，15b为“符合”，15c和15d“不符合”。条目15为“部分符合”。

条目16(系统评价与原始研究的选择) 与PRISMA不同的是，PRISMA-harms要求流程图中单独呈现危害性结局的研究数量。举例文献用流程图清楚地报告了文献筛选流程，但流程图中未单独呈现不良事件结局的研究数量，也未列出全文筛选阶段排除的研究和排除理由。16a为“符合”，16b和16c为“不符合”。条目16为“部分符合”。

条目17(系统评价与原始研究的特征) 要求报告纳入系统评价和(或)原始研究的特征，包括与PICOS相关的信息，如样本量、干预的剂量和频率、随访等，研究题目、作者等；并报告纳入研究的语言及发表状态限制。举例文献以表格形式呈现纳入系统评价的基本特征，但呈现信息相对简略，部分重要信息如样本量、干预的剂量与频率、随访等均未报告。虽可从纳入研究基本特征表判断纳入研究均为已发表的中文文献，但作者并未说明纳入研究使用的语言及发表状态限制，17a为“部分符合”，17b为“不符合”。条目17为“部分符合”。

条目18(重复) 新增条目，要求报告重复情况。如呈现并讨论重复研究、列出引文矩阵[指由索引出版物(行)和纳入系统评价(列)组成的呈现重复研究的交叉表格]等。举例文献未对纳入研究是否有重复情况进行说明，也未给出引文矩阵和讨论重复研究，条目18为“不符合”。

条目19(方法学和证据质量评价的呈现) 该条目建议以文字或图表形式呈现纳入系统评价、原始研究的方法学或报告质量评价结果，并提供证据质量分级结果。举例文献以文字和表格形式呈现纳入系统评价的AMSTAR方法学质量评价结果以及GRADE证据分级结果，但未呈现纳入系统评价中原始研究的质量评价结果。条目19为“部分符合”。

条目20(Meta偏倚的呈现) 该条目要求作者报告Meta偏倚评价的结果，如发表偏倚和不同研究的选择性报告等。举例文献简要描述了纳入研究的发表偏倚：“我们绘制的漏斗图结果显示，丹参酮ⅡA磺酸钠、复方丹参、通心络、丹参在总有效率和心电图改善率方面均存在潜在严重发表偏倚，生脉注射液在总有效率方面有潜在的发表偏倚”，但并未呈现漏斗图，也未报告是否存在选择性报告等其他偏倚。条目20为“部分符合”。

条目21(结果综合) 要求报告每种干预措施的利害结果，并对定量合成的结果用可信区间等表示，同时应报告其他分析结果，如亚组分析、敏感性分析等结果。举例文献报告了总有效率(利)、心电图改善率(利)及不良反应(害)的合并效应量及相应可信区间，但未报告每种干预措施的利害结果，且未对异质性或不一致性结果进行总结。21a为“部分符合”。也未报告是否进行敏感性分析，亚组分析、Meta回归等，21b为“不符合”。该研究共纳入15种中成药，但只有7种报告不良反应结果，21c为“部分符合”。条目21为“部分符合”。

条目22(证据总结) 该条目要求简要总结每个主要结局指标的分析结果，并报告其优势与局限性。举例文献讨论部分主要描述纳入系统评价及其原始研究的质量问题，但未对结果部分的主要结局指标进行总结分析，只简单地描述为：“15种常用抗心绞痛类中成药对总有效率、心电图改善有效率以及不良反应发生率的证据质量等级为低甚至极低，说明我们对抗心绞痛类中成药效应估计值的确信程度有限甚至几乎没有信心”，条目22为“部分符合”。

条目23(局限性) 要求分析报告自身和纳入系统评价的局限性，如不同的文献选择标准、检索的局限性、发表偏倚等，同时应报告由数据和信息缺失等造成的危害性相关的局限性。举例文献对自身和纳入系统评价的局限性进行了讨论，如可能遗漏外文文献、GRADE评价存在一定主观性等，但未报告与危害性相关的局限性。23a为“符合”，23b为“不符合”。条目23为“部分符合”。

条目24(结论) 要求报告总结研究结果并考虑不同临床场景中的证据应用，及对临床实践和未来研究的启示。举例文献结论部分主要描述纳入研究的质量问题，且对未来研究方向提出了建议，但并未报告该研究结果在不同临床场景中应用的问题。24a为“不符合”，24b为“部分符合”。条目24为“部分符合”。

条目25(作者贡献) 新增条目，要求报告文章所署作者的各自贡献。举例文献未说明所署作者在完成该研究过程中的具体分工，条目25为“不符合”。

条目26(双重作者) 新增条目，要求报告是否存在双重作者(指既是系统评价再评价的作者同时又是纳入系统评价的作者)的情况及相关的利益冲突。举例文献未报告是否存在双重作者及相关利益冲突，条目26为“不符合”。

条目27(资金及其他支持) 要求报告论文或作者是否接受资金支持。如果有，应提供资助者或赞助商的信息，并报告他们在该研究中的作用及是否影响研究结论。举例文献未报告任何关于资金支持的信息。条目27为“不符合”。

3 小结

PRIO-harms在PRISMA基础上增加了以不良事件及利害关系报告为主的新条目，本文以“抗心绞痛类中成药疗效及安全性系统评价的再评价”一文[9]为例，对PRIO-harms进行逐条评价分析和解读，发现举例文献中部分条目存在报告不完整的问题，特别是与利害关系报告相关的条目，如条目2、3、6、8、16、21、23。此外，一些与PRISMA共有条目的报告也存在一定问题，如条目5、7、16。研究表明，目前系统评价和系统评价再评价的质量不高[10-12]，并不是因为研究设计本身，只因为实施研究时未能严格遵守既定标准[13]。因此，PRIO-harms的研发为研究者全面、明确地报告系统评价再评价提供了规范，对促进和指导相关人员更加规范地报告系统评价再评价中干预措施的利害关系意义重大。建议国内期刊将PRIO-harms引入稿约，要求和督促系统评价再评价制作者参照PRIO-harms进行规范报告，从而提高系统评价再评价的报告质量。