朱政 胡雁 周英凤 顾莺 邢唯杰 陈瑜 张晓菊
(1.复旦大学护理学院 复旦大学JBI循证护理合作中心 上海市循证护理中心,上海 200032;2.复旦大学附属儿科医院,上海 201102;3.复旦大学附属肿瘤医院,上海 200032)
循证实践是对公开报道的研究进行组织、整理、评价、整合、分类、遴选和有效利用的过程,以促进证据向临床转化,促进护理实践水平的提高[1]。随着学科的不断发展,研究的数量呈现爆炸式增长,如何甄别研究的方法学质量成为了证据临床转化研究中的关键问题。文献质量评价是证据临床转化选题及问题界定和证据资源检索后的关键阶段[2]。从哪些方面对研究的方法学质量进行评价?采用什么工具进行方法学的质量评价?如何判断证据是否应该纳入到证据临床转化研究中?是研究者和临床实践者经常会提出的疑问。
在证据资源金字塔中[3],临床实践指南、证据总结、系统评价、原始研究、专业共识均在不同层面提供证据,但形成这些文献资源的研究均存在一定的偏倚风险,在研究者实际开展文献质量评价的过程中,需要选择对应的方法学质量评价工具进行逐条评价。评价除临床实践指南之外的文献时,由两位接受过循证医学方法学培训、且具备所评价文献涉及专业背景的研究者单独、逐条进行评价,当两位研究者意见出现分歧时,由第3位研究者进行判断或2人协商得出结论。临床实践指南评价则由至少2人,最佳4人进行单独评价,且对评价者的方法学背景及专业背景有更高的要求。由于不同条目造成研究偏倚的程度不相同,所以目前除评价指南的AGREE II工具外,文献质量评价工具一般不推荐计算条目得分确定最终是否纳入研究,而是根据总体评价结果,由研究者判断研究是否被纳入。评价过程应是透明、公开、可重复的。根据证据金字塔从上至下的原则[4],本文将介绍采用AGREE II对对基于证据的临床实践指南进行质量评价的方法、对证据总结的质量评价方法、采用JBI 2016版质量评价工具对系统评价、专家意见和原始研究进行方法学质量评价的方法。
1.1指南的方法学质量评价 指南可分为基于证据的临床实践指南(简称循证指南)和基于专家共识的指南(简称专家共识指南)[1]。循证指南是针对某一特定问题、特定的人群,由特定的组织和人员按照规范化的流程,集合当前最佳的证据,制定证据等级和推荐,用于指导临床实践的指南[1]。专家共识指南是指由某一特定专家团体针对特定问题,通过现场讨论和专家咨询的方式确定临床实践推荐的指南[1]。由于专家共识指南并非完全基于大量研究结果,而是基于专家个人的意见和经验,因此,专家共识指南通常被归类为专家意见类的证据。
采用AGREE II指南评价工具对于循证指南的方法学质量进行评价[5]。AGREE II是由AGREE协作网2009年制定并发布的指南研究与评价工具的第二版,2017年再次更新。AGREE II由6个领域(23个条目)和2个总体评估条目组成,见表1。AGREE II中推荐评价指南的人数至少为2人,最佳4人。AGREE II每个条目评分为1~7分,1分表示指南完全不符合该条目,7分表示指南完全符合该条目。
表1 AGREE II指南评价工具
续表1 AGREE II指南评价工具
2017年AGREE团队对工具中各领域的标准化得分进行补充[6],具体包括:(1)确定优先领域。通过专家共识确定评价标准的优先领域,界值可以由优先领域得分来设立。(2)阶段式评价。如果某个领域被认为比其他领域重要,可以优先仅对该领域进行指南评价,只有满足该领域的界值后(例如70%标准分),才可继续评价其他5个领域。(3)考虑所有领域得分。通过专家共识设立6个领域中的界值。(4)根据时间推移改进界值。
1.2证据总结的方法学质量评价 证据总结是针对某一特定循证问题,由特定组织和人员按照规范化的流程,集合当前最佳证据,用于指导临床实践的文献类型[7]。相对临床实践指南而言,证据总结的主题具体,涉及面也相对较窄,例如“脊柱外科术后患者深静脉血栓预防及管理的最佳证据总结”[8]。国内外有大量机构和杂志发表证据总结,证据总结也是证据临床转化研究中被广泛使用的证据资源类型。目前,没有单一的工具来评价证据总结的方法学质量。因此,应采用追朔参考文献的方法,评价所用推荐对应的研究的方法学质量。例如“在评价抗凝药物的研究和骨科手术后早期DVT筛查中,不推荐使用超声取代静脉造影术”[8]这一推荐来源于一篇类实验性研究,则采用类实验性研究的质量评价工具对所引用的该研究进行质量评价。若推荐来源于其他类型原始研究,则采用对应的原始研究评价工具对所引用的研究进行评价。
1.3系统评价的方法学质量评价 系统评价是根据某一具体的临床问题,采用标准化方法,选择评估相关原始研究,筛选出符合纳入标准的研究,并从中提取数据并分析[1]。系统评价包括定量和定性的系统评价。护理领域中较多采用JBI标准对系统评价的方法学质量进行评价[9],也可采用AMSART 2进行系统评价的质量评价。JBI关于系统评价方法学质量的评价工具包括11个条目,见表2。每一个条目采用“是”“否”“不清楚”和“不确定”进行判定。
表2 JBI关于系统评价方法学质量的评价工具
续表2 JBI关于系统评价方法学质量的评价工具
AMSTAR 2是由AMSTAR工作组发表的第2版用于评价随机或非随机干预性系统评价的方法学质量的工具[9],共包括16个条目,涉及到系统评价中的选题、设计、注册、数据提取、统计和讨论等全过程。AMSTAR 2中文版由中国循证医学中心引入[10]。
1.4专家意见和专业共识类文章的方法学质量评价 基于多元化证据理念,护理领域中将专家意见和专业共识纳入证据范畴。在缺乏大量高质量原始研究的情况下,专家意见和专业共识类文章对临床实践有着重要价值。目前,采用JBI标准对专家意见和专业共识类文章的方法学质量进行评价[11],评价工具包括6个条目,每个条目采用“是”“否”“不清楚”和“不确定”进行判定,见表3。
表3 JBI关于专家意见和专业共识类文章的方法学质量的评价工具
1.5原始研究的方法学质量评价 量性的临床原始研究按照是否存在人为干预,分为实验性研究和观察行研究两大类。实验性研究按照是否遵循随机原则进行分组和设立对照组分为随机对照试验和类实验性研究。观察性研究根据可分为横断面研究、队列研究、病例对照研究等。
1.5.1随机对照试验的方法学质量评价 随机对照试验(RCT)是原始研究中质量相对较高的证据,证据临床转化研究中当没有较高质量的指南、证据总结和系统评价时,也可以使用随机对照试验的研究结论。对RCT进行方法学质量评价的常用工具包括Cochrane风险偏倚评估工具[12]、JBI循证卫生保健中心的评价工具[11]、CASP清单[13]等。其中Cochrane风险偏倚评估工具最常用,该工具主要从6个领域对研究的风险偏倚进行评价,每条指标采用“低度偏倚”、“不清楚”和“高度偏倚”进行判定,见表4。
表4 Cochrane 风险偏倚评估工具
续表4 Cochrane 风险偏倚评估工具
1.5.2类实验性研究的方法学质量评价 类实验性研究和随机对照试验的区别在于未按照随机原则进行分组或未设立对照组。类实验性研究的方法学质量评价工具有JBI循证卫生保健中心对类实验性研究论文的质量评价工具[11]。该工具包括9个条目,包括:(1)是否清晰阐述研究中的因果关系。(2)组间基线是否具有可比性。(3)除了要验证的干预措施外,各组接受的其他措施是否相同。(4)是否设立对照组。(5)是否在干预前后对结局指标实施多元化测量。(6)随访是否完成,如不完整,是否报道失访并采取措施处理失访问题。(7)是否采用相同的方式对各研究组研究对象的结局指标进行测评。(8)结局指标的测评方法是否可信。(9)资料分析方法是否恰当。评价者需对每个评价项目做出“是”“否”“不清楚”“不适用”的判断,并最终经过小组讨论,决定该研究是纳入、排除,还是需获取进一步的信息。
在开展文献质量评价时,应根据科学、规范的评价标准进行评价,而并非依靠研究者个人的主观感受、临床和科研经验进行判断。证据临床转化研究中主要评价研究的方法学质量。影响研究方法学质量的包括以下3个方面[1]:(1)内部真实性,指研究接近真实值的程度或研究偏倚的程度,研究中常见的偏倚包括选择偏倚、实施偏倚、失访偏倚和测量偏倚。(2)外部真实性,也被称为适用性,指研究结果能否能应用到研究对象之外的人群中。(3)重要性,指研究是否具有临床价值,评价重要性时关注的是所涉及的临床问题是否明确、具体,选择的临床指标是否正确等。
文献质量评价是开展证据临床转化研究中的关键步骤和重要基础,我们建议在证据临床转化研究中,针对指南选择AGREE II评价工具,针对随机对照研究采用Cochrane风险偏倚工具,针对其他类型研究采用JBI质量评价工具,针对证据总结需要追溯引用原文进行评价。