GRADE证据质量评级及其在循证实践中的重要性

2021-09-03 01:21AnilKumarMeghanaTaggarsi翻译王瑞张崇凡夏君
中国医院院长 2021年14期
关键词:估计值循证指南

文/Anil Kumar Meghana Taggarsi 翻译/王瑞 张崇凡 夏君

GRADE 方法是批判性评价对照研究和为系统评价提供建议的主流工具之一。

循证实践是现代医学实践中不可或缺的一部分,忽视证据和证据质量的现代医疗是无法想象的1。然而,循证医学并不像人们认为的那样完美。在当代研究中,学者们总是会对证据质量提出质疑。《柳叶刀》杂志总编理查德·霍顿(Richard Horton)曾在《柳叶刀》上发文指出,由于纳入研究样本量较小、研究差异无统计学意义、分析方法不恰当、利益冲突明显、或对流行趋势的盲从等因素,近50%的科学文献可能存在错误或造假2。

循证医学的不恰当应用会对患者带来负面影响,不利于实现循证医学促进社会健康的理念3。英国国家健康与临床优选研究所(National Institute for Clinical Excellence)指出,用于制定指南和推荐意见的文献中,约有62%的研究是不可靠的,且无法确定这些研究与患者之间的相关性4。

最近,英国《卫报》的一则报道引起了全世界对证据质量和篡改证据的关注。报道称,影响力排名最高的两本国际医学期刊《新英格兰医学杂志》和《柳叶刀》分别撤回了一篇有关新冠肺炎疫情的文章。柳叶刀撤回的文章为A multinational registry analysis of hydroxychloroquine on COVID 19。受该研究影响,担心羟氯喹会增加死亡率,使用羟氯喹治疗新冠肺炎的临床试验在全球范围内被叫停,包括世界卫生组织和世界各国当时正在进行的随机对照试验5。后来的详细审查结果表明,该研究的数据来源和分析存在不一性。这项存在缺陷的试验会导致患者在这场全球疫情中面临风险,未来的试验可能会对受影响的患者数量进行说明。良好的研究质量是为医学实践提供证据的关键,因此,应努力确保产出最高质量的证据。

循证实践是现代医学实践中不可或缺的一部分,忽视证据和证据质量的现代医疗是无法想象的1。然而,循证医学并不像人们认为的那样完美。

推荐意见分级评估、制定和评价工作组(Grading of Recommendations Assessment, Development and Evaluation Working Group,GRADE)将证据质量定义为,报告的效应值真实可靠,以及其为具体推荐意见提供支持的可信度6。GRADE方法是批判性评价对照研究和为系统评价提供建议的主流工具之一。对系统评价和指南进行批判性评价是一项复杂的工作,需要熟练掌握GRADE工具或其他重要评价工具的相关知识7。

如何确保证据质量及其在指南和推荐意见制定中的应用

证据质量取决于研究的方法学和报告质量8。高质量的研究需要有严密的研究设计,并高度重视研究结局的可信度。基于诊断、预后、筛查和治疗的相关研究,牛津大学循证医学中心推出了证据金字塔,金字塔顶端为系统评价,其后依次为随机对照试验、队列研究、病例对照、病例系列和专家意见9。因此,在可行的情况下,应该使用实施良好的系统评价、荟萃分析和随机对照试验指导临床决策。

证据质量评级要素

方法学质量决定研究的整体质量,研究的整体质量决定证据质量。GRADE方法提出了8个影响证据质量的要素,其中包括5个降级因素和3个升级因素。降级因素分别为偏倚风险、不一致性、不精确性、间接性和发表偏倚。研究设计是决定证据质量的关键10。

未进行分配隐藏、未施盲、失访偏倚大、未遵守意向性分析的原则、对结局进行选择性或倾向《英国医学杂志》中文版2021年2月第24卷第2期循证医学性报告等偏倚风险因素会降低疗效估计值的可信度。这些偏倚导致研究存在局限性,对证据质量产生不利影响。不同的研究人群、干预措施和结局会导致异质性或多变性,进而造成研究结果的不一致性。如果研究人员无法对异质性作出合理解释,则须对证据质量进行降级。

如果针对某一问题存在两项有效的干预措施,相较于直接对比两项干预措施的研究而言,将每一项干预措施分别与安慰剂组对比的研究则显然为间接证据,证据质量因间接性而被降级。如果研究的样本量非常小,变量极少,导致置信区间很大,就会出现不精确的问题。制药行业赞助的临床试验可能会受到商业利益的影响。行业赞助的试验,尤其是小型研究或与新疗法相关的随机对照试验,可能会在方法学、结果报告和发表方面存在偏倚。这类研究经常会刻意隐瞒不良结果,这可能会导致严重的问题,尤其是在新疗法或药物获批上市时,没有考虑到赞助商可能未公开该药物或疗法的所有潜在获益或风险。因此,在高水平同行评议期刊上发表这类行业赞助的试验可能会引发偏倚,影响效应估计值的可信度,从而导致证据质量被降级11-12。这种局限性会影响证据的主体质量,局限性越大,证据质量越低6。此外,数据不准确或太少以及较高的报告偏倚也会降低证据质量13。

升级因素包括大效应量、可能存在的混杂因素调整和剂量-反应关系6。当效应在所有受试者中趋于一致或效应完全不同于过往相关试验结果时,可以因为效应意义重大而对证据质量进行升级。值得注意的是,如果结局具有主观性,研究者因观察到的大效应量,而考虑对证据质量进行升级时则需要保持警惕,尤其是在未对结局评估者实施盲法和分配隐藏的情况下10。剂量-反应关系可以反映出重要的因果关系,会增加我们对研究结果的信心,从而提高证据质量。如果观察性研究中所有可能存在的偏倚都会导致真实疗效被低估,则可以对证据质量进行升级。

证据质量级别

证据质量不仅取决于研究设计、质量、一致性和直接性,还会受到研究局限性、结果的不一致性、偏倚风险和证据不确定性的影响。GRADE方法对这些因素进行了分析,并将证据质量分为高、中、低和极低四个等级。

若进一步的研究不可能改变效应估计值,则为高质量证据;若仍有进一步的研究空间,且后续研究可能会改变效应估计值,则为中等质量证据;若后续研究会改变效应估计值,则为低质量证据;若无法确定任何效应估计值,则为极低质量证据。在撰写推荐意见和制定指南时,应对证据质量进行分级。证据质量级别会影响医护人员向患者提供循证实践时的选择10。

影响推荐意见的其他因素

高质量证据不一定产生强推荐。除证据质量外,推荐意见的撰写和指南制定还需要考虑其他因素,例如干预的利与弊、患者的价值观念和偏好以及成本问题7。因此,总体证据质量指的是对回答医疗保健问题、决定或制定推荐意见和指南有重要意义的所有证据质量的总和。

流程图描述了制定指南或推荐意见之前,使用GRADE框架来评估证据的简单易懂的方法(图1)。

图1 描述推荐意见分级的评估、制定和评价方法的流程图

结论

每一个临床医生都应该具备理解、评价和判断证据质量的能力。从研究或证据素材、方法和报告方面对证据质量进行批判性评价的工具有很多。对证据质量进行充分评价是很困难的。对证据的构成要素进行考察是评价证据质量的最合理方法,而不是盲目地将证据分为高质量或低质量。掌握批判性评价的本领需要保有谨慎的态度、接受培训和不断实践。近年来,在对Cochrane新发表的系统评价进行评估时,GRADE方法已成为不可或缺的一部分。GRADE是清晰、详细、有效的证据质量评级方法,为推荐意见的撰写提供了支持,确保了证据呈现和指南制定的透明性。

猜你喜欢
估计值循证指南
循证护理在上消化道出血护理中的应用效果观察
循证医学教育在麻醉临床教学中的应用
云上黑山羊生长曲线拟合的多模型比较
地震动非参数化谱反演可靠性分析
探讨循证护理在急诊烧伤患者中的价值
《循证护理》稿约
EM算法在闪烁噪声分布参数估计中的应用
如何快速判读指针式压力表
指南数读
论碰撞的混搭指南