在系统评价和指南制作中应准确理解和正确运用证据体评估和推荐意见分级策略

2021-03-12 09:27王慧珊王颖雯张崇凡
中国循证儿科杂志 2021年6期
关键词:工作组指南分级

王 瑞 王慧珊 王颖雯 张 萍 张崇凡,

2000年,近20个国家和国际组织共同成立GRADE (Grading of Recommendations Assessment,Development and Evaluation)工作组,制定出证据质量分级和推荐强度标准并于2004年正式推出[1]。GRADE在系统评价和临床实践指南制作中都起到了积极的推动作用,逐渐得到更多有影响的学术组织和机构(WHO、Cochrane协作网和NICE等)的首肯,也得到了主流期刊的审稿专家认可。

GRADE主要特征可以概括为:①基于医学相关的广泛专业视角制定包括但不限于临床医学、循证医学、临床流行病学、卫生统计学、卫生政策制定、卫生经济、人文、伦理等;②适用于制作系统评价、卫生技术评估及指南;③界定了证据体质量分级,提出证据体的升降级明确和综合的判断标准;④强调重要临床结局对证据的实质影响;⑤基于利弊判断信心的推荐强度;⑥从证据体的偏倚风险、患者价值观、公平性、可接受性和可行性等视角做出从证据到推荐意见的综合判断。

随着在系统评价和指南制定中越来越普遍应用GRADE,GRADE的中文翻译一直比较模糊和不确定,基于字面的翻译“推荐等级的评估、制定与评价”似乎无不可,但规范表达和运用非常必要。将GRADE翻译得精准和有神韵的确有难度(即使是翻译专业人士),复旦大学GRADE中心团队建议翻译为“证据体评估和推荐意见分级策略”。主要从以下几点考虑:①GRADE适用于系统评价、卫生技术评估及指南制作,不论是证据评估和推荐意见分级,均基于证据,虽然GRADE英文全称中没有“evidence”(证据),但意指证据,而且不仅是证据,而应当是证据体。证据体是围绕最佳决策的全方位信息,包括了临床问题的提出、经PICO转化,系统文献检索,文献筛选和评价,形成系统评价/Meta分析,也包括系统评价的证据体到推荐意见的综合考虑。②图1为GRADE工作组经典的图示,蓝色框是证据的系统发现、评价和整合过程(系统评价/Meta分析),翻译为证据体评估;粉色框为证据体到推荐意见的多视角的决策过程,翻译为推荐意见分级。③GRADE是可以实现目标的方案集合,也即策略,同样GRADE英文全称中中没有“strategy”(策略),但在行文使用和阅读理解时体现这是一种策略是必要的。

系统地学习GRADE的系列文献对于系统评价是必需的。GRADE工作组迄今为止已经连续在JournalofClinicalEpidemiology发表了33篇[2-32]体现GRADE方法学研究进展的文章。总体概括为:展现证据总结表和证据概要表的应用(第1[1]、12和13篇[12,13]),构建问题和证据体的升降级因素(第2~10篇[3-11]),证据到推荐意见的呈现和考虑因素(第14~16篇[15-17]),证据评价新问题研究结果(第11[12]、17~22[18-23]、26~33篇[27-32],第23和25篇尚未刊出,第24篇于2022年2月刊出)。学习这些文献时,语言的准确理解有一定的难度,临床医生还会受到方法学专业知识的困惑,特别是第11[12]、17~22[18-23]、26~33[27-32]篇文献,均是在系统评价和指南制作中运用GRADE的困惑而做出的深入研究和解释,没有指南制作经验的医生可能体会不到其精要所在。即使是有经验的指南制作者在阅读这些文献时也常需要深入思考、反复揣摩,甚至与同行、流行病学专家和统计学专家交流学习。

作为临床医生参与指南的制定,第1~16篇[2-17]是理解GRADE的基础性文章,如果不学习和掌握这些基础性文献会存在2个问题,一是与指南制作方法学人员交流有距离,二是不能很好地完成指南制作赋予的分工。作为指南制作方法学人员很好地理解第17~22[18-23]、26~33[27-32]篇文献更有利于理解和掌握GRADE。

GRADE工作组现已联合国际指南协作网(Guidelines International Network, G-I-N)共同发布了以GRADE为核心的国际指南从业资质认证课程(International Guideline Credentialing & Certification Program, INGUIDE)。整套课程分为4个级别,授课对象分别为指南工作组和专家组成员(第1级),指南制作方法学家(第2级),指南工作组主席(第3级),指南方法学培训师(第4级)。第1~2级课程现已开放注册。第1级课程共包含4个模块:①问题重要性排序,②指南工作组成员构成和角色分配、组建指南工作组的过程,③确认指南问题范围和目标受众、利益相关者和指南用户的参与,④利益冲突的管理。第2级课程将针对G-I-N和加拿大麦克马斯特大学的指南制定清单(GIN-McMaster)中的每一个领域进行详细讲解,包括考虑结局和干预措施的重要性、价值偏好和效用、确定证据的检索和纳入、评价证据体的质量强度和可信程度等内容。

图1 证据体评估和推荐意见分级策略(GRADE)示意图

指南的制定是在学习文献基础上的实践探索,再经典的指南制作流程图,再长时间的理论课学习,都不能代替全程参与指南制作过程的实践。复旦大学GRADE中心制作指南有9个标准步骤,每个步骤又分为1~12环节,共135个环节,在每个环节下还会有1~15个要点问题,控制和把握了指南制作的步骤、环节和要点的质量,才能保证指南制作的总体质量。遗憾的是,繁琐的环节和要点不总是能发现问题,比如从证据体到推荐,面对患者价值观环节,几乎无法穷尽这一环节需要关注的要点,不同患者病程是不同的,同一患者的生活环境是动态的,价值观随时可能修正。即使发现问题也不是总能找到恰当的处理方法,比如,证据体偏倚风险评价有“5降3升”原则,结局指标不精确性的判断是极为复杂的,要考虑证据体的样本量,要兼顾效应值的置信区间,还要求系统评价人员在可能存在不确定因素下预先设置可接受的置信区间范围[21],但仍有尚不确定的问题。恰当处理方法也可能存在局限,比如,尽管GRADE工作组系统地检索、复习和评价目前所有的Meta分析时处理缺失数据的方法,迭代式讨论并筛选出最合理的4种处理缺失数据的方法,并在此基础上最终形成结构化、过程透明、相对更具可操作性和更合理的方法来处理缺失数据并评价其对证据质量的影响[18],但仍不能很好地解决原始研究未能充分报告缺失数据情况下,缺失数据对证据质量的影响,推荐的处理方法仍显得武断和主观,所以GRADE工作组建议在讨论数据缺失相关敏感性分析结果时,承认这种局限性。

GRADE方法也在不断地与时俱进,GRADE组建的39个兴趣组(有些兴趣小组非常活跃,少数处于休眠状态),针对在指南制作过程中新的或不确定的问题仍在开展研究,研究结果汇总到GRADE工作组进行讨论,给出解决方案。

需要引起重视的是,随着GRADE被广泛传播和被知晓,兰州大学GRADE 中心团队总结了2019 年中文期刊公开发表的226篇中国指南[33],10.2%(23 篇)的指南证据质量和推荐强度分级均采用GRADE 分级系统,6.6%(15 篇)的指南按照GRADE 工作组要求规范呈现分级标准及内容。抛开经系统培训学习并有丰富实践经验的指南制作专业人员,凭着对GRADE浅尝则止的理解,以GRADE之名未行其实的指南制作是十分危险的,其危害在于:①在形式上混淆了低质量和高质量指南的分辨;②指南制作的科学性、透明性不能得以彰显,当然用专业的指南评价工具(如AGERRⅡ)是可以分辨的;③不当和错误地运用GRADE步骤、环节和要点,可能会产生截然相反的推荐意见;④在指南应用时为可能存在的利益冲突披上了“正义”的外衣。

《中国循证儿科杂志》2021年第6期选择了16篇[1-32]以英文形式发表的GRADE方法学研究前沿的文献,邀请中国4家GRADE中心指南制作专家、国外华人资深指南制作专家、循证医学专家、临床流行病学专家、医学统计学专家、医学编辑对上述文献做解读。总结起来,对这些文献语言的理解是有难度的,对全面完整理解原文的思想仍有距离,尽管如此,依然相信这次专业的文献解读,对更好地、全面地学习和理解GRADE会有极大的帮助。

最后需要说明的是,解读者是根据对原文的理解进行解读,但局限于解读者的角度可能受解读者经验和偏好影响,不一定完全反映原文的思想和内容。建议读者有兴趣或需要应用GRADE时,应进一步阅读原文。

致谢兰州大学GRADE中心陈耀龙教授,北京GRADE中心刘建平教授,宁波GRADE中心夏君教授,加拿大麦克马斯特大学健康研究方法证据及影响系姚晓梅教授对本文提出的建议和意见。

猜你喜欢
工作组指南分级
肖幼率工作组赴戴家湖涵指导抢险
32个工作组印迹 >
分级诊疗路难行?
指南数读
分级诊疗的“分”与“整”
磁县政协专题听取委员工作组2015年工作汇报
论碰撞的混搭指南
分级诊疗的强、引、合
“水到渠成”的分级诊疗
百项能效标准推进工程联合工作组会议在京召开