在皮肤学科指南中应用GRADE证据质量分级和推荐强度评价系统的意义

2018-01-19 03:42:29刘海波刘芳桑红
中华皮肤科杂志 2018年9期
关键词:估计值荨麻疹指南

刘海波 刘芳 桑红

210002南京总医院皮肤科

国内外的临床实践指南中,存在多种关于证据级别和推荐强度的评价系统,这些评价系统各异,标准不一[1]。为解决该问题,多个国家和组织包括WHO在2000年成立的“推荐分级评价、制定与评估(grades of recommendations assessment,development and evaluation,GRADE)”工作组于2004年推出了GRADE证据质量分级和推荐强度评价系统[2]。相比其他评价系统,GRADE系统具有合理性、规范性、透明性等优点[1,3],已被包括WHO在内的一百多个组织或协会采用,成为各国指南制定的标准。2009年[4]和2013年[5]颁布的“欧洲荨麻疹诊疗指南”中均采用了GRADE系统对证据质量和推荐强度进行分级,2009版中,对二代抗组胺药物反应欠佳的慢性自发性荨麻疹患者剂量增加至4倍的方案证据质量为低,推荐强度为弱推荐;而2013版中,该方案已变为强推荐。这两版指南中,证据质量是如何判定的?证据质量为低的意义是什么?强弱推荐对患者、医生以及政策制定者分别意味着什么?又是由什么因素决定的呢?回答这些问题必须要理解GRADE系统。GRADE系统在国内指南的制定中已有应用[6⁃8],但尚处于起步阶段,皮肤科领域颁布的指南中,尚未采用GRADE系统。本文拟介绍GRADE系统,以期未来皮肤科制定指南能应用该系统,提高指南的指导性。

一、国内外指南现状

近年来国内发表了多种常见疾病的诊疗指南[9⁃11]。应用指南研究与评价工具AGREE(appraisal of guidelines for research and evaluation)[12]对一些指南质量评估发现,中文指南的质量尽管逐年上升,但在AGREE包括的6个评价指标(范围与目的、参与的人员、制定的严谨性、表达的清晰性、应用性、独立性)方面均低于国际平均水平[13]。目前中文指南存在的问题主要有未注重在国际实践指南注册平台注册以及评审,未说明决策制定过程及使用的共识方法、未对证据质量和推荐强度进行分级(GRADE分级)、未说明利益冲突的处理方法等。另外,我国在患者指南制定方面仍是空白。

国际指南协作网(guideline international network,GIN)已经建立了全球最大的国际指南数据库,截至2017年10月,已收录了来自88个国家的6 423部指南。国外指南在制定的方法学上远较我国规范、合理。2011年,美国医学科学院发布了制定指南应该遵循的6大原则[14];2012年,国际指南联盟在《国际指南联盟:迈向临床实践指南制定的国际标准》一文中明确提出了高质量临床实践指南应遵循的11条标准[15]。NICE(national institute for health and care excellence)[16]和WHO[17]也对指南制定的方法和流程做过多次更新。GIN于2012年推出了第一部患者指南制定手册,并在2015年进行了更新[18]。患者指南主要针对患者和非专业人群。以美国国家综合癌症网络(national comprehensivecancernetwork,NCCN)为代表的多个机构已开始连续发布患者指南,它能够在一定程度上促进医患沟通和共同决策[18]。2014年,专门针对指南的注册机构国际实践指南注册平台正式启动,极大地促进了指南制定过程的科学化和透明化[19]。

二、GRADE系统

国外指南一个显著的特点是对证据质量和推荐强度进行了分级和展示。目前多数分级系统将证据质量根据研究类型分为3级至6级不等,例如Ⅰ级到Ⅳ级证据,将随机对照试验(RCT)视为Ⅰ级证据,推荐强度也分为3级至5级不等。这些系统晦涩难解,且存在诸多问题,如不同RCT实施的标准相差甚大,有的RCT结果非常不可靠。GRADE系统是一个全新的证据质量评价体系,它根据相应标准对存在的相关研究进行证据质量再评价,将证据质量根据结局指标效应值的可靠程度进行分级,避免见到RCT就认为是高级别证据或见到观察性研究就认为是低级别证据的错误。另外,GRADE系统也为指南中如何进行推荐强度分级提供了一种系统的方法。GRADE系统于2003年被引入《WHO指南制定手册》[3],明确定义了证据质量和推荐强度及证据的升降级标准,注重患者的选择意愿及就推荐强度的强弱进行诠释等。利用GRADE系统制定指南[20],首先从明确问题开始。例如,对二代非镇静类抗组胺药物疗效不佳的慢性自发性荨麻疹患者,增加剂量至4倍的方案与其他方案相比,在改善瘙痒、生活质量、病情严重程度方面有何优势?对于这个问题,先将改善瘙痒、生活质量、病情严重程度等结局指标分为关键性与非关键性两类[20]。其次,收集证据和形成效应估计,经检索纳入符合标准的研究,通过这些研究的数据综合得出每个结局指标的效应估计值及该估计值的可信区间,然后对证据质量评级,纳入的研究类型为决定证据质量的重要因素[20],RCT被定为高质量证据,5种因素可导致证据质量下降;观察性研究被定为低质量证据,3种因素可提高证据质量[3,20]。根据研究的升降级因素可在GRADEpro软件中对每个结局指标的证据质量进行分级。总的证据质量应基于关键结局指标的证据质量而不是非关键结局指标[20],即如果生活质量是关键结局指标,其证据质量为极低时,则总的证据质量为极低,而非参考非关键结局指标如瘙痒的证据质量。如有不止一个关键结局指标,则总的证据质量取决于关键结局指标中证据质量最低的评级。最后,综合考虑利弊平衡、患者价值观和选择意愿、资源配置以及证据质量四个方面的因素来决定推荐的方向和强度[3]。

三、基于GRADE系统的证据质量分级

以前文所述增加抗组胺药物剂量至4倍的方案治疗慢性自发性荨麻疹为例,对证据质量评级。假设经检索发现5个符合标准的RCT,通过Meta分析,合并结果后差异有统计学意义,得出“来自高质量RCT的Meta分析结果显示,增加剂量方案比其他方案在改善生活质量方面好”,开始被定为高质量证据。以下5种因素可导致证据质量下降:①研究局限性:研究在分配隐藏方面存在严重问题,可能会导致偏倚;②不精确:5个RCT样本量未达到最佳信息量(optimal information size)[21],合并效应量的可信区间较宽,精确性较差;③结果不一致:5个RCT的效应大小和方向有不同程度差异,结果间存在异质性;④间接证据:关注的是生活质量指标,而5个RCT只报道了症状缓解情况,则对结论的信心因间接性而降低;⑤发表偏倚:5个RCT全部或部分由企业赞助,有阴性结果的研究未发表,存在发表偏倚可能。使用GRADE系统综合这5个方面的因素[20]对证据质量重新评价后,可能会得出证据质量为低甚至极低的结论。对于观察性研究的证据质量评级,则可能会因为①效应量大,②存在剂量-反应关系和③所有混杂或其他偏倚因素增加我们对效应估计值的信心这3个因素的影响,由低质量上升为高质量证据[22]。因此,由GRADE系统评价证据质量是十分必要的,对证据质量认识不足,可能导致指南推荐不当。GRADE系统将证据质量分为高、中、低、极低四类,高级质量(high):非常确信真实的效应值接近效应估计值;中级质量(moderate):对效应估计值有中等程度的信心,真实值有可能接近估计值,但仍存在二者大不相同的可能性;低级质量(low):对效应估计值的确信程度有限,真实值可能与估计值大不相同;极低质量(very low):对效应估计值几乎没有信心,真实值很可能与估计值大不相同[23]。

四、基于GRADE系统的推荐强度分级

GRADE系统的推荐强度只有强推荐和弱推荐两级,这两级推荐强度对患者、临床医生和政策制定者的意义GRADE工作组也提供了明确的指导意见[24]。GRADE工作组建议指南制定者叙述时可使用“We recommend”和“We suggest”来分别表达“强”和“弱”推荐[25],前文提到的2009版[4]和2013版[5]欧洲荨麻疹诊疗指南采用了这种表达方式。推荐强度分级要综合考虑4个关键因素:利弊平衡、证据质量、价值观和选择意愿以及资源配置[24]。以使用奥司他韦治疗H5N1禽流感患者为例,展示如何给出推荐强度:①利弊平衡:对使用奥司他韦的获益并不是很确定,因为多个重要或关键结局指标没有观察;②证据质量:极低;③价值观和选择意愿:考虑到H5N1禽流感的高死亡率以及奥司他韦较低的不良反应,所有患者可能都愿意接受治疗;④成本(资源配置):考虑到H5N1禽流感零星散发的特点,价格可以接受。综合这4个方面因素,给出弱推荐的可能性较大。对临床医生而言,弱推荐的意义为“你应该认识到不同的治疗选择在不同患者身上都有其合理性,你应该帮助每个患者做出符合他或她本人价值观和选择意愿的处理决定”。但是,不同专家给出的推荐强度意见可能不一致,如有的专家可能考虑到价值观和选择意愿方面,由于H5N1禽流感的高死亡率及所有患者均可能愿意接受治疗,则给出强推荐的建议。在这种情况下,则需指南委员会成员讨论或者投票来决定推荐强度。

五、结语

GRADE系统提供了一套规范的证据质量分级和推荐强度分级体系,它对证据质量升降级的因素做了详细的解释,也对如何从证据到质量做了明确的定义[20,24]。首先需理解GRADE系统,我们才能理解欧洲荨麻疹诊疗指南中证据质量和推荐强度是如何判定的以及它们所代表的意义。在指南中给出证据质量对未来的研究还有一定的启发性。如2009版欧洲荨麻疹指南中,增加至4倍剂量的抗组胺药物方案应用于反应不佳的慢性自发性荨麻疹患者,为低质量证据。正是基于这一点,后续研究者针对该方案设计了一系列RCT研究[5],由于新的研究加入,其证据质量发生了变化,相应的推荐强度也发生了变化。因此,在2013版本中将该方案的推荐强度由原来的弱推荐提高至强推荐[4⁃5]。国内,北京大学第三医院曾在GRADE中国中心的帮助下制定并发表了基于GRADE系统的指南[6,26],因其制定过程规范而被美国国家指南文库收录。皮肤科医生也应该认识到在指南中应用GRADE系统的必要性和重要性,并积极与GRADE中国中心、AGREE工作组、GIN等国内外组织合作,制订质量更高的指南。

猜你喜欢
估计值荨麻疹指南
一道样本的数字特征与频率分布直方图的交汇问题
统计信息
2018年4月世界粗钢产量表(续)万吨
中国钢铁业(2018年6期)2018-07-26 06:55:00
指南数读
电视指南(2016年12期)2017-02-05 15:08:06
论碰撞的混搭指南
Coco薇(2015年12期)2015-12-10 02:55:48
经方辨证治疗慢性荨麻疹经验
中医研究(2014年8期)2014-03-11 20:29:21
中西医结合治疗慢性荨麻疹39例
中西医结合治疗慢性荨麻疹42例
2014年5月世界粗钢产量表万吨
中国钢铁业(2014年7期)2014-01-26 05:18:12
荨麻疹253例病因探讨