叶志康,杨辉
循证医学理念于20世纪80年代起源于加拿大McMaster大学,其主要创始人David Sackett教授及其学生Gordon Guyatt教授的一系列文章发表于JAMA,对循证医学做出定义和描述,并最终汇编成书Users' Guides to the Medical Literature,该书在国内已经被翻译成中文[1-4]。循证医学不仅是指证据的产生(如开展临床研究、系统评价和Meta分析及制定临床指南等),也包含知识证据使用转化,其目的是提供更有效的医疗服务和产品,增强卫生监护系统[5]。尽管循证医学领域的专家已经做了相当大的努力促进临床医生基于证据来指导临床决策,但医学知识证据和临床实践行为之间仍然存在着一条鸿沟,大量的医学研究证据不能被转化运用于临床实践[6]。鉴于中国大多数临床工作者仍然难以接触并仔细阅读这本书,尤其是基层医生,故而本研究在Gordon Guyatt教授授权和指导下尝试以更精简的篇幅、更易懂的语言、结合案例对循证医学进行方法学的说明,旨在帮助临床工作者学会如何批判性阅读、评价已发表的医学文献,并且运用这些文献证据指导临床实践。本文分别从“临床实践指南的制定”“临床实践指南的制定过程中存在的问题”“临床医生如何运用临床指南”3个部分进行分析,为更多研究者制订指南,并在临床中应用指南做出临床决策提供参考。
第一部分主要向临床专家介绍临床实践指南的定义和标准制定流程,以及基本的指南制定理念,为临床工作者阅读和运用临床实践指南夯实基础。单纯地依据指南发布协会、期刊及指南质量评价量表来评价指南质量并不全面、客观,只有了解临床实践指南制定的核心过程和理念,才能更好地从内容上评价一个指南的优劣,进而将指南运用于自己的临床实践。希望临床工作者在阅读完这一方法学章节后,可以掌握临床指南的核心内涵,遴选出实用且高质量的临床指南。另外,对于希望主持制定临床指南的中国专家,这一章节可以作为指南制定过程中基本且容易理解的“入门”读物。
2011年,美国医学研究院(Institute of Medicine,IOM)将临床实践指南的定义更新为包含了一至多条用于完善并优化患者监护条件的推荐意见的表述文本,而推荐意见的形成是基于系统评价总结的证据,以及不同干预措施的利弊平衡和相应的资源经济学评估。临床实践指南的定义非常重要,其英文原文定义为:CPGs are statements that include recommendations intended to optimize patient care.These statements are informed by a systematic review of evidence and an assessment of the benefits and costs of alternative care options[7]。这是目前全球公认的临床实践指南定义,该定义精炼地概括了指南的内核。
IOM要求高质量、高可信度的临床实践指南必须符合以下6条要求:
(1)总结当下所有证据的系统评价;(2)由多学科临床指南专家和患者代表组成的指南专家组制定;(3)合理考虑患者人群分类、患者意愿和价值观;(4)指南制定过程清晰、具体且透明,尽可能减少指南制定过程中的偏倚和利益冲突;(5)指南提供证据级别和推荐意见强度,且为推荐意见提供清晰且符合逻辑的解释;(6)新的、重要的证据出现且有可能改变现有推荐意见的时候,需要重新考虑或修改指南。
随着临床实践指南方法学的发展,指南制定标准和流程也相应出现。目前国际上普遍接受和使用的指南制定标准有两个:一个是世界卫生组织(World Health Organization,WHO)在2014年更新并出版的指南制定手册(第2版)[8],另外一个是国际指南协作组织(Guideline International Network,GIN)和加拿大McMaster大学共同研发、制定的指南制定列表[9]。这两个指南制定标准都可以免费下载,并且被翻译成多种语言版本,包括中文版本。
上述两个指南的制定标准相似,核心内容和要求一致。故本文将WHO和GIN-McMaster指南制定标准简化汇总成更为简洁、容易理解和操作的9个步骤。
规划指南要充分考虑指南的必要性、目标人群、制定时限、授权协会或组织和资源。
▶指南必要性:开始制定指南之前,指南指导委员会需要首先考虑一个核心问题:是否有必要制定或更新指南。制定一个临床指南需要花费大量的人力、物力和财力,明确指南的意义尤为重要。
▶指南目标人群:需在指南制定早期明确定义指南的目标人群(使用人群),目标人群是指使用指南的人群,而不是接受治疗推荐或诊断措施的人群。政策制定者、卫生部门管理者、临床医生、护士、药师及其他卫生专业人员都可以是指南的使用人群。指南使用人群决定了指南制定的角度,即可以从患者的角度制定指南,也可以从医保的角度制定指南。例如国际指南组织(Making GRADE the Irresistible Choice,MAGIC)和BMJ合作的快速临床实践指南,都是从患者角度制定指南,故较少考虑推荐措施的经济学效益[10];而临床医生和其他一线医护人员更多从患者临床结局考虑,而较少考虑社会医疗资源和费用问题;政策制定者和卫生部门管理者更多从整个卫生医疗资源系统方面考虑,其试图以有限的医疗资源获取最大化的医疗监护,故其非常重视干预措施的经济学分析。
▶指南制定时限:规划指南需要考虑指南制定的时限,指南制定时长可以从几个月到几年不等,指南制定时限直接决定单位时间内投入的人力、物力和财力。WHO和各国疾病预防控制组织在面对全球或本国的急性传染病疫情时,通常会在几个月内快速完成传染病指南/共识的制定,以应对快速传播的疾病。McMaster大学Gordon Guyatt教授和叶志康博士团队在2020年1月份开始规划制定一部新型冠状病毒感染(COVID-19)药物治疗指南,以帮助中国医生治疗COVID-19,这部指南及附属的系统评价于2020年5月正式发表[11-14]。对于常规疾病的诊疗指南,各个学科协会一般多年更新1次,从指南开始启动到发表常可达2年甚至更久。
▶指南授权协会或组织:启动指南制定工作前,需要确认授权或批准指南发布的协会或组织。指南推荐意见是由数量有限的临床专家和患者代表制定的,如果能够由协会或组织审核并授权,会极大地增加指南的权威性。协会或组织有自身的管理机构,在批准或授权指南发布之前会充分、审慎地审核和考虑推荐意见的合理性,以及指南制定过程的规范性。为了能够最终得到协会或组织的授权,建议邀请协会或组织的代表专家加入指南专家组或指南指导委员会,并参与指南制定全过程,适当地接受协会或组织专家的意见,这对于最终取得协会或组织授权非常有帮助。
▶资源:指南制定需要有充足的资源保证,包括人力、物力和财力。临床指南基于系统评价总结的证据制定,所以如果是在进行系统评价研究的基础上开发指南,则要投入大量的人力和时间。在指南的制定过程中,除了收集证据需要资金以外,开展线下会议形成推荐意见也需要大量资金,比如机票、车票、会议场地和食宿等,当然目前越来越多的指南制定者开始采用线上会议的方式,这样既高效又经济。除此之外,还有指南及附属系统评价、经济学评价的出版费用,国外期刊收取的指南出版费要远高于一般临床研究的出版费。最后,指南制定可能需要聘请指南方法学家参与,并应支付其相应的劳动报酬。
▶组建指南指导委员会:在开始组建指南专家组之前,建议先组建包含指南临床主席和方法学主席在内的指南指导委员会,人数一般在5名左右。指南指导小组成员必须准备好为指南制定工作分配大量时间,因此不满足此条件的专家需要排除在外。
指南指导委员会的职责包括:
(1)为指南制定提供管理、监督及资源;(2)确定指南范围并按照PICO(population,intervention,comparison,and outcomes of clinics)格式草拟指南临床问题;(3)确定指南专家组成员,包括系统评价团队;(4)撰写指南计划书;(5)监督证据收集和综合,草拟指南证据概要表;(6)收集并审核专家组的利益冲突表,并做出相应处理;(7)草拟指南的患者价值观和偏好;(8)组织指南专家组会议以形成推荐意见;(9)基于指南专家组会议达成的共识撰写指南初稿。
▶组建指导专家组:指南推荐意见由指南专家组集体讨论后决定,一般指南专家组成员为25名左右,包括熟悉该领域的多学科专家及指南受众(患者代表或者患者监护人)。指南专家组成员数量可以根据实际情况增减,指南专家组一般设临床主席和方法学主席各1名。
指南专家组的职责包括:
(1)审阅指南指导委员会草拟的指南范围和具体临床问题,并提出补充意见;(2)在掌握各种指南所采用的证据分级和推荐意见强度分级系统的基础上,对指南重要临床结局进行打分,审核指南证据概要表并提出意见;(3)客观且充分地参与指南会议讨论并形成推荐意见,需要综合考虑推荐治疗措施的利弊平衡、患者价值观、患者意愿和偏好、经济学分析、可行性、公平性、可接受性等因素;(4)审核并修改指南正文文本。
高质量的随机对照试验和系统评价一般会在注册平台注册以避免重复性工作,如美国临床试验数据库(clinicaltrials.gov)和国际前瞻性系统评价登记册(PROSPERO)平台。兰州大学GRADE中心牵头建立了全球第一个指南注册平台[15],这个平台在国内用得比较多,国际上暂未普及。
指南注册平台国际上使用较少的原因主要包括:
(1)与系统评价和随机对照试验相比,临床实践指南有其独特性,每个国家的协会都会基于学科发展常规在协会所属期刊发布临床实践指南,如美国、欧洲、加拿大和中国各自发表的高血压指南[16-19]。(2)不同于系统评价,指南推荐意见与本国的经济发展水平和文化氛围密切相关。以高血压为例,面对同样的证据,美国高血压指南更追求强化降压,建议收缩压低于130 mm Hg(1 mm Hg=0.133 kPa)[16],而中国、欧洲和加拿大的血压目标值更高一些[17-19]。(3)系统评价更多的是客观地总结临床证据,随机对照试验更多的是展示其临床结果和数据,但是临床实践指南的制定带有更强的主观性,故同样的临床研究,其证据级别有可能会不一样,推荐意见强度和方向也可能不一样。
与系统评价和临床研究一样,指南制定也可以撰写指南计划书。指南计划书可以提供清晰、深入和全面的规划,有助于指南制定者按照规划要求制定高质量的临床指南,有助于指南指导委员会提前计算指南工作量和需要的资源。
指南制定过程讲究透明和公平,利益冲突的声明和管理对制定公平、可靠的指南至关重要,指南专家组所有成员必须如实填写利益冲突声明表。利益冲突分为经济利益冲突和学术(非经济)利益冲突。存在经济利益冲突的个人绝对不能够参与推荐意见的形成,但可以适当允许学术利益冲突的存在。
▶经济利益冲突:指南制定专家持有医药公司的股票或专利、接受医药公司兼职聘用的报酬或者演讲酬金,而这些经济利益很有可能导致指南出现偏倚,降低指南可信度。
如参与指南制定的一位专家是某药厂的顾问,或者从药厂接受了研究资金或讲课酬劳,且该药厂与指南涉及的药物或医疗器械存在直接关联,则认为该专家具有很强的经济利益冲突,是不被允许参与推荐意见形成的。
▶学术利益冲突:研究者对某一学术观点持有某种程度的偏好和坚持,学术利益冲突通常和自己之前的研究课题、教育背景、所在研究机构相关[20-21]。
如某研究者曾经发表过一篇研究表明A干预措施优于B干预措施,且该指南涉及干预措施A和B的推荐意见,那么该研究者对这一条推荐意见存在潜在的学术利益冲突,其有可能会执着于“A优于B”这个观点,进而影响指南推荐意见的形成。学术利益冲突并不能完全避免,因为指南专家组成员都是熟悉该领域的专家,不可避免地会纳入一些开展过这个领域研究的专家。
对于上述举例,仍然可以允许该研究者成为指南制定组专家成员,但不允许其在这一条推荐意见上发表看法或参与投票。基于此,指南专家组每一位成员都需要仔细、如实地填写利益冲突声明表,指南指导委员会需要透明、客观地评估是否存在利益冲突及其可能产生的结果,并管理所有重大的利益冲突。指南文本应该如实、细致地公开指南所有的利益冲突,并且报告解决该利益冲突的措施和办法。
▶形成指南PICO问题:确定指南具体临床问题后,需要将指南临床问题转化成PICO格式,以便于系统地检索证据。
如将临床问题“对于感染耐甲氧西林金黄色葡萄球菌的成年患者,应该选择哪种抗生素?”转化成PICO格式:P为感染耐甲氧西林金黄色葡萄球菌的成年患者,I为万古霉素,C为利奈唑胺、替考拉宁,O为死亡率、感染治愈率及严重药物不良反应。
在开始规划指南时,需要确定该指南拟解决临床问题的数量,每一个临床问题至少对应一个系统评价,指南临床问题越多,所需要的时间、人力和资金就越多。
▶选择临床结局:比较不同的治疗或诊断技术常涉及多个临床结局,包括对患者有利的结局,也包括对患者有害的结局。有的结局非常重要,如死亡率;有的结局重要性一般,如轻度的药物不良反应。所以选择临床上对患者重要的临床结局并进行打分非常有必要。
GRADE系统将临床结局按1~9分打分:7~9分是对患者至关重要的结局,4~6分是重要的结局,1~3分是一般结局[22]。以朝阳医院药剂科牵头制定的胃肠道出血预防用药的BMJ快速临床指南为例,该指南选择死亡、临床明显胃肠道出血、肺炎、艰难梭菌感染为主要结局,并且总结了这4个临床结局的证据概要表,对于一般胃肠道出血并没有考虑[23]。
指南推荐意见的形成需要基于系统评价总结的最佳、最全面的证据。所以系统评价成了整个指南最坚实的基础,如果指南的系统评价是未更新的、有偏倚的、低质量的,那指南推荐意见的可信度将会降低。所以接下来的问题是指南的系统评价从何而来。
▶检索并评估系统评价:更方便且高效的方法是直接检索并评价现有的系统评价和Meta分析。基于指南PICO问题检索PubMed、EmBase和Cochrane数据库,纳入所有符合临床问题PICO的系统评价,如果检索出的系统评价较多,可以只考虑3年内或5年内发表的系统评价。
建议采用 ROBIS[24]或 AMSTAR 2[25]质量评价工具判断系统评价的质量,选定高质量的系统评价后,专家组通常需要对其进行更新。如选定的系统评价是2021年7月发表的,其检索时间截至2021年1月,那么指南专家组需要从2021年1月开始检索,纳入新出现的临床研究。更新系统评价通常比制定新系统评价花费更少且更加节省时间。
▶制定系统评价:如果没有合适的已发表的系统评价,指南专家组需要组织人力制定系统评价,这一步骤更为耗时、耗力。
▶证据概要表:系统评价的篇幅较长,可能超过10页,将系统评价结果总结成简洁且明了的证据概要表呈现给临床指南专家组是最方便、高效的方法。目前被广泛接受的证据概要表是GRADE证据概要表。
GRADE系统是按照单个临床结局来总结临床证据,将证据质量分为4级:高、中、低和极低。将随机对照试验初始定义为高质量证据,观察性研究初始定义为低质量证据,并且从5个维度来进一步评价证据质量,即研究偏倚、间接性、不精确性、不一致性和发表偏倚,任何一个维度有明显偏倚和缺陷都可以将证据质量降1级甚至2级,因此随机对照试验的质量也可以降级为中、低,甚至是极低质量[26-31]。本研究组会在接下来的系列文章中进一步阐述GRADE系统。
指南专家组审核、确认最终的证据概要表后,可以开始举办指南专家组全体会议,讨论形成推荐意见。GRADE系统将推荐意见分为强和弱两级,推荐意见的形成由以下4个主要因素决定,分别为:证据质量(对证据效应评估准确度的信心)、利弊平衡、患者偏好和价值观、经济资源[32]。除此之外,公平性、可接受性、可实施性、文化氛围等因素也需要被考虑。
▶证据质量:证据质量是确定推荐意见强度的关键因素,证据质量越高,形成强推荐的可能性越高,但这不意味着高质量证据一定会形成强推荐[32]。如:高质量证据证明新开发治疗药物A疗效和安全性优于现有治疗药物,但是药物A价格昂贵,超出了发展中国家的医保承受范围,则有可能得出在发展中国家弱推荐使用药物A的结论。
▶利弊平衡:任何治疗或诊断措施对患者都有收益和弊端,当该治疗或诊断措施对患者的收益明显多于弊端时,推荐意见强度更有可能成为强推荐;当该治疗或诊断措施对患者的收益和弊端相当时,推荐意见强度更有可能成为弱推荐。如:高质量的证据表明新开发药物B疗效明显优于现有治疗药物,但同时高质量证据也表明该药物B有明显的不良反应,利弊平衡,则仍有可能弱推荐药物B。
▶患者价值观和偏好:患者价值观和偏好与推荐意见强度密切相关。患者价值观和偏好定义比较广泛,包括患者的角度、治疗理念、治疗预期和生命健康目标,也包括患者权衡不同治疗或诊断措施所带来的收益、弊端、经济负担的过程[33]。患者价值观和偏好可以用定量数据表示,也可以用定性数据表示。
指南专家组获得患者价值观和偏好有4种方式:
(1)已发表的关于该指南治疗领域患者价值观和偏好的系统评价,这种方式最为简便、高效;(2)如果没有已发表的系统评价,指南专家组可以开展制定关于该指南治疗领域患者价值观和偏好的系统评价,前提是有已发表的患者价值观和偏好的临床研究,钠-葡萄糖协同转运蛋白2(SGLT-2)抑制剂和胰高血糖素样肽-1(GLP-1)受体激动剂临床应用指南的制定就是采用了这种方法[34-35];(3)如果既没有相关系统评价也没有临床研究,指南专家组可以设计问卷,调查患者关于该领域的价值观和偏好,这一方法最为费时;(4)指南专家组成员基于医疗经验从患者角度填写问卷,从而得到患者价值观和偏好的数据,胃肠道出血预防用药的BMJ快速临床指南就是采用这一方法制定[23]。
▶经济资源:由于医疗资源整体有限,故应追求以有限医疗资源获得最大化的患者临床收益。因此指南推荐意见也涉及卫生经济学范畴,卫生经济学家可以被邀请加入指南专家组。必要时可以开展经济学评价并将其作为推荐意见形成的证据基础。
▶推荐意见形成过程:通过召开指南专家组会议形成推荐意见,达成推荐意见的方式有多种。
达成推荐意见的方式包括:
(1)所有指南专家组成员通过充分公开讨论达成一致的推荐意见;(2)采用匿名的投票方法,这种方法可以降低指南专家组中某一位或几位权威专家对其他专家造成的影响和压力;(3)非匿名的投票方法。
这几种方法没有明显的优劣,可以根据具体情况自由选择,也可以两种方法结合使用,如先充分讨论达成共识,如果无法达成共识,再采用投票的方法。
指南制定过程是知识产生的过程,而指南传播和实施是知识转换的过程,指南制定最终的目标是将临床证据转化到临床实践中。
▶指南格式:指南格式与指南被接受度密切相关,很多指南都已经将推荐意见集中写在指南正文醒目位置,大写、加粗、加框显示。BMJ快速临床指南系列创新性地将证据和推荐意见用彩色流程图显示[23],这一经验可供中国指南和期刊借鉴。
▶指南发布、发表和传播:指南指导委员会在指南发布或发表后应该尽可能地在相关学术会议、报纸和医疗网站推广该指南。指南应该尽可能地争取发表于高水平的专业期刊。
▶指南实施:建议指南制定者在规划指南时考虑指南实施的计划。指南推荐意见形成过程必须要考虑指南实施潜在的障碍和有利因素,考虑到指南的可实施性和可操作性。针对指南实施潜在的障碍或不利因素,指南文本应该提供相应的解决办法。同时可以尝试将指南推荐意见嵌入医院决策系统或手机应用程序(APP)。
临床实践指南是指包含一至多条用于完善优化患者监护的推荐意见的表述文本,而推荐意见的形成是基于系统评价全面总结的证据、不同干预措施的利弊平衡及相应的资源经济学评估[36]。临床实践指南的制定过程标准严格,其对医生临床实践具有非常重要的指导意义,一般由各国相应学会组织制定并以学会的名义发布,有较高的公信力,政府部门一般并不参与其中。本文以2022年11月发布的中国高血压临床实践指南为例,从指南制定方法学角度反思、阐述中国临床指南制定领域存在的5个重要不足和忽略之处,包括学术利益冲突处理不当、忽略绝对效应量、不采用GRADE证据概要表、忽略患者意愿和价值观及没有充分考虑医疗资源花费情况(卫生经济学)。本部分不对该指南的临床内容做出评价。
指南利益冲突分为经济利益冲突和学术利益冲突,美国医学研究所将利益冲突描述为“可以影响个体人员以开放性思维去探讨一个科学问题的能力的一种经济或学术关系”[36]。经济利益冲突更多是指持有相关医药公司的股票或专利、接受相关医药公司兼职聘用的报酬、演讲酬金或研究资助等。经济利益冲突更容易被临床专家和指南方法学专家理解和注意,不容易被指南制定者忽略。相比之下,学术利益冲突更为隐蔽,常不被临床专家所了解,学术利益冲突是指个体专家的学术研究活动导致其可能持有某一特定看法观点,这种观点过度地影响其对某一具体推荐意见的判断,这种学术活动包括个体专家发表的临床研究、系统评价、指南或书籍等[37]。
以中国高血压临床实践指南为例,该指南主要作者2021年以通信作者身份在新英格兰医学杂志发表一篇随机对照试验(STEP研究),研究结果表明在60~80岁高血压患者中,与常规降压(130~150 mm Hg)相比,强化降压(110~130 mm Hg)可以显著降低心血管事件[38]。这种情况下,该作者在降压目标值和高血压诊断标准的推荐意见上存在明显的学术利益冲突,正确合理的做法是至少应该请该作者在降压目标值和高血压诊断标准的推荐意见上采取回避的态度,不对推荐意见发表意见或者投票。
研究表明美国胸科医师协会发布的第九版抗栓指南有431条推荐意见,其中63条(15%)推荐意见至少有1名指南专家组成员报告学术利益冲突[39]。相比之下,该高血压临床实践指南专家组包括众多中国一流的心血管专家,应该会存在相当数量的学术利益冲突,但是该指南正文声明所有作者声明无利益冲突。因此学术利益冲突的报告和处理是今后需要非常重视的一个方面。
该高血压临床实践指南将降压目标值下调到<130 mm Hg,指南正文解释是强化降压可以将心血管事件相对风险降低20%~30%。心血管事件相对风险降低20%~30%表面上看起来效应量很大,效果显著,但这仅仅是相对效应量,那心血管事件绝对风险降低多少呢?本部分以STEP研究为例,列出强化降压所带来的心血管事件的相对风险获益和绝对风险获益(表1)[38]。通过风险比(HR)可以估算出强化降压确实可以将卒中和急性冠脉综合征的发生风险相对降低30%,但是绝对风险都仅降低0.6%,心血管死亡率仅降低0.2%,这些不算显著的心血管事件获益是否能够支持推荐强化降压呢?毕竟强化降压导致更高的药物剂量、更多的药物不良反应及更多的医疗资源花费。这就涉及患者意愿和价值观及医疗资源花费等问题。
表1 强化降压与常规标准降压对心血管事件影响Table 1 Effect of intensive and standard blood pressure lowering on cardiovascular events
GRADE已经成为全球使用最为广泛的临床实践指南证据和推荐意见强度分级系统[31],中国已经从McMaster大学国际GRADE中心引进了3个GRADE中心,这3个中心对中国临床实践指南的发展起到了巨大的推动作用,目前中国临床指南也主要采用GRADE系统。GRADE系统的一个重要组成部分就是GRADE证据概要表,证据概要表按照临床结局进行证据汇总和分级,只展示对患者重要的临床结局证据,包含纳入研究数量和研究人群样本量,相对效应量、基线风险和绝对效应量、证据分级及证据降级升级因素,最为简洁地向临床医生展示临床干预措施的效应量大小、利弊和证据可信度。该高血压临床实践指南并没有提供或展示任何一个GRADE证据概要表,而是文字描述一部分临床结局的证据,且几乎都是只展示相对效应量,没有绝对效应量和相对应的证据级别。
推荐意见形成需要考虑患者意愿和价值观[32]。强化降压意味着更高的药物剂量、更多潜在的药物不良反应,以及更多的医药花费,那患者是否依然愿意接受强化降压呢?这取决于患者接受强化降压的意愿及对强化降压的看法,即患者认为至少应该达到某种程度的临床获益才愿意接受强化降压,这就涉及方法学上的一个概念——最小临床意义差值(minimum clinically important difference)。
目前常缺乏对最小临床意义差值的研究,为了快速得出患者对某一治疗措施期望的最小临床意义差值,指南制定方法学专家可以设计患者意愿和价值观问卷,由指南专家组成员基于和患者沟通的经验,站在患者角度完成该问卷。比如2022年发表的PCSK9抑制药和依折麦布BMJ快速临床实践指南,指南专家组成员通过完成问卷得出死亡率的最小临床意义差值为0.8%,非致命性卒中的最小临床意义差值为1%,非致命性心肌梗死的最小临床意义差值为1.2%[40]。再比如急性大卒中机械取栓合并静脉阿替普酶的临床实践指南通过问卷调查得出卒中后自主行动、死亡率和症状性颅内出血的最小临床意义差值分别为1.0%、0.8%和 1.0%[39]。
除了最小临床意义差值,患者意愿和价值观也体现在临床结局重要性评判方面。前面提到GRADE证据概要表需要包含所有对患者重要的临床结局,那如何判断哪些结局是对患者重要的呢?在问卷设计时可以纳入所有可能的临床结局,指南专家组成员站在患者的角度,选择患者认为重要的临床结局,并相应打分。GRADE系统将临床结局重要性按1~9分打分,7~9分表示对患者至关重要的结局,4~6分表示重要的结局,1~3分表示一般结局[22]。中国高血压临床实践指南缺乏相应的患者意愿和价值观信息,没有展示患者重要结局的最小临床意义差值。
推荐意见的第四个考虑因素是医疗资源花费。全球目前只有美国高血压指南推荐将降压目标值下调为<130 mm Hg[41],欧洲高血压指南依然推荐将降压目标值稳定在130~139 mm Hg[42]。各国降压目标值和高血压诊断标准必然与各国的经济发展情况和医疗资源相互联系。中国作为中等收入国家,将高血压标准从≥140/90 mm Hg下调为≥130/80 mm Hg,可导致增加至少3亿名高血压患者,将会沉重增加医保负担。当然强化降压确实可以预防一定数量的心血管事件发生,该指南在修改高血压诊断标准和降低降压目标值之前,应该开展严格的经济学评价研究高血压诊断标准下调和强化降压带来的卫生经济学效益,而且经济学评价必须是基于中国的临床医疗资源数据和社会成本数据。很显然该指南并没有相应的经济学评价支撑,尽管该指南有卫生经济学家参与。
临床实践指南对临床医生开展临床实践具有重要的指导意义,严格按照国际指南制定标准制定中国临床实践指南非常重要。在中国指南方法学家和中国GRADE中心的参与和推动下,中国临床指南的质量有了显著的提高,但也存在一些重要的不足和误区。本文以发布的中国高血压临床实践指南为例,列出中国临床实践指南制定需要着重提高的5个方面:重视学术利益冲突并积极处理规避;注重绝对效应量而不只关注相对效应量;建议采用GRADE证据概要表总结临床证据;重视患者意愿和价值观,并将其作为推荐意见形成的一个重要因素;考虑医疗资源花费和卫生经济学效益。
针对某一临床问题,有可能检索到多个临床指南,有时甚至各指南的推荐意见都不一致,这个时候就需要临床医生能够有能力评价指南推荐意见的可信度。建议从以下6个方面快速判断推荐意见的可信度。本部分不是评价指南的报告规范,而是关注推荐意见的内核,判断推荐意见的质量和可适用性。
高质量、可信度高的推荐意见会清晰地表述推荐的治疗措施、相对比的治疗措施、临床结局及推荐意见适用的人群。
可从以下方面评价推荐意见是否明确:
(1)推荐干预措施是否清晰、可操作:比如推荐药物A治疗某疾病,最好能够明确给药剂量、频次和给药途径等,推荐意见能否在自己所在的医疗单位得到应用。(2)对照组是否明确:推荐干预治疗措施常对应着对比治疗措施,每一个PICO问题也包含着干预(intervention)和对照(comparison)。(3)基于哪些结局做出的推荐意见:推荐意见的形成需要考虑推荐治疗措施所带来的利弊平衡,推荐意见形成是否考虑所有相关的患者重要临床结局,会产生哪些有益的临床结局,哪些不利于患者的临床结局。治疗措施常具有治疗益处,也可能存在与之伴随的不良反应。比如抗凝药物可以预防卒中的发生,但也有引起临床大出血的风险。
当指南的推荐意见有较大的差异时,不能以指南发表期刊、指南发表组织或者其他因素简单判断哪个指南的推荐意见更有可信度。需要仔细查看推荐意见基于的证据、利弊平衡等因素。高质量的指南会在每条推荐意见下面阐述形成该推荐意见的理由,包括证据质量、利弊平衡、资源花费和患者意愿价值观等因素。指南证据的收集形式常是系统评价和Meta分析,高质量的指南推荐意见会基于全面且最新的临床证据。
不同国家和地区有不同的文化习惯和价值观,往往治疗选择也会有一定的差异,甚至同一个地区不同患者对临床结局的优先侧重也不一样。高质量国际指南会专门描述该指南所持有的患者意愿和价值观,因此临床医生在阅读国外指南时需要考虑不同国家和地区之间患者意愿和价值观的差异,在临床实践中更多地鼓励患者参与临床决策,充分考虑患者的意愿。
高质量临床指南的推荐意见会同时提供相对应的证据分级和推荐意见强度,这样有利于临床医生判断该推荐意见基于证据的可信度及推荐意见的强度。不同指南可能采用不同的证据和推荐意见强度分级系统,临床指南一般会在方法部分写出该指南所采用的分级系统,并解释不同级别对应的含义。加拿大家庭医生期刊发表的慢性疼痛指南采用GRADE分级[43],GRADE将证据分为高、中、低和极低4个等级,依次表明证据可信度的下降;将推荐意见强度分为强和弱两级[31]。
标准的临床实践指南会在每一条推荐意见下面阐述形成该推荐意见的理由(rationale),解释如何在综合考虑证据质量、利弊平衡、患者意愿和价值观和资源花费等因素后形成该推荐意见。临床医生可以清晰地看到该条推荐意见形成的背后逻辑,自行判断是否合理,以及可以更加深刻理解并运用该推荐意见到临床实践中。
高质量临床实践指南应该明确列出所有相关的利益冲突及解决利益冲突的措施,指南存在严重利益冲突且无有效应对措施会严重影响指南可信度。临床医生在判断推荐意见可信度时,需要查看临床指南是否存在严重利益冲突。
综上,本文一方面采用简洁、通俗、易懂的语言概述了临床实践指南的定义、标准制定流程及存在的问题,有助于临床工作者对临床指南制定有一个基本且全面的了解;另一方面介绍了临床医生如何评价推荐意见,如何运用临床指南推荐意见。临床医生不仅需要查阅相关临床指南解决临床问题,更要评价推荐意见的可信度,分析推荐意见基于的证据,更加清晰地掌握推荐意见形成的内在逻辑,这对于临床医生灵活运用推荐意见指导临床实践非常有帮助。临床医生应该基于临床实践指南善于和患者共同讨论、制定临床治疗方案,共同决策。受限于国内医疗实际情况,临床医生往往面对大量患者,以至于不能和患者充分沟通讨论。充分地与患者沟通,将指南推荐意见及临床证据简单、明了地告知患者,让患者或患者家属充分参与到治疗中,可以提到患者医疗满意度和依从性。
作者贡献:叶志康负责栏目构思与策划、资料收集、文章撰写与修订;杨辉对文章提供指导和支持。
本文无利益冲突。