中医药临床实践指南制订和修订中德尔菲法应用的方法流程及建议

2023-09-28 06:30梁昌昊尹冠翔王雅琪刘思岐高一城刘鹏伟苏祥飞费宇彤
协和医学杂志 2023年5期
关键词:德尔菲共识指南

梁昌昊,尹冠翔,王雅琪,刘思岐,高一城,刘鹏伟,苏祥飞,费宇彤,4,5

北京中医药大学 1循证医学中心 2中医学院 4国际循证中医药研究院,北京 1000293中华中医药学会,北京 1000005北京GRADE中心,北京 100029

德尔菲法作为一种专家调查法,在诸多学科得到了广泛应用[1]。自20世纪50年代以来,德尔菲法已成为医疗健康领域的重要研究方法,也是制订临床实践指南(下文简称“指南”)时以结构化方式迭代寻求专家意见的必要方法[2-5]。研究表明,2016—2020年中医临床实践指南形成推荐意见时采用最多的共识方法为德尔菲法[6]。该方法的关键特点是参与者之间的匿名性,以及结构化方式接收意见并反馈[7],参与者可在后续迭代中根据小组的反馈调整其初始意见[8-9]。正确使用德尔菲法对于制订高质量的指南至关重要,但对于如何应用德尔菲法,目前尚未达成统一[10]。德尔菲法虽应用广泛,但在实际应用过程中存在诸多问题,如缺乏严格的专家选择标准、意见征询过程不明确等[11]。因此,可考虑对现有方法的具体实施细节进行完善,以形成中医药指南制订中共识意见形成的规范操作规程[12-13]。笔者将针对中医药指南制订中德尔菲法的应用流程、设计/实施要点和报告规范进行探讨,以期促进德尔菲法在指南制订中的规范应用。

1 德尔菲法的起源

在德尔菲法出现之前,焦点小组访谈是整合专家意见的常用方法,但该方法往往因强势人物的影响、群体的压力、环境的干扰等因素而使得结果不准确[14]。为克服这些缺点,兰德(RAND)公司开发了德尔菲法。应用德尔菲法解决问题有一个重要前提,即群体意见要比个人意见更“有效”和“可靠”[15]。因此,共识组的构成和人数,共识专家选取的标准和途径尤为重要。成立专家组后,德尔菲法的主要流程是针对某一特定主题多轮征求意见,整理、归纳、统计意见,再匿名反馈给所有专家,经讨论后最终达成共识[15]。经不断发展和改进,目前存在多种类型的德尔菲法,如经典德尔菲法、改良德尔菲法[15-16]、政策德尔菲法[17]、实时德尔菲法[18]等,其主要特征见表1。

2 德尔菲法的应用流程和设计要点

在指南制订过程中,确定临床问题、结局指标及形成推荐意见,常应用德尔菲法或改良德尔菲法征求专家意见。德尔菲法一般为多轮,其迭代次数在很大程度上取决于研究人员寻求共识的程度、问题的数量、达成共识主题的难易程度、课题执行时间,一般为3~5轮不等[7]。现以指南制订过程中临床问题的确定为例,介绍每1轮的基本任务。

2.1 第1轮:激发观点与想法

在第1轮德尔菲问卷发放前,工作组应确定好达成共识的标准,且不可在后期随意改变。工作组应在整理回顾相关文献及专家调研的基础上,形成初始临床问题,并以调查问卷的形式发送给共识专家,以作为专家激发观点和想法的基础。德尔菲法的第1轮调查应注意问题的开放性,允许小组成员对初始临床问题提出修改建议、评价其重要性及补充新的临床问题。工作组对于初始问题的整理应保持中立,问题的表述不应带有倾向性。第1轮问卷至关重要,应考虑其内容、格式、结构和布局,且篇幅不宜过长。

表 1 不同类型德尔菲法的主要特征

2.2 第2轮:条目评级与初步共识

在第2轮德尔菲调查中,专家需在第1轮问卷内容修订和排序的基础上,进一步对现有问题进行文字调整和再次排序。工作组应对第1轮的评分结果和专家意见进行汇总和整理,说明所有的文字调整、新增内容、删除内容,以及第1轮调查获得的问题重要性排序结果,并形成总结报告。该总结报告将与第2轮问卷一同发放给共识组专家。为便于专家比对内容的变化,建议在第2轮问卷的每个问题后注明第1轮专家提出的观点(同意或分歧)。若在第2轮调查中,某些临床问题在重要性评分、变异系数等方面达到了共识阈值且无专家提出评价或修改意见,即可认为专家组对该问题达成了共识。若所有问题在第2轮调查中均达到了上述要求,则认为专家组完全达成了共识,德尔菲法终止于此轮。

2.3 第3轮:修改意见与阐述原因

第3轮德尔菲调查的主要目的是函询共识组成员是否修改之前的判断或评分,并对未达成共识的条目进行原因阐述。第3轮问卷内容应包括上一轮问卷条目的结果和评分,该轮调查使得参与者具有进一步澄清观点的机会,并对条目的重要性进行新的判断。与上一轮相比,共识度可能存在不同程度的增加。若所有问题在此轮调查中均达到了共识规定的要求,则认为专家组完全达成了共识,德尔菲法将终止于此轮。

2.4 第4轮:最终修改与达成共识

第4轮德尔菲调查通常也是最后一轮,其目的是对未达成共识的条目提出意见并进行评级,此轮为参与者提供了最后机会以修正自己的判断。第4轮仍不能在表述或排序上达成共识的临床问题,一般应予以删除,特别有研究价值但未达成共识的问题可在指南中进行报告说明,一般情况下不进行第5轮德尔菲调查。

在形成推荐意见时,一般先应用德尔菲法进行一轮专家意见征询。此次意见征询,除上述注意事项外,还应在问卷中说明强弱推荐的定义、决定意见推荐方向和强度的因素[23]。建议在设计问卷时,参照 GRADE Evidence to Decision (EtD)框架[24],使专家能够在问题的优先性、利弊权衡、经济性、公平性等方面进行更为全面的考虑。此外,还应为共识组准备相应临床问题的证据总结表(summary of findings,SoF)[25],问卷中的证据内容应清晰、中立,且具有独立的证据摘要或解释信息,以便于专家依据相关证据的简明摘要进行决策。相关材料的制作及问卷格式的设置应在方法学家的指导和监督下完成。

3 德尔菲法的实施要点

3.1 共识组的遴选

共识组成员是得出共识意见的主体,其人员构成将影响共识的结果质量。WHO指南制订手册指出:“指南是多学科合作的结果,应涉及各个利益相关者的专业知识和观点”[26]。中医药指南制订过程常缺少患者、卫生经济学家和方法学家的参与[6,27]。因此,构建中医药指南共识组时,纳入的专家群体一般应包括中医专家、西医专家、中西医结合专家、护理专家、方法学专家、卫生经济学专家、患者及其家属,在条件允许的情况下可增加医保专家、医院管理人员、中医古籍或理论专家、理疗专家、营养专家、康复专家等。除上述人员外,还可根据指南的内容,个性化增加特定的专家群体。

除确保所有利益相关者参与外,还应考虑年龄、性别、专业知识、价值观、地区分布等方面的均衡,以保证共识组成员整体认知方面的平衡。年龄方面,在条件允许的情况下,应包含老、中、青三代;性别方面,应尽可能达到男女平衡;专业知识方面,应尽可能邀请所有相关学术流派的专家;价值观方面,共识组成员不应对某一干预措施有学术偏见,应中立、客观地看待问题;地区分布方面,对于全国性指南,在东北、华东、华北、华中、华南、西南、西北7个地理区域中,应至少覆盖5个区域,对于区域性指南,应考虑区域内行政规划搭配的合理性。

共识组人员的数量和异质性取决于指南制订的主题、未来推广应用的范围和指南制订的时长等[12,28]。在2016—2020年发布的中医药指南和专家共识中,共识组平均人数为(31±11)人[6]。也有学者认为,常见病指南的共识组人数不应少于 30 人,罕见病指南的共识组人数不应少于 15 人[13]。对于共识组的最优人数,目前尚未达成共识,笔者提出如下建议:(1)共识组人数不应过少,否则会被质疑样本的代表性;(2)共识组人数也不应过多,如50人以上会对工作组收集和整合意见带来挑战;(3)相同学科背景的专家人数不宜过多,一般以达到意见饱和为准;(4)重点应关注共识组专家类型的多样性,而非专家数量。

2016—2020年纳入分析的121部中医药指南和146部专家共识中,报告专家遴选标准的指南37部(13.86%),专家共识仅7部(2.62%)[6]。目前,中医药指南制订过程中临床专家的遴选标准为:(1)主任医师或其他高级职称;(2)具有相关领域10年以上临床工作经验;(3)在省级以上学会担任委员以上职务。在专家基本条件方面,笔者提出如下建议:(1)对指南制订主题感兴趣;(2)具有全程参与指南制订的时间;(3)具有指南制订经验、曾学习过指南制订方法或愿意参与指南工作组安排的培训;(4)具有良好的沟通技能;(5)具有副高级以上职称;(6)具有相关专业学士以上学位。

基于上述条件,符合以下遴选标准的专家可优先考虑,临床方面:从事指南相关主题的临床工作10年以上或5年以上且门诊工作量每周不少于15例患者。学术方面:(1)近10年发表过相关主题的高水平论文2篇以上;(2)具有与指南主题相关的授课经验;(3)曾与国内外知名组织合作关于指南主题的项目。共识组成员的遴选标准应由指南项目牵头人充分考虑后决定,不应仅考虑专家的职称高低和任职大小,且共识组的遴选办法应在指南编制说明中提及。工作组可对符合相关遴选标准的专家开展专业水平和指南制订主题理解程度的自我评估[29],若其专业技能与指南主题不甚相符,则不建议纳入共识组。

在遴选途径方面,笔者提出如下建议:(1)可通过检索数据库,查找相关学术论文的作者;(2)可邀请在专业学术组织担任一定层级学术职务的专家;(3)可邀请行业公认的领军人物或参考同行间的推荐。在邀请专家方面,工作组可将符合标准的专家纳入招募清单,由指南牵头人决定专家人选。

3.2 患者的参与

英国国家卫生与临床优化研究所(National Institute for Health and Care Excellence,NICE)指南制定手册指出,指南的共识组应涵盖所有利益相关者,如享受医疗服务的人群(患者及其家庭成员、看护者以及公众)[30]。WHO指南制定手册也指出(guideline development group,GDG)应包含受指南影响最大的群体,如医疗服务的使用者及相关弱势群体[26]。但国内外指南在制订过程中,患者的参与人数偏少且无详尽的参与方法[31]。针对患者如何更好地参与德尔菲法,提出如下建议:(1)患者参与应贯穿指南制订的整个过程[32],从临床问题和结局指标的确定至推荐意见的形成均应有患者参与;若为患者指南,在指南外审阶段也应有患者参与。(2)在确定临床问题前应广泛征集患者的偏好与价值观,并作为证据资料附在德尔菲法第1轮问卷中发给共识组成员。(3)患者及公众参与的策略包括:① 慢性病指南的制订可由基层卫生医疗单位的全科医生对患者进行电话访谈;② 可在专科门诊广泛发布电子问卷,调研患者偏好与价值观,并邀请感兴趣的患者全程参与;③ 采用访谈和问卷调查相结合的方式整理汇总患者意见,将意见进行归纳,并邀请1~2名患者代表加入共识组;④ 同种疾病不同类型和时期的患者均应参与,且应对所患疾病具有一定的认识,尤其注意弱势群体和特殊人群的偏好[33]。由于患者缺乏组织支撑且个体之间存在差异等问题,其参与为指南制订带来很大困难[34-35],因此应注意患者参与过程中的获得感。在德尔菲法实施过程中,应对患者进行疾病背景和方法学知识的科普培训,由专人进行对接和管理,发放一定的劳务费,并在最终报告中对参与的患者代表表达感谢。

3.3 匿名性

匿名性在德尔菲法实施过程中尤为重要。匿名为共识组每位成员提供了一个平等的机会以呈现和回应其他参与者的想法[28]。在德尔菲调查开始前,工作组应向所有参与者承诺实施过程的匿名性,这是保证专家真实回答问题、发表深刻见解和进行客观评分的前提。完全匿名可对工作组的数据收集造成一定困扰,且使得一部分专家发表一些未经深刻思考的意见。相较于完全匿名,仅对共识组实施盲法的半匿名更适用于指南制订。因德尔菲法要求参与者匿名参与调查,因此建议实施该方法前应先获得伦理委员会的批准。

3.4 数据分析与共识阈值

有学者对中医指南制订和修订中德尔菲法的统计分析方法进行了探讨[36],指出其统计指标包括集中程度、协调程度、权威程度及问卷的信度。在考虑是否达成共识的问题上,不应仅判断集中趋势或同意者的比例,更应注意结果的稳定性(协调程度),如变异系数(coefficient of variation,CV)等。CV是衡量总体取值波动程度的量[37],CV数值越小则说明专家对于问题的意见趋同且具有稳定性。此外,也有学者提出用权威程度衡量专家的专业性[38-40],权威系数(Cr)的判断包含两个因素,判断标准(Ca)和熟悉程度(Cs),Cr = (Ca+Cs)/2,详见表2及表3。当Cr值≥0.70时,认为专家权威程度较高[36]。同时,若专家已经过严格遴选,可不使用权威程度衡量其专业性。在数据分析时,若专家对某一问题具有坚定的学术成见,则应通过利益冲突管理办法判断其评分是否可纳入统计分析。

表 2 判断标准的量化

表 3 熟悉程度的量化

共识阈值方面,Green[41]建议至少 70% 的共识组成员同意或4级李克特量表(Likert)评分为 3 分或更高,且中位数须为 3.25 或更高。笔者建议设定一个较高的阈值,以更好地反映专家的不同观点。在同意百分比上,推荐不少于75%的共识组成员同意或5级李克特量表评分不低于4分[42]。应在德尔菲法实施前确定数据分析方案以及达成共识的标准,并告知共识组成员[14]。同时,应在指南编制说明中明确提及。对于达成共识的阈值,目前尚无明确的最佳标准[43],此领域有待进一步研究。

3.5 时间要求

德尔菲法相对于名义小组法更耗时。制订指南的德尔菲问卷包含大量内容,如EtD决策表、证据总结表等,工作组需在轮次之间花费时间去整理和归纳数据,因此提出如下建议:(1)3轮德尔菲调查的总时长应不少于45 d;(2)应将轮数限制在2~3轮,以免专家产生疲劳[44];(3)数据及专家意见的快速收集和整理可提高专家的参与热情[21],每轮问卷的发放时间最好不超过10 d,工作组整理意见再返回的时间不超过3 d;(4)持续的沟通和提醒可在整个研究过程中收到更好的反馈[45],每轮问卷的发放时间过半时应及时以邮件、微信或短信的形式提醒专家反馈问卷,剩余3 d时,应以致电的方式提醒专家。工作组成员充分发挥积极作用才是德尔菲法快速、有效收集整合专家意见的关键。

4 德尔菲法的报告

从目前已发布的指南来看,大多数指南在正文中未清晰报告共识意见形成的具体方法和过程,其实施过程缺乏相应的细节,因此无法获得对其客观评价的依据[13]。中医药指南在专家遴选方法、共识组构成及人数、达成共识的阈值、共识方法的次数或轮数、争议问题的解决办法等方面报告并不充分[6]。不仅在中医药领域,其他学科领域指南的报告也存在统计指标不全面、缺少专家意见的定量处理标准、缺少预先定义的共识标准、缺少不同意见的报告、缺少专家遴选标准、缺少专家基本信息等内容[46]。应用德尔菲法需报告实施过程的详细信息,信息的缺失给医学编辑、审稿专家以及其他相关利益群体带来了挑战。中医药领域应用德尔菲法的相关研究,其报告质量参差不齐[6,47],只有改进德尔菲法报告质量,才能够保障使用者获益。

参考既往发表的德尔菲法相关文献[7,48],对指南提出如下报告要求:(1)理由和目的。报告德尔菲法拟解决的问题以及选择该方法的合理性。(2)共识组。报告共识组专家的基本信息,包括业务身份、工作单位、职称及联系方式,共识过程中每轮参与的人数、专家的遴选标准及专家招募过程。(3)方法说明。报告开展调查的方式以及轮次、数据分析方法、专家意见的汇总方法、预先定义达成共识或放弃达成共识的标准、争议问题的解决办法。(4)共识过程。报告每一轮问卷的调查结果,如每一轮的意见变化或修改情况、调研过程中存在的不同意见等。(5)共识结果的局限性。报告德尔菲法实施过程中潜在因素对于结果可靠性的影响,如共识组的男女比例或地区失衡对于共识结果的影响等。

5 德尔菲法的局限性

德尔菲法虽然采用了结构化、匿名化方式收集专家意见,但也存在一定的局限性和风险。相较于共识会议法,德尔菲法虽可在一定程度上避免专家之间互相影响,但当专家意见过于趋同时,也产生一定的“乐队花车效应”[49],即不经思考即赞同大多数人的选择。对于这种情况,工作组需询问提出不同意见专家的想法以了解其背后的原因,而非仅陈述上一轮观点的评分情况。此外,德尔菲法不适用于对某一特定问题的深入探讨。在指南制订过程中,共识组成员往往是多学科的,虽然每位专家对于自身学科领域有着充分的认识和见解,但每位专家对于不同主题的知识存在不同程度的认知,其形成的共识结果可能存在不够深入的风险。因此,若对某一主题进行深入讨论,应改变专家的遴选原则,纳入更多对某一主题具有深入理解的专家。

6 小结

本文系统总结了德尔菲法在中医药指南制订过程中的应用流程、设计要点、实施要点、局限性以及报告建议,以期促进德尔菲法在指南制订中的规范应用。但目前国际上尚无公认的德尔菲法应用范式,相关建议均是基于过往指南制订工作中的经验,实际执行过程中还应根据具体情况酌情参考。建议未来研究应系统梳理德尔菲法的方法学文献,形成国际通用的实施和报告规范,以提高指南的共识质量,增加指南报告的透明性和规范性。

作者贡献:梁昌昊负责查阅资料、撰写论文;尹冠翔、王雅琪、刘思岐负责查阅资料、修订论文;高一城、刘鹏伟、苏祥飞负责论文初稿修订;费宇彤负责指导论文写作及审校。

利益冲突:所有作者均声明不存在利益冲突

猜你喜欢
德尔菲共识指南
德尔菲法构建肿瘤医院ICU患者身体约束评估量表
共识 共进 共情 共学:让“沟通之花”绽放
基于德尔菲法构建融合式旅救护所指标体系
论思想共识凝聚的文化向度
商量出共识
指南数读
论碰撞的混搭指南
基于德尔菲法的上海某专科医院公开招聘的影响因素研究
别让“PX共识”在爆炸中瓦解
就医指南