改良版定量系统评价证据分级方法对患者报告结局测量工具的评价

2020-11-05 01:44:50陈祎婷沈蓝君彭健胡雁余桂星李铮
军事护理 2020年10期
关键词:改良版内容效度证据

陈祎婷,沈蓝君,3,彭健,2,胡雁,2,余桂星,李铮

(1.复旦大学 护理学院,上海 200032;2.复旦大学 循证护理中心,上海 200032;3.复旦大学附属华东医院 护理部,上海 200040;4.厦门大学附属翔安医院 护理部,福建 厦门361102)

随着循证医学的迅速发展,证据等级与推荐级别标准逐渐成熟,包括世界卫生组织在内的19个国家与国际组织共同成立了GRADE(the grading of recommendations assessment,development and evaluation)工作组,针对证据分级与推荐意见存在的不足,推出了GRADE证据系统[1]。GRADE证据系统综合考虑研究的偏倚风险、发表偏倚、不一致性、间接性、不精确性、效应量大小、剂量-反应关系及混杂因素等,弥补了以往单纯按照研究设计类型划分证据质量等级的局限性[2]。由荷兰、美国、西班牙等研究机构的心理测量学专家提出了基于共识选择健康测量工具的标准(Consensus-based standards for the selection of health measurement instruments,COSMIN)[3],在已经存在的患者报告结局测量工具(patient reported outcome measures,PROMs)系统评价的基础上提出了COSMIN方法,详细阐述了如何制作规范的PROMs系统评价并形成最终推荐意见,以指导临床实践者与研究者选择最合适的PROMs,节约研究成本与时间[4]。目前,国内学者对COSMIN方法的认识与应用较少,对COSMIN的具体评价方法掌握不足。其中,COSMIN对PROMs的每种测量属性评价包括3个部分:(1)应用COSMIN偏倚风险清单评价每项研究的偏倚风险;(2)应用COSMIN质量准则评价PROMs每种测量属性的证据质量;(3)汇总PROMs测量属性的评价结果,运用GRADE系统形成推荐等级[4]。在第三部分中,COSMIN于传统GRADE证据系统基础上进行改良,以偏倚风险、不一致性、不精确性(不适用于内容效度)和间接性四个因素分别对PROMs测量属性的证据质量进行评级[3]。本文将此改良方法与传统GRADE方法相比较并介绍,以便研究者与临床工作者理解与应用。

1 证据质量等级与推荐强度的定义及分级

传统的GRADE证据系统提供了一套证据质量等级与推荐强度的评价体系。“证据质量”被定义为对效应估计值的确信程度作出评价,“推荐强度”则定义为对最终利弊效果比较的确信程度作出推荐[5]。GRADE将证据质量分为“高”、“中”、“低”和“极低”4个具体等级,并将推荐强度形成“强推荐”、“弱推荐”两个具体等级[2]。COSMIN同样认为在汇总PROMs每种测量属性的所有证据并对测量属性进行评价后,需对所得证据的质量进行评级。故在传统GRADE证据系统的基础上,COSMIN针对PROMs的系统评价,专门开发出一套改良版GRADE方法。传统的GRADE证据系统与改良版GRADE方法对证据质量等级的分类见表1,两者在该方面的分级描述相对应,区别在于评价的对象为干预措施的结果或PROMs的测量属性[2, 4]。

表1 传统GRADE与COSMIN改良GRADE证据质量的分级比较

传统GRADE证据系统根据利弊平衡、证据质量、价值观和意愿以及成本这四个关键因素,将推荐强度分为两个等级——强推荐与弱推荐[2],强推荐是指“明确显示干预措施利大于弊或弊大于利”,而“弱推荐”是指“利弊不确定或无论质量高低的证据均显示利弊相当”。COSMIN在选择最佳PROMs方面也提出了自己的推荐划分标准,见表2。由于COSMIN评价的对象为PROMs而非干预措施,故推荐强度不同于传统GRADE,其需要结合COSMIN偏倚风险清单对每项研究偏倚风险与COSMIN质量准则对PROMs每种测量属性证据质量的评价及证据质量分级进行汇总分析[4, 6-7]。 例如,某PROM存在可证明其内容效度与内部一致性为“充分(sufficient,+)”的中等证据,且无高质量证据证明其测量属性“不充分(insufficient,-)”,那么可将该PROM划分为A类PROM,即推荐使用,且可认为使用该PROM的研究的结果是可信的。 COSMIN偏倚风险清单对每项研究偏倚风险与COSMIN质量准则对PROMs每种测量属性证据质量的评价流程可参见Prinsen等[4]与Mokkink等[6]的研究。

表2 COSMIN关于选择最佳PROMs的推荐强度

2 证据质量等级

2.1 影响证据质量等级的相关因素 传统GRADE证据系统对证据质量的评价基于研究设计类型,将随机对照试验视作高质量证据,观察性研究视作低质量证据。其认为偏倚风险、不一致性、不精确性、间接性和发表偏倚等这五个因素均可能降低研究证据质量等级,而效应值很大、负偏倚、存在剂量-效应关系这三个因素可能升高研究证据质量等级,根据这八个因素的存在与否及重要程度,将证据质量进行降级或升级[8]。COSMIN在此基础上提出调整,因考虑到PROMs测量属性的相关研究很少登记注册,很难在PROMs的系统评价中评估存在的发表偏倚,故改良版GRADE方法在证据质量评级时删除了“发表偏倚”这一因素,只以偏倚风险、不一致性、不精确性(不适用于内容效度)和间接性等四个因素对PROMs每种测量属性的证据质量进行评级,COSMIN在评价开始前均默认证据等级为高等[4]。影响传统GRADE与改良GRADE证据质量等级的相关因素比较见表3。

表3 传统GRADE与COSMIN改良GRADE证据质量分级的影响因素比较

2.2 COSMIN改良版GRADE降级因素 COSMIN在传统GRADE基础上加以个性化考虑,设置四个降级因素与相应指标[4, 8]。

2.2.1 偏倚风险 根据COSMIN偏倚风险清单(COSMIN risk of bias checklist)对PROMs文献进行方法学质量评价,若相关研究的方法学质量模糊(doubtful)或不良(inadequate),或者只有一项研究的方法学质量良好(adequate),则可能存在偏倚风险[6]。根据偏倚风险的严重程度,对证据的质量进行降级调整[4]:偏倚风险严重,则降低1级(高质量证据降为中质量证据);偏倚风险很严重,则降低2级(高质量证据降为低质量证据);偏倚风险非常严重,则降低3级(高质量证据降为极低质量证据),见表3。偏倚风险的严重程度(无、严重、很严重、非常严重)分级详见表4。

表4 COSMIN偏倚风险的严重程度分级

2.2.2 不一致性 不一致性是指PROMs研究间存在不一致的结果,可采取对结果类似的研究进行分组分析的形式解决不一致性问题,此时不需要对证据降级。如果无法解释不一致性存在的原由,评审团队可以考虑不纳入此研究证据结果,直接对其评价“不一致”,此时不给予证据等级。对纳入的研究证据进行证据等级评价时,根据研究结果是否充分来调整证据级别[4]。评审者同样需要考虑研究间不一致性的严重程度,严重则降低1级,很严重则降低2级,见表3。具体情况需要评审团队斟酌考虑。

2.2.3 不精确性 不精确性是指研究纳入的患者和观察事件相对较少而导致的可信区间较宽[2]。COSMIN建议,当所有纳入研究的总样本量低于100时,降低1级;总样本量低于50时,降低2级,见表3。注意,对于部分测量属性(如内容效度、结构效度、跨文化效度)而言,本原则并不适用,因为COSMIN偏倚风险清单对其已有样本量的要求[4, 6]。

2.2.4 间接性 当PROMs研究中实际关注的群体、构念或情境与预想关注的不符时,就存在着间接性。若研究包含的研究对象(受试者)只是目标群体的一部分,那么评审团队也应考虑到间接性的存在,降低证据质量等级。当证据较为薄弱时,如证据仅是基于PROMs之间对不同构念测得结果的比较或仅是基于极端差异组测得结果的差异,则评审者可考虑到构念效度或反应度的间接性,降低证据质量等级[4],见表3。关于间接性严重程度的判断,需要评审团队根据具体情景斟酌考虑。

2.3 PROMs内容效度的证据质量评级 COSMIN制定的改良版GRADE方法对PROMs内容效度进行证据质量评级时,只考虑证据的偏倚风险、不一致性及间接性等三个因素[7]。由于PROM的开发和内容效度研究主要为质性研究,与不精确性的相关性较小,且缺乏PROM开发研究和内容效度研究的注册资料,难以评价发表偏倚,故不考虑证据的不精确性和发表偏倚因素,其他三个降级因素(即偏倚风险、不一致性及间接性)同表3,COSMIN在评价开始前均默认证据等级为高等[7]。

当PROMs的开发研究或内容效度研究方法学质量为模糊(doubtful)时,可认为偏倚风险存在。COSMIN建议,若内容效度研究的方法学质量为模糊(doubtful),则降低1级(高质量证据降为中质量证据);若没有内容效度研究或方法学质量不良(inadequate),以及PROMs开发研究方法学质量为模糊(doubtful),则降低2级(高质量证据降为低质量证据);若没有内容效度研究或方法学质量不良(inadequate),以及PROMs开发研究方法学质量为不良(inadequate),则降低3级(高质量证据降为极低质量证据)[7]。详见图1。PROMs内容效度研究的不一致性与间接性评价与其他测量属性相同,故不再赘述。

图1 COSMIN基于偏倚风险内容效度研究的证据质量评级

3 讨论

随着患者在治疗方式与其他医疗服务选择中的自主权占比日益增加,其可以通过自己的认知及判断对自我结局进行评估与审查[9],患者报告结局即来自于患者对其自身健康状况各方面的直接测量[10],为了适应此现状,医学工作者们提出了PROMs,但现有的PROMs质量不一,研究者很难判断应用的PROMs是否为最佳选择,因此对PROMs展开高质量的系统评价至关重要[4]。

3.1 COSMIN改良版GRADE法为PROMs的选择提供了个性化评价工具 科学的证据分级是选择与应用证据的前提,而传统的GRADE方法无法对PROMs进行针对性的证据等级与推荐强度评价。COSMIN在传统GRADE方法的基础上进行了个性化改良,为PROMs的选择与应用提供了评价工具。个性化改良体现在:由于登记注册的PROMs测量属性相关研究较少,PROMs的系统评价中难以评估存在的发表偏倚,故改良版GRADE方法在证据质量评级时删除了“发表偏倚”因素;在评价过程中结合COSMIN偏倚风险清单对每项研究偏倚风险与COSMIN质量准则对PROMs每种测量属性证据质量的评价进行汇总分析。在遵循基本原则的同时,针对PROMs的特点更好地调整与说明了评价流程与方法,帮助研究者与临床实践者评价PROMs研究证据质量等级。

3.2 COSMIN改良版GRADE法存在的局限性与注意事项 目前,COSMIN制定的改良版GRADE方法尚存在局限性,如只提及了降低证据质量等级的标准,而未定义升高证据质量等级的标准,完整性有待加强。在使用COSMIN改良版GRADE方法时,研究者需全面地认识与把握COSMIN评价体系,结合COSMIN偏倚风险清单与COSMIN质量准则,按步骤与要求进行严格、客观且系统的评价。改良版GRADE与传统GRADE有所差异,研究者在进行评价时切忌混淆误用。此外,PROMs研发人员也可在量表的制作过程中,参照COSMIN要求规范开发流程,从而制作出高质量、适用性强的PROMs。

猜你喜欢
改良版内容效度证据
中国饮食文化在日本的传播
——以陈建民“改良版”麻婆豆腐为例
COSMIN方法介绍:评价患者报告结局测量工具内容效度的评分系统
循证护理(2021年5期)2021-05-28 09:17:26
改良版Mini-CEX在肾病内科护理临床带教中的应用
医药前沿(2019年21期)2019-08-23 01:30:24
英语专八阅读理解部分内容效度的历时对比研究(2009—2017年)
对于家庭暴力应当如何搜集证据
红土地(2016年3期)2017-01-15 13:45:22
手上的证据
“大禹治水”有了新证据
手上的证据
大学英语新四级阅读理解内容效度研究
更正