刘明,葛龙,高亚,孙凤,武珊珊,杨智荣,董圣杰,张天嵩,田金徽
网络Meta分析(Network Meta-Analysis,NMA)是一种综合评估两种以上干预措施的统计分析方法。与传统双臂Meta分析不同,NMA能够将直接证据与间接证据合并以提高最终结果的精确度,并通过对所有干预措施进行排序筛选出最佳干预措施,以期为临床决策提供可靠证据[1-3]。NMA有频率法和贝叶斯法两种统计方法,能使用的拟合模型多种多样[4,5],NMA结果中包括相对效应量、干预措施排序和证据可信度等多重信息,适当、全面、简明、清晰和直观的可视化呈现NMA结果将会有利于促进NMA结果的转化和利用。如2016年Veroniki等[6]开发了一种利用可视化呈现多个NMA结果的热图,便于快速识别出最佳干预措施。2019年Law等[7]开发出两种新的NMA结果可视化方法,可使NMA结果更易解释。本研究对目前NMA结果的可视化呈现方法进行了结构化的概述,以期帮助我国NMA制定者和使用者更好地可视化呈现NMA结果。
1.1 网络图在NMA发展之初,网络图被用来可视化呈现干预措施间的直接比较与间接比较关系,据此可以快速评估NMA的可行性以及证据的强度和多样性[8]。图1a为Pan等在2018年发表NMA中的干预措施网络图[9],是最经典的NMA网络图,图中由代表干预措施的蓝色节点(如no exercise,flexibility training)与代表直接比较关系的黑线组成,节点大小代表干预措施的样本数量,线的粗细代表直接比较两种干预措施的试验数量。Konig等在发表研究中阐述了干预措施证据流向图(Flow-of-evidence graph)的制作方式与呈现信息(图1b)[10]。图中字母A、B、C、D和E分别代表五种不同的干预措施,带箭头的边表示干预措施的比较情况(箭头指向代表方向),数字表示比较路径的贡献度,该图呈现出了干预措施A与干预措施B直接比较和间接比较的一个证据来源(A与B直接比较的证据贡献度为40%,通过C、D和E间接比较的证据贡献度均为20%)。Batson等提出了一种包括协变量信息在内的3D网络图(3D network graph)(图1c),该立体图具有3个纬度,蓝色节点代表不同的干预措施(如Tocilizumab+MTX,Rituximab+MTX),节点间的连线代表干预措施间的直接比较,z轴上的圆柱代表每个试验直接比较中相对于参照组的连续性协变量水平的差值,正(绿色)负(红色)可以用不同的颜色表示,全图可利用由Batson等提供的Web软件在线完成[11]。Kossmeier等的研究描述了干预措施呈现方式-干预措施矩阵图,该图由Palmer等在2015年出版的书籍中首先提出,图中横轴是纳入研究编号,纵轴是各种不同的干预措施,灰色方块代表干预措施在不同的研究中存在直接比较证据[12,13]。
图1 四种常见网络图呈现方式
1.2 结果的可视化
1.2.1 森林图森林图是以统计分析方法为基础,利用数值运算结果绘制出的图形,最早可追溯至1982年[14]。传统Meta分析森林图建立在一个平面直角坐标系中,中心是一条垂直的无效线/等效线,平行于横轴的线段代表纳入研究的效应量和可信区间,最下面棱形用来描述多个研究合并的效应量和可信区间。在NMA中,森林图同样是最具代表性的图形之一。为了呈现更多的信息,NMA森林图需在传统Meta分析森林图的基础上进行升级。Chaimani等介绍了一种可以用Stata软件制作的森林图-Contrast forest plot(图2a)[15],图中黑色实线代表每对直接比较的效应量和可信区间,红色虚线代表各自的预测区间(用于评价异质性),中间蓝色垂直线为无效线/等效线,但该类森林图并不能直观呈现出干预措施间的排序情况。
Tan等2014年介绍了两种新的NMA森林图呈现方式,第一种森林图呈现方式为Summary forest plot matrix(图2b)[16],从左上角至右下角的对角线上为所有干预措施降序排列的秩序图,而直接比较分析结果分别以森林图和数值的方式呈现在矩阵中秩序图的上下方。第二种森林图呈现方式为Summary forest plot table(图2c),此图呈现的信息与图2b基本一致,差别在于该图中第三列信息能呈现两直接比较措施的临床试验数量,但未能像图2b一样提供排序情况。2014年Krahn等提出了一种能够同时呈现直接比较和间接比较的森林图-Network indirect path decomposition forest plot(图2d)[17]。图中第一行呈现了两种干预措施的直接比较结果(direct),接下来依次呈现出网络图中通过其它闭合环形成的间接比较结果(如indirect via bupr,indirect via cita),最下方的棱形为汇总后的最终结果。图中还包括了一些其它信息,如使用的分析模型、统计异质性等。Phillippo等还开发出单个研究水平的森林图(study level forest plot)[18],如图2e所示,左侧数据表格中从左往右依次是单个研究中相比较干预措施(括号外为研究编号,括号里为干预措施编号)、点估计值(logOR)、95%CI及 “invariant interval”(一种评估偏倚风险的方式,具体见原文[18]),右侧森林图中空心小圆点表示logOR,黑色水平线表示95%CI,灰色条带表示“invariant interval”;当95%CI超出“invariant interval”范围时,图中单个研究及相应的比较干预措施将被加粗显示,表明这些研究及相应的干预比较是偏倚风险的主要来源。
图2 五种常见森林图呈现方式
1.2.2 阶梯图阶梯图是最基本、最常用和最重要的NMA结果呈现方式。图3a为Cipriani等在研究中所呈现的阶梯图,图中所有干预措施按照首字母顺序呈阶梯样由上往下依次排列,阶梯下方为有效性的比较结果,阶梯上方为可接受性的比较结果,每级阶梯中提供了干预措施比较结果的OR值与可信区间,加粗字体代表有意义的比较结果[19]。图3b为Ge等在2020发表研究中使用的阶梯图,与图3a相比,图3b用不同的颜色来代表比较结果的GRADE分级[20]。与传统阶梯图比较,此两种阶梯图能呈现出更多的信息。
图3 两种常见的阶梯图
1.2.3 排序图图4呈现了10种不同的NMA结果排序方式,2009年Hawkins等在一项有关非小细胞肺癌的研究中首先使用了排序概率表图(图4a),英文全称为 Ranking table plot,图中行代表干预措施,并根据干预措施的效果从上到下进行降序排列,横轴往左表示有效(Most effective),往右表示无效(Least effective),每格中的数字表示有效/无效的概率,并用气泡大小表示概率的高低[21]。由图可知,厄洛替尼总生存率估计有85%的概率是有效的干预措施,而培美曲塞、多西他赛和吉非替尼的疗效存在相当大的不确定性。Salanti等提出了一种名为Barplot of ranking probabilities的排序方式(图4b)[22],该图类似于常见的柱状图,横轴为干预效果从最佳至最差的一个降级排序,纵轴为某个干预措施处于特定级别的概率,最上方为图例(用不同的颜色区分干预措施)。由图4b可知,阿司匹林+双嘧达莫的抗血小板治疗预防严重心血管事件最为有效,其次分别是噻吩并吡啶+阿司匹林和单用阿司匹林。图4c是一种极简的根据干预措施中位数进行排序的方式,由Tan等提出[16],图中从上到下依次是排名最佳干预措施至最差的干预措施,并用颜色进行区分以便一目了然。2016年Naci提出了一种崭新的NMA结果排序可视化方式(图4d),可以在线制作(http://lse.live.kiln.digital/statins/)[23]。图4d先对5种药物(阿托伐他汀、洛伐他汀、普伐他汀、瑞舒伐他汀、辛伐他汀)进行排序,不同颜色代表不同的结果,条形图用来表示每个结果的相对权重。排序结果可因关注结果的不同而实时改变,如当使用者认为全因死亡率是最重要的结果,其次是冠状动脉事件和脑血管事件时辛伐他汀排名最好。在流量时代,这是一种极佳的创新性可视化呈现方式,可基于此开发用于其它领域的NMA中,并可动态更新NMA实时调整结果。Chaimani等提出了针对单个结局指标的单一散点图(Ranking scatterplot for single outcome)[15],由图4e可知横轴为优选概率排名曲线(SUCRA)值,纵轴为排序情况(倒序),图中方块表示干预措施,与其他干预措施相比较,越往右上角的干预措施其效果越佳。Cipriani等在一项关于评价12种新一代抗抑郁药的疗效和可接受性的NMA中,使用了Rankogram(图4f)来呈现12种干预措施排序的概率分布,与Hawkins等使用的排序概率表图类似[19,21]。图中横轴表示排序,纵轴表示概率,红色实线和蓝色虚线分别代表干预措施的有效性和可接受性,由图中可知,艾司西酞普兰(Escitalopram)的有效性和可接受性均位于前列,其次是舍曲林(Sertraline)。Salanti等除提出Barplot of ranking probabilities的排序方式外,还提出了另一种排序方式-Probability to be within a range of the best treatment plot(图4g)[22]。从图4g中很容易发现,每种治疗在任何阈值都有比安慰剂更佳,且依次排序为阿司匹林+双嘧达莫优于单纯双嘧达莫优于单纯阿司匹林,此种可视化呈现方式可评价排名的敏感性,且可用于各种干预措施间可能存在的任何比较。图4h为Veroniki等在2016年提出一种新的NMA结果排序方式,图中由内而外叠套在一起的圆环分别代表3个不同的比较结果(Severe hypoglycemia,Weight gain和A1c),圆环由代表不同干预措施的小段组成,颜色用来不表示干预措施的排序统计值(Ranking statistic),其中白色表示无数据[6]。为了更好的呈现结果,Wu等在一项研究中以正方体图形呈现了分析结果,图4i为该项研究中的SUCRA曲线,根据此结果制作了更易理解的正方体图形(图4j)[24]。图中x、y和z轴分别代表3种不同的结果,不同颜色的圆点代表不同的干预措施,根据圆点位置可以确定干预措施在不同结果综合下的排序情况。
图4 十种常见的排序图
1.3 不一致性检验的可视化呈现目前NMA检测不一致性方法主要有反向计算法、节点拆分法和不一致性因子检测法等[9],导致呈现方式多样。Salanti等[25]和Krahn等[17]在研究中使用的两种常见的不一致性检测呈现方式如图5所示。图5a分别呈现出4个不同的闭合环估算出的不一致参数(即直接估计的处理效果与间接估计的处理效果之间的差异)及其95%CI。图5b能够呈现出更多有用的信息,该图中灰色正方形的区域显示了直接比较的贡献度,灰色正方形上有其他颜色覆盖表示两个干预措施的比较同时存在直接与间接比较;且用颜色的深浅代表直接与间接比较间不一致性的大小,越往冷色(蓝色)代表不一致性越小,越往暖色(红色)代表不一致性越大。
图5 不一致性检测的可视化呈现
1.4 相似性检测的可视化呈现在NMA中,相似性是指所有研究间以及不同对照组间影响效应量因素的相似度[26],常需要采用Meta回归的分析方法评估影响效应量因素的相似性,并最终对NMA结果进行合理解读[27]。图6为最常使用7种NMA中相似性检测的可视化呈现方式,其中图6a、6b、6c、6d和6e为Donegan等在Graphs of study contributions and covariate distributions for network meta-regression一文中提出的5种不同的相似性检测结果呈现方式[28]。图6a为干预措施T1和T2的直接比较与间接比较,横轴为协变量,纵轴为LogOR值的一个可信区间,底部为对直接比较的检测情况,上部为对间接比较的检测情况,证据来源研究的效果估计值和协变量值用单独的气泡描述,其大小与其对估计斜率(蓝色)和截距(红色)的贡献成正比。图6b与图6a呈现方式与内容基本相似,不同之处在于没有区分直接比较与间接比较,其横轴表示协变量的值,纵坐标为效应量:回归线上方的颜色表示对截距的贡献,回归线下方的颜色表示对估计斜率参数的贡献。图6c仅适用于比较干预措施较少的NMA,在每对直接比较干预措施间以柱状图的方式呈现所关注的协变量情况,可直观的呈现出研究间的相似性。图6d为协变量贡献热图,其可视化了临床试验中某些协变量值对NMA的贡献,而对于协变量值不存在或对NMA几乎没有贡献的协变量,应谨慎解释。图6e为协变量贡献散点图,图中可视化呈现出NMA中每组干预比较截距和斜率,对NMA的贡献和所有临床试验的贡献相关协变量值(如平均年龄)显示在每组比较的单独散点图中,该图允许评估协变量值的分布,并检测临床试验中哪些协变量值对回归分析有高贡献。图6f是一种较为常见的网络回归分析图,该图可用于网络中的任何两两干预措施之间比较,可直观呈现关注的协变量对观察的干预措施的影响[29]。Schwarzer等提出了Bland-Altman heterogeneity plot是一种较为特殊的图形,见图6g[30],目前尚未在已发表的研究中发现该图,图中呈现出纳入研究中干预措施的比较情况(如共有5个原始研究中有干预措施C与E的比较,2个原始研究中有干预措施G和C的比较,仅1个原始研究比较了干预措施C和M),横坐标为分别用固定模型和随机效应模型计算两个干预措施比较效应量的平均值,纵坐标为分别用固定模型和随机效应模型计算两个干预措施比较效应量的差值,根据所计算的平均值与差值来确定两个比较干预措施在图中的位置,根据具体位置偏离水平虚线(0.0)的远近来判断相似性,离水平虚线越远表示相似度越小。
图6 七种相似性检测的可视化呈现
1.5 发表偏倚的可视化呈现同质性、相似性和一致性假设是NMA进行数据合并的前提,然而发表偏倚的存在会破坏上述假设而影响结果的真实性。因此,在NMA中需要评估纳入研究发表偏倚的大小,目前最常用的是校正比较漏斗图(图7a)[15]。该图中红色垂直线为无效线,绿线为回归线,不同颜色圆点代表不同干预措施的比较,横轴为ln(OR)值,纵轴为标准误。另外,Peters等开发出了一种新的漏斗图,即轮廓增强漏斗图[31]。图7b为Luangasanatip等在2015年发表的一项研究中使用的轮廓增强漏斗图,横坐标为LogOR值,纵坐标为逆标准误,不同的颜色区域代表不同的P值范围,不同的形状代表不同干预措施的比较(白色区域形状代表的干预措施的比较可能存在发表偏倚)[32]。
图7 两种常见的漏斗图
从传统Meta分析扩展至NMA,不仅需从理论上和方法学上不断进行升级,而且鉴于NMA结果的复杂性,研究者们不断创造出更多、更直观的结果呈现方式,为NMA结果解读插上了可视化的“翅膀”,将更加有利于NMA证据的传播。本研究通过对研究中NMA结果呈现方式的汇总后发现图表多种多样,根据图表的特征可大致分为四类:第一类是干预措施网络图,第二类是主要结果的森林图和梯形图的可视化呈现,第三类是同质性、相似性、发表偏倚和不一致性相关结果的可视化呈现,第四类是结果排序图表的可视化呈现。
目前,NMA中图形的使用仍非常受限,许多研究中仅有森林图、梯形图等,而无其它任何图形,使结果的解读与传播受限。已发布的一些系统评价与Meta分析报告标准中,仅建议使用森林图来呈现分析结果[33-35]。可视化的方法并没有在NMA结果的呈现上发挥出应有的作用,其原因可能是:①大量可视化呈现NMA结果的图形的真正用途尚未被大众所熟知,尤其是研究制定者与使用者;②研究者、审稿专家及期刊编辑还没有认识到可视化呈现对NMA结果解读与传播带来的潜在价值;③许多用来创建NMA可视化图形的软件不易操作或者制图代码不易获取。本研究通过对NMA结果的可视化的概述,希望能增加读者对NMA可视化的认识和使用信心,尤其能改善因前两个原因带来的应用困扰。
综上,NMA结果的可视化已有大量图形可用,而多数图形并没有得到充分应用,但新的呈现方式仍然在不断涌现。本研究仅对目前NMA结果的可视化呈现方式进行了概述,并未深入陈述每一种图形的应用场景以及实际操作方法和过程,对于涉及到的模型分析等更深入的知识,读者有兴趣可参考既往发表文献[7,12,36-39]。为了更好的发挥NMA结果可视化的魅力,希望能有更多的研究者参与其中,开发出更多的操作性强的可视化呈现形式,并示范推广,以增加NMA结果的直观性、可读性和可解释性。