肝纤维化磁共振扩散加权成像Meta分析*

2017-09-15 03:11北京大学深圳医院影像科广东深圳518036
中国CT和MRI杂志 2017年9期
关键词:样本量灵敏度异质性

北京大学深圳医院影像科(广东 深圳 518036)

马武毅 黄 嵘 邓灵波张 凯 张重明 言伟强成官迅

肝纤维化磁共振扩散加权成像Meta分析*

北京大学深圳医院影像科(广东 深圳 518036)

马武毅 黄 嵘 邓灵波张 凯 张重明 言伟强成官迅

目的通过Meta分析研究方法对弥散加权成像磁共振检查方法评价肝纤维化分级诊断的准确性做出分析。方法通过检索国内外公开发表的DWI评价肝纤维化分级诊断准确性的文章,并且采用Metavir、Scheuer、Batts-Ludwig计分系统标准进行分级。两名研究人员按照纳入与排除标准独立选择文献并根据QUADAS评价条目标准进行质量评价。使用Meta-Disc软件进行Meta分析,并绘制SROC曲线。结果 检索到247篇相关文献,最终纳入了10项1.5 T场强研究和3项3.0 T场强研究,受试者总数为809例。Meta分析结果示各组间存在统计学异质性,采用随机效应模型合并分析。DWI磁共振检查方法对轻度肝纤维化(G1)组、明显肝纤维化(G2)组、严重肝纤维化(G3)组、早期肝硬化(G4)组的合并灵敏度和特异度分别为:0.74和0.74、0.83和0.76、0.78和0.79、0.83和0.79;SROC曲线下面积分别为:0.8363、0.8820、0.8663和0.8719。结论 DWI对肝纤维化分级具有较高的诊断效能。

肝纤维化;Meta分析;磁共振;功能成像;弥散加权

肝脏纤维化是胶原蛋白,蛋白多糖和其他大分子在细胞外基质内的过量沉积,是慢性肝病向肝硬化发展的必经阶段。关于DWI评价肝纤维化分期的临床研究结论仍存在争议。本研究通过Meta分析对DWI评价肝纤维化分期的现有研究进行合并分析,以组织病理学作为一个金标准,从循证医学的角度系统评估其准确性。

1 资料与方法

1.1 文献检索两名研究人员独立使用计算机检索PubMed、Medline、万方数据库、中国知网(CNKI)、Cochrane图书馆数据库、中国生物医学文献数据库、中国期刊全文数据库、中国数字化期刊数据库。检索时间范围从2006年1月至2016年1月。英文检索词包括:MR imaging,functional magnetic resonance imaging,DWI,diffusion-weighted imaging,liver cirrhosis,liver fibrosis,non-invasive detection。中文检索词包括:肝纤维化、肝硬化、无创检查、磁共振、磁共振功能成像、弥散加权成像等。

1.2 纳入与排除标准两个评价员独立以以下纳入与排除标准筛选文献,决定符合标准的纳入文献。两个人通过面对面讨论解决不一致的文献。纳入标准:(1)研究方法:用DWI评估人类肝纤维化分级的诊断性试验。(2)研究对象:肝纤维化、肝硬化患者。(3)研究的诊断金标准:病理结果,并且采用现在广泛使用的Metavir、Scheuer、Batts-Ludwig计分系统标准。(4)能够提供原始数据,直接或间接计出算真阳性值(TP)、假阳性值(FP)、真阴性值(TN)、假阴性值(FN)。排除标准:(1)文献类型为:病例报道、综述、系统分析、讲座及文摘类文章。(2)重复发表的文献。(3)研究数据不完整。

1.3 数据提取文献数据提取主要包括:(1)研究背景和设计信息:包括第一作者、发表时间、样本量、试验类型、MR品牌及场强;(2)参考试验:活检或者手术;(3)肝纤维化的病理评分标准;(4)受试者的病因;(5)最佳b值的临界值。

计算准确性的数据主要有:真阳性值(TP)、假阳性值(FP)、真阴性值(TN)、假阴性值(FN)。纳入研究肝纤维化的病理评分系统不同,根据各标准具体要求(如表1所示)将评分标准更精确的划分为以下五个级别,即S0级-无纤维化、S1级-轻度肝纤维化、S2级-中度肝纤维化、S3级-重度肝纤维化、S4级-早期肝硬化。四格表参照下面的分类提取,S0级VS 1-4级(即≥S1级)记为G1、S0-1级 VS 2-4级(即≥S2级)记为G2、S0-2级VS 3-4级(即≥S3级)记为G3、S0-3级VS 4级(即≥S4级)记为G4。

1.4 文献质量评价使用QUADAS[4](见表2)对入选文献的各条目按“YES”、“NO”、“UNCLEAR”进行评价。文献如各项条目评价均为“YES”,则为A级文献,即出现偏倚的可能性极低;若其中任何一条或多条评价结果为“UNCLEAR”或“NO”,则分别为B级、C级文献,即出现偏倚的可能性较高。两个评价员独立评价,出现争议时协商解决。

1.5 诊断效能评价与统计分析通过四格表萃取灵敏度、特异度、诊断比值比(diagnostic odds ratio, DOR)来估算每个研究方法对各期肝纤维化评定。使用Meta-Disc软件(Version 1.4)合并灵敏度、特异度、诊断比值比、阴性似然比、阳性似然比、SROC曲线并计算曲线下面积。采用χ检验对四个分级组所纳入研究进行异质性分析,如P<0.05,表示差异有统计学意义。当I2≥50%时各研究间存在异质性,采用随机效应模型对准确度指标进行汇总分析;当I2<50%时各研究间不存在异质性,则采用固定效应模型对准确度指标进行汇总分析。所得数据的都均以95%可信区间(confidence interval,CI)表示。合并诊断比值比越大,表明诊断试验判别有无疾病的能力越强。

若存在明显异质性,则根据文献质量等级、样本量、试验类型、MR场强、b值进行Meta分析,探讨异质性来源。若因不同研究的方法学质量差距过大造成,则进行敏感性分析。通过计算灵敏度对数与(1-特异度)对数的Spearman相关系数,若四个分级组的P值<0.05,表明存在阈值效应,灵敏度和特异度呈阴性关联,反之不存在阈值效应。

2 结 果

2.1 文献筛选按照上述检索策略,共检索出文献259篇。将文献的引文格式导人Noteexpress2.0软件去重,经过2位研究者独立阅读摘要、全文后逐篇排除,最终有9篇英文和4篇中文文献共13篇文献[5-16]纳入研究,受试者总数目为809例(年龄范围为18~74岁,病因有乙型肝炎、丙型肝炎、酒精性肝炎、非酒精性肝炎等),13篇文献基本特征详见表3、4、5。其中有两个作者均有两篇文献纳入研究,经过两名研究员讨论之后认为是不重复的,因为他们的所用的机器及参数不同,所采纳的b值也不同。文献筛选流程图见图1。

所纳入的13项研究均可以萃取出真阳性值(TP)、假阳性值(FP)、真阴性值(TN)、假阴性值(FN),金标准均为病理诊断分级。其中有5篇报道了G1分级组的诊断价值,13篇报道了G2分级组的诊断价值,13篇报道了G3分级组的诊断价值,7篇报道了G4分级组的诊断价值。

2.2 质量评价13篇文献中,8篇为回顾性研究,5篇为前瞻性研究,在META回归分析异质性来源时,回顾性记为0,前瞻性记为1。质量评价结果在META回归分析异质性来源时A级记为3,B级记为2,C级记为1,详见表6。

评价文献变异来源的项目1、2中,项目1(疾病谱组成)中评价“YES”的文献占90%。项目2(选择标准)中评价“YES”的文献为100%。

评价偏倚的项目4、5、6、7、10、11、12、14中,项目5、6、7、10、11中评价为“YES”的文献均为100%,而项目4(疾病发展偏倚)、14(退出病例)中评价为“YES”的文献分别为60%、70%,评价为“UNCLEAR”的分别为40%、30%。

评价试验实施质量的项目8、9、13中,项目8(待评价的试验实施)中评价为“YES”的文献为100%。项目9(金标准的实施)评价为“YES”的文献为40%,评价为“UNCLEAR”的为60%。项目13(无法解释的试验结果)评价为“YES”的文献为50%,评价为“UNCLEAR”的为50%。

2.3 Meta分析结果

2.3.1 轻度肝纤维化(G1)组:五项研究之间诊断优势比(P=0.0000,I2=85.7%)、灵敏度(P=0.0020,I2=76.3%)、特异度(P=0.0007,I2=79.3%),5项研究间存在异质性。采用随机效应模型加权定量合并各诊断指标,结果显示:合并灵敏度为0.74(95%CI:0.67~0.79),合并特异度为0.74(95%CI:0.64~0.82),合并阳性似然比为3.39(95%CI: 1.17~9.83),合并阴性似然比为0.36(95%CI: 0.16~0.81),合并诊断比值比为11.01(95%CI: 2.11~57.84),SROC曲线下面积为0.8363,Q指数为0.7684,见图2。

2.3.2 中度肝纤维化(G2)组:十三项研究之间灵敏度(P=0.4591,I2=0.0%)、诊断优势比(P=0.0973,I2=35.7%)不存在异质性,特异度(P=0.0001,I2=70.4%)存在异质性,13项研究之间存在低度异质性。采用随机效应模型加权定量合并各诊断指标,结果显示:合并灵敏度为0.83(95%CI: 0.79~0.86),合并特异度为0.76(95%CI: 0.71~0.80),合并阳性似然比为3.33(95%CI: 2.44~4.55),合并阴性似然比为0.23(95%CI: 0.18~0.28),合并诊断比值比为15.72(95%CI: 11.08~22.32),SROC曲线下面积为0.8820,Q指数为0.8125,见图3。

2.3.3 重度肝纤维化(G3)组:十三项研究之间诊断优势比(P=0.0278,I2=47.8%)不存在异质性,灵敏度(P=0.0014, I2=66.7%)、特异度(P=0.0037, I2=63.1%)存在异质性,13项研究之间存在异质性。采用随机效应模型加权定量合并各诊断指标,结果显示:合并灵敏度为0.78(95%CI: 0.72~0.83),合并特异度为0.79(95%CI: 0.76~0.83),合并阳性似然比为3.63(95%CI: 3.03~4.34),合并阴性似然比为0.27(95%CI:0.18~0.40),合并诊断比值比为15.38(95%CI:8.76~27.00),SROC曲线下面积为0.8663,Q指数为0.7968,见图4。

2.3.4 早期肝硬化(G4)组:七项研究之间诊断优势比(P=0.8111,I2=0.0%)、灵敏度(P=0.2729,I2=20.5%)不存在异质性,特异度(p=0.0180, I2=70.2%)存在异质性,7项研究之间存在低度异质性。采用随机效应模型加权定量合并各诊断指标,结果显示:合并灵敏度为0.83(95%CI: 0.74~0.89),合并特异度为0.79(95%CI: 0.74~0.83),合并阳性似然比为3.50(95%CI: 2.79~4.38),合并阴性似然比为0.23(95%CI:0.15~0.36),合并诊断比值比为16.49(95%CI: 9.25~29.38),SROC曲线下面积为0.8719,Q指数为0.8024,见图5。

2.4 Meta回归分析与亚组分析计算灵敏度对数与(1-特异度)对数的Spearman相关系数,四种分级的p值均大于0.05,表明不存在阈值效应。因为所纳入的13篇文献的b值不一,在亚组分析时我们将其进行区间分组,分为以下三组:b值≤500 s/mm2、b值为600-800 s/mm2、b=1000 s/mm2。

2.4.1 轻度肝纤维化(G1)组:回归分析显示研究间异质性来源可能与场强(RDOR=1.03, P=0.56)、研究质量有关(RDOR=1.35,P=0.45)。将纳入评价为C级、场强为3.0T的研究排除,汇总分析结果未见明显差异。

2.4.2 中度肝纤维化(G2)组:回归分析显示研究间异质性来源可能与样本量(RDOR=1.35, P=0.59)、b值有关(RDOR=1.49, P=0.24)。将纳入样本量按<30、40、50逐一排除分析显示,合并分析结果未见明显改变。将b值≤500s/mm2、b值为600~800s/ mm2、b=1000s/mm2的文献分组分析SROC曲线分别为0.8089、0.9011、0.8935;合并灵敏度分别为0.78(95%CI: 0.68~0.85)、0.84(95%CI: 0.80~0.88)、0.83(95%CI: 0.73~0.89);合并特异度分别为0.69(95%CI: 0.58~0.79)、0.82(95%CI: 0.75~0.87)、0.71(95%CI: 0.62~0.79)。

表1 三种病理评分标准

表2 QUADAS条目

2.4.3 重度肝纤维化(G3)组:回归分析显示研究间异质性来源可能与样本量(RDOR=1.21, P=0.92)、b值有关(RDOR=2.12, P=0.07)。将纳入样本量按<30、40、50逐一排除分析显示,合并分析结果未见明显改变。将b值≤500s/mm2、b值为600-800s/ mm2、b=1000s/mm2的文献分组分析SROC曲线分别为0.8023、0.9033、0.8784;合并灵敏度分别为0.67(95%CI: 0.56~0.77)、0.87(95%CI: 0.77~0.94)、0.80(95%CI: 0.76~0.86);合并特异度分别为0.73(95%CI: 0.63~0.82)、0.83(95%CI: 0.78~0.87)、0.81(95%CI: 0.77~0.84)。

2.4.4 早期肝硬化(G4)组:回归分析显示研究间异质性来源可能与研究质量(RDOR=1.16, P=0.69)、b值有关(RDOR=1.04, P=0.96)。将纳入评价为C级的文献剔除,汇总分析结果未见明显变化。b值≤500s/mm2的文献量不足,无法分析。b值为600~800s/mm2、b=1000s/mm2的文献分组分析SROC曲线分别为0.9051、0.8491、合并灵敏度分别为0.84(95%CI:0.68~0.94)、0.76(95%CI:0.60~0.87);合并特异度分别为0.83(95%CI: 0.76~0.89)、0.77(95%CI: 0.70~0.83)。

表3 纳入研究的基本特征

表4 纳入研究基本特征(续)

表5 场强3.0 T研究基本特征

表6 纳入文献质量

3 讨 论

Meta分析是应用统计学方法对研究目的相同多个研究资料进行分析和概括,以提供量化的平均效果来回答研究的问题。其优点是通过增大样本含量来增加结论的可信度,解决研究结果的不一致性,通过绘制SROC曲线和曲线下面积(AUC)判断诊断效能[17]。

本项研究就DWI评估肝纤维化分级的文献进行合并分析,结果表明DWI对轻度肝纤维化(G1)组、明显肝纤维化(G2)组、严重肝纤维化(G3)组、早期肝硬化(G4)组的合并灵敏度和特异度较高。

部分学者的研究表明[18]DWI对≥F2、≥F3、≥F4期肝纤维化具有较高诊断效能,曲线下面积(AUC)均大于0.90。本研究中4个分级组的SROC曲线下面积分别为:0.8363、0.8820、0.8663和0.8719。说明DWI对肝纤维化分期较高的诊断效能,与他们提出的结论相一致。很多学者的研究结果并不支持上述结论,Boulanger等[19]认为ADC值的降低与纤维化分期无相关性,Koinuma等[20]也认为ADC值不是肝纤维化有意义的量化指标。研究结论的分歧可能与b值和样本量有关。b值选取较小(最大b值为250s/mm2),结果受微循环灌注影响较大。本文探讨异质性来源的时候发现,G2、G3、G4组的异质性来源与b值有关,且进行分组比较的结果显示当b值的范围在600-800s/mm2时,SROC曲线下面积均>0.90,DWI能够较好的评价肝纤维化分期,国内外多位学者[21-23]认为选取较大的b值可以减少灌注的影响。Boulanger等[19]的研究样本量只有18例,结果会产生偏移。

本研究中纳入文献的异质性还与所纳入研究的质量、所用机器场强、样本量有关,在亚组分析是,将逐个因素剔除,发现结果变化不大,说明纳入文献数据稳定性较好,但还是建议研究者严格根据STARD[24]的标准展开诊断性试验,临床提供高质量的研究结果。

由于Meta分析是对文献的二次研究,本研究结果受纳入文献的影响,没有ROC分析的文献未被纳入研究。对于b值,本文在异质性来源分析进行了区间分析,并没有对其进行确切值的分析,故没有判定最佳b值。

[1]Scheuer PJ,Standish RA, Dhillon AP. Scoring of chronic hepatitis[J].Clin Liver Dis, 2002,6(2):335-347.

[2] Batts KP,Ludwig J.Chronic hepatitis.An update on terminology and reporting[J]. American Journal of Surgical Pathology,1995,19(12):1409-1417.

[3]Bedossa P,Poynard T.An algorithm for the grading of activity in chronic hepatitis C.The Metavir Cooperative Study Group[J]. Hepatology,1996,24(2):289-293.

[4] Whiting P,Rutjes AWS,Reitsma JB,et al.The development of QUADAS:a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews[J].BMC Med Res Methodol,2003,3(3):25.

[5]Taouli B,Tolia AJ,Losada M,et al. Diffusion-weighted MRI for quantification of liver fibrosis:preliminary experience[J].American Journal of Roentgenology,2007,189(4): 799-806.

[6] Sandrasegaran K,Akisik FM,Lin C,et al.Value of diffusion-weighted MRI for assessing liver fibrosis and cirrhosis. American Journal of Roentgenology,2009,193(6): 1556-1560.

[7] Do RKG,Chandanara H,Felker E, Hajdu CH,Babb JS.Diagnosis of Liver Fibrosis and Cirrhosis With Diffusion-Weighted Imaging:Value of Normalized Apparent Diffusion CoefficientUsing the Spleen as Reference Organ[J].American Journal of Roentgenology,2010,195(3): 671-676.

[8] Taouli B,Chouli M,Martin AJ, et al.Chronic hepatitis: Role of diffusion-weighted imaging and diffusion tensor imaging for the diagnosis of liver fibrosis and inflammation[J].Journal of Magnetic Resonance Imaging, 2008,28(1):89-95.

[9] Fujimoto K,Tonan T,Azuma S,et al.Evaluation of the Mean and Entropy of Apparent Diffusion Coefficient Values in Chronic Hepatitis C:Correlation with Pathologic Fibrosis Stage and Inflammatory Activity Grade[J]. Radiology,2011,258(3):739-748.

[10]Wang Y,Ganger DR,Levitsky J, et al.Assessment of Chronic Hepatitis and Fibrosis: Comparison of MR Elastography and Diffusion-Weighted Imaging[J].American Journal of Roentgenology,2011,196(3): 553.

[11]Shi Y GQY,Liao W MY,Qi WX. MR diffusion weighted imaging for quantification of liver fibrosis in patients with chronic viral hepatitis[J].Chin J Radiol,2010,44(1):65-69.

[12]周梅玲,徐鹏举,沈继章,纪元.磁共振弥散加权成像评价肝纤维化的临床病理对照研究[J].中华医学杂志,2009,89(25):1757-1761.

[13]Cece H, Ercan A, Yildiz,et al.The use of DWI to assess spleen and liver quantitative ADC changes in the detection of liver fibrosis stages in chronic viral hepatitis[J]. European Journal of Radiology, 2013,82(8):307-312.

[14]崔恩铭,龙晚生,兰勇,等.多b值弥散加权成像评估肝纤维化程度[J].中国医学影像技术,2013,29(10): 1674-1678.

[15]石喻,张兰.3.0T MR弥散加权成像及张量成像评价肝纤维化的临床研究[J].中国医科大学学报,2012, 41(4):343-345.

[16]李新瑜,张雪林,熊伟.3.0T MR弥散加权成像评价肝纤维化的临床应用[J].实用放射学杂志,2010, 26(10):1465-1468.

[17]Hong Y,Shi Y,Liao W,et al. Relative ADC measurement for liver fibrosis diagnosis in chronic hepatitis B using spleen/renal cortex as the reference organs at 3T[J]. Clinical Radiology,2014,69(6): 581-588.

[18]杨克虎.系统评价指导手册.北京:人民卫生出版社,2010,179-213.

[19]Boulanger Y,Amara M,Lepanto L,et al.Diffusion-weighted MR imaging of the liver of hepatitis C patients[J].NMR Biomed,2003,16(3):132-136.

[20]Koinuma M,Ohashi I,Hanafusa K,et al.Apparent diffusion coefficient measurements with diffusion-weighted magnetic resonance imaging for evaluation of hepatic fibrosis [J].J Magn Reson Imaging,2005, 22(l):80-85.

[21]孙骏,施裕新,张志勇,等.肝纤维化磁共振ADC值与病理学分期的相关性研究[J].实用放射学杂志,2010, 26(11):1609-1612.

[22]Hsu FO,Chiou YY,Chen CY,et a1.Diffusion-weighted magnetic resonance imaging of the liver in hepatitis B patients with Child-Pugh a cirrhosis[J]. Kaohsiung J Med Sci,2007, 23(9):442-446.

[23]王秋实,郭启勇,梁长虹,等.MR弥散加权成像评价肝纤维化的初步实验研究[J].解剖学研究,2007,29(3): 212-216.

[24]Bossuyt PM,Reitsma JB,Bruns DE,et al.The STARD statement for reporting studies of diagnostic accuracy: explanation and laboration[J]. Clin Chem,2003,49(1):7-18.

图1 文献纳入流程图。图2 轻度肝纤维化(G1)组SROC曲线。图3 中度肝纤维化(G2)组SROC曲线。图4 重度肝纤维化(G3)组SROC曲线。图5 早期肝硬化(G4)组SROC曲线。

(本文编辑: 刘龙平)

Meta-analysis of Hepatic Fibrotic Magnetic Resonance Diffusion Weighted Imaging*

MA Wuyi, HUANG Rong, DENG Linbo, et al., Department of Radiology, Peking University Shenzhen Hospital, Shenzhen 518036, Guangdong Province, China

ObjectiveA meta-analysis was performed to assess the diagnostic efficiency of DWI (diffusion-weighted imaging) for hepatic fibrosis stage assessment with MR imaging.MethodsOnline journal databases had been searched. Diagnostic tests of DWI for hepatic fibrosis stage assessment were included. Liver fibrosis was categorized by redistribution into five stages according to the histopathological description by Metavir, Scheuer and Batts-Ludwig score system. The quality of these studies were evaluated according to the QUADAS (Quality assessment of diagnostic accuracy studies) items. The Meta-analysis and the SROC (Summary receiver operating characteristic) curve were performed by Meta-Disc. Results Thirteen studies were identified which met the criteria could perform a meta-analysis. There were 809 cases involved in this study. Meta-analysis showed high heterogeneities among these studies. The pooled sensitivity of G1, G2, G3, G4 hepatic fibrosis stages were 0.74, 0.83, 0.78 and 0.83 respectively. The pooled specificity were 0.74, 0.76, 0.79and 0.79 respectively. The AUCs of SROC were 0.8363, 0.8820, 0.8663 and 0.8719 respectively.ConclusionDWI has a high diagnostic efficiency for staging hepatic fibrosis.

Liver Cirrhosis; Meta-analysis; MR Imaging; Functional Magnetic Resonance Imaging; DWI; Diffusion-weighted Imaging

R322.4+7

A

深圳市战略新兴产业发展专项资金资助(JCYJ201208311 43255567和JCYJ2015040309 1443279)

10.3969/j.issn.1672-5131.2017.09.025

2017-08-17

黄 嵘

猜你喜欢
样本量灵敏度异质性
Meta分析中的异质性检验
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
样本量与东方蜜蜂微卫星DNA遗传多样性参数稳定性的关系
18F-FDG PET/CT代谢参数及代谢异质性与胃癌临床病理特征的相关性
城市规模与主观幸福感——基于认知主体异质性的视角
基于机电回路相关比灵敏度的机电振荡模式抑制方法
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
医学研究中样本量的选择
基于可持续发展的异质性债务治理与制度完善
Beta-blocker therapy in elderly patients with renal dysfunction and heart failure