朱桂娟,张鑫,叶晓航,李锋
淮安市第四人民医院 影像科,江苏 淮安 223000
肝纤维化是慢性肝炎发展过程中最常见的病理变化,是肝硬化最终发展的基础和必要阶段。研究表明,肝纤维化的病理损害过程是可逆的[1-2],因此,肝纤维化的早期诊断和早期干预尤为重要。肝活检病理是诊断肝纤维化的“金标准”[3],但肝活检是一种侵入性手术,存在一定的临床并发症和医疗风险,也影响了患者的接受度。目前诊断肝纤维化的影像学方法主要有超声、CT和MRI。MRI在诊断和评估肝纤维化方面具有独特的潜力和优势。弥散加权成像(Diffusion Weighted Imaging,DWI)可用于检测活组织中水分子的布朗运动[4-5],这使得它可以安全无创地诊断肝纤维化。
2006年,Hinton等[6]提出了深度学习的概念,它起源于人工神经网络的研究。Chen等[7]提出了一种新的卷积神经网络(Convolutional Neural Network,CNN)架构,称为密集资源-感应网络,以改进卷积层进行学习医学图像的特征。Gu等[8]提出了一种基于注意力的综合CNN,可以同时感知最重要的空间位置、通道和尺度,从而实现更准确和可解释的医学图像分割。因此,基于深度学习的计算机辅助诊断系统已经开发医学成像(非自然图像)领域,目前,人工智能技术评估肝纤维化是肝纤维化研究方向的热点,但将人工智能应用于 MRI表观弥散系数(Apparent Diffusion Coefficient,ADC)图像诊断肝纤维化的研究相对较少。基于此,本文拟采用基于深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的肝纤维化自动检测方法对123例经病理确诊的肝纤维化患者的ADC图像进行分析,旨在评估ADC图像特征与肝纤维化程度的关系。
回顾性分析123例慢性乙型肝炎患者的磁共振ADC图像,123例患者肝纤维化分级经肝穿刺病理证实。由具有20多年从业经验的病理学主任医师阅读所有标本,肝硬化患者的分级采用国际METAVIR方法[9],确定了5组肝纤维化阶段(F0~F4),其中F0表示无肝纤维化,F1表示轻度肝纤维化,F2表示明显肝纤维化或肝纤维化,F3表示晚期肝纤维化,F4表示肝硬化。F0期12例,男6例、女6例,年龄24~56岁,平均(41.00±11.68)岁;F1期26例,男13例、女13例,年龄22-64岁,平均(42.00±10.91)岁;F2期20例,男12例、女8例,年龄24~71岁,平均(44.20±11.40)岁;F3期26例,男17例、女9例,年龄30~70岁,平均(45.42±10.18)岁;F4期39例,男20例、女19例,年龄21~72岁,平均(50.08±10.97)岁。本文使用二元分类的方法,其中F0、F1纳为一组为阴性,F2、F3、F4纳为一组为阳性。本研究已获得淮安市第四人民医院伦理委员会批准(批号 :2020011)。
1.2.1 肝穿刺组织学检查
穿刺的位置和深度由彩色多普勒超声确定(肝右叶,远离大血管)。首先常规皮肤消毒,局部麻醉,嘱患者屏气后,用16G肝穿刺针(Rraun,德国)负压抽吸肝组织(样本长15~25 mm);然后用4%甲醛固定,石蜡包埋,连续切片,HE和Masson染色;最后在多视场光学显微镜(奥林巴斯CX31,日本)下观察。
1.2.2 MRI检查
所有受试者均进行了上腹部MRI扫描和DWI检查,检查前禁食6 h以上并进行呼吸训练。MRI检查设备选用GE MR3551.5T超导MRI系统。患者取足先进、仰卧位、八通道相控阵体线圈,先行常规MRI扫描,扫描范围为膈肌顶部至肝下缘。DWI采用单次平面回波成像序列,扫描参数为:TE 61.8 ms,TR 9230.8 ms,矩阵256×256,切片厚度6.0 mm,间隔1.5 mm,信号激励数2次,b值为800 s/mm2。
1.2.3 磁共振的ADC值测量
在ADC图像中不同层面上随机绘制3个感兴趣区域(Region of Interest,ROI)。ROI的大小约为 100 mm2。ROI的选择应避开肺门和第二肺门的大血管。测量由2名副主任医师同时进行,结果协商一致,最后测得3个ADC值,并计算平均值。
1.2.4 DCNN结构方法
本文主要提出了一种5层DCNN结构,用于慢性乙型肝炎肝纤维化的自动分类。神经网络自提出以来,一直被研究人员不断的优化和深化[10-13]。本文提出的5层DCNN结构由输入层、3个卷积层、3个池化层、2个全连接层和输出层组成,见图1。
图1 5层DCNN流程图
(1)卷积:卷积层是DCNN的重要组成部分之一。在 DCNN中,卷积层为3D输入和3D滤波器实现了2D卷积,因为输入和滤波器的通道是相同的[14]。在DCNN中,卷积层的工作原理是过滤器扫描输入进行卷积运算,提取特征[15]。由于卷积具有“权重共享”的特性,可以降低计算成本,防止参数过多导致的过拟合。
如图2所示,输入矩阵大小为4×4,滤波器矩阵大小为3×3,输出矩阵大小为2×2。假设输入大小为Wk×Hk×Dk过滤器的数量一般是不确定的。研究人员通常根据经验确定过滤器的数量。输出计算如公式(1)~(3)所示。卷积层的流程图如图3所示。
图2 卷积操作
图3 卷积层流程图
式中,Wk代表输入的宽度,Hk代表输入的高度,Dk代表输入的深度,Fw代表滤波器的宽度,Fh代表滤波器的高度,Fd代表滤波器的深度,B代表填充,Q代表步幅,M代表滤波器个数。输出的大小为Wk+1×Hk+1×Dk+1。
(2)汇集:在深度卷积神经网络中,通常在1层或多层卷积层之后加入池化层。池化层操作不需要特定的内核。池化层有2个优点:① 有助于获得平移不变性;② 降低维度以减少计算量[16]。通常使用2个池化层:最大池化和平均池化。如图4a所示,在池区域内选择最大值的最大池化。池化层的宽度和高度将降低1/2,步幅为2。池化操作的输出是一个2×2的矩阵,而输入是一个4×4的矩阵。池化操作使得输入尺寸的维度大大减小。如图4b所示,平均池化的工作原理与最大池化类似,只是用平均值代替了最大值。
图4 池化层
假设给定一个矩形区域Rij,其中i为行数,j为列数。最大池化计算方式如公式(4)所示,平均池化计算方式如公式(5)所示。
式中,mij表示通过矩形区域Rij最大池化的输出值,xpq表示矩形区域Rij中(p,q)处的元素。
式中,aij表示通过矩形区域Rij平均池化的输出值,xpq表示矩形区域Rij中(p,q)处的元素,|Rij|表示矩形区域Rij中的元素个数。
对123例患者图片利用5层DCNN结构建立了肝纤维化自动诊断模型。卷积层、池化层、激活层和全连接层构成了DCNN的框架,见表1。每个卷积层都与一个池化层相连。每个卷积层都有不同数量的卷积核。第一个卷积层有32个卷积核,第二个卷积层有64个卷积核,第三个卷积层有96个卷积内核。每个卷积层的卷积核为3×3。3次卷积后和池化计算,参数为24576(16×16×96),第一个完全的参数连接层到第二层为24576×300,第二个全连接层的输出是300×2。DCNN结构流程图如图5所示。
表1 DCNN结构流程图
图5 DCNN流程图
1.2.5 统计学分析
使用SPSS 23.0进行统计学分析,计量资料以±s表示,采用t检验;使用Microsoft Visio 2013绘图软件。十折交叉验证方法是一种通过“交叉”(将原始数据拆分为多种不同的数据组合)来“验证”(准确度评估:损失函数、方差、偏差)模型对象的处理工具,主要是对原始数据进行分组。
基于DCNN采集ADC图像的准确度、敏感度、特异性、精密度、F1、马修斯相关系数(Matthews Correlation Coefficient,MCC)和福尔克斯–马洛斯指数(Fowlkes–Mallows Index,FMI)分别为88.13%±1.47%、81.45%±3.69%、91.12%±1.72%、80.49%±2.94%、80.90%±2.39%、72.36%±3.39%、80.94%±2.37%,见表2。MRI测得图像ADC值的准确度、敏感度、特异性、精密度、F1、MCC和FMI分别为75.07%±13.35%、90.03%±9.24%、42.67%±35.42%、78.44%±11.42%、83.30%±8.18%、16.00%±60.46%、83.77%±7.98%,见表3。基于DCNN采集ADC图像的准确度、特异性、MCC均显著高于MRI测得ADC值结果,敏感度显著低于MRI测得ADC值结果,DCNN采集ADC图像的准确度、敏感度、特异性、MCC与MRI测得ADC值比较差异有统计学意义(t=3.075、-2.727、4.320、2.943,P=0.007、0.014、<0.001、0.009);基于DCNN采集ADC图像的精密度、F1、FMI与MRI测得图像ADC值比较差异无统计学意义(t=0.550、-0.892、-1.075,P=0.589、0.384、0.297)。
表2 基于DCNN ADC图像自动检测结果(%)
表3 MRI测得ADC值结果(%)
肝纤维化是肝炎发展过程中常见的病理变化,随着技术的逐渐成熟,尤其是近年来肝脏的研究和应用[17],MRI DWI可以通过水分子的微观条件判断人体组织的生理病理特征[18]。正常肝细胞形态和排列规则有序,实质细胞和细胞基质稳定。当慢性肝病患者发生肝纤维化时,肝脏内的纤维细胞增殖,胶原纤维沉积在肝脏的细胞间质中,水分子的活性受到限制,导致病变组织的ADC值降低[19-21]。对于较严重的肝纤维化病变,ADC值可以更准确地诊断,但在最初的肝纤维化病变中,ADC值的敏感度较低,可能与病变早期的肝内细胞外基质沉积及胶原纤维分布较少、对水分子运动的限制不足有关。
深度学习是人工智能领域的重要突破[22-26],在放射学领域,尤其是在肿瘤的影像诊断方面优势明显[27]。它在提取成像数据和图像分析、提取图像特征(包括形状和空间关系特征)方面得到发展,具有提取小特征的潜力。基于MRI的深度学习模型在肝纤维化分期方面也显示出优势。Yasaka等[27]使用增强MRI肝胆成像构建深度学习模型,对肝纤维化分期具有较高的诊断价值。本研究提出了一种用于肝纤维化自动诊断的5层DCNN结构,其准确度高于MRI工作站测量的ADC值的准确度,说明CNN自动检测方法在肝纤维化分期中具有较高的诊断价值。分析原因为MRI工作站测得的ADC值即是图片上勾画ROI内像素均值,而DCNN自动检测是提取图片的成像数据和图像分析、图像特征,所以获得图片信息高于ADC值。另外,MRI工作站测得的ADC值是需要在图片上勾画ROI,而ROI面积较小,需要在每个图片上测量较多ADC值,并且要测量所有图片,这显著增加了医师工作量及工作时间,此外,不同的医师技能水平不同,可能会受到主观因素的影响,误测位置进而影响诊断,而人工智能自动检测所有图片,这可以大大减少医师工作量及工作时间,通过对比得出DCNN可以更准确地得到结果,即DCNN可以作为一种辅助手段对慢性乙型肝炎肝纤维化进行诊断。
本研究存在以下不足之处:① 训练数据集较小,随着病例数的增加和训练量的增加,系统的性能会达到更高的准确度;② 本研究收集的数据来自同一家医院,可能存在数据偏倚,未来需收集来自不同中心的其他 MRI检查,以评估此测试的效率。
DCNN自动检测方法在慢性乙型肝炎肝纤维化分期中具有较高的诊断价值,自动检测方法的准确度优于MRI测量的ADC值,可以更全面、深入地分析图像特征,减少人工诊断主观性带来的误差,进一步提高肝纤维化早期诊断的准确性,有望成为一种诊断监测肝纤维化和评估患者预后的有效方法,为临床治疗提供重要依据。