丁亚,王韦刚△,涂真珍,许晨东
(1.南京邮电大学 电子与光学工程学院 微电子学院,南京 210023;2.南京邮电大学 材料科学与工程学院,南京 210023)
电阻抗成像(electrical impedance tomography, EIT)是一种非侵入性技术,主要用于生物医学成像中的活体组织可视化[1-2]。在电阻抗成像中,先在生物体周围附着电极片,并施加安全电流,然后将电极上的电压记录下来,用于重建生物组织或器官的电导率。EIT技术也被广泛应用于工业过程成像、材料无损检测、地球物理勘探等[3-6]。在生物医学应用方面,它在胸部成像、肺通气监测、肿瘤检测和脑功能等方面显示出巨大的潜力[7-12]。尽管电阻抗成像技术无辐射、低成本且便携,但由于其非线性和高度不适定的特性及对测量噪声和建模误差的敏感性,导致从电流/电压测量数据到形成电阻抗成像图像是一个具有挑战性的逆问题[13-15]。
在解决EIT逆问题的方法中,迭代优化方法通常用于解决具有正则化的问题。例如,基于全变分的算法[16]、基于边界元的方法[17]、变量约束的数值方法[18]、以及基于子空间的优化方法[19]。除了迭代方法之外,还有一些非迭代方法被用来解决EIT逆问题,如因式分解法[20]、D-bar算法[21]、截断奇异值分解法 (truncated singular value decomposition,TSVD)[22]。使用正则化的迭代方法在重建质量方面表现良好,但是通常其计算成本较高、受测量噪声和建模误差的影响较大[23-24]。相反,非迭代方法通常比迭代方法快,但是图像质量较差。此外,无论是迭代方法还是非迭代方法,重建图像的空间分辨率都受到EIT问题的不适定性和非线性的严重限制,阻碍了其临床应用的发展。最近,深度学习由于为图像分类[25]、目标检测[26]和分割[27]提供了良好的结果,而引起了广泛关注。具有回归特征的神经网络也在逆问题上提供了有效的解决方法,例如信号去噪[28]、反卷积[29]、插值[30]和解决不适定线性反演问题[31]。
在图像重建领域已经证明了深度学习和神经网络具有改善低质量或有损图像的能力。尤其是将快速直接重建过程与深度神经网络相结合,可以提供低延迟的高质量图像,从而在许多应用中实现预期的实时成像。卷积神经网络(CNN)特别适用于基于非迭代算法的初始重建的后续处理,由于某种低通滤波和欠采样,这种初始重建通常会损失较多的分辨率,以及出现较多的伪影。目前,已经针对医学成像中的几个线性逆问题,包括CT[32],MRI[33]和PAT[34],研究了通过训练CNN来去除这些伪影,以改善重建图像信息内容的方法。
在已有研究的基础上,本研究提出了一种深度卷积神经网络O-Net以及相应的解决电阻抗成像问题的方法。
EIT逆问题的求解算法是以正问题的求解为基础的,因此,合理的正问题求解方法尤为重要。
EIT的正问题是如何在已知电导率分布σ和边界条件的情况下,计算电势分布,并从电势分布中提取边界电压U。边界电压与电场中电导率分布的关系为
Sσ=U
其中,S为灵敏度矩阵。
解决正问题的方法大致可分为解析计算方法和数值分析方法。通过解析计算,可以根据实测场建立的数学模型,推导出电势分布的解析表达式。然后根据解析表达式计算出被测场的边界电压,但该方法仅适用于场域形状规则、电导率分布均匀的情况。因此,常采用数值分析方法来解决正问题。
数值分析包括差分法、有限元法、边界元法等。有限元法是将一个区域划分为有限元计算。利用该方法,可以不受场的形状和分布的限制而对敏感场进行分析。这是目前最常用的解决电阻抗成像正问题的方法。
EIT逆问题是一个典型的数学物理逆问题,即如何在已知边界电压U和边界条件的情况下,求解测量场的电导率分布σ。在解决逆问题的非迭代算法中,因为TSVD方法的适应性较强,同时可以有效地降低计算的复杂度,所以本研究采用TSVD方法进行EIT的初始重建。
对于非线性逆问题,可以先用分段线性化,再用奇异值分解(SVD)进行分析。逆问题的最小二乘解表示为:
σ=argmin‖Sσ-U‖2
矩阵S的奇异值分解为:
(3)
其中λi是矩阵S的特征值,ui和vi是特征向量,u=(u1,u2,…,uD)∈RD×D和v=(v1,v2,…,vM)∈RM×M是由特征向量组成的正交矩阵。∑是由特征值组成的对角矩阵,可以表示为:
(4)
其中q=min(D,M),λ1≥λ2≥…≥λq≥0。如果矩阵S的秩为r,且r EIT的线性逆问题可表示为: STSσ=STU (5) 等式两边同时乘以(STS)-1得: σ=S+U (6) 其中S+=(STS)-1ST是矩阵S的广义逆。 将式(3)带入式(6), 可以得到: (7) 由式(7)可知,如果λi很小, 那么1/λi会很大,将会导致小的噪声被放大,造成很大的重构误差,使得该逆问题的解变得很不稳定。 为了解决上述问题,本研究采用截断奇异值分解方法。如果λm(1≤m≤r)大于设定的测量精度μ, 则λi(i=1,2,…,m)就会被保留。因此,电导率的解为: (8) 将上述方法求得的电导率放入计算机中生成图像,得到初始重建结果,并将其作为深度学习网络的输入。 本研究的目的是为了减少电阻抗成像逆问题不适定性的影响,产生清晰、准确的电阻抗成像图像。将章节1中的TSVD方法与CNN相结合,并将TSVD的计算结果以图像的形式作为神经网络的输入。在诸多CNN网络构架中,本研究选择U-Net结构作为基础框架。U-Net结构最初是为图像分割而开发的,而文献[32-34]已经表明,对于线性逆问题,这种特殊的网络结构可以被修改以成功地去除医学图像重建中的伪影。基本方法是使用快速简单的重建算法来获得低质量的图像,然后训练网络来消除这些误差。因此,U-Net结构非常适应于EIT成像。 U-Net结构由收缩路径和扩张路径组成。收缩路径遵循典型的卷积网络架构。它包括3*3卷积、2*2最大池和整流线性单元(ReLU)。 (9) 在每个下采样步骤中,特征通道的数量将增加一倍。扩展路径类似于收缩路径,但收缩路径中的最大池被扩展路径中的3*3上卷积所取代。在扩展路径中,还会与收缩路径中相应的裁剪后的特征图进行跳层连接。 本研究对U-Net结构作了以下改进以解决EIT问题(见图1): 图1 O-Net网络结构Fig.1 O-Net network structure 在神经网络的输入层和输出层添加了一个跳层连接。虽然输入图像存在一定的误差,但仍然包含大量的特征信息,通过此连接可以使得神经网络直接提取输入的特征信息以及计算出与输出之间的差异,同时也避免了神经网络学习已经包含在输入中的丰富特征信息。 在输入与输出连接之后加入了1*1卷积,为神经网络学习输入图像的特征信息提供了一个权重选择,使网络可以自适应地调整对输入图像特征信息的提取程度,避免因输入图像误差过大而导致网络学习更复杂、输出结果与预期结果误差增大,增加了网络的灵活性和适应性。 在神经网络的输入与输出连接之前,对输入图像进行稀疏表示。由于输入图像具有稀疏性,稀疏表示能够减少输入图像中存在的计算误差和噪声信息,使得输出能够从输入图像中提取更多、更准确的特征信息。 稀疏表示的示意图见图2。对于初始重建结果σ∈RN,给定字典D,通过稀疏编码得到稀疏系数α,在重建过程中,利用字典D和稀疏向量α相乘即可用来表示初始重建结果,信号σ的稀疏表示模型为σ=Dα。 图2 稀疏表示示意图Fig.2 Schematic diagram of sparse representation 本研究采用一种随机椭圆数据集(RED)[35]构建心脏和肺部模型。RED由四个具有随机大小和电导率的椭圆组成,分别标记为E1、E2、E3和E4,见图3。四个椭圆可相互交错,后一个椭圆中的电导率将取代之前生成的椭圆的电导率,即若E4与E1交错,E4的电导率将取代与E1重叠部分的电导率。图3中,允许E1和E2在[-15°,15°]范围内以随机角度旋转,并且在规定范围内随机选择其电导率,用于模拟肺部。在RED中,E3用于模拟心脏,而E4用于模拟肺部中可能存在的病理部分。 图3 随机椭圆数据集示意图Fig.3 Schematic diagram of random elliptic dataset 训练步骤如下: 步骤1:对输入图像进行三次卷积核大小为3*3的卷积操作,卷积方式为same。然后进行最大池化操作。 步骤2:对步骤1中池化后的特征图像再次进行2次卷积核大小为3*3的卷积和一次最大池化操作,然后重复2次上述操作。 步骤3:对步骤2处理后的特征图像进行卷积核大小为3*3的反卷积,并与步骤2中对应通道数的特征图进行拼接,然后进行2次卷积核大小为3*3的卷积操作。之后重复3次上述操作。 步骤4:输入图像进行稀疏表示后,与步骤3的处理结果拼接,然后进行卷积核大小为1*1的卷积操作。 步骤5:计算步骤4的结果与预期输出的损失,然后进行反向传播,更新卷积核参数使损失变小。 步骤6:重复步骤1-5,直到达到指定训练次数或者损失降到指定值以下。 在本研究网络训练中,采用的损失函数为欧几里得损失函数。即当网络输入为σ,输出为σ*时,损失函数为: (10) 本实验是在模拟数据的基础上进行的。测量域为模拟人体胸腔的2D模型,最大长度和最大高度均为300,即x,y轴都为[-150,150]。设置该测量域的电导率为1 S/m,并将其剖分为3 136个单元格,图4展示了剖分为256个单元的模型,本研究的剖分方式与之相同。 图4 胸腔模型剖分示意图Fig.4 Schematic diagram of thoracic cavity model subdivision 本研究使用RED生成了1 000张具有随机电导率的随机椭圆组成的图像,其中800张用于网络的训练,200张用于训练后的测试。以图3为例,每张图像中E1、E2为模拟肺部的模型,中心点分别为[-75,0]、[75,0],短轴(平行于x轴)均为35,长轴(平行于y轴)均为60,并且椭圆会在[-15°,15°]范围内以随机角度旋转,其电导率在[1.4,1.5]范围内随机选择。E3为模拟心脏的模型,中心点为[0,60],短轴和长轴均在[25,35]范围内随机选择,电导率的选择范围为[1.9,2]。E4模拟肺部可能存在的病变,其中心点会在E1、E2内部的随机位置出现,长轴和短轴将在[20,30]范围内随机选择,电导率的选择范围为[1.8,2]。 上述方法生成的图像将通过第1节中的TSVD初始重建方法得到初始电导率分布。为了便于网络的训练和测试,本研究将初始电导率分布转换为64×64大小的图像作为网络的输入。 在Google Colab的GPU上用800张图像分别在U-Net网络和O-Net网络上进行训练,用200张图像进行测试。训练次数(Epoch)为50次,学习率为10-4,O-Net的平均训练时间约为0.5 h,U-Net的平均训练时间约为0.8 h。实验结果见表1。 表1 U-Net与O-Net方法的数值结果Table 1 Numerical results of U-Net and O-Net methods 表1中,“损失”为式(10)的计算结果,“精确度”表示神经网络实际输出图像的像素中与预期结果相同的像素所占的比例。由表1可知,本研究提出的O-Net方法的精确度相比于U-Net方法略有提升,同时损失也有所下降。同时,采用了SPSS 20.0软件进行相应的统计学分析,P<0.05具有统计学意义。 为了更好地展示实验结果,本研究通过RED方法创建3张图像作为实验样本,实验结果见图5。 图5 胸腔模型的成像结果Fig.5 Imaging results of thoracic cavity model 由图5可知,对于心脏和肺部模型,U-Net方法和O-Net方法都能准确地重建。然而,U-Net的成像结果中,M1模型的病变部分有明显的缺口,M2模型的右肺出现多余的病变信息,而且病变体的形状明显变形,M3模型的病变形状也存在误差。因此,对于肺部的病变部分,O-Net方法的成像效果要优于U-Net。 为了更直观地表现两种方法重建结果的差异,本研究引入结构相似性指数(structural similarity indices, SSIM)[36],来衡量重建结果与标准图像之间的相似度。O-Net方法的SSIM要高于U-Net方法的SSIM,见图6。 图6 U-Net和O-Net的结构相似性指数Fig.6 Structural similarity indices of U-Net and O-Net 由于实际测量电压的过程中,不可避免地会引入噪声信号,因此,本研究对O-Net方法进行了抗噪声的鲁棒性测试。对模型M4的测量电压分别加入1% (SNR = 40 dB)和3% (SNR = 30 dB)的高斯噪声。实验模型M4见图7,实验结果见图8。 图7 实验模型M4Fig.7 Experimental model M4 由图8可知,当噪声为1%时,两种方法都能使重建图像达到预期效果,而当噪声达到3%时,U-Net方法的重建结果出现了明显的变形。为了进一步定量评估噪声干扰对本研究方法的影响,实验模型M4随不同噪声水平变化的SSIM变化曲线,见图9。O-Net方法的SSIM始终高于U-Net方法的SSIM,而且随着噪声水平的提高,两者的SSIM差距也越大,充分验证了本研究方法在抗噪干扰能力方面的优越性。 图8 不同噪声水平下M4的重建结果Fig.8 Reconstruction results of M4 with different noise levels 图9 模型M4重建结果的SSIM与噪声的关系曲线Fig.9 The relation curve between SSIM and noise of reconstruction results of M4 上述鲁棒性实验是针对测量电压添加的噪声干扰,然而本研究采用的TSVD初始重建方法在抗噪声干扰方面表现不足,未完全体现出本研究O-Net神经网络的抗噪声干扰能力。因此,为了进一步展示O-Net神经网络的抗噪声能力,对模型M4的初始重建结果即神经网络的输入添加高斯噪声并进行实验。试验中所添加的高斯噪声分别为2% (SNR=34 dB),4% (SNR=28 dB)和8% (SNR=22 dB)。 由图10可知,当噪声为2%时,两种网络的输出图像准确性都很高。当噪声达到4%时,O-Net网络的输出变化并不明显,而U-Net网络的输出图像中已经出现了图像变形、边缘模糊的现象。当噪声高达8%时,O-Net网络的输出仅在部分区域有轻微变形现象,U-Net网络的输出图像中,肺部的旋转角度变化很大,各个部分的形状和边缘出现严重变形。 对O-Net和U-Net网络的抗噪能力进行定量评估,输出图像的SSIM随噪声的变化曲线见图11。O-Net网络对应的曲线随噪声的增加变化得较为平缓,直到噪声为10%时才明显下降。而U-Net网络对应的曲线呈斜坡式下降,与O-Net对应曲线的间距也越来越大,在噪声为8%时达到最大。图10和图11表明,本研究提出的O-Net网络性能要优于U-Net网络。 图10 不同噪声水平下两种不同网络的输出结果Fig.10 Output results of two different networks with different noise levels 图11 两种不同网络的SSIM与噪声的关系曲线Fig.11 Relation curve between SSIM and noise of two different networks 本研究改进了U-Net神经网络的结构,对神经网络的输入和输出添加了跳层连接。未直接使用测量得到的边界电压数据作为神经网络的输入,而是先通过TSVD算法将电压数据转化为电导率图像,再将此图像作为神经网络的输入。利用EIT图像的稀疏性,在O-Net网络的输入与输出进行连接之前对输入图像进行稀疏表示,减少输入图像中存在的噪声和计算误差,使得O-Net网络的输出通过跳层连接提取输入特征信息时能够得到更加准确的特征信息。在RED生成的数据集下,相较于U-Net方法,本研究提出的O-Net方法的训练集精确度提高了约1.22%,损失降低了约25.2%;测试集精确度提高了约1.24%,损失降低了约13.7%。 无论是对测量电压还是网络输入添加噪声,O-Net网络的重建结果在视觉图像上和数值结果上都优于U-Net网络。证明了网络中的稀疏处理部分起到了很好的去噪作用,输入与输出的跳层连接也增加了网络的适应性。需要说明的是,在测量电压含有较大噪声时,由于初始重建使用的TSVD方法抗噪声能力有限,导致网络的输入和输出受噪声影响较大,但同时初始重建也减轻了神经网络的计算负担,减少了病态性逆问题的影响。在后续的研究中,将进一步优化初始重建方法。2 基于O-Net的EIT重建方法
2.1 U-Net网络结构
2.2 改进的O-Net网络结构
2.3 网络训练
3 实验结果与分析
3.1 实验参数
3.2 实验结果与分析
3.3 O-Net网络的性能分析
4 结束语