基于深度学习的低剂量CT图像去噪

2022-05-31 07:34谢丰雪杨帆冯维曾雷雷缪月红雷平贵
中国医学物理学杂志 2022年5期
关键词:残差尺度卷积

谢丰雪,杨帆,冯维,曾雷雷,缪月红,雷平贵

1.贵州医科大学生物与工程学院,贵州贵阳 550025;2.贵州医科大学大健康学院,贵州贵阳 550025;3.贵州医科大学附属医院影像科,贵州贵阳 550004

前言

目前CT是临床上广泛使用的影像诊断设备,但检查过程中CT辐射会对患者的身体造成一定的伤害。因此,Naildich 等[1]提出应用低剂量CT(Low-Dose Computed Tomography,LDCT)作为肺癌高危人群的筛查,以减少辐射对人体的危害。另外在一项I类临床实验中证实采用LDCT为高危人群进行肺癌筛查可以将肺癌死亡率降低20%左右[2]。然而,临床上LDCT图像有明显的噪声、伪影以及对比度低等问题,这影响了医生的诊断,可能会造成误诊、错诊或漏诊[3-4]。为解决这些问题,有研究提出改善LDCT图像质量的方法,如惩罚加权最小二乘法(Penalized Weighted Least-Squares,PWLS)[5]、非局部均值(Non-Local Mean,NLM)滤波法[6]、局部自适应双边滤波算法[7]、弦图降噪算法[8]、基于稀疏表达的小波技术[9]等。虽然这些方法在一定程度上提高了CT图像质量,但对于复杂的医学图像,去噪效果还有待提高。近几年,深度学习方法广泛应用于医学图像的处理和分析[10-11],其中一些方法被用于CT图像的去噪,如Green等[12]提出一种局部一致性的非局部均值(Locally-Consistent Non-Local Means,LC-NLM)去噪算法,该方法可实现LDCT图像的降噪并保留图像的精细细节;Kuanar等[13]提出通过基于RegNet的自动编码器网络结构来消除CT图像的噪声;Heinrich等[14]运用XCAT软件来模拟LDCT噪声模型,并提出采用残差U-net 网络对LDCT 图像进行去噪;Baguer 等[15]和Leuschner等[16]分析和评估了不同深度学习方法对于LDCT图像去噪的表现。

LDCT 图像噪声复杂,以往深度学习方法基于单尺度的图像特征提取有限,图像去噪性能还需进一步提升。本研究在U-net 模型的基础上提出多尺度并行残差U-net(Multiscale Parallel Residual U-net,MPR U-net)的深度学习方法对LDCT 图像进行去噪,该方法采用多尺度结构进行不同尺度的特征提取,在上下采样路径使用残差结构,改善随着网络结构加深而梯度消失的问题,旨在去除图像噪声的同时尽可能保留LDCT图像信息。

1 材料与方法

1.1 数据集与预处理

1.1.1 数据集本研究的实验数据来自公开的LoDoPaB-CT 挑战赛数据库[17],该数据集包括752 名受试者标准剂量的CT图像和对应的模拟LDCT投影数据,各42 895 张。其中,标准剂量CT 图像来自于LIDC/IDRI 数据库[18]中正常剂量胸部CT 扫描;对应的模拟LDCT投影数据中添加的噪声为泊松噪声,用于模拟LDCT扫描时的噪声。

1.1.2 预处理将数据集划分为3个部分,其中训练集632名受试者,共35820张图像,验证集60名受试者,共3522张,测试集60名受试者,共3553张图像。对模拟LDCT投影数据采用滤波反投影重建算法(Filtered Back Projection,FBP)[19]进行重建,重建结果如图1所示。

图1 图像重建Figure 1 Image reconstruction

1.2 方法

1.2.1 模型结构本研究提出的MPR U-net 深度学习模型如图2 所示,其输入和输出图像尺寸均为128 像素×128 像素,该模型主要由多尺度并行模块、残差连接、上下采样路径组成。其中,多尺度并行模块如图3 所示,分别采用1×1、3×3、5×5的卷积核对输入图像进行卷积操作,不同的卷积核拥有不同的感受视野,可以帮助提取到不同程度的特征;残差连接包含3×3 卷积层(Convolution, Conv)、归一化层(Batch Normalization Layer, BN)[20]与线性整流激活函数(Rectified Linear Unit,ReLU)[21];下采样路径阶段采用最大值池化(2×2)进行下采样,上采样路径阶段采用步长为2,卷积核尺寸2×2的反卷积恢复图像尺寸。在上下采样路径之间使用4个跳跃连接,用于深层与浅层结构的特征信息传递。

图2 MPR U-net模型结构Figure 2 MPR U-net model architecture

图3 多尺度并行模块Figure 3 Multiscale parallel module

1.2.2 实施细节采用Matlab R2020b 深度学习工具箱,并使用4 块NVIDIA RTX 2080 Ti 显卡对所提出的模型进行训练。训练过程中,使用Adam(Adaptive moment Estimation)优化器对模型参数进行优化[22],网络初始学习率为0.001,BatchSize 为128,Epoch 为100,每个Epoch结束后随机打乱数据,并将学习率下降为原来的0.98倍。

1.2.3 评估方法采用峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)和结构相似性系数(Structural Similarity, SSIM)来评估模型的去噪效果。PSNR 主要用于评价实验结果与参考图像之间的质量好坏,PSNR 的值越大,实验结果图像的质量越高,公式如下所示:

其中,x为参考图像;为实验结果;L是图像的像素值取值范围,对于LoDoPaB-CT数据,L=1.0。SSIM主要用于评价实验结果与参考图像之间的结构相似程度,取值范围为0~1,值越大图像越相似,公式如下所示:

其中,M为样本数;uj分别表示参考图像x和实验结果的均值;σ2j、分别表示x、的方差;C1=(K1L)2,C2=(K2L)2是为了避免公式除零的两个常数,K1=0.01,K2= 0.03。

2 结果

2.1 去噪效果

本研究从测试结果中随机选取2 名受试者的部分图像展示去噪效果,图中红框区域显示了放大后图像的去噪表现,如图4所示。从图中可以看出相对于FBP,所提方法明显提升图像的质量,并去除大部分噪声,其结果与标准剂量图像相似。

2.2 评价指标结果

图4 FBP重建图像、标准图像和本文方法重建图像比较Figure 4 Comparison among images reconstructed by FBP,standard images and images obtained by the proposed method

运用PSNR与SSIM对测试集进行评估,表1为本研究所提的MPR U-net深度学习模型与FBP及其它深度学习方法的指标结果。与FBP比较,本研究提出的方法去噪效果提升明显,PSNR和SSIM均高于FBP。与U-net模型相比,所提的多尺度结构与残差连接相组合的方法可以进一步提升模型的去噪性能。同时与最新LDCT图像深度学习去噪方法Learned Primal-Dual[16,23]比较,虽然PSNR略低于该方法,但SSIM相较于该方法得到提升。主要原因在输入数据时采用多尺度的结构帮助提取了更多图像特征,更有利于恢复图像原本信息;另外该指标表明MPR U-net得到的结果与标准剂量图像最相似,因为SSIM越高,图像失真越小,越接近原始参考图像。然而本研究仅针对模拟的LDCT图像去噪,缺乏实际的LDCT扫描数据,后续研究需要采集更多的真实数据,进一步提升PSNR。

表1 不同方法的PSNR与SSIM比较Table 1 Comparison of PSNR and SSIM among different methods

3 讨论

LDCT 图像去噪的重点在于去除噪声的同时保留有用的临床诊断信息。本研究提出MPR U-net 深度学习模型对LDCT图像进行去噪,相较传统去噪算法,能有效去除噪声并保留图像细节,在测试集上PSNR 和SSIM 分别达到38.22 dB 和0.966,平均处理时间只需0.03 s,其中SSIM 高于最新深度学习方法(Learned Primal-Dual)。

LDCT 图像的噪声出现位置与程度不确定,采用单尺度的特征提取方式不能有效获取图像的全部特征,因此本研究在U-net 深度学习模型基础上引入多尺度并行特征提取模块加大网络的感受野,获取更多图像特征信息,并利用跳跃连接方式传递特征信息,减少输入与输出之间特征图的差异,提升模型的去噪性能。另外通过残差连接让浅层特征输出直接参与到深层特征输入中,改善随着网络层数加深带来的梯度消失问题,进一步提升网络性能。

4 结论

本研究针对LDCT图像,提出MPR U-net深度学习模型对其去噪。该模型融入多尺度并行残差结构,相较传统方法有较高的PSNR与SSIM。与最新深度学习方法相比具有更高的SSIM,在去除噪声的同时具有更高的结构相似性。未来研究中,将继续对模型结构进行优化,收集更多真实的LDCT数据,进一步提升LDCT图像的质量,帮助医生更准确地诊断疾病。

猜你喜欢
残差尺度卷积
基于全卷积神经网络的猪背膘厚快速准确测定
环境史衰败论叙事的正误及其评判尺度
基于残差-注意力和LSTM的心律失常心拍分类方法研究
用于处理不努力作答的标准化残差系列方法和混合多层模型法的比较*
融合上下文的残差门卷积实体抽取
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
基于深度残差网络图像分类算法研究综述①
以长时间尺度看世界