利用GDL残差U-net模型分割放疗定位CT图像上甲状腺的初步研究

2022-09-21 06:52:56文晓博袁美芳孙梦真李进芝

中国医学计算机成像杂志 2022年3期

文晓博赵彪袁美芳孙梦真李进芝杨毅

在全球癌症数据统计中，乳腺癌和鼻咽癌发病率和死亡率均处于较高水平［1］。在目前的临床治疗中，放射治疗是治疗乳腺癌与鼻咽癌不可或缺的部分［2-3］。乳腺癌和鼻咽癌放射治疗过程中，甲状腺的解剖学结构使其不可避免地受到剂量照射。有研究［4-5］表明，当甲状腺受照剂量超过26 Gy，会发生甲状腺功能衰退，辐射剂量与甲状腺功能衰退之间存在显著相关性。因此，制订放射治疗计划时，须将甲状腺作为危及器官（organs at risk，OARs）加以保护。在目前的临床工作中，OARs的勾画主要由医师手动勾画，这种勾画方式会受到医师主观性和经验的影响，因而使甲状腺的受照剂量存在差异。自动勾画不仅能避免主观性的影响，而且效率更高。基于图谱的自动分割方式（atlas-based auto segmentation，ABAS）是医学分割中较为常用的一种分割的方式。蒋晓芹等［6］使用ABAS对鼻咽癌危及器官的勾画结果显示，大部分危及器官的相似度系数在0.9以上，基本可以满足临床要求。但ABAS的分割方式在解剖学结构差异较大的情况下并不能够得到较好的结果。随着人工智能的发展，深度学习的自动分割逐渐应用于医学领域［7-8］。Ronneberger等［9］在2015年提出的U-net神经网络模型是目前医学图像分割领域中最常用的模型。在甲状腺的分割研究中，大多数是在超声图像上对甲状腺结节进行诊断和分割，在放射治疗大孔径模拟定位CT上甲状腺分割的研究却少有报道。大孔径CT由于其孔径大、排数小、图像像素相对较差，需要进一步研究来观察深度学习的分割效果。基于Dice损失函数的U-net模型（DLU-net）和基于广义Dice损失函数（generalized Dice loss，GDL）的U-net模型（GDLU-net）在放疗定位CT图像上分割甲状腺的结果，虽然能够基本满足临床需求，但仍存在部分过、欠分割现象［8］。

本研究改进了一种深度学习模型，基于GDL残差的U-net模型（GDLResU-net），并在放疗定位CT上进行了甲状腺分割研究，以期为放疗甲状腺危及器官的勾画提供帮助。其创新点在于：①将残差连接（residual connection，RC）和归一化层（batch normalization，BN）融入传统的U-net模型来提取特征，使用跨步卷积来进行下采样，使模型能够充分学习图像特征，并使用了一种针对极其不平衡数据的损失函数GDL，使模型能够正确学习甲状腺的特征，避免模型将图像像素点预测偏向于背景点。②将GDLResU-net模型应用于图像质量相对较差的大孔径放射治疗定位CT，为大孔径放疗定位CT图像上的甲状腺的分割提供一种选择。

方法

1. 数据集获取

所使用的实验数据集来源于2014年6月—2019年4月在云南省肿瘤医院放射治疗科同一主诊组收治的76例鼻咽癌和乳腺癌患者，采用西门子公司大孔径CT（Somatom Sensation Open，24排、Φ85 cm）对每例患者进行模拟定位，层厚为5 mm或3 mm，患者CT扫描包含完整的甲状腺器官，图像分辨率为512×512，均采用增强数据。标签图由影像学医师通过3D slicer软件进行勾画，如图1所示。采用留出法，将数据集随机划分为训练集（59例）、验证集（8例）、测试集（9例），为了提高模型的泛化性和鲁棒性，通过旋转、翻转、缩放和剪切的方式对训练集进行了数据扩充，扩充后的训练集包含2 157张甲状腺CT切片。

2. 图像预处理

对数据集进行相关的图像预处理，其中包括HU值转换、窗宽窗位调节、自适应直方图均衡化和图像归一化操作。HU值转换由Simple ITK包自动转换；窗宽、窗位值为160、80，图像归一化操作将图像范围归一化至［0，1］。

3. 模型架构

本研究的模型架构是基于U-net架构［9］进行改进，主体框架同样由下采样、上采样以及跳跃连接（skip connection）组成。但我们在上、下采样中融合了RC和BN层，模型架构如图2所示。在传统的U-net中，每一次下采样由2个卷积和1个最大池化层组成，单纯的卷积特征提取可能会导致梯度爆炸和消失，因此，在本研究的模型架构设计中，在每个卷积层后添加一个BN层来有效地解决上述问题，同时BN层能够加速模型的收敛，使其能够在较大的学习率的情况下进行训练。除此之外，本研究所改进的模型采用残差块替代传统U-net模型中的用于特征提取的2个卷积块，残差块结构如图3所示。残差块通过一个1×1的卷积和一个归一化层的并行通路，将特征提取前、后的特征进行融合后输入给下层网络。残差块有效地解决了网络在训练过程中信息丢失和深层网络梯度消失或爆炸的现象，使模型能够更好地提取目标特征。传统U-net模型压缩特征采用的最大池化层，虽然能够减少模型的参数量，但是会造成特征提取中信息丢失，因此，本研究采用了步长为2的跨步卷积来代替最大池化层。上采样部分采用2×2的upsample法将图像从低分辨率向高分辨率转换，同时，上采样部分同样使用残差块替代传统U-net模型中用于特征提取的2个卷积。

在本研究中，模型的初始输入为512×512×1的甲状腺CT图像，输出结果为512×512×1的模型预测图像，上、下采样卷积特征提取采用Relu激活函数，最终结果输出采用Sigmoid激活函数。为了保证下、上采样的对应特征能够正确地融合，须保证特征融合时图像分辨率大小一致。因此，我们在卷积操作中采用了补零填充的方式，确保在每一分辨率的特征提取过程中图像保持大小不变，去除了跳跃连接中的裁剪步骤。

4. 损失函数

甲状腺解剖学结构特点使其在放疗定位CT图上所占比例较小，在数据扩充前，我们统计了训练集中每一层CT图像甲状腺所占比例，得到的均值为0.001 2，为严重不均衡样本。如果使用传统的交叉熵损失函数，模型更倾向于将像素点预测为背景，从而导致甲状腺无法正确预测。因此，传统的交叉熵损失函数并不能够在此数据集上获得良好的结果。Milletari等［10］在V-net的研究中提出了一种针对医学图像分割中样本不均衡现象的损失函数——Dice损失函数。Dice损失函数是根据戴斯相似系数（Dice similarity coefficient，DSC）所设计的损失函数，能够直接比较和预测真实图像，但由于其梯度会导致训练过程中出现震荡，影响模型的准确率。Sudre等［11］在研究极度不平衡的数据中提出了一种广义Dice损失函数——GDL，它能够有效地平衡病灶和Dice系数之间的关系。因此，在本研究中采用GDL作为损失函数，其计算公式如下：

5. 模型评价指标

采用医学图像分割中较为常用的DSC、杰卡德相似度系数（Jaccard similarity coefficient，JSC）、阳性预测率（positive predictive value，PPV）、灵敏度（sensitivity，SE）、豪斯多夫距离（Hausdorff distance，HD）来进一步评估模型的泛化能力和分割精度，并对测试集单个患者进行分割耗时统计，采用模型10次分割耗时的平均值作为每例患者的分割时间。

DSC、JSC计算公式：

其中X表示由医师勾画的标准分割图，Y为神经网络模型分割出的预测图，|X∩Y|表示医师所勾画的标准图与模型所预测图中重叠的部分。DSC和JSC的值域为0～1，值越接近于1，表示模型预测结果越好，反之越差。

PPV、SE计算公式：

其中TP表示预测正确的前景目标值，FP表示错误预测为前景目标值的背景目标，FN表示错误预测为背景目标值的前景目标。

HD计算公式：

HD的值越小，表明模型预测结果越优。

6.模型运行环境及参数

模型搭建使用TensorFlow和Keras，编程语言使用Python 3，操作系统为Windows10，CPU为Intelcore i7-8750H，显卡为NVIDIA GTX1060 6G，内存为16 G。模型超参数根据实验条件选取最佳结果，如表1所示，其中的Batch size表示每次迭代图像的输入数、Epoch表示所训练的批次、Image size表示图像的输入大小、Learning rate表示初始学习速率，采用指数衰减，Decay steps表示经历多少个步长进行一次学习率衰减，Decay rate表示学习率衰减系数。

表1 模型训练参数

7.统计学分析和绘图方法

使用EXCEL函数进行统计学分析，计量资料以均数±标准差（）表示，箱型图由Origin 2021进行绘制。置信区间为95%，α=0.05。

结果

使用DLUnet、GDLU-net和GDLResU-net对测试集进行预测，并计算评价指标。预测结果显示，GDLResU-net模型相较于DLU-net和GDLU-net模型在放疗定位CT甲状腺分割中过分割现象有所减小，与影像医师所勾画的甲状腺更加相近。图4、5为其中某患者的影像图、甲状腺真实分割图以及3个模型的预测结果可视化图。结果显示，GDLResU-net模型相较于其余2个模型，在甲状腺左叶的分割中能够较好地将甲状腺与血管分割开来，过分割现象明显减小，与影像医师所勾画的甲状腺相近。测试集评价结果如表2所示，GDLResU-net模型DSC评价指标为0.84±0.15（95%CI：［0.81，0.86］）、Jaccard评价指标为0.74±0.17（95%CI：［0.71，0.77］）、PPV评价指标为0.93±0.13（95%CI：［0.90，0.95］）、SE评价指标为0.78±0.17（95%CI：［0.75，0.81］）、HD评价指标为2.56±0.68（95%CI：［2.44，2.68］）、分割耗时评价指标为1.31±0.26（95%CI：［1.11，1.51］）、相较于DLU-net和GDLU-net模型，GDLResU-net的DSC、JSC、PPV、HD均有明显的梯度提升，SE评价指标GDLResU-net提升较小。分割耗时方面，DLU-net和GDLU-net单个病例耗时仅比GDLResU-net分别少0.15 s和0.16 s。因此，综上所述，GDLResU-net具有一定优越性。

表2 测试集评价指标

为了更加直观地显示测试集的结果，本研究将3个模型的评价指标结果绘制成箱型图，如图6所示。箱型图结果显示，GDLResU-net箱体上、下四分位差距均要小于另外2个模型，且大部分评价指标中位值、均值和异常值均要优于其余2个模型，这表示GDLResU-net能够有效地提高甲状腺在放疗定位CT上的分割能力。

讨论

在放射治疗计划的设计中，靶区与危及器官范围的精准性是评价放射治疗计划优劣以及剂量优化的重要因素。在目前的临床工作中，放疗医师对靶区及危及器官的勾画存在主观差异性，影响着靶区计划的设计。因此需要寻找一种高效的方法来解决人工勾画的缺陷。随着卷积神经网络（CNN）的提出，基于人工智能的图像分割开始广泛应用于医学。van Dijk等［12］对比了ABAS和深度学习方式头颈部危及器官的分割结果，结果表明基于深度学习的分割方式要优于ABAS。综上所述，基于深度学习自动勾画头颈部肿瘤患者危及器官的方式有着较大的潜力和效果。

由于甲状腺体积较小、形状复杂，利用深度学习的方式来精准分割甲状腺仍存在一定挑战性，因此，需要进一步改进模型来提高甲状腺的分割结果。在本研究中，我们引入残差机制与U-net模型相结合，同时使用GDL损失函数来对放疗定位CT中的甲状腺进行自动分割。结果表明，相较于基础U-net模型，GDLResU-net在特征提取过程中，引入残差连接的方式，避免了深度学习过程中网络退化的问题，使其能够更好地学习甲状腺的特征。研究中对比了GDLResU-net与DLU-net和GDLU-net模型的甲状腺分割结果，其中测试集的DSC系数和JSC系数的提升较为明显，其余模型评价指标也有提升。除此之外，GDLResU-net模型在一定程度上缓解了DLU-net和GDLU-net模型预测分割甲状腺所存在的过分割现象，且与影像医师勾画结果相似。Zijdenbos等［13］提出，Dice＞0.70则分割结果达到基本标准。GDLResU-net模型测试集的DSC为0.84，远远超过了0.70，表明该模型能在放疗定位CT上较好地分割出甲状腺。

同时，我们将本研究的分割结果与其他头颈部甲状腺分割的研究进行了对比，门阔等［14］利用了深度反卷积神经网络（deep deconvolutional neural network，DDNN）对230例患者数据进行训练分割，得到甲状腺的DSC值和HD值分别为0.78±0.03和4.9±1.7，而本研究所提出的模型DSC和HD值分别为0.84±0.15与2.56±0.68，分割结果有着较大的提升。杨鑫等［15］采用了自适应U-net对鼻咽癌危及器官进行分割并获得甲状腺的Dice值为0.83，这与本研究结果相似。

综上所述，本研究所提出的模型能够有效改善甲状腺的分割结果，但从箱型图可以看出，GDLResU-net模型仍存在异常值，究其原因，可能是因为周围血管边界紧密，甲状腺上、下极体积较小，难以分割。因此，在今后的研究中，需要探索性能更优的网络架构和学习策略，进一步提高模型对于甲状腺的预测能力，为放射治疗医师的甲状腺勾画提供新的思路与方法。