基于深度学习的正常组织自动勾画在计划设计中的剂量准确度评估

2021-10-28 10:00:38陈旭明刘勇

中国医疗设备 2021年10期

陈旭明，刘勇

上海交通大学附属第一人民医院放疗科，上海 201620

引言

在患者的定位CT图像上勾画危及器官（Organs-at-Risk，OAR）是放疗计划设计过程中不可或缺的环节之一。然而传统的手动勾画十分费时费力[1-2]，因此近年来自动勾画在临床工作中得到了广泛的应用，以提高勾画速度，减少患者等待治疗所需时间[3]。大量研究已经表明，基于深度学习算法的自动勾画技术能够显著减少勾画所需时间，同时可达到接近专家的勾画精度水平[4-10]。然而此类研究主要聚焦于勾画准确性，对实际计划设计中可能存在的剂量偏差鲜有涉及。Nelms等[11]研究表明，同样的剂量分布在不同的勾画结果之间可能存在巨大的剂量差异，对计划评估造成显著影响。因此，本研究的目的在于考察将自动勾画结果直接应用于放疗计划设计时与专家手动勾画结果之间存在的剂量偏差，评估自动勾画结果在实际计划设计中的具体可行性。

1 材料与方法

1.1 Ua-Net架构

Ua-Net[12]是我们此前设计的一款基于U-Net[13]的深度学习框架，可以自动勾画28个头颈部OAR，其勾画精度可达到专家相似水平，同时可以大幅度减少正常组织勾画所需要的时间。该网络架构由两个子网构成：① OAR探测，主要目的是首先框定各OAR所在的位置和大小；② OAR勾画：在OAR探测的范围基础上对各OAR进行精细化勾画。由于采用了先探测后勾画的两段式设计，本网络相较U-Net架构具备以下优点：① 只在局部范围内进行勾画，所以明显大幅压缩了散在于目标器官外的假阳性点；② 与U-Net在整个图像范围内进行特征采样不同，该网络仅需在OAR探测范围内进行特征上采样，因此模型训练所需时间明显缩短；③ 在勾画中采用局部对比归一，可显著提高一些在CT图像上对比度不明显的OAR的勾画精度。前人研究中介绍了Ua-Net 的具体细节[12]。

1.2 患者资料

回顾性选取2019年6月至2020年5月在本科接受放疗的鼻咽癌患者30例，其中男22例，女8例。

1.3 OAR勾画

参考相关指南[14]，在患者的定位CT图像上手工勾画以下28个OAR：臂丛神经、脑干、咽缩肌、两侧中耳、两侧眼球、垂体、喉、两侧晶体、下颌骨、视交叉、两侧视神经、口腔、两侧腮腺、两侧颌下腺、脊髓、舌下腺、两侧颞叶、甲状腺、两侧颞颌关节、气管，为手工勾画组（Manual Delineation，MD）。另外，由Ua-Net勾画28个相同的OAR，为自动勾画组（Automatic Delineation，AD）。

患者定位CT为GE Discovery 590 RT，图像层厚为2.5 mm，图像分辨率为512×512。

1.4 勾画精度评估

使用 Dice相似度指数[15]（Dice Similarity Coefficient，DSC）评估AD与MD之间的勾画相似度：

式中Mp和Mg分别表示自动勾画和手工勾画的器官体积，DSC介于0～1，越接近于1表示两者的重合度越高。

1.5 计划设计与评估

为评估AD直接应用于临床计划设计的可行性，在每一例患者的AD图像组上设计放疗计划，直接使用自动勾画的OAR进行计划优化及计算。计划完成后再将其移植到MD组的图像上，使用剂量-体积直方图评估两组OAR在相同剂量分布中存在的剂量差异。对于臂丛神经、脑干、晶体、视交叉、视神经、脊髓、颞叶以及气管，评估其最大剂量的差异，其余OAR则评估其平均剂量的差异。采用双侧配对t检验的方法对两组勾画结果的剂量差异进行统计分析，P<0.05代表差异有统计学意义。

计划处方剂量为鼻咽原发灶PGTV1：70 Gy/32 Fx，PGTV2：66 Gy/32 Fx，PTV1：60 Gy/32 Fx；双侧颈部PGTVLn：66 Gy/32 Fx，PTVLn：60 Gy/32 Fx；锁骨上PTV2：50 Gy/25 Fx。所有计划均采用Varian Eclipse 13.6计划系统，使用双弧旋转容积调强技术，治疗设备为Edge直线加速器，同时在优化过程中使用铅门跟随技术。

2 结果

2.1 勾画示例

典型层面的勾画结果如图1所示，图中AD列代表Ua-Net自动勾画的结果，MD列代表手工勾画的结果。勾画结果的三维视角如图2所示。

图1 勾画典型层面示例

图2 勾画结果的三维视角

2.2 自动勾画精度评估

28个OAR勾画结果的DSC如表1所示。其中，变异系数（Coefficient of Variation，CV）定义为标准差与均数之比，用于衡量比较各OAR勾画结果DSC的离散程度，数值越低则表明结果越均一、稳定。由表1结果可见：17个OAR的平均DSC>0.80，臂丛神经、垂体、视交叉、舌下腺的结果相对欠佳（DSC<0.70）。此外，臂丛神经、垂体、两侧晶体、视交叉、两侧视神经以及舌下腺的变异度较大（CV>10%）。

表1 28个OAR的勾画结果DSC和变异系数

2.3 剂量差异评估

两组勾画结果对应的器官平均剂量如表2所示。其中，臂丛神经、脑干、晶体、视交叉、视神经、脊髓、颞叶以及气管的剂量为最大剂量，其余为器官平均剂量。

表2 28个OAR的剂量分析（cGy）

其中，咽缩肌、左侧眼球、喉、下颌骨、左侧颞叶、右侧颞颌关节的剂量差异具有统计学意义。其剂量差异（AD-MD）如图3所示，最大差值发生在左侧颞叶，为-346.80 cGy。其平均差值分别为-93.48、24.79、-40.16、17.21、29.11、-41.45 cGy。

图3 剂量差异存在统计学意义的OAR的剂量差值箱形图

在30个患者共840个OAR中，剂量偏差大于500 cGy的情况发生28次，全部出现在DSC<0.70的情况下，且全部出现在臂丛神经、垂体、视交叉和两侧视神经中，其中垂体次数最多，为9次，极端最大差值出现在左侧视神经（AD-MD=1456.2 cGy，对应DSC为0.64）。

3 讨论

近年来，各类自动勾画工具越来越广泛的应用于放疗科的日常临床工作中，协助医生和物理师完成正常组织或靶区的勾画[3,16]。然而其应用仍然涉及剂量安全，以往的研究更多聚焦于勾画的准确性，对直接应用自动勾画所得的OAR于计划设计及其剂量安全性涉及相对较少。因此，我们将自动勾画结果直接应用于计划设计，评估其剂量安全性。

在本研究中，我们首先再次测评了Ua-Net的勾画精度。其中17个OAR的平均DSC>0.8，但臂丛神经、垂体、视交叉、舌下腺的结果相对欠佳，这也与以往的一些研究结果相类似[4-5,17-19]。此现象可能与这些OAR的体积相对较小有一定关系，由于DSC的计算方式决定了体积较小的OAR，即使只有轻微的偏差，也会严重影响DSC的计算结果；同时，这些器官在CT图像上相对较低的密度分辨率也可能对结果造成一定的影响[20]。CV也同样体现了相同的结果，即体积相对较小的OAR，其勾画结果的DSC变异也较大，更易受到小体积偏差的干扰。因此，总体而言，大部分OAR的自动勾画结果可以接受，但部分小体积器官仍需一定的人工介入、核查。

咽缩肌、左侧眼球、喉、下颌骨、左侧颞叶、右侧颞颌关节的剂量差异具有统计学意义，然而其差值普遍较低（平均值均在100 cGy以内，极端最大差值为-346.8 cGy），在临床上可以接受。由于这些器官的DSC都相对较高，因此这种剂量偏差有可能来自样本量相对较少。同时我们发现垂体的剂量偏差较大，差值大于500 cGy的频次是所有OAR中最高的，这可能是由于垂体相对较低的DSC和较小的体积所导致的。其余OAR的剂量偏差普遍较低，且未发生超出推荐剂量限值范围的情况。

Rooij等[21]曾研究11个自动勾画OAR的剂量准确度，发现剂量偏差普遍可接受，然而与我们普遍发生于小体积OAR不同，其最大剂量偏差发生在颌下腺，这可能与他们的自动勾画算法建模数据有关，且他们的研究方法为分别在AD和MD设计两套计划，最后将两套计划在MD上评价剂量差异，然而这种方法并未能完全反映自动勾画在计划优化中的直接应用。

4 结论

综上所述，直接将Ua-Net的自动勾画结果应用于计划设计中时，总体安全可靠，但仍需关注部分小体积器官，如垂体、视交叉、视神经等，在计划设计前需对这些器官进行人工审查及修改，以避免发生剂量偏差现象。本研究的局限性在于，所有测试均在本科室内部完成，在勾画精度上可能存在一定主观偏差，未来尚需多中心广泛应用研究推广。