鲜利勋,李光俊,肖青,陈黎,胡臻尧,柏森
1.四川大学华西医院放疗科,四川成都610041;2.四川大学物理科学与技术学院,四川成都610065
当前成熟的商业自动勾画软件有很多,每个软件的勾画性能各有差异,其中基于图谱集的自动勾画软件(ABAS)是采取非刚性形变的自动勾画轮廓工具,它以CT 图像为基础,通过详尽计算解剖结构边界,为放疗治疗计划提供必须的轮廓勾画[1-3]。有研究表明自动轮廓勾画技术避免了逐层手动勾画或基于插值的半自动勾画方法,耗时、耗资源、勾画轮廓的准确性受住院医师经验影响等问题[4-5],且能帮助临床医师节省大量时间,进而推动了自适应放疗技术的发展[6],因此保证自动勾画轮廓的准确性就显得尤为关键。若此步骤存在问题,会让后续整个放疗流程产生严重的系统误差[7],对于胸部危及器官的轮廓勾画,若存在误差则可能导致放射性肺炎等急性症状,其勾画的准确性严重影响着患者的生存率。
目前自动勾画轮廓准确性评估研究大多数都是直接采用定量评估方法,即利用几何指标来表征自动勾画结果的准确性。由HD以及HD衍生出的两个变体HDmean、HD95%和DSC、Jaccard被广泛应用于轮廓的准确性评估[8],这些几何指标虽然易于计算,但是却未考虑临床效应,缺乏临床相关性[9-10]。此外,评估轮廓准确性的几何指标之间也存在相当大的可变性。在假定的参考轮廓情况下(本研究把高年资医生修改、审核后的ABAS勾画结果视为参考轮廓),临床评估放射治疗轮廓勾画准确性的方法是根据放射治疗计划的剂量分布来确定和预测自动勾画轮廓的剂量偏差[9-11]。本研究选取ABAS 软件勾画的3 种大小类型的食管癌放疗中的危及器官双肺、心脏和脊髓,探究危及器官的位置、属性与几何指标、剂量学参数间的联系,探讨具有临床指导意义的自动勾画轮廓评估方法。
随机选取2019年1月至12月在四川大学华西医院放疗科接受调强放疗(IMRT)的15 例食管癌患者作为研究对象。利用Atlas-Based Autosegmentation(ABAS)(Elekta CMS, Stockholm, 2.01 版本)软件进行胸部危及器官的自动勾画,将待勾画患者的定位CT图像以DICOM 形式导入ABAS软件中,通过与图谱库的参考图像进行形变配准,获取两种图像之间的形变矢量,并将形变矢量从模板图像上已勾画好的感兴趣器官映射到新CT 图像上,完成对危及器官双肺、脊髓、心脏的勾画。最后在ABAS 勾画的结果上,由高年资医生对危及器官轮廓进行修改与审核,并勾画靶区。
本研究选用了5个被广泛应用的几何指标,即3个基于距离的指标HD、HDmean、HD95%和两个基于体积的指标DSC、Jaccard。利用3D Slicer开源软件4.10.2版本[12],计算HD、HDmean、HD95%和DSC,由3D Slicer计算的HD 指标是双向距离,双向距离具有对称性特点,较其他方法计算的单向距离稳定。Jaccard 的计算根据其定义,读取相应轮廓的体积参数,再利用公式Jaccard=|A∩B|/|A∪B|计算,其中,A代表参考轮廓,B代表自动勾画轮廓。
以95%的靶区体积接受5 040 cGy 的剂量为处方,在参考轮廓基础上采用Raystation(Raysearch,Stockholm,Sweden)计划系统设计5 个照射野的常规IMRT 放疗计划,计算网格精度为3 mm。为了确定危及器官轮廓变化导致的剂量学参数差异,本文采用的方法是将自动勾画轮廓叠加到由参考轮廓获得的原始剂量分布上,获取危及器官的剂量学参数,双肺V5、V20、V30、Dmean,脊髓Dmax,心脏V30、V40。
利用SPSS软件21.0版本(StataCorp, Texas,USA)进行数据分析,用R²来量化几何指标HD、HDmean、HD95%、DSC、Jaccard 与危及器官剂量学参数间的相关性。P<0.05为差异有统计学意义。
ABAS 勾画的食管癌危及器官双肺、心脏、脊髓的体积参数分别为:(3 676.1±840.1)、(580.3±130.3)、(71.3±12.8)cm³。
对于双肺、脊髓、心脏的距离类几何指标变化范围见图1,数据表明在这3 个几何指标中,HD 的变化范围最大,HD95%次之,HDmean最小。在这3种结构中,双肺的HD 值变化最大,心脏次之,脊髓最小,这种变化趋势与它们自身相应的形状、大小属性有关,自动勾画结果中,一个偏离整体结构、没有体积的离散点也可能引起HD 值的显著变化。体积类几何指标变化范围见图2,双肺、脊髓、心脏都具有较高的DSC和Jaccard 值,总体大于0.75。数值上DSC 较Jaccard 系数大,但Jaccard 系数所评估的重叠区域(A∩B部分)较DSC 权重更为突出。相对距离类几何指标值,体积类变化幅度小,这是因为距离类和体积类几何指标的计算算法不同引起的,自动勾画过程中产生的零星的异常点,距离类计算时也被当做勾画结构纳入计算,而对于体积类,点不产生体积则排除在外,微小的波动不会对体积类指标造成很大的影响。
图3 是危及器官参考轮廓的原始剂量与自动勾画轮廓的剂量参数对比图。数据表明,这两种方式的勾画结构剂量变化情况整体接近,自动勾画结构所接受的剂量要稍大于参考轮廓的剂量,但是都在临床可接受范围内。
图1 双肺、脊髓、心脏的距离类几何指标Fig.1 Distance-related geometric indices of the lungs,spinal cord and heart
图2 双肺、脊髓、心脏的体积类几何指标Fig.2 Volume-related geometric indices of the lungs,spinal cord and heart
基于同一病人不同器官(双肺、心脏、脊髓)的几何指标与剂量学参数间的关系,选取几何指标HD 和剂量学参数进行图示分析,图4 分析得到的结果表明,少数病例存在线性关系,多数病例的几何指标与剂量学参数间不存在线性关系。对双肺、脊髓、心脏的几何指标与剂量学参数进行线性回归分析,见图5。几何指标与剂量学参数差异呈现的关系不是单一性、一致性的,45%的几何指标与剂量学参数具有相关性[其中,多数呈弱相关(69%),少数呈中度相关(31%)](P<0.05)。
现有的自动勾画研究中,常常仅凭几何指标值来评估自动勾画结果的准确性程度。在使用客观评价方法的情况下(即几何指标),除了普遍认为的DSC>0.7表示自动勾画轮廓和手动勾画轮廓的重合度高,勾画效果好[13-16],对于距离类几何指标值(HD、HDmean、HD95%)也总是认为其值越小,越趋近零,表示其勾画结果越好,临床可接受度越高。但对于那些相互独立的勾画研究,这种说法是模棱两可的。如对危及器官肝脏进行自动勾画研究的文章表示HD=(37.7±13.8)mm勾画轮廓的准确度高[17],而另一篇文章HD=(15.77±1.00)mm也同样表示准确度高[16],虽然后者数值比前者小,但由于缺少一个通用的标准参照物,使得HD指标没有可比较性,也不具有分辨性,进而无法具体表述这两个独立研究勾画轮廓的准确性高低。有研究表明[18]HD指标与DSC指标的结合使用,能在最大限度上说明轮廓之间的符合程度和准确性。本研究的3种危及器官中,双肺的HD值变化最大(高达44.7 mm),心脏次之,脊髓最小,但是双肺和脊髓DSC的取值范围相对集中,心脏的DSC值变化大且小于前两者(三者DSC均大于0.7)。这种情况下出现了DSC结合HD值也不能清楚表述自动勾画重合度的弊端,DSC和HD依然是几何层次的体积参数,距离类指标和体积类指标间的结合使用有效地描述了自动勾画轮廓与参考轮廓几何层面的符合度,但它们用来评估自动勾画结果的临床可接受度却是不完整的。
许多文章都表明量化勾画轮廓的变异度或不确定性程度固然重要,但对其剂量的测定和确定临床结果的影响更重要[9-10,19-20]。Van Rooij 等[20]研究了基于深度学习,头颈部危及器官自动勾画的几何指标和剂量学参数评估,分析了头颈部自动勾画结果的几何指标SDC(Sørensen-Dice similarity coefficient)和剂量差异的相关性,研究发现对于自动勾画的所有危及器官,其SDC 和剂量差异间存在弱相关关系(r=-0.24,P=0.002),但是这种相关性无法体现到某一个具体的危及器官或病人。这与本研究结果类似,基于同一病人,3 个危及器官的HD 指标与剂量学参数间的关系不一致(图4),多数病人的几何指标与剂量学参数间不存在线性关系,这也更加表明几何指标不可以准确评估所有的勾画结构。危及器官双肺、脊髓、心脏的几何指标与剂量学参数存在相关性,相关性的强弱关系却不一致(图5),也暗示着几何指标值与剂量学参数间并不是一一对应的关系。危及器官双肺的DSC 变化范围相对较小且集中在0.97 左右(图2),但是其对应的剂量学参数的变化范围却很大(图3a 和图3b);危及器官脊髓的DSC 值:0.97~1.00,且脊髓自动勾画轮廓的剂量学参数跟原始剂量学参数基本一致(图3c)。这种几何指标值变化小,而剂量学参数变化波动大或基本不变的情况,说明阈值范围内的几何指标值DSC 并不一定代表着临床可接受的剂量学参数,也解释了有关文献相互矛盾的内容。Feng 等[21]研究认为口咽癌的危及器官轮廓变化对剂量影响不大,但Nelms等[22]认为这对剂量的影响很大。
图3 双肺、脊髓、心脏的剂量学参数指标Fig.3 Dosimetric parameters of the lungs,spinal cord and heart
图4 基于同一病人几何指标HD与剂量学参数的关系Fig.4 Relationship between geometric index HD and dosimetric parameters of the same patient
图5 双肺、脊髓、心脏几何指标与剂量学参数的相关性Fig.5 Correlation between geometric indices and dosimetric parameters of the lungs,spinal cord and heart
靶区与危及器官的相对位置,以及危及器官的形状、大小、放疗计划设置约束条件等都会影响剂量学参数,剂量学参数是多种因素的最终表现形式。对双肺、心脏、脊髓进行研究的结果表明,几何指标与剂量学参数的相关性和勾画器官的大小的关系并不明显,而受器官所在位置剂量梯度的影响要更加明显,这也是通过加入更多的病种、病例数计划着手验证的后续研究方向。本研究分析几何指标与剂量学参数间的相关性旨在表明,仅凭几何指标值不能全面表征自动勾画轮廓的临床可接受性,以及对几何指标设立阈值是没有临床意义的。
现阶段对于自动勾画的轮廓差异评估,仅考虑几何层面的差异,缺乏临床效应。此外几何指标间的选择也不应是随意的,建议距离类指标联合体积类指标进行轮廓差异评估。通过分析几何指标和剂量学参数发现,几何指标与剂量差异的不一致性,自动勾画结果的临床可接受性,不能单凭几何指标来判断所有勾画结构的准确度。因此,本文建议评估自动勾画结果时,应加入剂量学参数这一指标,它可以更全面更准确更直接地解释勾画轮廓的临床剂量响应关系。