影像分割中Dice系数和Hausdorff距离的比较

2019-11-29 09:03何奕松蒋家良余行傅玉川
中国医学物理学杂志 2019年11期
关键词:勾画靶区相似性

何奕松,蒋家良,余行,傅玉川

四川大学华西医院放疗科,四川成都610041

前言

在放疗计划的制定过程中,靶区勾画需要花费医生大量的时间和精力。随着人工智能技术的发展,通过计算机深度学习(卷积神经网络[1-2]、全卷积神经网络[3])来完成对靶区和危及器官的自动勾画已成为可能[4],但在此过程中存在勾画的准确性评判问题。通常使用Dice系数(Dice Similarity Coefficient,DSC),即重叠比较法,评估两个轮廓之间相似程度,一般认为DSC>0.7表示自动分割区域和手动分割区域两者重复度高,分割效果好[5];另一种评估方法是Hausdorff距离(Hausdorff Distance,HD),它是一种对位置信息差异很敏感的参数,如果仅有一小部分偏离较大都会导致HD陡然增大,其值越小意味着重复度越高,但也和目标区域大小有关,越大的区域其HD值往往越高,比如,文献[6]中股骨头与膀胱的平均HD值之间的差异。图1~2分别为鼻咽癌CTV2[7]自动勾画和手动勾画的图像实例,下方有其相应的DSC值和HD值,从其中很难看出这两种方法之间的联系和异同,因此有必要进行基于抽象轮廓的系统比较和分析。本研究设计了18个(9对)从临床靶区中抽象出的轮廓,系统计算和比较这两种相似性系数,从直观上说明DSC和HD这两种表达系数的相互联系和互补性。

图1 较大偏差图像示例Fig.1 Example of images with large deviations

图2 小偏差图像示例Fig.2 Example of images with small deviations

1 两种轮廓相似度评估方法

1.1 DSC

DSC通过估计两个轮廓的相互重叠部分体积(面积)与其总体积(面积)的百分比来描述它们之间的相似程度。计算公式为:

其中,A和B分别表示两个目标区域;∩表示取二者共同的部分;+表示取二者之和。这种计算方法是运用得最多的比较方法[8]。实际上,DSC是Kappa系数中的一个特例[9],在极限情况下,Kappa系数的计算公式可以被简成现在的DSC计算公式。早在1945年,Dice[10]就在研究生态学上不同物种之间数量时提到这个参数。

通过式(1)计算得到的DSC是一个取值范围在0到1之间的参数。数值为1的时候表示两个目标区域完全重合,数值为0则表示两个目标区域完全分离。为了拓宽DSC的值域(使其值不局限在0到1之间),可采用它的一种变形式将它的取值范围拓宽到整个实数域,这就是Logit转换[11]:

这是一种单调的转换,转换后的Logit(DSC)的取值范围是整个实数域,并且具有单调性。当Logit(DSC)=0的时候,相应的DSC为0.5,这样就能在大量相似度相近的数据中更加明显地看出其不同之处。

在描述空间重叠度时,Zijdenbos等[9]认为一个好的空间重叠,对应的DSC应该大于0.700 0,相应的Logit(DSC)为0.847 3,这样我们观察的范围就可以从0.700 0到1.000 0变成0.847 3到正无穷了。

DSC对位置和大小的差异性都很敏感,例如,大小相等的两个图形,把它们的一半区域重叠,彼此只有一半面积,导致DSC=0.5;或者一个区域完全覆盖在另一个比它小一半上的区域上,DSC就只有三分之二。在DSC测量图像相似性的过程中,位置的差异相比大小的差异更能反映出不同,重合相同体积(面积)的图像,其所在位置不同会导致最后的DSC不同。这样能够反映出直观的感觉,两个区域(其中一个完全包含另一个区域)比两个部分重叠区域更加相似。结合实际轮廓图像处理来看,虽然DSC在计算过程中具有简洁明了的优点,但它却不能描述所有的情况。

1.2 HD

距离比较法HD是受到几何建模、计算几何和计算机图形学研究领域学者关注的相似性度量参数。临床医学上CT图像的轮廓相似性比较实际上是比较CT图像上一系列坐标点围成的轮廓之间的相似性。当需要比较两个集合之间的相似度的时候,HD是对分割不好区域非常敏感的参数。HD作为一种相似性度量[12],在图像匹配领域用来衡量二值图像之间的相似度,与以往大多数图像匹配度量准则不同的是这种度量不强调图像中的匹配点一一对应,点与点之间的关系是模糊的,同时距离也满足一些性质,如同一性、对称性和三角不等性,其优点是这种度量本身具有很强的抗干扰能力和容错能力[13]。使用HD时,由于不需要考虑被测点集之间点和点的对应关系,因此还可以有效地解决图像当中存在噪声和目标被部分遮挡时的识别问题[14]。

与图像处理领域中距离的计算和应用研究形成鲜明对比的是针对连续几何对象间的距离的计算研究相对较少,截止目前,只有少数学者对自由曲线或曲面间的精确距离进行研究[15-18]。CT图像轮廓的相似性比较实际上是两组坐标点连成的图像之间的比较,即两个不同的点集之间的比较。在二维平面中,HD是指一个集合到另一个集合之间最近点的所有距离的最大值。给定两个有限点集A={a1,…,ap}和B={b1,…,bq},它们之间的HD被定义为:

对HD来说,不像DSC一样有着某个确定的值象征着重合度好或者坏的区分界限,但正常情况下,如果图形重合的很好,其HD会很小,倘若存在某一部分偏差较大,那么HD会立刻飙升至几十甚至上百,这足以用于评价其重合程度。只要HD不是异常大,都可以认为重合度是很好的,此处将20作为评判的标准。

2 材料与方法

2.1 材料

为了让结果看起来更加简单明了,这里没有选用常规的CT勾画图像,而是设计了一些由这些CT勾画图像抽象出来、线条单一、简洁、通过画图软件画出来的轮廓图像。图像分别有3组,每组包含6幅图像,总计18个轮廓(9对)。图3为其中的一对轮廓。

图3 轮廓比较示意图Fig.3 Comparison of segmented contours

2.2 方法

通过MATLAB提取出图像轮廓的坐标点,将其导入预先编辑好用来进行计算DSC和HD的Python脚本,最后输出该幅图像中对应轮廓之间的DSC和HD。所有9对轮廓处理完毕后,将其结果与图像进行统一比较。判断参数好坏的标准目前并没有一个准确的值,由于HD本身的敏感性大,再加上与目标区域的体积有关[6],所以很难得到一个绝对的标准。为了能更加直观地反映出本文所述的情况,在模拟图像时,放大了整个图像,相应地HD的值也会提高。对本次研究设计模拟的3种类型的图像,选定DSC与HD的边界值分别为0.700 0和20。

3 结果

实验中每幅图像都对应了两个输出参数,分别为DSC和HD,图4~6分别显示了3种典型的轮廓类别比较,所有18个轮廓的输出结果如表1所示(表内数据保留4位有效数字)。由图表可知图像大致可以被分成3种不同的类别:DSC大于0.700 0且HD不超过 20,DSC大于 0.700 0但 HD 超过 20,DSC小于0.700 0且HD超过20。

图4 DSC好且HD也好的图像示例(类别1)Fig.4 Example of contours with good DSC and good HD(category 1)

图5 DSC好但HD过高的图像示例(类别2)Fig.5 Example of contours with good DSC and greater HD(category2)

4 讨论

如图4所示的类别1中,两个轮廓之间的DSC都达到并超过了0.900 0,接近于1,远超过之前设定的评判标准0.700 0,说明轮廓之间有着非常好的形状相似性。同时,它们的HD分别为14.14和12.21,均小于评判标准20,说明轮廓之间也有着非常好的距离相似性。假设在临床的靶区勾画中,自动勾画结果和手动勾画结果满足这个条件,则可以认为两者具有很好的相似性。

图6 DSC低且HD过高的图像示例(类别3)Fig.6 Example of contours with lower DSC and greater HD(category 3)

表1 3种典型类别轮廓相似性参数的比较Tab.1 Comparison of contour similarity parameters of 3 typical categories

图5的类别2在临床实践中不常见,但也是不可忽略的一类情况。两个轮廓之间的DSC都超过评判标准0.700 0,并达到0.887 1、0.882 1,说明轮廓之间也有着非常好的形状相似性,但反观其HD却不尽如人意,二者的HD值为127.1和97.42,远远大于预设值20,说明它们之间的距离相似性很差。综合两个参数来看,虽然DSC展示出很好的相似性,但HD却截然相反,说明存在这样一种情况,即轮廓在整体上的符合度很好,但存在某一小部偏差很大,导致HD变得很大,在临床实践中是存在这种情况的,比如机器在识别靶区或器官上存在一些误差,或者是医生有意增减受到照射的区域。此类情况说明不能把DSC作为判断轮廓相似性的唯一衡量参量。

一般会被排除的情况如图6所示,两个轮廓之间的DSC和HD分别为0.576 2、160.6和0.618 3、125.3。无论从DSC还是HD的角度上看,都是偏离评价标准很大的值。除此之外,不存在DSC不好但HD很好的情况,一旦DSC很小,说明有很大一部分区域偏离大,此时对应HD也应该很大。

本研究结果表明,在影像分割技术中,仅靠DSC系数作为唯一的轮廓相似度评判标准是不完善的,应在此基础上增加对距离敏感的参数HD的筛选,这样才能更加全面准确地评估影像分割轮廓的相似性。

猜你喜欢
勾画靶区相似性
一类上三角算子矩阵的相似性与酉相似性
18F-FDG PET/MR融合图像对宫颈癌大体肿瘤靶区的影响
放疗中CT管电流值对放疗胸部患者勾画靶区的影响
放疗中小机头角度对MLC及多靶区患者正常组织剂量的影响
浅析当代中西方绘画的相似性
对术后局部复发的食管癌患者进行调强放疗时用内镜下肽夹定位技术勾画其放疗靶区的效果
基于隐喻相似性研究[血]的惯用句
找一找
考古学勾画早期中国历史文化图景
V4国家经济的相似性与差异性