李华玲,王沛沛,李金凯,李彩虹,昌志刚,顾宵寰,孙新臣,曹远东
1.南京医科大学特种医学系,江苏南京210009;2.南京医科大学第一附属医院放疗科,江苏南京210009
近年来随着肿瘤放疗的快速发展,接受肿瘤放疗的人数逐渐上升。据估计,美国每年有470 000 名患者接受放疗[1]。在肿瘤放疗的整个过程中,危及器官(Organs‐at‐Risk, OAR)的准确勾画是一个非常关键的环节[2‐3]。而医生手动勾画OAR 是一个十分耗时的过程,每一个患者都有数百张CT 图像,而医生需要对相关的CT图像进行逐张勾画。Walker等[4]和Teguh 等[5]经过研究发现与手动勾画OAR 相比,自动勾画可节省大量的时间。手动勾画OAR一般需要数小时而自动勾画则仅需数分钟乃至数秒即可完成。近年来,多种OAR自动勾画技术被相继开发,其中包括基于图谱的自动勾画技术[6‐7]、基于机器学习的自动勾画技术[8]和基于神经网络的自动勾画技术[9‐10]。在自动勾画技术提出的同时,自动勾画技术的准确度也随之得到了重视,并且逐渐成为学者们的研究热点。已有不少学者对各种自动勾画技术的准确性进行了评估[11‐14]。目前用于评估自动勾画技术的常用方法有豪斯多夫距离(Hausdorff Distance, HD)和体积重叠方法。本研究主要目的是评估基于人工智能(Artificial Intelligence,AI)的自动勾画软件的准确度,并研究自动勾画的几何准确性是否受OAR 体积大小的影响。
选取来自南京医科大学第一附属医院放疗科2018年1月至11月的161例患者,其中头颈部肿瘤40例、胸部肿瘤40例、腹部肿瘤41例、盆腔肿瘤40例。所有病例均使用CT 模拟定位机(德国Siemens)进行扫描,并将CT 图像通过DICOM 传至自动勾画软件工作站和医生工作站。使用经训练的AccuContour自动勾画软件与手动勾画方法对晶体、视神经、眼球、垂体、脑干、腮腺、下颌骨、肺部、心脏、肾脏、肝脏、直肠、膀胱、股骨头等部位进行勾画。通过MIM Maestro 软件计算获得戴斯相似系数(Dice Similarity Coefficient,DSC)、Jaccard系数、HD及体积等参数。
AccuContour 自动勾画软件是由Manteia(中国)公司开发的一种基于深度学习的自动勾画软件。通过建立图像分割模型,并以多种网络结构模型、多种loss 结构融合进行训练,进而对大量的数据进行学习,从而实现对目标图像的自动分割和轮廓勾画。
有经验的多位医师在Elekta MONACO‐SimⅤ5.1 工作平台上对头颈部、胸部、腹部及盆腔肿瘤的OAR 在CT 图像进行手动勾画,其中每个部位均由同一位医师进行勾画。所勾画的OAR 包括晶体、视神经、眼球、垂体、脑干、腮腺、下颌骨、双肺、心脏、双肾、肝脏、直肠、膀胱、股骨头等部位。勾画时均参考RTOG OAR 勾画指南,所涉及的OAR 勾画范围均一致。
目前用于评估自动勾画技术的常用评估方法有HD 和体积重叠方法,而目前流行的重叠方法有DSC及Jaccard系数[15]。
(1)DSC 用于评价自动勾画和手动勾画之间的体积重叠性[5,16],其计算公式为:
其中,Va代表自动勾画轮廓的体积,Vm代表手动勾画轮廓的体积。DSC ∈[0,1],数值越高代表勾画效果越好,0代表两者没有任何交集,1代表两者完全重合。
(2)HD 是用于描述两组点集之间相似程度,是两个点集之间距离的一种定义形式,是一个点集中的点到另一个点集的最短距离的最大值。假如自动勾画的集合A={a1,a2,…,ai},手动勾画的集合M={m1,m2,…,mj},则两集合的HD为:
H(A,M)越小,表示自动勾画集合和手动勾画集合的最短距离的最大值越小,两个集合的交集越大,自动分割越准确。
(3)Jaccard 系数用于比较手动勾画和自动勾画二者之间的相似性与差异性,为自动勾画集合A和手动勾画集合M交集的大小与二者并集大小的比值,其公式可表示为:
Jaccard 系数值越大,表明自动勾画与手动勾画相似性度越高。
使用SPSS 23 软件对数据进行统计学分析。总体的DSC、HD、Jaccard 系数为偏态分布,用中位数及四分位间距表示;各部位的DSC、HD、Jaccard 系数则用均数±标准差表示。对总体及各个部位的DSC、HD、Jaccard 系数与体积进行Spearman 相关分析;对晶体、视神经、眼球、双肺、双肾等成对OAR 的DSC、HD、Jaccard 系数进行Wilcoxon 配对秩检验;对双肺的体积进行Wilcoxon 配对秩检验。检验水准为0.05,P<0.05为差异有统计学意义。
总体的DSC 中位数为0.896,四分位数间距为0.125;总体的HD 的中位数为5.754 mm,四分位数间距为8.380 mm;总体的Jaccard系数的中位数为0.813,四分位数间距为0.193,具体分布情况如图1所示。
图1 DSC、Jaccard系数、HD的分布情况Fig.1 Distribution of Dice similarity coefficient(DSC),Jaccard coefficient,Hausdorff distance(HD)
图2为自动勾画与手动勾画的比较,从图中可以看出两者重合性较好,但是可以看到在肝脏的自动勾画中,自动勾画软件将积液误认为肝脏组织(图2c),自动勾画算法在感兴趣区消失层面效果有待提高。
各个部位的DSC 均数均大于0.7,其中晶体、视神经、垂体的DSC 均数为0.7~0.8,其他部位均大于0.8。头颈部的HD 均数均小于8 mm,胸部均小于22 mm,肝脏为34.563 mm,腹部其他OAR 均小于19 mm,盆腔均小于16 mm。头颈部的Jaccard系数均数为0.557~0.880,其中最低的为右视神经,最高的为下颌骨,具体数值详见表1。总体的DSCall、HDall、Jaccardall系数与体积具有正相关性;其中,相关系数均大于0.7(rDSC=0.757,rJaccard=0.775,rHD=0.761;PDSC=0.000,PHD=0.000,PJaccard=0.000)。晶体、视神经、眼球、垂体、脑干、腮腺、下颌骨、双肺、膀胱、股骨头等部位的DSC、Jaccard 系数与其体积具有相关性,其他部位则暂不能认为有相关性,如表2所示。尚不能认为各个部位的HD与体积有相关性。
双肺之间的DSC、Jaccard 系数差异具有统计学意义(PDSC=0.000,PJaccard=0.000),且双肺之间的体积差异也具有统计学意义(P=0.000)。左右晶体、左右视神经、左右眼球、左右腮腺、左右颞颌关节、双肾、左右股骨头等部位的DSC、Jaccard 系数差异则不具有统计学意义,详见表3。
AccuContour 自动勾画软件是基于深度学习的自动勾画软件,本研究显示各个部分的DSC 均数均大于0.7,其中体积较大的部位的DSC 可达到0.9 以上,如双肺、心脏。有学者认为DSC>0.7 则可认为自动勾画和手动勾画重叠性良好[17‐18]。头颈部的Jaccard 系数均数为0.557~0.880,其中最低的为右视神经,最高的为下颌骨。头颈部、胸部、盆腔的HD 均数分别小于8、22、16 mm;肝脏的HD均数为34.563 mm;腹部其他部位均小于19 mm。 由此可看出AccuContour 自动勾画软件的总体勾画结果良好。但是经过分析对比发现,自动勾画系统在头颈部小体积器官、腹部及盆腔OAR的勾画效果还有所欠缺,对于小体积的OAR,因为其仅在几个CT 层面出现,所以勾画效果偏差较大。针对这个问题,已有学者研究针对于小体积OAR 自动勾画的方法。例如Zhao 等[19]提出一种基于卷积神经网络的自动勾画方法用于小体积器官的勾画。对于腹部及盆腔的OAR的自动勾画,在某些情况下,自动勾画系统会把其它组织误认为当前所勾画的OAR。例如在肝脏的自动勾画中,自动勾画系统会将积液误认为是肝组织,其可能受到两个因素的影响:(1)腹腔、盆腔病变的电子密度及CT 值与周围正常组织相近;(2)呼吸运动及肠道蠕动使得腹部及盆腔中OAR的位置相对不固定,说明自动勾画算法在感兴趣区消失层面效果还是有所欠缺。
图2 自动勾画与手动勾画的对比Fig.2 Comparison between automatic segmentations and manual segmentations
除了评价自动勾画系统的准确性,本研究还探讨了自动勾画的几何准确性是否受体积大小的影响。从结果显示体积大小对自动勾画的几何准确性存在一定的影响,但是所研究的OAR自动勾画中,仍有部分的OAR体积大小对自动勾画的几何准确性的影响不具有统计学意义,例如直肠、肝脏等。这说明还有其他因素影响自动勾画的几何准确性,例如感兴趣区消失层面的识别、对电子密度相近器官的识别及区分等。
本研究也存在一定的局限性,主要是OAR 勾画的误差。具体分析,误差主要来源于3 个方面:(1)RTOG 勾画指南理解偏差,即医师对OAR 勾画范围边界的理解不一致,这受到医生解剖学知识掌握情况的影响;(2)人为实践操作的差异,即同一名医师在不同时间或地点勾画同一病例OAR 之间的偏差;(3)图像质量的影响,本研究所使用的图像皆为CT图像,在CT 图像上某些解剖结构难以清楚识别。有学者发现影响自动勾画效果的不仅包括几何准确性还包括剂量学上的准确性[11]。可进一步研究体积对自动勾画的剂量准确是否有影响。
表2 DSC与Jaccard系数与体积的相关性分析Tab.2 Correlations between volume and DSC or Jaccard coefficient
表3 DSC、HD及Jaccard系数之间的Wilcoxon配对秩检验Tab.3 Wilcoxon pairing rank test on DSC,HD and Jaccard coefficient