不同多模型迭代重建算法与卷积核参数对CT影像自动分割稳定性的影响

2022-04-11 23:49作者姜筱璇余行邓中华朱智慧傅玉川
中国医疗器械杂志 2022年2期
关键词:卷积噪声自动

【作者】姜筱璇,余行,邓中华,朱智慧,傅玉川

四川大学华西医院 放疗科,成都市,610041

0 引言

随着人工智能技术的快速发展,基于神经网络的医学影像处理应用也变得更加广泛[1-2],其在放射治疗领域中的典型应用之一就是针对医学影像中解剖结构(肿瘤靶区和危及器官)的自动分割,以达到减少放疗医生的勾画时间、显著提升放疗流程效率的目的[3]。目前临床上主流的自动分割方式有基于图集模板和基于深度学习(deep learning,DL)的分割,其中基于图集的自动分割效果取决于患者影像与图集的相似性,而基于DL的算法不依赖于先验轮廓,能够自主对图像数据进行学习,相较于基于图集的分割模式,基于DL的自动分割准确性和效率均更高[4-5]。

然而,DL自动分割算法在鲁棒性和稳定性方面仍需进一步研究,文献报道不同的图像获取途径和重建协议会对DL的性能产生影响[6]。放射治疗流程中靶区与器官勾画、计划设计和剂量计算等均建立在CT(computed tomography,CT)图像的基础上,而临床使用的不同CT重建协议参数会造成图像质量的差异,进而影响DL的稳定性。临床上广泛采用的滤波反投影法(filter back projection,FBP)重建速度快且易于实现,但对图像噪声敏感,重建之后的图像噪声高、条纹伪影明显,空间分辨力可检测性较差。近年来由GE Healthcare公司推出的多模型迭代重建(adaptive statistical iterative reconstruction-VEO,ASiR-V)算法采用了更为先进的系统噪声模型,同时纳入被扫描物体模型和物理模型来降低图像噪声,提高空间分辨率[7-8];另一个能够改变图像质量的参量是重建卷积核(convolution kernel),临床应用中可根据实际需求选择不同类型的卷积核[9]。在放射诊断学中,ZHAO等[10]的研究证明基于DL的方法相比影像组学在肺腺癌诊断的表现,更容易受到自适应统计迭代重建技术(adaptive statistical iterative reconstruction,ASiR)与卷积核参数的影响;BLAZIS等[11]的研究结果也表明,基于DL的肺结节检测系统在迭代重建算法生成的图像和FBP图像之间表现存在差异。相比于传统的FBP算法,ASiR-V和卷积核重建参数对CT影像自动分割的影响目前尚不明确,有必要对其稳定性进行评估。本研究使用DL分割算法,在使用不同参数重建的盆腔CT影像上,对危及器官(organs at risk,OAR)进行自动分割,将分割结果与FBP图像的分割结果进行比较,探究重建算法参数对CT影像自动分割稳定性的影响。

1 材料与方法

1.1 数据资料

选取2020年11月至12月在四川大学华西医院放疗科接受盆腔放疗的肿瘤患者20例,男12例,女8例,平均年龄为(62.3±12.6)岁。所有患者均采取仰卧位、体部热塑膜进行体位固定,双手交叉置于头顶。

CT定位采用256排Revolution CT(GE Healthcare,美国)扫描仪,设置管电压为120 kVp,采用自动管电流调制技术,探测器宽度为80 mm,螺距为0.992:1,转速为0.5 s/r,单层影像尺寸为512×512像素,扫描层厚为0.625 mm,重建层厚为3 mm。增强CT图像扫描时,对比剂使用碘佛醇(350 mgI/mL),流速为1.8~2 mL/s,动脉期扫描延迟约40 s。扫描范围自胸10椎体至坐骨结节下5 cm。

1.2 图像重建算法介绍及参数选择

ASiR-V结合了上一代的ASiR与基于模型的迭代重建(model-based iterative reconstruction,MBIR,商品名VEO)的优势,三种不同迭代重建算法的模型差异,如图1所示。ASiR-V在MBIR的基础上舍弃了重建过程中耗时最久的光学模型[8],因此重建速度与FBP算法相当。ASiR-V采用先进的噪声模型将数据采集系统中的电子噪声、光子噪声和重建图像的噪声谱均考虑在内。与传统的迭代重建算法相比,ASiR-V能够在降低剂量的同时保证一定的空间分辨率。ASiR-V的参数可以在0~100%范围内进行选择,重建后的图像由FBP重建和ASiR-V迭代重建共同组成,例如30% ASiR-V的图像由30% ASiR-V重建与70% FBP重建组成。

图1 三种迭代重建算法模型差异比较Fig.1 Comparison of three iterative reconstruction algorithms models

重建卷积核又称滤波函数,是指CT图像重建中在反投影前修改投影数据频率的过程,其作用是补偿CT影像采集过程中数据采样不均匀性造成的模糊,并恢复或增强成像对象结构的边缘信息。卷积核的选择会影响图像处理的质量,其应用主要体现在对像素噪声及图像分辨率的处理效果上。如在临床实践中,“Soft Kernel”的应用虽然可以减少图像噪声,但为保证低对比度的细节,削弱了图像的清晰度。

在本研究中,所有患者均仅进行了一次CT扫描,以FBP重建图像作为基准,使用ASiR-V(包括30%、60%、90%三种)和卷积核(包括Stnd、Soft、Detail三种)交叉重建出9组图像。

1.3 基于DL的器官勾画

利用AiContour智能勾画系统(Version 3.1.10.0,LinkingMed,中国)完成每个病人10组图像上的OAR自动分割工作,其中包括3个软组织器官(膀胱、肠袋、小肠)和5个骨性器官(左、右股骨头,左、右股骨,骨盆)。本智能勾画系统主要由分类加分割的两阶段算法执行体系构成,其分割网络为U-Net和ResNet结合的网络架构。

1.4 分割结果评价指标

DSC系数(dice similarity coefficient)是最常见的用于评估图像分割效果的指标[12]。在图像分割中,DSC是指两结构相交面积占二者总面积的百分比,由于OAR是具有一定体积的三维结构,因此在使用DSC时应计算体积上的重合度。DSC的具体计算公式如下:

通过式(1)计算得到的DSC是一个取值范围在0到1之间的参数,DSC结果越大,说明分割结果相似性越高。在本研究中,将FBP图像上DL分割的结构作为参考标准,其余9幅图像上的结构均分别与之比较得到各自的DSC结果。

Hausdorff距离(Hausdorff distance,HD)作为一种相似性度量,对分割结果的位置差异敏感,在二维平面中,HD是指从一个集合到另一个集合之间最近点的所有距离的最大值[13]。本研究采用95%HD值,表示第九十五百分位上的边界间的距离。

1.5 统计学分析

采用SPSS Statistics 25.0(IBM,美国)进行统计学分析,计量资料使用均数±标准差表示。非正态分布数据选用非参数Friedman M检验来进行差异显著性检验和两两比较,P值由Bonferroni校正后得到,P<0.05表示差异具有统计学意义。

2 结果

利用DL自动分割的9组重建图像结果与FBP图像结果的DSC值进行比较,如表1所示,每组图像所有器官的DSC均值均高于0.9。其中,与周围组织具有高对比度的骨性结构,在每种重建算法下自动分割的结构相似性均较高(DSC均值大于0.97),且差异范围均在2%以内。膀胱DSC均值较高(大于0.95),30% ASiR-V与Stnd卷积核重建图像上的膀胱结构与FBP图像上的膀胱结构最为接近,而90% ASiR-V与Stnd卷积核重建所得图像的分割结果与参考标准相似性最低。小肠DSC值在9种重建图像间的偏差为6.0%,且与FBP图像上分割结果最相似的重建参数为30% ASiR-V与Stnd卷积核。DL算法在肠袋分割的表现呈现出了稳定的结果,最高DSC(30% ASiR-V与Stnd卷积核)与最低DSC(90% ASiR-V与Soft卷积核)的差异为1.2%。DL在不同迭代重建算法CT图像上的分割差异,如图2所示。其中:膀胱由黑色填充标注,肠袋由白色框线标注,小肠由白色填充标注。图2(a)和(b)分别为DL在FBP、90% ASiR-V和Soft卷积核重建图像上的自动分割结果。与FBP的分割结果相比,在90% ASiR-V与Soft卷积核重建后的图像中,小肠的分割相似性远低于肠袋。

图2 DL在不同迭代重建算法CT图像上的自动分割差异(同一层面)Fig.2 Difference of auto-segmentation on CT images with different iterative reconstruction algorithms by neural network (on the same layer)

表1 九种重建算法自动分割结果与FBP图像自动分割结果比较的DSC值Tab.1 DSC of auto-segmentation results between nine reconstruction algorithms and FBP

当卷积核确定时,随着ASiR-V迭代次数的增加,所有器官分割结果的DSC均呈现下降趋势;同样的,下降趋势在每一个卷积核都存在,但统计学差异只存在于部分组间,如软组织结构在所有的卷积核重建下,30%ASiR-V与90%ASiR-V的组间比较差异均具有统计学意义(P<0.05)。当ASiR-V迭代次数确定时,不同卷积核重建影像对自动分割影响的统计学差异主要存在于Soft和Stnd、Soft和Detail之间。除左股骨头90% ASiR-V重建协议外,其余Stnd和Detail卷积核之间的两两比较尚未发现差异具有统计学意义。

除小肠外,所有软组织结构和骨性结构的HD值均在90% ASiR-V重建图像中最高(见表2),且当卷积核固定时,不同ASiR-V参数组间比较的差异均具有统计学意义(P<0.05)。

表2 九种重建算法自动分割结果与FBP图像自动分割结果比较的Hausdorff距离Tab.2 HD of auto-segmentation results between nine reconstruction algorithms and FBP

3 讨论

迭代重建算法作为一种新颖的CT重建技术,在图像噪声抑制、辐射剂量降低和空间分辨率提高等方面均有明显的效果[14]。传统FBP重建作为解析算法的代表,在辐射剂量降低时无法克服噪声增加的矛盾[15]。现有文献表明,基于ASiR-V的图像重建可以获得良好的客观与主观评价[16],同时也是迭代算法代替传统解析算法的新方向。为减少肿瘤患者的受照剂量,并提高医生勾画工作的舒适度,一些中心会使用迭代算法,如针对Philips公司iDose4迭代重建算法在放疗CT影像的器官轮廓识别、剂量测定等方面的研究表明,iDose4迭代算法能够与FBP图像的CT数保持一致,且不影响靶区和危及器官勾画的准确性,可以用于放射治疗定位和计划设计[17-18]。因此本研究探讨了现有的DL自动分割方法运用在不同重建算法参数的图像上能否保持其稳定性,从而使临床获益更多。

不同MBIR重建参数影像对盆腔OAR分割的研究结果表明,影像重建参数对自动分割的稳定性存在影响[19],这与我们的研究结果相似。截至目前,尚未有针对ASiR-V和卷积核组合重建算法参数对放疗CT影像自动分割影响的研究。

本研究旨在探究多种ASiR-V与卷积核组合形成的重建算法参数得到的图像对深度学习自动分割结果稳定性的影响。DSC的结果显示,DL对软组织的分割结果受重建参数影响更明显,例如在某些病例中小肠在90% ASiR-V重建协议下,分割的结果与FBP图像比,DSC值仅有0.6807,而DSC值大于0.7时才可认为参考结构和被测结构相似度良好。这可能是因为肠道是腔型结构,腔内内容物的变化与训练网络时的训练集差异较大导致分割不佳,因此自动分割结果在各个重建图像上的差异都比较大。小肠的分割结果与FBP最接近的重建算法为30% ASiR-V与Detail卷积核的组合,但在同为30% ASiR-V的卷积核组间比较中尚未发现统计学差异。这表明虽然卷积核不同,DL在针对小肠这种变异度较大的结构时,自动分割功能受卷积核影响可忽略不计。对于所有软组织结构,DL在Soft卷积核重建图像下均未能表现出良好的分割结果。因此与放射诊断学不同,相比于Stnd与Detail卷积核,Soft卷积核不能使软组织结构在自动分割阶段获益更多;此外,HD的结果证明,90% ASiR-V或Soft卷积核重建图像中的自动分割结果在OAR边缘处理方面与FBP图像的结果相似性低,这表明了DL在过于“平滑”的图像中对器官组织边缘的识别能力不佳。在研究中针对肠道结构,选择了肠袋和小肠两种结构进行比较,DL的表现在肠袋中较稳定,分割结果良好,也有研究得出相似结果[20],因此临床中医生偏好以肠袋代替小肠作为限制剂量的目标结构。骨性结构的自动分割受到CT重建参数的影响较小,且在临床工作中,医生手动勾画时间相对较短,因此该部分影响可以被忽略。

本研究仅选择了20例病例展开分析,样本量较小,这是本研究的不足之一。另外,本研究目前仅得出ASiR-V与卷积核组合的重建后的CT对DL稳定性存在影响的结论,关于如何提升DL的分割准确性仍需进一步研究,即优化预处理的算法以应对因CT图像重建参数与训练集不同而导致分割不准确的情况。

4 结论

ASiR-V与卷积核对放射治疗盆腔OAR自动分割稳定性在软组织结构中影响较大,尤其对空腔结构的小肠影响较大,对于膀胱、肠袋等影响较小,对骨性结构影响更小,临床可以通过医生手动修改来弥补差异。更高的迭代次数虽然能够降低图像噪声,但影响了深度学习的分割质量,且容易出现伪影,因此不推荐使用;重建卷积核对分割稳定性具有一定影响,但造成的差异较小。在实际应用中需在图像质量与分割质量中寻求平衡,探索更适合放射治疗影像的CT重建算法,同时需要改进DL的算法以达到能够在不同重建参数形成的CT上均实现良好分割结果的目的。

猜你喜欢
卷积噪声自动
舰船通信中的噪声消除研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
自动捕盗机
卷积神经网络的分析与设计
从滤波器理解卷积
汽车制造企业噪声综合治理实践
基于傅里叶域卷积表示的目标跟踪算法
让小鸭子自动转身
自动摇摆的“跷跷板”
关于自动驾驶