边界信息保持的全染色肾脏切片多粒度分割

2023-11-22 01:19花勇李珍珍潘建宏杨烜
中国图象图形学报 2023年11期
关键词:步长切片粒度

花勇,李珍珍,潘建宏,杨烜

深圳大学计算机与软件学院,深圳 518060

0 引言

慢性肾脏病已成为威胁人类健康的主要疾病之一,早期诊断是治疗慢性肾病的关键。肾小球在血液循环中保留较高分子量的蛋白质,肾小球的分割、识别对慢性肾病的诊断具有重要意义。肾切片染色是进行肾小球自动分割、识别的成像手段,肾切片全染色图像(whole slide image,WSI)能反映肾小球的分布和解剖特点,可以用于肾小球自动分割与识别,如图1(a)所示。图1(b)—(d)展示了全染色图像WSI 的局部切片,图中绿色曲线勾勒出的区域为肾小球,可以看出目标大小差异大、内部纹理复杂、形状不规则且存在白色的鲍曼囊,鲍曼囊在切片中并不总是可见的,给分割带来了困难。另外,染色过程中肾小球染色深浅不同,染色的其他组织与肾小球的纹理非常接近,都使分割问题变得复杂。

图1 全染色肾脏切片与肾小球染色切片Fig.1 Full-stained kidney slice and stained glomerular slice((a)full-stained kidney slice;(b)the difference of glomerulus in shape and size;(c)the glomerulus is close to background;(d)non-uniform staining)

全染色图像是肾组织切片在显微镜下的成像,这类图像分辨率非常高,可以达到108以上像素,需要对局部切片图像分别进行分割,然后进行分割结果拼接。图像的局部切分会使目标处于局部切片边界,弱化其概率响应,因此直接拼接会出现误差,导致在这类高分辨图像上采用滑窗的方式效率极低。

目前,深度学习在医学图像分割、检测和识别领域展现了良好的性能。在Long 等人(2015)提出全卷积网络(fully convolutional network,FCN)和Ronneberger 等人(2015)提出U-Net 网络架构后,涌现出一批新的网络架构和方法用于医学图像分割。对于WSI 肾小球分割问题,Gadermayr 等人(2016)为提高分类模型在肾脏病理数据上的泛化能力,提出一种域自适应方法,但其基于特征的逐块分类方法的性能仍不足以进行可靠地分类和染色分割;Pedraza 等人(2017)使用预训练的AlexNet模型,以训练样本区分肾小球和非肾小球;Gadermayr等人(2017)提出一种弱监督的基于图像块的检测、分割两阶段架构;Kannan 等人(2019)使用Inception v3 架构判别无肾小球、正常或局部硬化的肾小球和全局硬化的肾小球;Altini 等人(2020)将SegNet(Badrinarayanan 等,2017)和DeepLab v3+(Chen 等,2018b)网络应用到肾小球的分割中,将以上两种网络的尾层替换为像素级分类层,分为背景、硬化性肾小球和非硬化性肾小球3 个类别;Jha 等人(2021)针对WSI 图像提出一种先检测后分割的端到端的网络。时永刚等人(2017)提出一种基于全卷积网络和GrowCut 的肾皮质自动分割算法,可分割正常和变异肾脏图像。

由于肾小球目标形态差异大,多分辨率特征在提高分割精度中起着关键作用,Sertel等人(2009)提出一种模拟病理学家评估的多分辨率方法,从最低分辨率开始分析,并在必要时切换到更高分辨率,在特定分辨率级别上做出判决;Barker 等人(2016)对WSI 图像中局部特征进行从粗到细的分析,粗分析包括在整个图像中提取形状、颜色和纹理的空间局部特征;细分析提供对不同类别的单独表示,通过投票决策获得整个图像级别的诊断。由于不能在千兆像素分辨率的WSI 图像上直接训练,Hou 等人(2016)提出一个决策融合模型实现patch-level 级预测,实现对图像块的分类。

为提高医学图像的分割精度,许多研究从多尺度特征提取、上下文信息以及不同层间的信息流动等方向进行改进。其中,感受野(receptive field,RF)的大小往往决定了卷积核能够提取到的多粒度信息是否丰富,因此如何扩大感受野一直是卷积神经网络研究中的一个关键问题。此外,在医学图像分割领域,由于病灶区域大小存在着尺度变化大、边缘模糊的情况,需要丰富的多粒度上下文信息来完成像素级别的分类。Zhang 等人(2017)设计一种金字塔空洞卷积替换普通卷积,使得在不损失分辨率的情况下能够更好地利用全局上下文信息并扩大网络的感受野;Sarker 等人(2018)在编码层的尾部使用金字塔池化,并在不同分支采用不同的池化率,丰富特征的多粒度信息。罗会兰和张云(2019)提出使用选择搜索方法从图像中生成不同尺度的候选区域,提取每个区域的特征,进行高层和底层特征的融合,从而得到区域信息和上下文信息。尽管这些方法能够获得一定的感受野提升,捕获到更多的长距离信息,但卷积核不能无限制扩张,金字塔池化模块分支不能无限增加,因此能够捕获到的上下文信息仍然具有局限性。

在WSI 肾小球分割问题中,上下文信息还未被充分关注,较少得到应用,同时图像分块造成的目标处于边界上的问题也很少有文献进行研究。另外,超大的图像分辨率在整图中检测目标时导致巨大的计算量。针对以上问题,本文提出一种边界信息保持的全染色肾脏切片多粒度分割方法,该方法将WSI 整图切分成图像块处理,在每个图像块中提取多粒度的上下文特征信息,使用增广路径方法对图像块边界进行补零填充,以保证目标处于图像边界时信息不丢失,确保目标处于图像边界时分割的精度,并从理论上阐明这种增广路径补零策略的有效性;最后,为完成在整图中的目标预测,本文提出一种特征复用的滑窗方法,可以有效提高完整目标的预测效率。

本文的创新贡献包括:1)提出一种多粒度上下文的空间注意力机制(multi-granularities context based spatial attention mechanism,MGCA),用于提取丰富的上下文信息以提高目标分割精度。通过对特征图内的像素进行全局上下文建模,增强边界模糊的目标特征。2)将高分辨率的全染色肾脏图像切分为多个图像块时,常用的卷积运算中的Padding补零操作使处在边缘的目标特征出现损失,本文使用增广路径的补零填充方式,使边缘像素的信息能够无损失地向后传递。3)为增强小目标的特征响应,消除小目标对位置的敏感性,提出概率累积的滑窗预测策略,通过网络层特征图复用,有效提高全染色图像分割效率。

本文方法是在Li 等人(2021)工作的基础上进行的扩充,Li 等人(2021)的工作主要讨论了增广路径的零填充方法,本文在该方法中增加了多粒度上下文的空间注意力机制,以及概率累积的滑窗预测方法,是针对全染色图像肾小球分割的完整方法,Li等人(2021)的工作内容仅是本文方法的一个步骤。

为了验证本文方法的有效性,在私有小鼠肾脏数据集和kaggle2021(2021 kaggle machine learning&data science survey)中所提供的公开HuBMAP(human biomolecular atlas program)人类肾脏数据集上进行验证,验证结果表明本文方法在多个评估指标方面优于现有方法。

1 多粒度上下文空间注意力机制

WSI 图像中肾小球存在染色差异大、形状变化大以及目标边界与背景边界不清晰的问题,Hervé等人(2011)曾指出在染色变化很大的数据集上,需要同时提取颜色和纹理信息,语义上下文信息对辨识肾小球尤为重要。因为U-Net 网络在医学图像分割领域有良好的性能,本文采用U-Net 作为目标分割的基准网络。但U-Net 的池化操作仅得到固定面积的感受野,意味着其全局上下文信息的尺度是单一的,会影响网络对肾小球特征的提取能力。本文提出一种多粒度上下文的空间注意力机制MGCA,以提高U-Net在多尺度特征的提取能力。

由于卷积运算只能捕获局部的细粒度信息,而不能获取特征图全局的粗粒度信息,很多卷积神经网络都在研究粗粒度的全局信息感知。Simonyan和Zisserman(2015)通过多层卷积操作,扩大局部感受边缘直至全局。Kamnitsas 等人(2017)使用并行卷积路径,结合局部和全局的多粒度信息;Inception(Szegedy 等,2017)和DeepLab(Chen 等,2018a)系列设计具有不同感受野的卷积分支,以增强捕获多粒度上下文信息的能力;Ding 等人(2019)提出一个语义相关、形状可变的上下文注意力(shape variant context,SVC)模块,使目标区域的网络注意力随目标变化;Zhang 等人(2020)将具有不同空洞率的卷积核引入多分支结构,再将多个分支提取到的不同大小感受野的特征进行融合,以解决感受野不足的问 题;PSPNet(pyramid scene parsing network)(Zhao等,2017)和PoolNet(Liu 等,2019)设计具有不同大小的池化分支并进行特征融合,从而增强多粒度信息;Feng 等人(2020)使用注意力机制对网络不同阶段提取到的特征进行筛选,以应对特征粒度的变化;Hu等人(2020)提出基于通道的注意力机制,以融合全局信息。

全染色肾脏图像中的肾小球与背景组织在纹理上存在相似,同时由于染色成像的影响使得肾小球组织的边界不够清晰。本文受SVC(Ding 等,2019)的启发,提出一种多粒度上下文的空间注意力机制,通过控制感受野的尺寸来提取全局到局部细节的不同粗细粒度的信息,以生成多粒度的空间注意力图,对目标给予更多的注意力,减弱背景对目标的干扰,强化网络的感知能力。SVC 的核心模块是成对卷积,用于描述局部特征之间的差异。对于给定的特征图x∈RC×H×W,位置(i-m,j-n)与位置(i,j)的卷积结果之间的差值为

本文在成对卷积的结果上,将K×K感受野产生的上下文空间注意力机制记为

采用多个不同大小的K来产生不同粒度的空间注意力机制并将多个粒度的空间注意力机制堆叠。

多粒度上下文的空间注意力机制如图2 所示。假设K1=3,K2=7,K3=11 的MGCA 中包含4 个分支,下面3 个分支用于提取每个像素与周围像素的多尺度语义相关性,得到的是不同K的加权注意力上下文特征,最上面的分支是将卷积提取的特征空间信息的特征图,与上述分支得到的不同粗细粒度信息的特征图进行滤波,得到不同粗细粒度的强化特征。

图2 多粒度上下文的空间注意力机制Fig.2 Multi-granularities context based spatial attention mechanism

MGCA 的时间复杂度随特征图大小的增加而增加,因此本文将提出的多粒度空间注意力模块加入到U 型结构的最底部,即特征图尺寸最小处,如图3所示,在强化U-Net 对高层视觉特征提取的同时,提升模型速度。

2 基于增广路径的边界信息传播

感受野在深度卷积网络中起着至关重要的作用,卷积的填充方案与感受野密切相关。在卷积神经网络(convolutional neural network,CNN)的卷积操作中,常用的零填充会引起信息衰减以及权重偏差。例如,一维图像零填充,如图4 所示,底层x0表示输入图像,顶层x4表示输出图像,图中的圆圈表示图像的像素:不受零填充影响的纯像素、受零填充影响的混合像素和零填充像素,混合像素是通过纯像素与零填充像素(或其他混合像素)的卷积运算生成的,由于边缘使用零填充,混合像素的信息在前向传递时出现信息衰减。下面本文从理论层面分析传统零填充存在的信息衰减问题。

图4 零填充卷积运算中信息衰减和积累效应Fig.4 Information attenuation and accumulation in zero-padding convolution

表1 列出了不同位置像素及相邻像素的贡献值,可以看出,越是靠近边缘时(如r=4),输入图像上相同位置的信息贡献就会有明显的衰减,而对r=4 这个位置,r=3 贡献大于r=4 的贡献,也就说明输入图像中的主要贡献会偏移到相邻像素的位置上,本文称该现象为贡献偏移效应。

表1 输入图像中不同位置像素的贡献度量Table 1 Contribution of pixels located in positions

图5 展示了不同层数网络中,二维图像进行卷积的贡献度量,亮度越大表示该位置贡献越大,可以看出,越是靠近边缘的位置,衰减的程度越大;随着网络的加深,信息衰减效应的影响面积与理论感受野的大小之比越来越小,说明感受野在一定程度上可以对抗信息衰减的效应。

图5 二维图像上像素贡献可视化Fig.5 The visualization of contribution of 2D images in pixel

图6 展示了二维输入图像的相邻位置对输出图像的贡献,图中红色方框为所要计算的不同位置的目标像素输入对输出的贡献量,可以看到,贡献最大的位置与红色方框位置不吻合,说明贡献中心存在偏移。并且,卷积深度越深,贡献中心偏移越远。

图6 相邻位置的贡献可视化Fig.6 The visualization of contribution of adjacent position

上述分析表明,卷积运算中采用零填充方式会出现信息衰减效应以及相邻像素的贡献偏移问题。本文使用一种增广路径传播的补零填充策略(receptive field rectification via augmenting path,RIAP),如图7 所示,假设卷积核大小为(2n+1) ×(2n+1),在输入层填充n个零,产生n个增广像素;在第1 层填充2n个零,生成2n个增广像素,依此类推,直至在层中填充×n个增广像素。该方法使得层可提供足够的填充数据,在之后的层中,不填充新数据也可产生无损失的输出特征图。输入边界信息将会沿着虚色标记的路径进行传播,该路径称为增广路径。对于池化层而言,由于增广像素包围生成的特征图提供足够的填充信息,池化操作可以按照正常的方式执行。对于扩张卷积的数据填充,贪婪算法可以提供足够的填充数据,为了估计最优填充数据的数目,可以使用类似的算法。需要说明的是,RIAP 的增广像素只是一个填充像素,不是神经元,无需额外的网络架构来处理。

图7 增广路径Fig.7 Augmentation path

使用离散傅里叶变换(discrete Fourier transform,DFT)将w(t)和转换至频域表示(w)。具体为

(r)可以使用可逆离散傅里叶变换表示,具体为

3 滑窗预测的概率累积

由于全染色肾脏切片存在分辨率极高的问题,在测试时可以将原图分割成多个patch,再拼接结果。但拼接时,处于边缘部分的肾小球会出现较大的预测误差。在整图中,滑窗的方式可以解决肾小球处于边界的问题,但在图像中小目标位置不同的问题会使预测发生波动。为降低因目标位置不同而导致的网络分割精度下降,本文采用概率累积预测的方法:在全视野肾脏染色切片上,以一定的步长滑动窗口,并对预测概率进行累积。

如图8 所示,图8(a)是滑窗滑动无重叠的预测结果,图8(b)是滑窗以步长为20 重叠的预测结果,可以看出滑窗无重叠的情况下,分割出的肾小球破坏严重,造成漏判增多,通过对多个预测概率的叠加,图8(a)中未预测出的部分在图8(b)中有概率响应,但重复计算patch的共同部分会造成较高计算时耗的问题,因此在概率累积的基础上,本文提出图像重叠部分的特征复用算法,即相邻的两次滑动窗口对应的特征图存在交叠,对交集部分特征图进行复用,以减少计算量。滑窗的方式与patch 的方式相比,避免了patch 间共同部分的重复计算,又对特征进行了复用,减少特征图的计算时间。

图8 非概率累积和步长为20的概率累积方法预测的结果Fig.8 The results predicted by non-probabilistic cumulative and probabilistic cumulative methods with step=20((a)the result predicted by non-probabilistic cumulative method;(b)the result predicted by probabilistic cumulative method with step=20)

如图9 所示,本文对不同滑动步长的预测结果进行对比,分别展示出原图、标签、步长=162 和步长=20 的概率累积预测结果,椭圆标出的是漏检的目标。可以看出,步长为20 比步长为162 减少了漏检目标的个数。

图9 不同步长概率累积方法预测的结果Fig.9 The results predicted by probabilistic cumulative methods with difference steps((a)original images;(b)ground truth;(c)step=162;(d)step=20)

此外,卷积操作具有平移同变性,即输入发生平移,卷积结果也会发生相同的平移,而空间下采样会破坏特征的平移同变性。以一维数组为例:如图10所示,该数组分别平移0、1 像素后进行2 倍下采样,当滑动步长为2 时,采样结果保持平移同变性。依此类推,平移的像素为采样个数的整数倍时,一次下采样操作能保证平移同变性,推广到L层下采样,需要平移2L个像素才能够保持平移同变性。

图10 下采样的平移同变性Fig.10 The translational equivariant of down sampling

网络在卷积层后会加批归一化(batch normalization)层和激活函数ReLU,产生的计算误差会随着网络层数加深越来越明显,若继续对特征图重叠部分进行复用,将会对网络的分割性能产生影响,导致分割精度下降。为验证上述分析的有效性,本文随机选取训练集中的图像,并选取大小为1 024 ×1 024像素的局部区域进行测试,滑动窗口的移动步长设置为6,记录每一层卷积及下采样之后,特征图复用产生的误差,该误差是指两种方法产生特征图之间的差异。一种方法是一次滑窗产生的两个部分重叠的子图,后一个子图利用前一个子图重叠部分的特征进行复用,而不需要重新计算;另一种方法是利用原图直接卷积得到特征图,计算两种特征图之间的差异。由于下采样等操作的影响,在前面1、2层的特征误差较小,但是到了后面深层部分,浅层的误差经过传递和放大就会产生较大误差。图11 显示了网络前4 层的输出误差。可以看出,随着网络层的持续增加,上一幅特征图的重叠部分与当前特征图的重叠部分的误差增大,如果继续对更深层的重叠特征进行复用,会对分割的效果产生较大的影响,所以本文对网络前两层进行了特征复用。

图11 不同网络层的重叠部分误差Fig.11 Error of the overlapping region in different layers

4 实验结果与分析

4.1 数据集、评价指标、实验环境

为验证本文方法的有效性,本文采用小鼠肾脏细胞切片和HuBMAP(HuBMAP Consortium,2019)人体肾脏数据集,如表2 所示,先对全染色图像进行下采样再进行切片,以8∶2 的比例将切片划分为训练集和测试集,并进行平移、形变等数据增强,对部分光照不均匀以及模糊的图像,进行随机亮度、光照以及对比度的调整。

表2 数据集结构Table 2 The constitution of dataset

小鼠肾脏染色切片数据集共10 幅有标注的全染色小鼠肾脏切片,每幅肾脏图像的分辨率大小在60 000 × 50 000 像素左右;HuBMAP 肾脏染色切片数据集共20 幅全染色图像,平均分辨率大小为40 000 × 40 000 像素,全染色图像无重叠切割512 ×512像素图像块进行训练。以15幅有标注的图像作为训练集,余下的5 幅无标注图像作为测试集。本文使用准确率Acc、Dice 系数、Jaccard 系数、真阳性(true positive,TP)、假阳性(false positive,FP)、真阴性(true negative,TN)、假阴性(false negative,FN)作为分割精度的评价标准。

本文代码基于Ubuntu18.04 Linux 操作系统和PyTorch 深度学习框架,所使用的硬件包括:Intel(R)Core(TM)i7-7800X CPU @ 3.50 GHz;64 GB 内存;NVIDIA RTX2080Ti GPU,11 GB 显存。梯度优化策略使用Adam 优化器(Kingma和Ba,2017),初始学习率为0.000 1,学习率非线性衰减。

4.2 多粒度空间注意力机制

为验证多粒度空间注意力机制的有效性,本文分别对小鼠肾脏细胞切片和HuBMAP 人体肾脏两个数据集进行训练和测试,对测试结果进行像素级和目标级评估。表3 列出评估结果,其中U-Net +SVC 是单粒度注意力机制的实验结果,后缀数字表示不同K的大小,多粒度注意力机制采用3 个不同的局部窗口进行融合。需要说明的是,本文分别采用了K=3、7、11 的窗口大小,这些窗口基本能够适应肾小球不同的大小情况,同时过大的K会导致计算开销过大。可以看出,加入多粒度空间注意力机制后,在像素级别的精度有较大的提升,目标级漏检个数也在下降,漏判FN 的个数降到了最低,占总数的2%。

表3 基于像素级别的分析Table 3 The analyze based on pixel

图12 和图13 分别展示了小目标和大目标的分割示例。可以看出,U-Net对于部分难以辨别的小目标分割结果表现不好,在网络中加入多粒度空间注意力机制后,小目标漏检的情况得到一定的改善;对于大目标分割的残损情况也得到一定的改善。

图12 像素级、对象级别分割精度Fig.12 The segmentation accuracy of pixel-level and object-level results((a)input images;(b)U-Net;(c)SVC;(d)ours)

图13 大目标的分割结果Fig.13 The segmentation results of large target((a)input images;(b)U-Net;(c)SVC;(d)ours)

为进一步验证多粒度注意力机制的有效性,本文将加入MGCA 的U-Net 网络与7 个分割网络在HuBMAP公开数据集上进行对比实验,分别是U-Net(Pedraza 等,2017)、CE-Net(Han 等,2020)、CPF-Net(Simonyan 和Zisserman,2015)、ACS-Net(Hu 等,2020)、CA-Net(Gu 等,2021)、CCBA-Net(Nguyen 等,2021)和RF-Net(Wang等,2021)。

为公平起见,所有的方法均使用相同的预处理和数据集划分方式,训练过程与训练环境也保持一致。不同网络的分割结果如表4 所示,本文方法的Dice为91.4%,相较于U-Net提高近1%,本文方法的得分优于对比方法。此外,本文方法具有参数量小的优势,且每秒浮点运算次数(floating-point operations per second,FLOPs)较基线网络U-Net 有较小幅度的提升。另外,因HuBMAP 数据集的测试集没有给出对应的真实标签,所以不能对其进行目标级的分析。

表4 公开数据集结果对比Table 4 The contrast results of public datasets

图14展示了部分样例切片的分割结果。第1行图像中,RF-Net 和U-Net 均未分割出目标,ACS-Net对于目标有部分概率响应,而本文网络在小目标分割方面优于其他网络;第2、3 行展示了目标与背景分界不清晰的图像,ACS-Net、RF-Net 预测出了部分的目标,U-Net 则没有预测出,说明本文方法改善了分割残损的情况;在第5行图像中,U-Net和ACS-Net网络产生了多判的预测结果,而RF-Net 则预测有残损,本文方法的预测更接近真实标签。

图14 不同网络对应的分割结果Fig.14 The segmentation results of different networks((a)input images;(b)ground truth;(c)ACS-Net;(d)RF-Net;(e)U-Net;(f)ours)

4.3 RIAP

为了对RIAP 的有效性进行验证,使用U-Net 和U-Net_SVC(Liu 等,2019)以及U-Net_MGCA 三种网络,分别在卷积时使用零填充和RIAP 填充两种方式,并对数据集采用5重交叉验证的方法。表5列出两种方法的比较结果,其中1—5列是5折验证集,对应的值为Dice(百分比形式),Avg是5次交叉验证的平均Dice。

表5 Zero和RIAP方法的结果对比Table 5 The contrast results of Zero and RIAP method

图15 展示了对比实验分割图。由于图像中的肾小球在分块过程中会产生碎片化,边缘信息的处理能力在较大程度上决定着网络的分割精度,可以看出RIAP 有效提高了预测精度。对于FLOPs 的计算,在改变传统卷积的填充方式时,FLOPs的增加幅度较小。

图15 零填充和RIAP的分割结果比较Fig.15 The segmentation results of Zero and RIAP methods((a)U-Net based on zero padding;(b)U-Net based on RIAP)

本文从验证数据集中随机选取切片,并将切片沿着x方向移动以获得包含不同位置的肾小球目标。这些切片均被输入到具有零填充的U-Net 和具有RIAP 的U-Net 网络中分割肾小球。将上述实验重复10次,具有相同偏移量切片的平均Dice如图16所示,在目标偏移的情况下,使用零填充的U-Net 网络,其分割结果的波动幅度较大,而使用RIAP 填充的网络得到的结果波动幅度较小。由此说明与零填充相比,使用RIAP的分割精度对目标的移动更具鲁棒性。

图16 零填充和RIAP的分割结果比较Fig.16 The segmentation results of zero padding and RIAP method

4.4 快速滑窗的概率累积

最后,本文对滑窗的概率累积和非概率累积两种不同的方法做对比实验,图像块大小为256 × 256像素。表6 列出不同滑动步长时的分割精度,其中每次滑动都利用了概率累积,可以看出概率累积的测试方法精度优于非概率累积的测试方法,滑动步长越小,分割精度越高,较小步长可弱化小目标对位置的敏感性。

本文对网络的前两层进行特征图复用,对保存的特征图和当前特征图卷积非重叠部分进行拼接,在WSI 上采用不同步长的滑窗进行滑动,对不同步长测试所需要的时间进行对比。如表7 所示,当步长较大时,复用特征与不复用特征在测试时间上相差不大。当步长较小时,网络第1 层进行特征复用比不复用提高52.83%,网络第2 层进行特征复用比不复用的时间提高49.98%。网络的第1层和第2层复用特征比不复用提高55.89%,由此说明特征复用的滑窗测试可以大幅度节省测试时间。

表7 不同滑动步长的特征不复用与复用的测试时间Table 7 The testing time results of different sliding steps reusing features or not reusing features∕s

表8 列出了概率累积中采用特征复用后的精度,对照不复用特征分割结果(表6),不同滑动步长的分割精度有微小下降或几乎相等,这说明特征复用在大幅度减少计算时间的前提下,可以有效保持分割精度。

表8 基于像素级别的分析Table 8 The analyze based on pixel

5 结论

本文提出一种多粒度上下文的空间注意力机制MGCA,通过多粒度感受野融合多种尺度的信息以产生强化或抑制特征图中相关与无关的区域,将注意力集中在目标肾小球上,增强其边界特征,以提高分割精度;提出的基于增广路径的卷积填充方式可以解决传统补零填充存在的信息衰减效应以及贡献偏移问题,可以解决目标处于边界时存在的信息丢失问题,提高处于边界位置的目标的检测精度;提出的概率累积的滑窗预测方法利用特征复用提高了预测速度,同时可以解决小目标对位置敏感的问题。本文方法在不同的数据集上进行测试和比较,实验结果表明,本文方法优于较新的一些对比方法,增广路径的填充策略具有更稳定的性能表现以及更好的鲁棒性,基于概率累积的滑窗方法有着更高的分割精度,且大幅减少了计算时间。在后续工作中,将进一步探讨在多粒度空间注意力机制中,学习所需的局部窗口大小;另外,由于个别肾小球切片过程中成像目标过小,分割困难,网络训练过程中需要更多的这类样本,而这些目标的训练样本很少,可以进一步讨论利用生成对抗网络生成更多的小目标训练样本,以进一步提高预测精度。

猜你喜欢
步长切片粒度
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
粉末粒度对纯Re坯显微组织与力学性能的影响
基于矩阵的多粒度粗糙集粒度约简方法
基于粒度矩阵的程度多粒度粗糙集粒度约简
基于SDN与NFV的网络切片架构
肾穿刺组织冷冻切片技术的改进方法
基于逐维改进的自适应步长布谷鸟搜索算法
冰冻切片、快速石蜡切片在中枢神经系统肿瘤诊断中的应用价值比较
一种新型光伏系统MPPT变步长滞环比较P&O法
一种新颖的光伏自适应变步长最大功率点跟踪算法