叶 枫 王路遥 洪 卫 丁国军 车镓荣
1(浙江工业大学管理学院,杭州 310023) 2(浙江省肿瘤医院医院胸部肿瘤科, 杭州 310023) 3(浙江省肿瘤医院医院放射科, 杭州 310023)
中国疾病预防控制中心与美国华盛顿大学健康测量及评价研究所(IHME)最新调查结果显示[1],中国年龄标准化下的肺癌死亡率有所上升,肺癌导致寿命损失的排名从1990年的第13位升至2017年的第3位。降低肺癌死亡率、延长病人生存时间,最关键的是早发现、早诊断、早治疗。早期疾病的5年相对生存率超过50%,而晚期疾病的生存率不到5%[2]。目前,临床前期诊断主要根据影像学检查、穿刺肺活检(PALB)、痰液细胞学检查、纤维支气管镜检查等方法[3],但由于肺结节在胸腔内,部位特殊,肺部的小病灶常因呼吸而移动,定位不准、重复穿刺容易产生严重的并发症。影像学X线计算机断层摄影包括CT图像、胸部X线片、PET[4],其中CT扫描速度快,能够捕捉到微小病变区域,并且图像清晰度高,所以在实际的肺结节检测与诊断中得到广泛应用[5]。传统肺结节诊断是靠医生直接观察大量的CT图像,凭自身经验识别与判断患者肺结节的良恶性等级,缺乏客观的标准。计算机辅助结节识别诊断模型,能够在医生辨别肺结节良恶性上给出参考性意见,其主要判断依据是结节的大小,肺癌的风险随结节的大小呈指数增长,同时结节的内部结构、钙化、纹理、毛刺征、分叶征、圆度、边界以及细致度等都是判断结节良恶性的重要依据。伴随着人工智能技术的发展,尤其在深度学习的图像识别领域,大量专业性诊断分析工具应运而生[6-8]。其中,基于卷积神经网络(CNN)肺结节分类算法效果显著[9-10]。Song等[11]比较分析了用于肺癌钙化检测的3种深度神经网络模型(CNN、DNN、SAE),在LIDC数据库上对肺结节的良恶性进行诊断分类、预测评估。实验结果表明,CNN的性能优于DNN 和SAE的性能,准确率为84.15%,灵敏度为83.96%,特异性为 84.32%,在3种网络中效果最好。Yang等[12]对LIDC-IDRI数据集进行了增广,并使用简单图形生成了大量的样本, 通过4层卷积网络进行分类,最好的分类误差小于0.05。Ramaswamy等[13]对比了几种经典的分类网络2D和3D的AlexNet和 GoogLeNet等,得到89.6%的敏感度和86.2%的准确率;Zhao等[14]提出了一种新的敏捷卷积神经网络框架,以克服小规模医学图像数据库和小结节尺寸的难题。该模型根据组合LeNet的图层设置和AlexNet的参数设置而构造,通过参数优化设置得到85.6%的准确率。Hua等[15]将2-D CNN应用于肺结节的分类中,解决了传统计算机辅助系统性能不够稳定、由人工制定的规则不够全面和无法持续提高准确率等问题。从LIDC-IDRI数据库中选择2 545个直径大于3 mm的肺结节进行实验,最终该方法的灵敏度为73.3%,特异度为78.7%。
尽管在图像识别领域肺结节辅助诊断技术取得了一些突破性进展,但在实际的应用领域仍存在诸多的问题。首先,大多数的模型针对公开数据集LIDC-IDRI进行训练测试,但要作为临床医生辅助诊断的参考依据,准确率、特异性等指标还不够理想;其次,目前的一些研究在数据预处理上没有进行明确的样本分析,且对图像的处理比较粗略,在提取肺结节上需要人工选取阈值,存在一定的经验性,不能做到样本的统一均衡处理;最后,传统的CNN框架包含三部分:卷积层、池化层以及全连接层。CNN在运作时,高层特征将低层特征进行线性组合,并传入到激活函数中进行激活[16]。在这个过程中,高层特征与低层特征之间并不存在位姿(如平移和旋转)关系。同时,CNN通过使用最大池化、平均池化以及后续卷积层,减少网络的数据空间,增加高层网络神经元的“视野”, CNN的处理效果几乎优于先前的任何网络模型,但池化操作使得神经元忽略了除上一层最活跃的神经元以外的所有其他神经元,大量潜在有价值的信息被遗失。
针对以上问题,本研究采用了一种具有动态路由机制的胶囊网络(CapsNet)进行肺结节分类检测,并在特征通道层面上对网络进行改善,构建SENet块,采取“特征重标定”策略,在不引入新的空间维度下进行通道融合。在数据预处理上,建立了一套完整的图像去噪流程,并对预处理数据进行数据扩增,提高网络的泛化能力。试验表明,在基于本研究的预处理条件下改进CapsNet网络模型,可以有效地进行肺结节图像分类。
胶囊网络(CapsNet)[17]源自改进传统的CNN中的平移不变性,以及池化带来的信息丢失等缺陷。CapsNet采用胶囊模块代替CNN中的神经元,用来表示一些特定的实体类型,如姿势(位置、大小和方向)、变形、速度、反射率、颜色、纹理等。例如,在图像识别里,将图像中的空间信息编码作为特征。CapsNet通过训练,捕获图像的特征及其变体的可能性,而非捕获特定变体的特征。因此,胶囊的目的不仅在于检测特征,还在于训练模型以学习变体,以便同一胶囊可以在不同方向上检测相同的对象类别。Hinton等使用CapsNet在MNIST数据集上,实现了0.25%的分类错误率,5.2%的多变量分类错误率,以及10.6%的CIFAR10分类错误率,2.7%的smallnorb分类错误率。当前,CapsNet被应用于多个领域,如人像识别、语义识别等。本研究在CT图像的肺结节分类上应用CapsNet,并通过加入SENet优化处理进行改进。实验结果表明,该方法对于肺结节的分类效果明显改善。
图1 动态路由机制Fig.1 Dynamic routing mechanism
在CapsNet中提供了一种基于聚类思想的结构,代替CNN中的池化层完成特征整合,称之为动态路由。动态路由是一种信息选择机制,作用于两层胶囊网络之间,对主胶囊层(primary capsule)的特征层次进行聚类,并将聚类输出的特征信息传给对应的数字胶囊层(digital capsule)。CapsNet本身也可以通过动态路由算法带来类似于池化的不变性,其优势在于:相对于传统的池化算法,胶囊保留了全部的图像特征,其表达能力更强;能够根据自身的特性更新参数,从而初步达到梯度下降的目标。动态路由的作用过程如图1所示。特征层次经主胶囊层进行编码获得初级胶囊ui,通过乘以权值矩阵wij进行变换得到所有的预测向量uj|i(1,…,n),wij为待训练的权值矩阵,通过反向传播梯度更新进行训练;动态路由则作用于所有预测向量uj|i与主胶囊层的输出sj之间。
bij←bij+〈vj,uj|i〉
(1)
(2)
式中,bij是归一化前的耦合系数,初始化为0。动态路由机制使得bij到第j个胶囊时,迭代增加〈vj,uj|i〉。经过三次迭代,得到主胶囊层的最终输出vj。在动态路由过程中,参数bij和wij分别通过动态路由算法和梯度下降反向传播算法有区别地训练[18]。
在CapsNet中,每个主胶囊层胶囊输出一个既存在方向又有长度的激活向量。其中,激活向量的长度表示特定实体出现的概率,激活向量的方向表示该实体所对应的更高层级属性。但是,传统CNN中的softmax或sigmoid激活函数不能对向量进行压缩。因此,CapsNet引入非线性squash函数,以确保短向量压缩到几乎为零的长度,长向量压缩到略小于1的长度,同时保持激活向量的方向不变。在实验中发现,原CapsNet中的激活向量会对全局变量进行压缩,因此本研究将原函数加以变换,有
(3)
这个函数的特点是在向量的长度接近于0时能够起到放大作用,长度接近1时仍保持原始的压缩作用。
提出SE-CapsNet架构,网络结构如图2所示。内含7个关键步骤:预处理数据输入、卷积层、primary capsule、SEblock、digital capsule,以及重建与分类两个分支。首先为避免其他因素的干扰,通过预处理构造肺部掩膜,提取肺实质,同时采用最大类间方差法,对肺结节轮廓进行提取填充,获取肺结节感兴趣区域。为使网络结构能够更好地抓住一些底层的信息(如肺结节的边缘等),在CapsNet中仍然保留卷积层为第一层结构,而主胶囊层与数字胶囊层则用于检测更深层次、更复杂的对象。
图2 SE-CapsNet结构Fig.2 Architecture of SE-CapsNet
1.3.1肺结节提取
样本提取主要包含两部分:一是对原始CT图像进行肺实质提取与肺结节分割的去噪处理,二是对样本数据降维与增强。预处理流程如图3所示。
图3 CT图像预处理流程Fig.3 CT image preprocessing process
1)图像去噪。其主要作用是去除胸腔中的血管、气道等组织结构,包含肺实质分割与肺结节分割两个步骤[19]。首先采用Hu等设计的一个经典肺分割流程[20],即灰度阈值分割、连接度分析、左右肺分离,形态学闭合肺内高密度结构。采用阈值优化算法,寻找最大两个连通分量,肺粘连时不断用形态学腐蚀的方法将其分离,最终得到仅包含肺实质的图像I。根据医生标注的肺结节范围,从肺实质图像中分割肺结节感兴趣区域(ROI),此时该区域周围粘连肺实质等组织结构,通过最大类间方差法对肺结节轮廓进行提取并填充。肺结节分割的一个例子如图4所示。
图4 肺结节提取。(a)原始肺部;(b)肺实质;(c) 肺结节放大Fig.4 Extraction of pulmonary nodules (a)Original lung CT; (b) Lung parenchymal;(c) pulmonary nodules enlarged
2) 数据降维。在分割得到的肺结节图像中,每个结节包含3~20张切片。但对于同一个结节,由于z轴的不同,结节的大小以及形态具有较大的差异性,且在自动阈值提取肺结节时,像素区分度不高的结节切片易发生分割错误(通常在z轴维度最大或者最小时)。通过只提取靠近中心结节的办法,降低结节自身大小等因素变化带来的影响。对于LIDC-IDRI 数据集,采用加权求和划分方法,降低原始数据评价中由于各医生评定结果不一致带来的影响。
针对公共数据集LIDC-IDRI,放射科医生将肺结节的恶性程度分为5类:癌症可能性极小、癌症可能性小、不确定可能性、癌症可能性中等和癌症高度怀疑。本研究仅对肺结节的良恶性进行划分,采用文献[21-22]中的划分方式,等级1、2划分为良性,等级3、4划分为恶性。在标注过程中,由于不同医生之间的标注会存在误差,造成同一个结节属于不同的类别。本研究在数据划分时采用加权求和的方法,对5类恶性程度赋予不同的权重,权重划分如表1所示。
表1 权重划分Tab.1 Weight partition
划分方式如下:
(4)
式中,wi为第i个医生判断的结节所对应的恶性等级权重,xi为评定该结节的医生,其值为1。当结果大于0时,划分为良性类;小于0时,划分为恶性类;等于0时,同时分配到两个类中,最终得到集合。
3)数据增强。增强样本,可以提升有限训练样本的泛化能力。在本研究中,数据增强采用图像平移、左右翻转以及添加噪声点的操作来增加结节图像的数量。
1.3.2肺结节诊断
构造的SE-CapsNet网络结构如表2所示,由预处理输入层、卷积层、主胶囊层、SENet(squeeze and excitation networks)[23]等7个模块组成。由于原始的CapsNet网络为获取更加丰富的底层结节特征信息,在引入胶囊与动态路由概念改进传统CNN的同时,带来了较为严重的计算代价。为提高原始CapsNet性能,本研究通过加入SEblock网络结构,从特征通道层面对模型进行优化,在胶囊层之间进行改进。SEblock通过衡量特征通道之间的关系,显示通过“特征重标定”策略,在不引入新的空间维度的情况下进行通道融合。通过学习的方式,自动获取每个特征通道的重要程度参数。原始主胶囊层输出向量vi由式(3)的激活函数计算,输入数字胶囊层。在该过程中间,对每一个胶囊结构插入一个SEblock,对不同胶囊的不同特征赋予不断学习的权重,从而加快模型的训练速度。SEblock嵌入CapsNet网络如图5所示。肺结节图像经primary capsule结构输出,得到主胶囊层胶囊vj,维度为c×h×w。vj首先经过挤压操作,根据时间维度进行特征压缩,再将二维通道压缩,得到一个具有全局感受野的实数,输出结果的维度和输入的特征通道数相匹配,此处的挤压操作计算方式为
(5)
表2 SE-CapsNet模型的详细信息Tab.2 The details of the SE-CapsNet
图5 嵌入SEblock模型结构Fig.5 The embedded SEblock model structure
其次是激励操作,它类似于循环神经网络中门的机制,通过参数给每个特征通道生成不同的权重。激励操作的计算方式如下:
fex(zj,W)=σ(W2δ(W1zj))
(6)
uj=Fscale(vj,sj)=sj·vj
(7)
激励操作的输出权重为特征选择后每个特征通道的重要性,通过逐通道加权到先前的特征上(见式(7)),完成在通道维度上对原始特征重要性重标定。
在CapsNet中,最后6个网络层为分类与重构层。分类主要用于计算最终肺结节良恶性诊断;重构层则是用于在训练过程中增强模型的泛化程度,降低模型由于过度训练造成过拟合。
1)分类。在进行分类任务时,用计算不同类别对应的激活向量的模长表示该类型实体存在的概率,其中模长最大的胶囊对应分类结果。当网络检测到了某种实体时,概率趋近于1;而当网络认为某种实体不存在时,概率趋近于0。CapsNet的损失函数采用支持向量机(support vector machine)[24]中经常使用的 Margin loss,其表达式为
λ(1-Tj)*max(0,‖Vj‖-m-)2
(8)
式中:j是分类的类别;‖Vj‖表示第j个数字胶囊的长度;Tj表示第j个目标标签,当j类存在时,Tj为1,否则为0;m+与m-分别代表上下边界值;λ是降低权重的因子,用于防止在初始学习过程中缩小所有胶囊输出的长度。
2)重构肺结节。在神经网络训练过程中,通常会使用正则化降低过拟合的风险。在SE-CapsNet中,采用一种重构(reconstruction)结构进行正则化。重构结构忽略分类错误所对应的Capsule的激活向量,采用Mask层的值重新构建原始图像。重构结构类似于自动编码机中的解码器(decoder),通过重构肺结节与原始肺结节图像,计算得到重构损失,并将其计入模型总损失,经由梯度回传进行更新。重构结构实现了正则化目的,激励Capsule的激活向量包含更多的特征信息。本研究尝试了多种重构方式,包括全连接、卷积+上采样、反卷积等,最终选择使用多层反卷积的结构,使肺结节数据重构效果最优,有
L=L1+λ2L2
(9)
式中,分类损失L1与重构损失L2共同构成了SE-CapsNet的总损失L。
为了确保分类的准确性,λ2应恰当地选择。经过多次反复实验,最终设置参数λ2=0.01。
1.4.1数据描述
为提高研究实用价值以及信度,本研究选取LIDC-DRI数据库[25]中1 010例数据进行实验,每个病例包含肺部CT图像100~300张。由于LIDC-IDRI数据库不能体现临床辅助诊断效果,因此又选取了30例医院真实样本进行测试,其中25例为恶性结节病例,5例为良性结节病例,直径范围为3~30 mm,共包含肺部CT图像7 861张,选取的病例均有完备的CT资料。
1.4.2模型训练
对模型中的不同参数进行系统评估,包括整个模型中主胶囊层胶囊的个数、数据集样本大小和图像尺寸。为了观察网络配置的性能对模型的影响,本研究分析了主胶囊层胶囊个数、样本的数据量大小以及图像尺寸3个因素。在SE-CapsNet中,Ncaps为主胶囊的数量,通常为8个胶囊,通过实验比较,Ncaps={2,4,8}时,模型的性能存在一定的差异。为捕获不同尺寸下结节形态的影响,对预处理图像尺寸分别为Isize={16×16,32×32,64×64}时的模型进行实验评估。对于数据集大小的差异,随机取预处理数据的{1/4,1/2,1},数据扩增后,进行模型检验。
首先对原始数据集经预处理得到的肺结节样本进行5折交叉验证,将实验数据集划分为训练集、验证集和测试集3个子集,将得到的准确率、敏感性、特异性3项评估指标分别取均值。评估实验共进行了10次,取平均值作为最终的实验结果。该算法使用python3.7,在TensorFlow框架下编写,在带有GTX1070GPU的计算机上实验,具体实验分析如下。
利用基于SE-CapsNet的肺结节分类算法,对给定标签的预处理数据集按不同评价标准进行性能评价。首先定义良性肺结节为阴性(N),恶性肺结节为阳性(P),TP、FP、TN、FN则分别表示真阳性、假阳性、真阴性、假阴性,如表3所示。
表3 分类统计量Tab.3 Classification statistics
根据上述4类样本实例的实验结果,定义准确性、敏感性和特异性3个评价指标,每个指标的具体计算方法如下:
(0≤AC≤1)
(10)
(11)
(12)
式中:准确性(accuracy, AC),表示正确分类的样本占所有样本的比例,直接反映分类算法的精度;真阳性率或敏感性(sensitivity,SE)表示正确分类的恶性结节占所有真实恶性结节的比例,反映算法的误检率;真阴性率或特异性(specificit,SP)表示正确分类的良性结节占所有良性结节的比例,反映算法的漏诊率。
在肺结节良恶性诊断阶段,由SE-CapsNet得到分类结果。肺结节随着候选切片序列的顺序,从预处理到输入诊断效果,如图6所示。预处理的方法在一定程度上降低了切片上其他组织的影响,但在基于阈值的肺结节提取上,却造成了结节原始形态的腐蚀过度,并产生噪声留存等影响,而对于检测结果而言,目前造成的影响较小。SE-CapsNet与CapsNet二者诊断指标如表4所示,数据显示前者的准确率为95.83%,与后者相比整体的准确率提高了2.34%。可见,构建SENet网络块进行特征重标定,能够有效地加强网络的诊断能力,提高结节诊断的准确率。
表4 SE-CapsNet与CapsNet诊断结果Tab.4 SE-CapsNet and CapsNet diagnosis
图6 SE-Capsnet诊断学习(从左到右为候选切片序列,前4张图片为通过CT图像提取恶性肺结节感兴趣区域,并诊断为恶性,后2张为提取的良性肺结节并诊断为良性)Fig.6 SE-Capsnet diagnostic learning (left to right is the candidate secton sequence. The first four images are CT images to extract the ROI of malignant pulmonary nodules and diagnose them as malignant. The last two were extracted benign pulmonary nodules and diagnosed as benign)
根据本文第1.4.2节的描述,研究共测验了3种不同的胶囊数量配置,评估结果如图7所示。经测验,SE-CapsNet模型结果稳定,准确度均高于80%,当Ncaps=8时,取得最高分类精度为95.83%。实验结果表明,针对模型较小的胶囊网络结构,增加胶囊个数,拓宽网络结构,在一定程度上会大大增强网络的学习能力,能提取更多深层次的结节语义特征,继而达到高效的诊断结果。除了Ncaps,还评估了预处理后肺结节图像切割尺寸的影响。训练SE-CapsNet输入不同的Isize,分类精度比较如图7所示。可以看出,对于不同尺度的肺结节样本,模型诊断的结果差异相对明显,当样本的尺度较大时,模型得到充分的训练学习,对于良恶性结节之间的差异特征提取更丰富,从而实现更好的评判。从实验结果来看,Ncaps数量取较大的值,加大样本的尺度,模型的泛化能力越强,诊断可靠性将会越高。
图7 不同参数的测试精度Fig.7 Test accuracy of different parameters
表5 不同数据量的分类精度Tab.5 Classification accuracy for different data volumes
实验结果表明,数据越多,模型从训练数据中提取的结节良恶性特征更丰富,从而实现更高的效率。
一个良好的肺结节诊断模型,除了具备精准诊断结节恶性程度的能力外,模型的计算效率也至关重要。对SE-CapsNet模型与传统的CapsNet,分别取10次重复实验的平均值进行比较,本研究模型的实际正确分类的样本准确率有一定程度的提高,表现出了较好的分类效果,且模型的收敛速度也有进一步的改进。模型经多次迭代后收敛到最优解,SENet在每次的训练过程中不断迭代特征通道权重,加速模型得到最优解的速度。以某次随机实验的总损失与训练精度结果进行比较,如图8所示。相较于原始胶囊网络,在近200次循环后,loss开始趋于平缓,并稳定在一个较小的值。SE-CapsNet在训练的第50次时已趋近于收敛。由此可见,添加SENet模块能够有效地改善反馈调节时造成的梯度消失问题,加快网络收敛,使训练时长缩短。SE-CapsNet在提高收敛速度的同时,使训练分类精度同步提高,如图9所示。但由于干扰因素的存在,改进模型在训练期间存在一定的扰动。
图8 Loss对比Fig.8 Loss comparison
图9 精度对比Fig.9 Accuracy comparison
不同的模型,数据预处理方式与特征提取算法的结果存在差异性,难以进行单一的定量比较。为增加模型的可比性,本研究选取了同样采用LIDC-IDRI数据集进行训练的分类模型。文献[15]首次将深度学习技术应用于肺结节分类问题的研究,在深度置信网络 (DBN) 上最终取得了82.2%的敏感性。文献[26]提出的多尺度卷积神经网络,在基于非精细化图像处理下的肺结节分类精度达到87.5%,在保证模型分类准确率的情况下,大大降低了前期数据准备的工作量。与上述几种方法进行比较,如表6所示。数据表明,所提出的肺结节诊断方法SE-CapsNet的准确率和敏感性均优于几种文献所提出方法的相应性能。这是由于文献[15]与文献[26]虽然都采用了预处理的方式对原始数据进行去噪,但前者采用的模型架构较为简单,不足以进行充分的特征提取,而后者在用多个网络进行多尺度特征提取时,保留池化操作以降低模型的计算参数,使得训练过程中低活性神经元失活,丢失掉了一部分重要信息。与文献[27]中表现优异的模型相比,本研究在基于精细化预处理的前提下,模型的分类准确率达到了95.83%,远高于该文献所提出分类方法的准确率。
表6 不同分类模型比较Tab.6 Comparison of different classification models
临床试验基于来自浙江省某医院的30例脱敏肺癌患者的病例样本,这些病例是医生随机抽取的。样本中已确诊为恶性的 25例,已确诊为良性的5例。样本病例提取的结节如图10所示。通过预处理以及精细化图像分割,最终共获得77个肺结节图像样本,其中良性的11个、恶性的66个。选择15个作为测试样本,62个作为训练样本,在先前模型的基础上进行再训练,并进行测试。
图10 医院样本示例(从左到右:前3例样本为恶性肺结节,后2例为良性肺结节)Fig.10 Examples of sample hospital(From left to right, the first three samples were malignant pulmonary nodules, the last two were benign lung nodules)
这5次实验的诊断准确率如表7所示,平均准确率为94.67%,相比于LIDC-IDRI数据集的测试准确率,该样本数据集的准确率存在一定的下降,模型存在轻微的过拟合现象,但仍保持较高的水准,这对临床医生依据CT图像判定肺结节良恶性具有一定的参考价值。
表7 五折交叉验证准确率Tab.7 5-fold cross validation accuracy
本研究提出一种基于胶囊网络的SE-CapsNet深度学习架构,对结节进行精细化的预处理,提取无噪声的肺结节结构,明显提高了模型分类的精度。同时,将结节特征提取嵌入到分层网络中,消除手工制作特征工程带来的人为因素影响,简化常规肺结节良恶性分类的工作流程。在CapsNet舍弃传统CNN卷积网络中池化等操作以增强特征的学习能力时,势必会带来特征冗余、网络训练周期长等问题,因此引入SENet的思想,对胶囊的重要程度进行学习。这种改进不仅提升了检测效果,同时提高了模型的收敛速度,图7与图8验证了该改进算法的有效性。表5给出的与其他优秀算法比较的结果表明,在基于精细化处理的前提下,虽然前期数据预处理的工作量较大,但与文献[26]提出的基于非精细化处理的多尺度卷积神经网相比,精度提高了8.33%,说明精细化处理在一定程度上影响模型的预测效果。与基于CNN的模型[15]相比,本研究模型的特异性更优,分析表明:舍弃池化等操作,改用胶囊结构,可以明显减少恶性结节的漏诊。本研究还存在如下不足:一是精细化预处理方法耗时较大,且针对肺结节与毛细血管的粘连,自动分割容易导致分割偏差;二是需要对训练样本中的肺结节进行标注,并且给出金标准的良恶性结果。目前,对CT样本图像中的肺结节标注是由放射科医生完成的,存在不同医生的标注结果有差异的情况。下一步的研究将引入肺结节自动识别功能,以提升模型和方法的可操作性。
本研究提出基于SE-CapsNet的肺结节诊断方法,在LIDC-IDRI数据集上,结节诊断的总体分类准确率为95.83%,特异性为93.5%,敏感性为92.1%。实验表明,本研究与原始的CapsNet模型相比,准确率提高了2.34%,且收敛速度更快。为验证模型与方法的临床应用价值,利用浙江省某医院随机抽取的30例样本进行实验,最终模型的平均准确率为94.67%,说明在实际的应用场景中模型的表现良好。相较于三维图像的立体化信息,本研究模型与方法所针对的数据集为二维图像,信息量相对较小。在下一步的研究中,将通过CT图像三维重建技术,提取隐藏在第三维度的肺结节信息,从而进一步提升模型分类准确率[29-31]。