结构图注意力网络的新冠肺炎轻重症诊断

2022-03-26 05:13刘彦北李赫南张长青肖志涛张芳隗英高耀宗石峰单飞沈定刚
中国图象图形学报 2022年3期
关键词:肺叶重症样本

刘彦北,李赫南,张长青,肖志涛,张芳,隗英,高耀宗,石峰,单飞,沈定刚,7

1. 天津工业大学生命科学学院,天津 300387; 2. 天津光电检测技术与系统重点实验室,天津 300387;3. 天津工业大学电子与信息工程学院,天津 300387; 4. 天津大学智能与计算学部,天津 300073;5. 上海联影智能医疗科技有限公司,上海 200232; 6. 复旦大学附属公共卫生临床中心,上海 201508;7. 上海科技大学生物医学工程学院,上海 201210

0 引 言

新型冠状病毒肺炎(corona virus disease 2019,COVID-19),简称“新冠肺炎”,其临床表现高度可变,当患者转为重症时,严重者可能会快速出现急性呼吸窘迫综合征、脓毒症休克等症状(Corman等,2020),病情恶化速度较快。因此,辅助医生快速准确地分辨轻重症病人进行针对性治疗无疑可以有效减轻患者病情,降低死亡率,对于新冠肺炎治疗具有十分重要的意义。通常判断新冠肺炎患者病情需要依赖医生丰富的诊断经验,医生通过临床检测、胸部CT图像等方法了解、判断患者病情,为其提供针对性治疗。但临床检测费时费力且大大增加了医生的感染风险。因此,作为一个替代的选择,基于医学影像的人工智能计算机检测方法成为辅助医生诊断的有力依据(左艳 等,2021),它可以加快疾病诊治速度,减少医护人员与患者的直接接触次数,降低感染风险。

目前已有大量学者利用机器学习、深度学习等手段进行新冠肺炎的检测与分析研究,但新冠肺炎轻重症的诊断仍旧是一个难点。首先是因为轻重症患者的人数比例严重不平衡,轻症患者数目远多于重症患者数目。依据中国疾病预防控制中心(Chinese center for disease control and prevention, CDC)的报告以及中国—世界卫生组织的联合报告,在中国新冠肺炎患者中,约包含14%重症患者和6%危重患者(Wu和McGoogan,2020;World Health Organization,2020)。因为重症与危重症均需重点关注,本文将其统一称为重症。此时轻重症患者比例约为4 ∶1(Wei等,2020),因此在使用真实数据集执行分类任务时将面临巨大的挑战;其次,不同患者感染新冠肺炎的程度不同,病灶大小不同,症状复杂,轻重症不易判断;最后,因为当前样本不足,直接利用图像执行分类任务容易过拟合。针对上述问题,Zhu等人(2021)利用Shan等人(2020)提出的VB-Net算法提取胸部CT图像中肺部患病区域的密度、体积和质量3种特定特征,并进一步利用特征实现了轻重症样本的分类任务。该方法首先利用1-范数进行特征选择降低维度,再利用0-范数平衡轻重症样本类别数目降低类别不平衡的影响,最后使用逻辑回归与线性回归的方法判别样本属于轻症患者或是重症患者并预测轻症样本有可能在未来多少天内转为重症。该算法首次对轻症与重症进行区分,并可预测转重症天数,但它存在计算复杂度高,性能与人为设定的0-范数、1-范数高度依赖,重症分类的准确率不高等问题。

针对上述问题和难点,提出一种基于结构图注意力网络的新冠肺炎轻重症诊断算法,用以提高新冠肺炎轻重症诊断的准确率。具体地讲,即以肺部实际解剖结构构建拓扑图,将左、右肺叶内的肺段当做节点,对应位置的CT图像提取特征作为节点属性。通过上述方法每个样本均可获得代表左、右肺叶的两幅子图。算法利用图神经网络获取不同节点的表示后再通过池化层获取左、右肺叶的图表示。此时图表示中既包含了CT图像提取特征,也融合了肺部结构信息。其次,因为每个样本的左、右肺叶感染程度不同,引入结构注意力机制,分别计算不同样本左、右肺叶对于自身疾病诊断的重要性大小,以此融合左、右肺叶的特征。最后,为解决数据中存在的轻重症样本类别不平衡问题,引入Focal-Loss损失函数。

本文主要贡献如下:1)提出结构图注意力网络的新冠肺炎轻重症诊断算法(structural attention graph neural network, SAGNN),该方法结合肺部的感染特征和真实的解剖结构信息利用图神经网络学习左、右肺叶图表示,并利用结构注意力机制融合左、右肺叶图表示获得最终整体图表示,以图分类的方式完成轻重症的判别。2)在模型中引入结构注意力机制——依据左、右肺叶对判别结果的重要性大小决定左肺叶特征与右肺叶特征汇聚时的权重系数。针对数据集内轻重症类别不平衡问题,采用Focal-Loss损失函数,提高困难样本的分类准确率。3)利用真实数据集验证模型有效性。良好的实验结果表明相比于其他方法,算法判别COVID-19轻、重度病例更加准确,尤其是重症判别的准确率取得了较大的提升。

1 相关工作

图(graph)在现实世界中是普遍存在的,如社交网络、引文网络和生物网络均可以构成图。它们通常以单个样本为节点,以样本间的关系为连接构建图。图G中包含众多节点与边,G=(V,E),V代表图中节点的集合,E代表图中边的集合。每个节点v均有自己的特征向量,节点之间的连接传递着重要的信息。在图神经网络(graph neural networks, GNNs)(Micheli,2009;Scarselli等,2009)中通常遵循递归邻域聚合的规则,每个节点依靠聚合其邻居节点的特征获得自身特征向量。经过k次聚合后,节点可以聚合k阶邻居节点的特征。目前,图学习已成为机器学习的一个重要研究方向,它可以连接到多种任务中,如图分类(Ying等,2018)、节点分类(Kipf和Welling,2016)和链路预测(Zhang和Chen,2018)等。

图分类是图学习中的一个重要任务,它通常在节点聚合其邻居节点的特征后利用池化层得到整图的表示,例如利用均值池化(mean-pooling)的方式将所有节点的特征值加和求平均以获得图表示。目前,学者们已经提出了许多通过优化聚合方式或池化层获得图表示的图分类方法。首先是优化聚合方式的方法,Hamilton等人(2017)提出GraphSAGE(graph sample and aggregate),该方法可以学习聚合邻居信息的“聚合函数”,均匀地采样固定个数的邻居。Xu等人(2018)提出了GIN(graph isomorphism network),该网络针对GraphSAGE的局限性,通过理论证明聚合函数采用SUM-Pooling的方式可获得更加优秀的性能。依据改变池化方式优化模型性能的方法包括Zhang等人(2018)提出的DGCNN(deep graph convolutional neural network),它采用一种特殊的包含排序和对齐功能的池化方式Sort-Pooling获取最终图表示。Ying等人(2018)提出的DiffPool同样针对池化层进行改动,它引入了一种自适应池化机制,该机制可以基于一种监督标准来获取当前层的节点表示。

当前,在新冠肺炎诊断领域图神经网络多用于新冠肺炎传播模式预测以及可使用药物预测。Kapoor等人(2020)利用图神经网络进行新冠肺炎传播模式模拟,其中节点表示区域级别的人类接触数据,边基于人类间的互相接触构建。Fritz等人(2021)也采用类似方法,两种模型均取得了不错的效果。Ioannidis等人(2020)、Doshi和Chepuri(2020)、Cheung和Moura(2020)则利用图神经网络预测医治新冠肺炎的药物或药物分子特性,结果也均令人满意。除此之外,也有一些学者利用图神经网络执行与新冠肺炎有关的分类任务,但大多数分类任务集中于区分新冠肺炎患者和非患者或区分新冠肺炎患者、普通肺炎患者和非患者。例如,Wang等人(2021)提出了FGCNet,即利用提出的DFF(deep feature fusion)融合CNN(convolutional neural network)与GCN(graph neural networks)分别提取图像特征与自注意力特征。Saha等人(2021)将提取的肺部边缘信息与图神经网络结合,仅考虑肺部边缘而不是整幅图,进而执行图分类任务,区分患者病情(包括二分类与三分类)。目前,面向轻、重症新冠肺炎分类任务的研究较少。Goncharov等人(2021)提出的模型可以识别COVID-19的潜在病例并量化病情程度,将其形式化为分类任务以及肺部患病百分比的估计任务。Zhu等人(2021)预测了样本是否为轻重症以及轻症转重症的时间。

尽管目前基于深度学习的新冠肺炎研究取得了不错的效果,但这些方法均忽略了人体内肺部不同部位间的内在联系,没有考虑实际结构信息。另外,上述方法同样未考虑肺叶患病程度不同对最终诊断结果的影响。因此提出一种基于结构图注意力网络的新冠肺炎轻重症诊断算法以解决上述问题。

2 本文方法

利用从CT图像中提取的质量特征、体积特征和密度特征3种特定特征以及肺部结构信息判别样本当前处于新冠肺炎轻症阶段或是重症阶段。模型主要分为4个部分:1)图的构建。利用肺部真实解剖结构以及特定特征构建图,肺叶中的肺段代表节点,CT图像提取特征为节点属性。每个样本构建的图包含两幅子图,分别代表左肺叶与右肺叶。2)节点级特征聚合策略。利用图神经网络聚合邻居节点信息,再利用池化层得到左肺叶和右肺叶分别对应的图表示。3)图级特征聚合策略。利用结构注意力机制聚合左、右肺叶图表示获得最终图表示,即计算左、右肺叶图表示对新冠肺炎轻重症判别的重要性大小,重要性越大,在聚合最终图表示时设置的注意力参数值将越大。4)分类结果及损失函数。利用分类器执行图分类任务获得最终分类结果。同时,利用Focal-Loss损失函数降低类别不平衡对分类结果的影响。具体算法框架图如图1所示。

图1 方法框架图Fig.1 Framework of the proposed method

2.1 图的构建

有效的图结构是应用图神经网络算法的重要基础。Tian等人(2020)以样本作为节点,基于样本特征之间的相似性来定义图边。Rakhimberdina和Murata(2019)提出以大脑中不同区域作为节点,区域的时间序列之间的函数关联构成边,获得的节点表示用于自闭症诊断。本文利用图神经网络引入肺部的结构信息,寻找特征间的潜在联系。因此提出以肺部内各肺段的实际位置关系构建结构图,将肺部结构作为图的结构信息融入图神经网络中,得到包含信息更加丰富的特征。

人体内肺包含左肺叶与右肺叶。右肺叶由上、中、下3个肺叶组成,其中包含10个肺段。左肺叶由上、下2个肺叶组成,其中包含8个肺段。在构建的图中因左、右肺叶间通过支气管连通无直接接触,因此将左、右肺叶构建的图看做两幅子图,代表右肺叶的图包含10个节点(10个肺段),代表左肺叶的图包含8个节点(8个肺段),二者间无连接。当肺段间具有实际接触关系时,连接它们对应的节点构成无向边。同时,利用CT分析工具 (Shan等,2020)从胸部CT图像中提取密度特征、体积特征和质量特征。密度特征定义为当前输入区域的平均CT值,CT值也称为HU值(Hounsfield unit);体积特征为当前输入区域的体积;质量特征依据密度特征与体积特征计算而得,可表示为

m=(HU+1 000)×V×0.001

m为质量,V为体积。

依据上述方法,提取每一肺段的整体密度特征、质量特征和体积特征,以及每一肺段中患病区域的密度特征、质量特征和体积特征。最终单一肺段提取特征的总维度为37。

提出的图用{G1,…,Gk}⊆G,Gk=(Vk,Ek)描述,即每个样本包含k幅子图(k=2),其中G1代表左肺叶的结构图,G2代表右肺叶的结构图。Vk表示第k幅子图中的节点,Ek表示第k幅子图的边。

2.2 节点级特征聚合策略

为了获取有效的图表示,首先需要汇聚肺部内各个肺段的特征,利用GNN汇聚邻居节点特征的计算方法可表示为

(1)

u∈N(v)∪{v}

为了计算出每幅子图的重要性,首先需要利用pooling层汇聚节点特征,得到图表示zk,具体方法可表示为

(2)

式中,SUM代表Sum-pooling,它将所有属于该图的节点特征进行累加,获得最终图表示用于后续计算。

2.3 图级注意力特征聚合策略

在传统图神经网络中,注意力机制往往应用于节点汇聚邻居特征时为不同邻居节点施加不同大小的注意力,本文将注意力机制应用于图级别。因为新冠肺炎患者左、右肺叶的感染程度往往是不相同的,所以在判别轻重症时应该对左、右肺叶给予不同的关注度。将作用于节点间的注意力机制转换为可应用于图级别的结构注意力机制,计算不同结构图所汇聚出的图表示对判别分类结果时的重要性,即计算左肺叶图表示以及右肺叶图表示分别对判别样本属于轻症还是重症新冠肺炎患者这一结果的重要性大小。通过图级别结构注意力机制达到对更能影响诊断结果的肺叶施加更大关注度的目的。引入的图级别结构注意力的计算方法可统一表示为

(β1,…,βk)=att(z1,…,zk)

(3)

式中,att(·)代表注意力层,即研究中应用的图级别结构注意力机制模块。βk代表经过深度卷积网络后所获得的第k幅子图的重要性大小。通过式(3)可以发现,每幅子图对判别结果的重要性是依据其自身所得图表示计算出的,与其他因素无关。

为了得到不同图表示向量对分类结果判别的重要性,SAGNN将图神经网络所得到的表示输入到非线性网络中进行整合,即将图表示输入到注意力层求出每一幅子图的影响力大小,具体计算为

pk=aT·tanh(W·zk+b)

(4)

式中,W是权重矩阵,b是偏差向量,a代表注意力层。pk表示第k幅子图的影响力大小。此时,不同的样本共享同样的W、b以及a这些网络参数,但因每个样本的子图所得到的图表示不相同,即输入不同,所以获得的影响力pk不同。

在得到每幅子图对于样本诊断的影响力后,利用Softmax函数进行归一化,计算为

(5)

式中,βk是第k幅子图的重要性大小,∑βk=1。第k幅子图获得的βk越大,代表由图神经网络所得到的图表示对判别结果的重要性越大,当前肺叶越有助于完成分类任务。

在计算出不同图表示对最终判别结果的重要性后,利用重要性将所有图表示汇聚为最终图表示。该过程可理解为在获得不同肺叶对疾病判别的重要性大小后,将不同肺叶的特征汇聚成一个统一的隐表示,该隐表示即为最终的图特征。计算为

(6)

式中,z是获得的最终图表示。为了更加清晰地说明图级别结构注意力特征聚合策略,图2展示了具体的计算过程。

图2 图级结构注意力特征聚合策略Fig.2 Explanation of attention based graph-level representation learning

2.4 分类结果及损失函数

为获得样本的分类结果,将分类器用于输出当前样本分别属于两个类别的概率。通过获得其中较大概率值的索引值得到样本分类结果,完成新冠肺炎轻重症诊断。同时面对训练中存在的新冠肺炎轻症患者与新冠肺炎重症患者间严重的类别不平衡问题,采用Focal-Loss损失函数进行优化,以减少对分类结果的影响。Focal-Loss损失函数的具体表示为

(7)

式中,C代表分类器中全部参数。该分类器由线性层与Softmax激活函数构成,输入最终图表示执行分类任务,诊断当前样本属于轻症或是重症。n是训练集中包含的样本数目,zm是样本m的最终图表示,ym是样本m的标签,α与γ是超参数。SAGNN通过反向传播优化所提出的模型,学习图的表示。

2.5 本文算法

SAGNN采用4层GNN层和1层注意力层。任意两个GNN层间均包含一个批标准化层(batch normalization,BN)和一个ReLU层。注意力层由两层线性层以及线性层中间的激活函数tanh组成。分类器由1层线性层和softmax函数组成,预测最终分类结果。

训练过程中的隐表示维度设置为128。Adam优化器和反向传播算法用于优化模型,初始学习率为0.001,每100个周期学习率衰减0.3倍,batch-size设置为64,训练次数设置为400。采用10倍交叉验证策略对所有比较方法进行评价,给出了性能的均值和标准差。

算法步骤如下:

输入:样本肺部不同部位的特定提取特征;α=0.325,γ=2。

输出:轻重症诊断结果。

1)初始化图神经网络参数M,W,b,a,C,并利用输入特征与肺部实际结构构建结构图。

2)汇聚节点信息,得到分别对应左、右肺叶的两个图表示。

3)利用图表示以及图级结构注意力机制,分别计算左、右肺叶的重要性。

4)根据计算的重要性汇聚左、右肺叶表示,得到最终图表示。

5)利用分类器输出分类结果。

3 实验结果及分析

3.1 数据集

采用的数据集由上海公共卫生临床中心和联影公司联合提供。目前,上海公共卫生临床中心的伦理委员会已批准了研究方案。数据集中所有患者均由中国疾病预防控制中心(CDC)根据新冠病毒核酸抗体的阳性结果进行确认。数据集包含336名患者,每名患者提供的不同次检测结果作为样本。数据集共包含样本1 687例,其中包括1 328个新冠肺炎轻症样本和358个新冠肺炎重度样本。每例样本所对应性别和数据集内患者年龄分布如表1和图3所示。CT图像由日立医疗公司的SCENARIA-64、飞利浦的Brilliance-64和UIH的uCT528三种型号的仪器采集。拍摄CT时充分吸气屏住呼吸,电压为120 kV,重建厚度1~1.5 mm。本研究中所有使用的特征均是利用V-Net模型自CT图像中分割不同肺段和肺段中的患病区域所得。

表1 样本性别分布Table 1 Subject distribution in terms of gender

图3 患者年龄分布Fig.3 Subject distributions in terms of age

3.2 性能分析

3.2.1 评价指标及对比方法

因数据集样本内部类别不平衡现象较为严重,准确率无法直观衡量模型算法性能,因此采用ROC(receiver operating characteristic)曲线下面积(area under curve, AUC)、灵敏度(sensitivity, SEN)和特异度 (specificity, SPE)进行评价,SEN与SPE的计算方法可表示为

(8)

式中,TP为真阳率,代表样本为重症且预测为重症的样本数;FN为假阴率,代表样本为重症但预测为轻症的样本数;FP为假阳率,代表样本为轻症但预测为重症的样本数;TN为真阴率,代表样本为轻症且预测为轻症的样本数。综上,SEN为重症判别准确率,SPE为轻症判别准确率,AUC为ROC曲线下的面积,3个评价指标数值越大代表模型性能越好。

为验证模型的有效性,本文算法分别与经典的机器学习方法和流行的图分类算法进行比较,经典的机器学习方法有支持向量机(support vector machines, SVM)(Cao等,2006)、逻辑回归(logistic regression, LR)(Ng和Jordan,2000)、高斯朴素贝叶斯(Gaussian naive Bayes, GNB)(Xue和Titterington, 2002)和多项式朴素贝叶斯(multinomial naive Bayes, MNB)(Xue和Titterington, 2002);图分类算法有图卷积网络(graph convolution network, GCN)(Kipf和Welling,2016)、GraphSAGE(graph sample and aggregate)(Hamilton等,2017)和GIN(graph isomorphism network)(Xu等,2018)。此外,在算法框架下,为验证结构注意力机制对分类结果的有效性以及损失函数Focal-Loss对类别不平衡问题优化的有效性,考虑了3种变体,即SAGNN-atten、SAGNN-FL与SAGNN-atten-FL进行消融实验。SAGNN-atten在汇聚左、右肺叶特征时,不再计算左、右肺叶的重要性,赋予二者相等的重要性,损失函数采用Focal-Loss;SAGNN-FL仍计算左、右肺叶重要性,但损失函数替换为交叉熵损失函数;SAGNN-atten-FL不计算左、右肺叶重要性且采用交叉熵损失函数。

所有对比模型均遵循原始参数,且与SAGNN采用相同的10倍交叉验证,最终取10次结果的平均值与方差,所有实验的具体结果如表2和表3所示。

表2 分类实验结果Table 2 Classification results

表3 消融实验结果Table 3 Ablation experimental results

3.2.2 结果分析

表2主要展示了SAGNN与对比方法的性能比较。从表2中可以看出,传统机器学习方法的轻症诊断准确率(SPE)普遍较高而重症准确率(SEN)普遍较低,这是因为使用的训练集中轻重症样本比例约为4 ∶1,且测试集同样如此。与此同时,包括SAGNN在内的所有应用图神经网络的模型在具有相同训练集与测试集的情况下,SEN方面取得了较好的提升。此时轻症判别准确率虽然有所降低但并不多,且重症判别准确率提升使得AUC得到提升。基于上述对比,可以发现引入图结构对于新冠肺炎的轻重症分类诊断是有帮助的。

SAGNN算法与传统机器学习方法相比在SEN上取得了较大的提升(14.2%~42.0%),与其他图神经网络的方法相比提升了3.6%~4.8%。与此同时,SAGNN在AUC指标上也取得了一定的提升,在与传统方法和图分类算法对比时取得了8.9%~18.7%和3.1%~3.6%的提升。为了更直观地对模型性能进行比较,实验提供了最终图表示的可视化聚类结果,如图4所示。具体而言,通过t-SNE(van Der Maaten,2014)工具箱将SAGNN和不同对比算法学习到的最终图表示分别投影到2维空间中形成样本点,并根据样本点的标签对其着色。在图4中,蓝色和红色样本点分别代表COVID-19轻症样本和COVID-19重症样本。不同颜色的样本点类间距离越大、类内聚敛效果越好,代表模型获得的表示效果越好,越有利于分类。通过图4可以发现,相比于图4(a)—(c)的方法,图4(d)的方法中红蓝样本点间的界限最为清晰,两类样本的类间距离最大。但同时也可以发现,本文方法的类内聚集效果并不十分理想,样本点间距离较分散,这可能是因为缺少类内约束的原因。

图4 可视化实验结果Fig.4 Comparison of visualization of results on dataset among different methods((a)GCN;(b)GIN;(c)Graph-SAGE;(d)SAGNN)

表3中展示了消融实验的结果,可以发现注意力机制与Focal-Loss损失函数在模型中均起到积极的作用。通过对比SAGNN-atten-FL与SAGNN-FL和SAGNN-atten,可以发现结构注意力机制对于模型的提升相对更大,在SPE,SEN,AUC指标上SAGNN-FL比SAGNN-atten-FL提升了2.4%,1.4%,1.1%;SAGNN-atten比SAGNN-atten-FL提升了2.1%,1.1%,0.9%。

3.3 算法分析

3.3.1 拓扑结构图分析

通过表2可以发现未利用图结构的传统机器学习方法对于重症的分类效果明显低于利用了图拓扑结构的图神经网络方法,其中基于图的方法(不包括SAGNN)在SEN方面领先传统机器学习方法10.6%~38.4%,在AUC方面领先5.8%~15.6%。由此可以发现引入图结构对疾病的判别具有帮助,对于重症的判别能力提升明显。为了进一步证明所提出的基于肺部结构构建拓扑结构图的科学性,计算了不同肺段特征两两之间的相关性r,计算公式为

(9)

式中,xp与xq为要计算相关性的两个特征向量,d为向量维度,m为所有样本数。在计算过程中,对结果取绝对值。为方便观察用热力图表示其数值大小,相关性越大颜色越深。依据统计学相关理论,|r|≤0.5为不相关或低度相关;0.5<|r|≤0.7为中度相关;0.7<|r|≤1为高度相关。图5为计算的相关性结果。图中LS_1~LS_8分别代表左肺叶8个肺段,RS_1~RS_10分别代表右肺叶的10个肺段。

图5 肺段间相关性Fig.5 Correlation of lung segment features((a)left lung segment;(b)right lung segment)

在构建图结构过程中,以左肺叶为例,将左肺上叶前段(LS_1)与左肺上叶上舌段(LS_2)和左肺下叶背段(LS_4)分别相连,除此之外左肺上叶前段与其他节点无连接。与此同时可以发现,如图5(a)所示,LS_1与LS_2,LS_4的相关性相比其他节点更高,这也证明在它们之间存在着潜在的联系。肺部间相连肺段患病特征具有高度相关性这一现象也说明了构图方法的合理性,即相互接触的肺段的患病特征较为相似。

3.3.2 结构注意力机制分析

图6分别统计了在训练集和测试集上不同样本对左、右肺叶特征的注意力分配情况,蓝色柱状图代表分配给样本右肺叶的重要性大于左肺叶,红色柱状图代表样本左肺叶的重要性大于右肺叶。通过图6可以发现在训练集中右肺叶在疾病判别中扮演更重要角色的样本数是左肺叶扮演更重要角色的样本数的2.79倍,测试集中恰好为3倍,二者比例较为一致。上述结果表明右肺叶通常对于新冠肺炎轻重症的判别有着更大的作用,这一结果从实验角度证明了在利用深度学习方法诊断新冠肺炎轻重症时左右肺重要性并不相同,验证了结构注意力机制的有效性。

图6 左右肺叶重要性大小统计Fig.6 Statistics of the attention of left and right lungs

4 结 论

基于图神经网络以及注意力机制,提出了结构图注意力网络的新冠肺炎轻重症诊断算法,利用肺部实际解剖结构构建拓扑图,引入结构注意力机制,以图分类的方法实现对于新冠肺炎轻重症样本的分类任务。同时,模型引入Focal-Loss损失函数,降低样本类别不平衡对分类结果的影响。在新冠肺炎数据集上与其他方法相比,重症判别准确率取得了3.6%的提升,AUC指标取得了3.1%的提升。在下一步工作中,将会考虑将预测轻症样本是否会转为重症的概率和时间加入到任务中,以多任务的方式进一步优化模型,提升模型准确度。

猜你喜欢
肺叶重症样本
优化急诊护理在重症颅脑损伤中的应用
全方位促醒护理在重症脑出血术后昏迷患者中的应用观察
不同肺复张方法应用于胸腔镜下肺叶切除术中的临床效果比较
上海此轮疫情为何重症少
雪后
幽灵
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
基于支持向量机的测厚仪CS值电压漂移故障判定及处理
七年级数学下册期末检测题(B)