姚 凌 程 雯 王 萃 管 睿
肺发育不成熟引起的呼吸窘迫综合征是新生儿发病和死亡的重要原因[1]。羊膜腔穿刺术是目前临床产前评估胎儿肺发育成熟度的常用方法,但其有创,可能对胎儿及孕妇造成一定伤害,且重复性差[2]。近年有研究[3-4]初步证明超声图像中胎儿肺纹理信息可显示胎龄与胎儿肺发育成熟度的相关性。因此,早期确定胎儿肺发育成熟度,对其肺发育过程中存在的潜在问题进行干预,对临床有重要指导意义[5]。本研究假设胎儿肺发育过程可以由超声图像中的肺纹理信息来表示,而胎儿肺发育成熟度通常与胎龄成正比,因此,超声图像中胎儿肺纹理信息能在一定程度上反映胎龄。如果基于超声图像胎儿肺纹理的模型可以估算胎龄,则该模型可以估算胎龄代表的胎儿肺发育成熟度。本研究收集胎儿心脏四腔心切面中肺部超声图像,建立一个大型数据库,通过独立测试数据集上的试验结果验证深度模型定量评价胎儿肺发育成熟度的可行性。
选取 2019 年 1 月至 2020 年 12 月在我院行常规产前超声检查的单胎孕妇316 例,其中经产妇73 例,初产妇243例,年龄25~38岁,平均(32.62±3.39)岁,分娩胎龄39~41 周,平均(39.32±1.21)周,Apgar 评分9~10 分,平均(9.92±0.31)分。根据入组时不同胎龄分为24~30周组 49 例、>30~36 周组 63 例,>36 周组 54 例。排除标准:①心脏病、妊娠合并肾功能不全及合并其他疾病者;②合并产前子痫、胆汁淤积综合征者;③有严重酗酒、吸烟和滥用药物史;④胎儿畸形、胎儿宫内发育迟缓、胎儿染色体异常;⑤妊娠中晚期超声估测孕周与真实孕周相差1周以上。本研究经我院医学伦理委员会批准,所有孕妇均签署知情同意书。
1.仪器:使用GE Voluson E 8 彩色多普勒超声诊断仪,C1-5探头,频率2~5 MHz。
2.图像采集:图像采集过程中调整中心频率、图像深度和时间增益补偿等参数,使图像质量达到最佳,避免肋骨或脊柱的声影遮挡肺组织。由同一经验丰富的超声医师于胎儿标准四腔心切面采集图像,先确定胎儿头、心脏和胸腔等结构,然后在四腔心切面识别胎儿肺区域,收集所有代表胎儿肺纹理信息的超声图像(不进行任何后期处理),每幅图像手动描绘肺组织的轮廓,避开肺组织的阴影区域。见图1。
图1 胎儿肺区域超声图像采集示意图
3.迁移学习方法的两阶段:第一阶段,深度模型首先学习超声图像中胎儿肺纹理的识别。先用带有标记(标记表示图像样本是否完全来自胎儿肺区域)的超声图像训练模型识别胎儿肺区域,这些样本应从整个妊娠期获得,尽可能完整地代表胎儿肺区域的特征。第二阶段,预训练的深度模型进一步行迁移学习,以从超声图像上胎儿肺纹理信息准确估算胎龄。根据第一阶段获得的模型参数,生成不同胎龄胎儿肺区域图像样本,指导深度模型进一步学习。此过程即为将胎儿肺识别的知识传递到评价胎儿肺发育成熟度任务的迁移学习过程。由于第一阶段后的模型已经能够“识别”超声图像上的胎儿肺区域,因此第二阶段的学习着重于研究超声图像中肺纹理信息与胎儿肺发育成熟度之间的关系。但临床实际上很难获得反映胎儿肺发育成熟度的直接依据,尤其在妊娠期。由于胎儿肺发育成熟度通常与正常胎儿的胎龄成正比,故在本研究提出的迁移学习方法第二阶段,可以直接以胎龄作为胎儿肺发育成熟度发育的真实值进行深度模型的学习。但需注意在测试中应使用胎龄真实值对用于评估胎儿肺发育成熟度的深度模型进行验证,并与传统的基于“胎儿多参数计算机辅助分析”估算结果进行比较,探讨该迁移学习方法估算胎龄的有效性,该方法通常也可在一定程度上反映胎儿肺发育成熟度。
4.深度模型的建立:本研究中深度模型是应用机器学习方法来建立的[6],采用U-Net结构[7]设计。该模型共39 层,由9 个执行图像卷积的块来分析图像纹理信息,在块之间建立剩余连接。模型中卷积层的激活函数是整流线性单元(ReLU)[8],输出层的激活函数为S型,用于模型训练的批次大小为16,Loss为均方误差,学习优化器为adam[9],学习率为 0.00 001,具体结构见图2。深度模型的训练主要通过在线学习完成,因此可以通过替换所应用的训练数据来直接实现迁移学习。在第一阶段,模型输出的真实值是一个标签,其值为1 或0,以表示样品是否来自胎儿肺区域;在第二阶段,模型输出的真实值分布于0~1,其是通过标准化收集超声图像数据的胎龄而获得的。在迁移学习的两阶段中,深度模型的输入部分、基本原理和输出部分的结构均保持不变,图像样本的输入大小固定为32 mm×32 mm;分别使用两阶段中2个具有不同真实值的已建立的训练图像数据集来直接执行迁移学习方法。以Dice 相似系数(Dice similarity coefficient,DSC)评价深度模型的分割效果,该指标用于度量深度模型分割胎儿肺的结果与医师手动描绘的重合度,公式为:,X、Y 分别表示医师手动描绘的胎儿肺区域及模型预测区域所包含的像素点集,DSC越接近1,分割结果越准确。
图2 深度模型结构图
316例患者中,各组用于训练数据(前166例)与测试数据(后150例)的一般资料比较差异均无统计学意义。见表1。
表1 各组训练数据与测试数据一般资料比较
在迁移学习的第一阶段,166例孕妇共采集16 268个图像样本用作训练数据,样本中来自胎儿肺区域和非肺区域的比例各为50%。使用该数据集对深度模型进行训练,直到训练过程的损失变得稳定(图3A)。在迁移学习的第二阶段,仅从胎儿肺区域生成图像样本,并将胎龄标准化为真实值,150 例孕妇样本数量为8134 个。使用此数据集对第一阶段预先训练的深度模型进行直接训练,直到训练损失变得稳定(图3B)。
图3 两阶段迁移学习的训练过程示意图
深度模型中U-Net分割网络对测试数据中胎儿肺区域分割的DSC为(80.76±19.37)%。
本研究结果显示,测试数据中的估算结果与真实值比较,不精确度为(1.43±0.21)周,迁移学习的深度模型估算结果与胎龄真实值呈正相关(r=0.773,P<0.05);与具有同一设计结构但未经过两阶段迁移学习的一般训练深度模型比较,仅对上述第二阶段的数据进行训练,与胎龄真实值呈正相关(r=0.521,P<0.05)。在胎龄 24~30 周组、>30~36 周组和>36 周组中,深度模型估算胎龄与胎龄真实值的相关系数分别为0.337、0.762、0.794(均P<0.05)。
胎龄>30~36 周组和胎龄>36 周组中,经过迁移学习后深度模型对胎儿胎龄的估算结果与传统的基于“胎儿多参数计算机辅助分析”估算结果的不精确度比较差异均有统计学意义(t=17.159、8.988,均P=0.000);胎龄24~30周组两种方法估算结果的不精确度比较差异无统计学意义。见表2。
表2 深度模型与传统方法对不同胎龄估算结果的不精确度比较()
表2 深度模型与传统方法对不同胎龄估算结果的不精确度比较()
方法深度模型传统方法t值P值24~30周2.49±0.63 1.93±0.75 1.700 0.093>30~36周1.07±0.24 2.44±0.57 17.159 0.000>36周0.83±0.11 1.09±0.17 8.988 0.000
胎儿肺发育主要是从主干逐渐到次级分支,最终到末端肺泡额形成,一般情况下孕24 周才会形成具有气体交换功能的呼吸细支气管和终末细支气管,孕25周后毛细支气管盲端扩张形成肺泡,孕28周后形成大量肺泡,孕37 周左右胎儿肺发育成熟,此时肺泡表面的Ⅱ型细胞能分泌足够的肺表面活性物质,确保胎儿出生后进行气体交换。既往多通过羊膜腔穿刺术判断胎儿肺是否发育成熟,但该方法有创,可能导致孕妇流产,临床应用受限。超声作为一种操作简单、无创、重复性佳的检查技术,在产前检查中具有重要价值。研究[3-4]认为超声可以对胎儿肺发育程度进行评估,但临床很难直接获得胎儿肺发育成熟度的真实值。因此,本研究提出超声图像中肺纹理信息可以反映胎儿肺发育成熟度的假说,然后基于超声图像中胎儿肺纹理信息,在模型训练过程中以胎龄为真实值,建立深度模型。既往研究[10]表明,模型的训练数据对胎龄估算结果与真实胎龄之间具有良好的相关性。为进一步探讨建立模型在临床上的可行性,本研究提出了一种两阶段的迁移学习方法来建立模型,以提高其对胎儿肺发育成熟度的评估性能,并使用独立测试数据集对模型的性能进行评估和验证。
本研究建立的深度模型主要以胎龄的真实值进行训练,因此在评估胎儿胎龄时很容易测试模型性能,也可以认为是对胎儿肺发育成熟度模型评估的间接检验。本研究将150 例患者的超声图像作为独立测试数据,将样本输入到已建立的深度模型中,发现测试数据的估算结果与真实值比较,不精确度为(1.43±0.21)周,估算结果与胎龄真实值呈正相关(r=0.773,P<0.05),在一定程度上验证了所建立的深度模型对估算胎儿胎龄的有效性。在计算机视觉中,模式识别是一项重要任务,而人类视觉系统通常可以实现良好的性能。基于此,本研究提出了两阶段迁移学习的研究方法试图模拟人类的认知过程视觉系,即深度模型首先学会识别胎儿肺,然后基于获得的“先验知识”对该模型进一步训练,以评估胎儿肺发育成熟度。结果显示模型估算胎龄与胎龄真实值的相关系数从具有同一设计结构但未经过两阶段迁移学习的0.521 提高到学习后的0.773,进一步表明迁移学习对深度模型的有效性。
为了进一步验证迁移学习后深度模型的估算结果,本研究将测试数据集分为胎龄24~30 周组、>30~36 周组和>36 周组,对间隔完全相同的子数据集与传统胎龄估算方法进行比较,结果显示在胎龄>30~36周组和胎龄>36 周组中,经过迁移学习后深度模型对胎龄的估算结果与传统方法估算结果的不精确度比较差异均有统计学意义(t=17.159、8.988,均P=0.000)。另外,本研究对子数据集进行相关性分析,发现胎龄24~30 周组、>30~36 周组和>36 周组的模型估算胎龄与胎龄真实值的相关系数分别为0.337、0.762、0.794(均P<0.05)。分析原因为胎龄较大的胎儿肺部超声图像信息更加清晰。这也说明在整个妊娠期间胎儿超声图像肺纹理信息发生了改变,超声能够很好地显示其特征,当超声图像中胎儿肺区域变大时,纹理信息分析结果会更加可靠。进一步验证了本研究所建立模型的有效性,也是对本研究基本假设的验证,即超声图像中胎儿肺纹理信息可以反映胎儿肺发育成熟度。
综上所述,胎儿肺发育成熟度可以由深度模型的输出来表示,该输出则由估计的胎龄表示;本研究初步验证了超声图像中胎儿肺纹理信息可以反映胎儿肺发育成熟度。