周汇恩 陈婉明 王梦蝶 罗斯佳 陈佳琳 何堃 过新民
广州市红十字会医院暨南大学附属广州红十字会医院超声医学科(广州 510240)
近年来,国内报道早产儿的发生率呈上升趋势,研究报告中的早产率为6.1%,二胎政策的实施导致高龄产妇有所增加可能是早产率增加的重要因素[1]。我国2014 年早产指南中指出,经阴道超声测量宫颈管长度(cervical length,CL)是预测早产高危人群的金标准[2],且因超声具有无痛、无创且操作便捷、实用性高等特点,能更好地对孕妇宫颈管长度变化进行动态观察[3-4]。妊娠期宫颈的过早重塑、软化和扩张与宫颈组织中的细胞外基质刚性、胶原交联成熟度比率有关,变化难以通过传统超声进行鉴别[5]。与传统的成像方法相比,影像组学能更为客观量化传统超声无法观察到的信息,从而为临床诊断提供重要依据[6]。经阴道超声影像组学对预测早产风险的研究报道较少,本研究经特征降维筛选、使用逻辑回归建模方法,建立结合经阴道超声影像组学特征和临床危险因素的临床-超声影像组学模型,并探讨其在早产中的应用。
1.1 研究对象 回顾性分析2017 年1 月至2022 年12 月就诊于我院定期产检妊娠期妇女,记录一般资料。行经阴道超声检查,测量CL,并保存宫颈清晰图像。纳入标准:(1)在本院建档并分娩;(2)妊娠满28 周但不足37 周;(3)单胎且为头位。(4)产检胎儿胎盘无异常。排除标准:(1)合并子宫肌瘤或子宫腺肌症;(2)宫颈机能不全;(3)孕妇子宫发育畸形或有宫颈手术史;(4)临床资料不完整;(5)超声图像不清晰。
随访妊娠结局,孕周由末次月经和孕早期超声检查联合确定。将研究对象分为早产组和足月产组。共纳入117例孕妇,其中早产组48例,足月产组69 例,年龄20 ~38 岁,平均28.9 岁。本研究经暨南大学附属广州红十字会医院伦理审查委员会批准。
1.2 图像采集 所有入组的孕妇均进行宫颈超声检查,采用GE Voluson E10 和E8 超声诊断仪进行图像采集,经阴道探头频率为5 ~9 MHz。孕妇经阴道超声检查前需排净尿液、清空膀胱,患者保持膀胱截石位置。使用阴超探头,对宫颈进行全面细致的扫查,在不施加压力的情况下获得宫颈矢状面,以识别宫颈内外口。在测量过程中,应特别注意避免子宫峡部收缩导致的测量误差。
1.3 方法
1.3.1 特征提取 运用3D-slicer 软件,手动绘制宫颈边界,勾画感兴趣区域(ROI),如图1 所示。对勾画好的ROI 进行特征提取,提取的特征类型包括第一阶特征,形状特征和纹理特征,本研究共提取出851 个超声组学特征,保存于Excel 表格中。
图1 经阴道超声宫颈图像及宫颈ROI 示意图Fig.1 Schematic diagram of transvaginal ultrasound cervical images and cervical ROI
1.3.2 特征筛选 对117 例病例以8∶2 的比例划分为训练集和验证集,将训练集及验证集提取好的特征进行Z标准化(Z-score),训练集用于模型拟合,验证集用于验证模型的泛化能力。通过U检验分析及最小绝对收缩和选择算子(least absolute shrinkage andselectionoperator,LASSO)算法对特征进行筛选。经U 检验及LASSO 降维最终选取14 个系数非零的稳定特征。
1.3.3 构建模型 将所选特征通过逻辑回归分别构建超声组学模型,联合临床特征及影像组学特征建立联合模型,并绘制列线图使结果可视化。
1.3.4 模型评估 用受试者工作特征曲线(ROC)分析曲线下面积(AUC)来量化每个模型的性能,评价指标分别为AUC、敏感性、特异性,为了评估模型的临床实用性,使用决策曲线(DCA)来检验模型的临床应用价值,使用校准曲线评价模型在训练集和验证集中的拟合程度。
1.4 统计学方法 使用SPSS23.0 进行统计学分析,R 语言(4.3.0)用于构建和评估预测模型。若是连续变量,符合正态分布的数据,以平均数±标准差表达,组间比较用t检验。若非正态分布数据采用中位数(四分位数)表达,组间比较用秩和检验。计数资料以例(百分比)表示,组间比较采用χ2检验。使用逻辑回归构建组学及联合模型来分析对早产的预测价值。以P<0.05 认为差异有统计学意义。
2.1 临床资料 孕妇年龄与CL 两组差异有统计学意义(P<0.05),妊娠期糖尿病、妊娠期高血压疾病两组差异无统计学意义(P>0.05)。见表1。
表1 妊娠期妇女基本临床信息Tab.1 Basic clinical information for women during pregnancy
2.2 超声影像组学特征提取及筛选 本研究共提取出851 个超声影像组学特征,使用U检验对特征进行初步筛选,然后使用LASSO 降维最终选取14 个系数非零的稳定特征,如图2、3 所示。超声组学评分为纳入特征的定量表达值与其系数的线性相乘,见表2。
表2 构建超声组学模型的影像组学特征Tab.2 Building an ultrasound radiomics model of the radiomics features
图2 LASSO 拟合的交叉验证的MSE 值Fig.2 Cross-validated MSE values for the LASSO fit
图3 特征系数和λ 的函数关系Fig.3 The relationship between the characteristic coefficients and λ
2.3 建立模型
2.3.1 影像组学模型 基于14 个宫颈超声影像组学特征建立预测早产的影像组学模型,训练集的ROC 曲线如图4 所示,AUC、敏感度、特异度分别为0.841[95%CI(0.761,0.921)]、66.7%、86.8%、验证集的ROC 曲线如图5 所示,AUC、敏感度、特异度分别为0.824[95%CI(0.616,1.00)]、83.3%、76.5%。
图4 训练集超声影像组学模型ROC 曲线Fig.4 ROC curve of ultrasound radiomics model for training set
图5 验证集超声影像组学特征ROC 曲线Fig.5 ROC curve of ultrasound radiomics model for validation set
2.3.2 联合模型 基于2 个临床特征(年龄、CL)和14 个宫颈超声影像组学特征建立预测早产的联合模型,训练组的ROC 曲线如图6 所示AUC、敏感度、特异度分别为0.908[95%CI(0.850,0.966)]、90.5%、76.9%;验证集的ROC 曲线如图7 所示,AUC、敏感度、特异度分别为0.892[95%CI(0.693,0.100)]、83.3%、100%。
图6 训练集联合模型ROC 曲线Fig.6 ROC curve of combined model for training set
图7 验证集联合模型ROC 曲线Fig.7 ROC curve of combined model for validation set
2.4 列线图的构建 将临床及超声特征的独立预测因子与纳入影像组学模型建立列线图,如图8所示。
图8 预测早产联合模型列线图Fig.8 Nomogram of predicting preterm birth combined model
2.5 决策曲线评估 为了检验模型的临床实用性,本文使用DCA 曲线对模型进行评估,训练集和验证集的DCA 曲线分别如图9、10 所示。发现在0.2 ~0.8 阈值内联合模型的临床实用性优于超声影像组学模型。和由ROC 曲线推出的结论一致。
图9 训练集DCA 曲线对比Fig.9 Comparison of DCA curves of training sets
图10 验证集DCA 曲线对比Fig.10 Comparison of DCA curves of validation sets
2.6 校准曲线评估 为了展示预测值和实际值的差距,本文使用校准曲线来作为该逻辑回归模型的重要评估部分如图11-14 所示。由图11、12 与图13、14 的对比得知,联合模型不管是在训练集还是在验证集中准确度都优于超声影像组学模型。
图11 训练集超声影像组学校准曲线Fig.11 Calibration Curve of ultrasound radiomics model for training set
图12 验证集超声影像组学校准曲线Fig.12 Calibration Curve of ultrasound radiomics model for validation set
图13 训练集联合模型校准曲线Fig.13 Calibration Curve of combined model for training set
图14 验证集联合模型校准曲线Fig.14 Calibration Curve of combined model for validation set
经阴道超声评估宫颈管等对早产风险的预测有着重要意义[7-9]。但是,目前国内外基于超声影像组学特征建立预测模型来评估早产风险的研究较少。本研究通过逻辑回归分析经阴道超声影像组学特征,建立预测早产的模型,本文发现模型具有较佳的诊断效能,本研究还联合了年龄及CL 这两个影响早产的传统危险因素建立联合模型,表明联合模型可提高其诊断价值。
早产严重影响母婴健康安全,因此,有必要早筛查、早发现,及时实施医学干预,降低早产风险,优化母婴结局[2]。超声是妊娠期应用最广泛的影像学检查方法,但存在检查效率较低、经验依赖性强等缺点[10]。超声影像组学基于超声图像,将肉眼无法分辨的图像信息量化为数据[11]。人工智能技术逐渐被用于产科超声检查的各个方面[12],主要包括胎儿结构切面的智能识别、产科超声参数的自动测量以及生长发育情况智能辅助评估等[13]。既往已有研究探索超声影像组学对预测早产风险的意义。一项前瞻性研究通过对孕中期宫颈超声组织纹理进行定量分析,认为自发性早产与孕中期宫颈纹理特征有关,宫颈超声纹理定量分析能识别自发性早产的风险[14]。另外一项多中心研究研究显示,与单纯超声测量CL 方法相比,在20 ~22 周时对超声宫颈纹理进行定量分析可提高早产的检出率,两者联合可以显著提高预测性能[15]。本研究提取孕晚期宫颈经阴道超声的超声影像组学特征,并通过降维筛选去除冗余特征,以防止数据过拟合、提高模型稳定性,最终筛选出14 个最优特征。其中,绝大多数属于纹理特征,表明纹理特征具有良好的分类作用。训练集及验证集中,基于14 个影像组学特征建立的超声影像组学模型预测早产的训练集及验证集的AUC分别为0.841[95%CI(0.761,0.921)]、0.824[95%CI(0.616,1.00)],表明超声影像组学特征鉴别诊断效能较佳。既往研究认为,高龄、妊娠期糖尿病、妊娠期高血压疾病、宫颈管缩短是早产的危险因素[7,16]。本研究统计结果显示,妊娠期糖尿病与妊娠期高血压疾病差异无统计学意义,这可能由于样本量少,造成数据偏倚所致。年龄与CL 有统计学意义,因此本研究联合年龄与CL 2 个临床特征和14 个超声影像组学特征建立的联合模型鉴别诊断的AUC 分别为0.908[95%CI(0.850,0.966)]及0.892[95%CI(0.693,0.100)],其效能优于超声影像组学模型,表明超声影像组学特征进一步联合临床特征可提高其诊断价值。本研究还使用简洁明了的列线图形式对模型进行了呈现。校准曲线贴合良好,表明该模型校准度良好。临床决策曲线图显示该模型的潜在临床获益可观。
本研究尚存在一定的局限性,首先,由于单中心样本量有限,数值波动性较大,今后的研究中需要采用更大样本和进行多中心研究;其次,本研究仅针对灰阶图像进行分析,在未来的研究中,可纳入宫颈角测量、弹性成像等技术进行多模态研究,构建更稳健的模型。早产的影响因素极其复杂,不能通过单一的检查就能准确预测,未来需要建立预测模型,结合孕妇的病史、生产史以及一系列生物、物理和生化标记物等进行动态观察[17-20],实现精准的个体化早产预测。本研究对超声检测孕晚期宫颈长度预测早产只是初步探讨,其实际应用于临床仍处于早期发展阶段,仍需要多中心大样本量的研究加以证实。
综上所述,使用经阴道超声影像组学特征建立的预测模型效能较佳,可协助评估孕妇早产风险,联合临床特征可进一步提高其诊断效能。基于超声图像特征及临床特征构建的影像组学模型能预测早产发生的风险,可为临床诊治提供参考依据。因此,超声影像组学在早产预测中具有较好的应用价值和前景。
【Author contributions】ZHOU Huien and CHEN Wanming performed the experiments and wrote the article.WANG Mengdie and LUO Sijia performed the experiments.CHEN Jialin and HE Kun revised the article.GUO Xinmin designed the study and reviewed the article.All authors read and approved the final manuscript as submitted.