基于Logistic回归模型及卡方自动交互探测决策树模型预测胎儿染色体异常的研究

2023-01-03 14:22罗孝勇
临床超声医学杂志 2022年12期
关键词:鼻骨侧脑室决策树

阳 蓉 罗孝勇 李 陶

染色体异常可能导致胎儿发育畸形甚至死亡,活产儿中染色体异常的发生率约为0.67%[1]。目前有创性产前诊断方法是筛查胎儿染色体异常的金标准,其中以羊水穿刺最常用,但其可能引起早产、流产、胎盘早剥、宫内感染等风险。研究[2-3]表明超声软指标与胎儿染色体异常存在一定关联,但对于超声软指标异常孕妇是否需行有创性产前诊断存在一定争议[4]。本研究通过建立Logistic 回归模型和卡方自动交互探测(CHAID)决策树模型筛选胎儿染色体异常的影响因素,并比较两种模型的预测价值,以期提高产前筛查的准确性。

资料与方法

一、研究对象

选取2017 年1 月至2021 年12 月在四川省遂宁市中心医院行羊水穿刺的642 例孕妇,年龄16~45岁,平均(29.45±5.35)岁,孕17~31周,平均孕(20.83±2.88)周。纳入标准:①单胎妊娠;②10 种常见超声软指标中有一项为阳性;③获得羊水穿刺结果,孕期资料和产后资料完整。排除标准:①双胎或多胎妊娠;②有两项或多项超声软指标为阳性;③有先兆流产征兆;④胎儿存在严重结构畸形。本研究经四川省遂宁市中心医院医学伦理委员会批准,所有孕妇及家属均知情同意。

二、仪器与方法

1.超声检查:使用GE E 10 彩色多普勒超声诊断仪,C1-6和C2-9凸阵探头,频率分别为1~6 MHz和2~9 MHz。孕妇取仰卧位,经腹部进行胎儿标准化切面扫查,明确胎儿数目及其是否存活,估测胎儿孕周及体质量,观察胎儿是否存在结构畸形及阳性超声软指标。10 种常见超声软指标具体为[5]:①NT 增厚,即孕11~13+6周时胎儿正中矢状切面上颈后部皮肤高回声区深部的无回声或带状低回声大小≥2.5 mm;②鼻骨缺失,即超声检查胎儿各个切面均未见鼻骨回声为双侧鼻骨缺失,超声检查双眼球横切面仅见一侧鼻骨回声为单侧鼻骨缺失;③侧脑室增宽,即侧脑室后角内径10~15 mm;④肾盂分离,即双肾横切面显示肾盂分离但不足以诊断肾盂积水,孕20 周内肾盂分离>4 mm,孕20~30 周肾盂分离>5 mm,孕30 周以上肾盂分离>7 mm;⑤脉络丛囊肿,即超声示脉络丛内见直径≥3 mm的圆形或椭圆形无回声结构,囊壁薄,边缘光滑、整齐,单双侧均可出现;⑥单脐动脉,即脐带纵切面仅见一条脐动脉,横切面为“吕”字结构代替正常的“品”字结构,CDFI 仅显示膀胱一侧的一条血管;⑦永存左上腔静脉,即三血管-气管切面示肺动脉左侧可见一条多余的静脉,四腔心切面示冠状静脉窦增宽;⑧永久性右脐静脉,即腹部横切面可见脐静脉与右门静脉相连,向胃泡左侧走行;⑨肠管回声增强,即肠管回声类似或强于骨骼回声;⑩心室强光点,即心室内见点状强回声。

2.染色体检查:孕16 周后于超声引导下行羊膜腔穿刺术,常规抽取羊水20 ml 进行细胞培养及染色体核型分析。

三、统计学处理

应用SPSS 26.0统计软件,计数资料以率或频数表示。以胎儿染色体结果为因变量(Y=1 为阳性,Y=0 为阴性),对超声软指标进行赋值(有=1,无=0),先行单因素Logistic回归分析,再将差异有统计学意义的变量采用逐步向前法进行多因素Logistic回归分析,筛选胎儿染色体异常的影响因素。将超声软指标进行决策树交互检验分析,规则如下:①树的生长“枝条”分割显著性水准α=0.05;②设定决策树父节点、子节点最小样本量分别为100例和50例,并产生CHAID 决策树模型的胎儿染色体异常预测概率。绘制受试者工作特征(ROC)曲线分析Logistic 回归模型和CHAID 决策树模型预测胎儿染色体异常的价值,曲线下面积比较采用Z检验。P<0.05为差异有统计学意义。

结 果

一、一般情况

642 例孕妇阳性超声软指标中染色体异常发生情况见表1,阳性超声软指标声像图见图1。

图1 阳性超声软指标声像图

表1 642例孕妇阳性超声软指标中染色体异常发生情况 例

二、Logistic回归分析结果

单因素Logistic 回归分析显示,NT 增厚、鼻骨缺失、侧脑室增宽均为胎儿染色体异常的影响因素;多因素Logistic 回归筛选NT 增厚(OR=7.511,P<0.001)、鼻骨缺失(OR=4.819,P<0.001)、侧脑室增宽(OR=4.789,P<0.001)用于回归模型的拟合,获得回归方程:Y=-2.888+2.016×NT 增厚+1.572×鼻骨缺失+1.566×侧脑室增宽。见表2,3。

表2 胎儿染色体异常影响因素的单因素Logistic回归分析

三、CHAID决策树模型分析结果

将超声软指标用于建立CHAID决策树模型,决策树生长共2层,3个终端节点数。见图2。结果显示NT增厚、鼻骨缺失均为胎儿染色体异常的影响因素,其中NT 增厚对染色体异常影响最大。CHAID决策树模型中,第一层为NT增厚,NT增厚时胎儿染色体异常的发生率为29.5%,NT正常时胎儿染色体异常的发生率为7.8%;第二层为鼻骨缺失,在NT 正常的基础上,鼻骨缺失时胎儿染色体异常的发生率为21.2%,鼻骨正常时胎儿染色体异常的发生率为6.4%。见图2。

图2 CHAID决策树模型图

表3 胎儿染色体异常影响因素的多因素Logistic回归分析

四、ROC曲线分析

ROC 曲线分析显示,Logistic 回归模型预测胎儿染色体异常的曲线下面积为0.712(95%可信区间0.675~0.746),约登指数40.77%,敏感性62.69%,特异性78.09%;CHAID 决策树模型预测胎儿染色体异常的曲线下面积为0.675(95%可信区间0.637~0.711),约登指数34.05%,敏感性50.75%,特异性83.30%。Logistic回归模型的曲线下面积大于CHAID 决策树模型,差异有统计学意义(Z=2.267,P<0.05)。见图3。

图3 Logistic 回归模型和CHAID 决策树模型预测胎儿染色体异常的ROC曲线图

讨 论

染色体异常是导致胎儿发育畸形甚至死亡的主要原因之一,产前诊断在提高筛查准确性的同时应遵循由无创到有创的顺序。超声软指标与胎儿染色体异常存在一定关联,从而被越来越多的临床医师用作有创性产前诊断的指征之一,但对所有超声软指标阳性者进行有创性产前诊断会造成不必要的资源浪费,且可能增加宫内感染和流产的风险。本研究选取642例有一项超声软指标阳性并获得羊水穿刺结果的单胎妊娠孕妇,应用Logistic 回归模型和CHAID 决策树模型分析10 种常见超声软指标在预测胎儿染色体异常中的价值,旨在为临床产前筛查提供参考。

本研究中胎儿染色体异常的多因素Logistic 回归分析结果显示,NT增厚胎儿发生染色体异常的风险是正常胎儿的7.511 倍,CHAID 决策树模型的首层为NT增厚,表明本研究纳入的10 项超声软指标中,NT 增厚与胎儿染色体异常的关联最强。CHAID 决策树模型显示,NT 增厚胎儿染色体异常的发生率为29.5%,高于NT 正常胎儿染色体异常的发生率(7.8%),与研究[6-8]报道NT增厚时胎儿染色体异常风险增加的观点一致。CHAID 决策树模型的第二层显示鼻骨缺失时胎儿染色体异常的发生率为21.2%,Logistic 回归模型中鼻骨缺失胎儿发生染色体异常的风险是鼻骨正常胎儿的4.819 倍。赵萍等[9]研究发现鼻骨发育异常是胎儿染色体异常的危险因素(OR=6.771),本研究结论与其相似。目前胎儿NT 增厚、鼻骨缺失在早孕期即可筛查,因此当临床发现NT 增厚、鼻骨缺失时,建议及时行产前诊断及系统全面的超声筛查。

目前针对侧脑室增宽能否作为胎儿染色体异常的独立危险因素,进而建议孕妇行有创性产前诊断仍存在争议。常清贤[10]研究发现孕妇年龄和侧脑室增宽均是胎儿染色体异常的危险因素,但年龄因素的OR值较侧脑室增宽更高(9.669 vs.5.450),说明年龄对于筛查胎儿染色体异常的价值更大。本研究Logistic 回归分析显示,侧脑室增宽是胎儿染色体异常的影响因素(OR=4.789,P<0.001),但该指标在CHAID 决策树模型中被剔除,分析原因可能是本研究纳入的侧脑室增宽的样本量相对较少,且未考虑孕妇年龄、宫内感染等因素,因此对于临床发现侧脑室增宽的胎儿可综合评估孕妇年龄及血清学检查结果后再进行有创性产前诊断。

本研究ROC 曲线分析显示,Logistic 回归模型和CHAID 决策树模型预测胎儿染色体异常的曲线下面积分别为0.712、0.675,差异有统计学意义(Z=2.267,P<0.05),表明Logistic 回归模型的预测效能优于CHAID 决策树模型。Logistic 回归模型的敏感性为62.69%,特异性为78.09%;CHAID 决策树模型的敏感性为50.75%,特异性为83.30%,CHAID 决策树模型的特异性高于Logistic回归模型,即误诊率较低。在进行临床筛查时,高特异性可以减少为了确定实际染色体正常而进行有创性产前诊断的数量;CHAID 决策树模型的敏感性低于Logistic回归模型,即漏诊率较高。研究[11-13]显示,Logistic 回归模型的优势在于分析因变量(胎儿染色体结果)与自变量(超声软指标)的依存关系时,是在控制其他变量不变的情况下分析某变量的主效应,但不能很好地反映各自变量间的交互作用;CHAID 决策树模型是在已知各独立变量(超声软指标)发生概率的基础上对数据进行分类,其优势在于算法简单,图形直观易于理解,能反映超声软指标之间的交互作用,但受子节点的数据影响结果相对不稳定。本研究中部分超声软指标的单因素Logistic 回归分析差异无统计学意义,如单脐动脉、脉络丛囊肿、永存左上腔静脉、永久性右脐静脉、肠管回声增强、心室强光点等,因此当临床发现这些单一指征时,应观察是否合并其他高危因素,综合考虑是否需要行有创性产前诊断。

综上所述,本研究通过对两种模型的比较、分析发现,Logistic 回归模型预测胎儿染色体异常的价值优于CHAID 决策树模型。但本研究仅依据单一超声软指标进行染色体筛查,敏感性较低,且胎儿染色体异常的影响因素很多,今后需结合孕妇年龄、血清学检查结果、胎儿结构畸形、多项软指标阳性等高危因素进一步综合评估。

猜你喜欢
鼻骨侧脑室决策树
产前超声在胎儿侧脑室增宽的临床价值
磁共振检查在胎儿侧脑室陈旧性出血诊断中的意义
超声和MRI测量胎儿侧脑室扩张的一致性评估
胎儿鼻骨发育不良与结构畸形和染色体非整倍体异常的关系探讨
孕期产前超声诊断胎儿鼻骨缺失和鼻骨短小的分析观察
MRI在孕中晚期胎儿侧脑室扩张中的临床应用价值
中孕期胎儿鼻骨缺失与发育不良在筛查染色体异常的应用价值
决策树和随机森林方法在管理决策中的应用
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖