吴贻怡,肖 湘,罗 琼
(桂林市人民医院超声科,广西桂林 541000)
先天性心脏病(简称先心病)是临床上常见的一种儿科疾病,也是胎儿多种先天性发育畸形中较为常见的一种,据相关统计,在活产新生儿中,先心病的发病率为3%~8%[1]。不仅对其生命健康产生严重威胁,也对患儿家庭造成了巨大影响。随着医学超声诊断设备的不断进步,医疗设备的不断改善,产前检查技术不断提高,使得能够在妊娠期便给予有效措施进行干预成为可能,这可使神经管缺损、发育异常等各种畸形疾病的发生率明显降低[2]。在多种出生缺陷中,先心病的发病率已处于前列。因此,寻找能够早期有效诊断先心病的方法已成为产科医生们的重点研究问题。心脏大血管异常是造成先心病的重要原因,而产前超声检查是检测胎儿时期心脏大血管发育异常的主要方法,具有诊断方便、安全性高的特点[3-4]。但超声检测影响因素较多,具有一定的局限性。随着计算机辅助系统及数字挖掘技术的逐渐发展,其能够从海量的数据中提取隐含的信息。数字挖掘技术包括logisitic回归分析、神经网络及决策树等方法[5]。本研究中收集455例临床相关彩色多普勒超声(color doppler ultrasound,CDU)影像图像资料,分别建立logisitic回归分析、反向传播(back propagation,BP)神经网络及决策树模型,通过比较,旨在探究诊断先心病的最佳模型。
选取2017年3月至2020年1月在本院进行先心病筛查的455例孕妇产前CDU检测图像资料。其中孕妇平均年龄(27.58±1.72)岁,平均孕周(13.04±2.03)周。纳入标准:(1)胎儿心率正常;(2)无先心病生育史;(3)无染色体异常现象;(4)临床资料完整;(5)胎儿家属知情同意并签订知情同意书;(6)本研究经医院伦理委员会同意批准,并签订知情同意书。排除标准:(1)以先心病转入本院;(2)具有心脏手术史;(3)对行CDU检查不配合者。
1.2.1CDU检测
采用GE VOLUSON E8、E10 CDU仪进行检测,孕妇取仰卧位及侧卧位,调整探头角度,探头频率3.5 MHz。监测胎儿心率、胎儿心脏外形、位置、结构、功能状态及心脏瓣膜功能。
1.2.2资料录入
采用问卷调查、体格检查及实验室检查,由经过专业培训的人员进行调查,包括孕妇的年龄、孕周、孕妇血糖、是否早期服用致畸药物史、新生儿出生孕周、新生儿性别、出生体重、Apagr评分,以及三尖瓣返流(tricuspid regurgitation,TR)、肺动脉瓣返流(pulmonary regurgitation,PR)、主动脉瓣返流(aortic regurgitation,AR)程度等。将所收集的资料录入计算机数据库,各项指标均严格按照变量的定义进行数据录入,所有数据均采用Epidate3.1软件,分两人分次录入,相互检查校正。
1.2.3建立数学模型
采用SPSS Clementine13.0软件将455例彩超资料的建模指标进行分析,并建立logisitic回归分析(表1)、BP神经网络及决策树模型,分别计算3个数学模型的准确度、灵敏度及特异度。利用Medcal软件分别绘制logisitic回归分析、BP神经网络及决策树模型3个数学模型的受试者工作特征(receiveroperatingcharacteristic,ROC)曲线,计算曲线下面积(area under curve,AUC)。
表1 先心病发生影响因素的变量赋值
1.2.4观察指标
(1)记录研究对象的临床基本资料;(2)比较3种模型检测的灵敏度、特异度及准确度;(3)比较3种模型检测的ROC曲线AUC;(4)采用Medcal软件对3种模型的AUC进行比较,分析3种模型对先心病的诊断价值。
采用SPSS19.0软件进行统计学数据分析,计数资料以率表示。logisitic回归分析、BP神经网络及决策树模型3个数学模型的AUC比较,以P<0.05为差异有统计学意义。
455例研究对象中61.32%的孕妇血糖正常,93.63%的孕妇早期未服用致畸药物,63.52%的新生儿出生体重超过2 800 g,91.21%的新生儿出生时Apagr评分大于8分,95%以上的新生儿TR程度、PR程度、AR程度均正常,见表2、图1~3。
表2 研究对象的临床基本资料[n(%),n=455]
图1 12周胎儿的头臀径
图2 12周胎儿的颈项透明层图像
图3 胎儿静脉导管血流频谱
logisitic回归分析模型、BP神经网络模型、决策树模型检测的灵敏度、特异度及准确度分别为84.82%、61.57%、81.79%,93.28%、81.68%、84.25%,86.46%、56.83%、81.02%,BP神经网络模型的灵敏度、特异度及准确度均明显高于其他两种,见表3。
表3 3种模型检测的灵敏度、特异度及准确度(%)
logisitic回归分析模型、BP神经网络模型、决策树模型3种模型的AUC分别为0.742、0.786、0.728,BP神经网络模型的AUC明显高于logisitic回归分析模型及决策树模型(P<0.01);而logisitic回归分析模型与决策树模型的AUC比较,无统计学意义(P>0.05),见表4、5。
表4 3种模型检测的AUC
表5 3种模型的AUC比较
先心病属于先天性畸形中最常见的一种,其主要的致病原因主要是由于胎儿时期心脏发育障碍所引起。在年龄越小的人群中,先心病的发病率越高,病死率越高,且先心病手术的成功与否,在很大程度上取决于术前的诊断[6]。因此,早期诊断先心病,并给予及时治疗,对于改善患儿的预后意义重大。CDU作为早期诊断胎儿心脏形状、位置及功能的重要方法,具有无痛、无创且重复性较好的优势,但其对于某些复杂先心病的诊断较为费时,诊断率较低,且仍有部分先心病无法在产前被诊断出[7]。因此,有必要针对先心病的CDU影像检查结果,通过建立数学模型来早期诊断先心病,从而降低患儿病死率,改善患儿预后。
数学模型包括神经网络、logisitic回归分析、决策树等多种方法,其中,决策树是一类算法的总称,包括CHAID、CART、ID3、SLIQ及C5.0等多种算法,其能够根据某种规则将研究对象分为不同亚群,使每个亚群中的因变量取值基本一致[8]。决策树模型能够分析出每个影响因素与因变量关系的密切程度,其在处理定性资料时能够生成直观的且容易理解的观察结果。logisitic回归分析根据因变量的资料类型可以分为二分类、多分类等[9],其中,二分类是较为常用的一种,其能够从众多复杂的因素中筛选出具有统计学意义的因素,并对各因素间的相互作用进行深入分析,从而评价疾病与各因素间的定量关系[10]。侯继文[11]在轻度认知障碍影响因素分析及决策树模型研究中发现,决策树分析结果显示受教育年限、受教育程度与痴呆的发病率明显相关,且经常饮茶能够保护老年人的认知功能,而logisitic回归分析未能体现出来。认为决策树分析较logisitic回归分析能够更为细致地发现影响痴呆发生的危险因素与保护因素。
神经网络使给予对人脑组织结构、活动机制的初步认识而提出的一种新型信息处理体系,BP神经网络属于神经网络的一种,包括输入层、隐层、输出层,各层神经元仅与相邻层神经元相连[12]。韩颖[13]在预测儿童急性髓系白血病的预后研究中,结果显示,相较于logisitic回归分析,BP神经网络有着更高的准确度。灵敏度、特异度与准确度作为重要的评价指标对有效诊断先心病具有重要作用。本研究结果发现,BP神经网络模型的准确度均明显高于logisitic回归分析模型及决策树模型。BP神经网络模型对于先心病的诊断具有更高的准确度。
有研究证实,AUC的大小与实验的识别算法能正确区分正确与错误目标能力的大小关系密切[14-15]。本研究中建立logisitic回归分析、BP神经网络及决策树模型3个数学模型,通过分析不同数学模型的AUC,结果发现,BP神经网络AUC明显高于logisitic回归分析模型与决策树模型;此外,通过采用Medcal软件对3种模型的AUC进行比较,结果发现,logisitic回归分析模型与 BP神经网络模型比较及BP神经网络模型与决策树模型比较差异有统计学意义(P<0.01),而logisitic回归分析模型与决策树模型比较差异无统计学意义(P>0.05)。表明BP神经网络模型能够更为准确地诊断先心病的发生。
综上所述,相较于logisitic回归分析模型与决策树模型,BP神经网络模型诊断先心病灵敏度、特异度与准确度更高。但在临床实际应用中,可根据不同情况选择多种模型结合的方法进行疾病的诊断,以期能够更为准确地诊断疾病的发生。