王 萌,弭博岩,郑 奋
(海军军医大学 卫生勤务学系 计算机与仿真技术教研室,上海200433)
近年来,随着人工智能技术的蓬勃发展,其在医疗卫生领域逐渐占据重要的地位,已在并发症预测、康复护理、疾病管理等方向得到广泛应用。胎儿健康监测是评估胎儿健康状况、及时识别胎儿潜在健康危险及降低产妇妊娠意外的有效手段,但由于监测项目及参数在时域、形态学等方面指标众多,如非经过专业培训且经验丰富的医生,在进行判读时容易受到主观因素的影响,从而引发误诊漏诊。人工智能技术能摒弃主观因素影响,从海量数据中自动化提取出计算机可识别的病理特征,从而构建出稳健、可靠的模型[1],为构建灵敏、准确、方便地监测胎儿健康状况提供可能,人工智能技术与胎儿健康监测领域相结合已成为数字医学的重要发展趋势之一。
人工智能技术是指使计算机对人的思维过程和行为进行模拟,从而实现自动化从海量数据中获取并分析有价值的信息。人工智能技术的引入在目前在我国的医疗健康行业中已在逐渐发展和完善[2],并已初具使用效果。人工智能技术的很多重要分支在胎儿健康监测领域中都有着很高的应用前景,主要利用了机器学习[3]、深度学习、计算机视觉[4]等多种技术。
宫内窘迫是胎儿在宫内的缺氧征象,严重会危及胎儿生命。电子胎心监护[5]是临床应用最广泛的判别胎儿宫内窘迫的常用方法之一。在实际应用中,由于监测信号的复杂多样,致使人工判读结果效率低、效果易产生偏差,因此已有众多学者利用机器学习算法从胎心监护参数中提取特征并进行模型训练。
2.1 模型评估方式
为直观反映各机器学习模型的分类性能,通常以模型预测结果的分类归属[6]为基础,计算出的准确率、精确率、召回率、特异度来对模型进行评价。准确率是模型预测每个类别正确的样本所占的比例大小;精确率是所有预测结果为每类的样本中预测正确的样本所占的比例,召回率是每个类别真实结果为该类样本中预测结果正确的样本比例,特异度是将负样本识别正确占所有负样本的比例。以上四个指标均为越大效果越好。
2.2 算法概述
Hoodbhoy[7]等以加利福尼亚大学欧文机器学习库中的胎心监护图数据进行模型训练,运用极端梯度提升树(Extreme Gradient Boosting,XGBoost)算法得到最优判别结果。聂磊[8]以同一数据集进行模型训练,将五种机器学习模型进行对比,提出的集成算法(Stacking)为最优方案。曾冬洲等[9]以福建省某医院的脱敏临床数据进行训练,将应用梯度提升决策树和逻辑回归相融合(gradient boosting decision tree-logistic regression,GBDT-LR),设计了预诊断模型,融合后的模型较单个模型的预测效果有显著提升。郝婧宇等[10]以波尔图大学公开的葡萄牙孕妇胎心监护数据进行模型训练,提出了一种运用五层堆叠(Stacking-5)模型融合的方法,相较于融合前检测效果大幅度提升。以上算法对比如表1所示。
表1 评价指标对比
胎儿畸形虽不会对胎儿造成致命伤害,但难以预测出生后的影响,一些严重疾病会给家庭造成很大负担[11]。超声检测[12]是判断畸形的常用手段,但由于畸形种类较多,成因繁杂,致使手动测量效率低下,且漏诊现象较为常见。运用机器学习、深度学习等技术结合超声信号进行胎儿畸形筛查的方式已成为研究热点。
Zhang等[13]提出一种基于监督文本的精确分割方法自动化测量胎儿头部和股骨,平均精度为96.85%、84.37%。Matthew等[14]运用全卷积网络来测量胎儿头围和双顶径值,该模型的表现水平与专家相似。李志昂等[15]对图像分割领域U-NET[16]结构进行改进,引入扩张卷积模块,提出一种对胎儿的腹围、股骨长以及头臀径等参数进行测量的方法(D-UNET),模型测量值几乎等同于医生手工标注的标准测量值,精度较高。汪金婷等[17]将U-NET与目标检测模型YOLOv3[18]相结合并进行改进,最终模型Dice系数、豪斯多夫距离和头围绝对差值分别为97.81±1.41、1.32±0.86、2.02±1.97,能克服干扰,提高胎儿头围测量精度。
近年来,我国胎儿巨大儿的发生率逐年升高[19]。巨大儿易增加产妇产伤及母婴并发症风险[20]。我国估测新生儿体重的常用手段为超声信号结合Hadlock公式[21],但对于巨大儿的预测精度有很大提升空间。
李昆等[22]运用深度神经网络进行预测模型构建,最终将预测体重误差控制在100 g到500 g之间,能够减少严重的预测失误。董蓉蓉等[23]利用新生儿出生体质量及超声测量数据分别进行多元线性回归计算、机器学习模型训练,并与Hadlock公式预测结果进行比较,提出的多元线性回归方法将预测的正确率提升8.63%,灵敏度提升19.36%,机器学习算法将预测正确率平均提升14.42%,灵敏度平均提升44.09%。Ye等[24]运用机器学习中的集成方法结合多个模型,提高了胎儿体重预测精度。张硕彦等[25]在长短期记忆网络的基础上提出一种变长时间间隔的模型,使预测平均相对误差下降0.65%。
人工智能技术在胎儿健康监测领域有着广阔的发展前景。相较于传统、手工的监测方式,人工智能技术的引入能在众多方面提升胎儿健康监测效能。但结合实际应用需求进行分析,在算法设计、统一评价指标、临床实践验证三方面还存在提升空间。
由于模型训练需要大量数据,可用数据量过少、噪声数据过多从而产生的训练过拟合现象是需要克服的。此外,部分算法虽相较于传统算法有所提高,但与同领域专家教授的识别结果相比还有所差距,提升算法精度工作仍应继续。
对于同一研究方向的算法而言,设计过程与实际临床之间的评价指标无法统一,在分析多个算法之间的优劣时难以进行对比,因此统一评价指标对于分析与提升算法效能而言有着重要意义。
部分算法虽运用测试集检测效果优越,但缺乏临床的实践验证,难以进行广泛推广及应用。
因此,广大科研工作者应继续推进人工智能技术与医学领域的结合,不断优化算法、调整参数,进一步提升模型性能,推进临床应用,以推动数字医学的蓬勃发展。