使用信噪比正则化LightGBM的腹部源胎儿心电信号提取方法

2022-09-17 13:50蔡文涛蒲秀娟罗统军
电子学报 2022年8期
关键词:正则母体腹壁

韩 亮,蔡文涛,蒲秀娟,罗统军,黄 谦

(1.重庆大学微电子与通信工程学院,重庆 400044;2.生物感知与智能信息处理重庆市重点实验室,重庆 400044)

1 引言

胎儿电子监护能反映胎儿健康状况,便于各类胎儿疾病的早期诊断与及时治疗,从而降低围产儿的发病率[1].目前在临床中使用最多的胎儿电子监护技术是胎心宫缩图[2],但利用胎心宫缩图难以获取可靠的瞬时胎儿心率变异信息[3].胎儿心电信号(Fetal Electro-CardioGram,FECG)能无创地对胎儿健康状况进行长期连续监护,并实时提供高精度的胎儿心率信息,具有广阔应用前景.

非侵入式FECG 采集方法置电极于孕妇体表,能长期连续监护胎儿健康状况[4].但采用该方法从母体腹壁获得的FECG 受到以母体心电(Maternal ElectroCardioGram,MECG)成分为主的各种干扰的污染[5].FECG和MECG 成分在时域和频域都大部分重叠在一起,且MECG 成分的时域幅度和频域能量均远大于FECG,因此,如何从母体腹壁混合信号中有效抑制MECG 成分是一个巨大挑战.

基于非侵入式采集方法的FECG 信号提取方法分为组合源方法和腹部源方法[6].组合源方法需置电极于母体胸部和腹部,主要包括自适应滤波[7]、人工神经网络[8]、支持向量机[9]等.腹部源方法仅需置电极于母体腹部,便于临床应用,主要包括模版相减法[10]、卡尔曼滤波[11]、小波变换[12]、盲源分离[13]等.

应用于FECG 提取的机器学习方法通常使用均方误差(Mean Squared Error,MSE)损失函数作为目标函数,将输出信号与目标信号差值作为FECG.但是,MSE损失函数仅表示输出信号与目标信号之间的均方误差最小,并不意味着FECG 的质量最好.LightGBM[14,15]是一种基于梯度提升决策树的集成学习模型,常用于分类和回归等机器学习任务.Outram[16]将互相关分析用于估计FECG 的信噪比,其信噪比越高,说明FECG 质量越好.为此,本文提出一种使用信噪比正则化Light-GBM 的FECG 提取方法.针对原始母体腹壁混合信号,先使用传统滤波方法进行噪声抑制;再使用FastICA 从中分离得到MECG 估计和FECG估计;构建信噪比正则化LightGBM 模型并使用该模型估计残留于FECG 估计中的MECG 成分,将其抑制后最终获得高质量的FECG.

2 腹部源FECG提取基本原理

2.1 FECG采集

基于非侵入式采集方法的FECG 提取方法分为组合源方法和腹部源方法,如图1所示.

图1 FECG采集示意图

其中,腹部源方法仅需采集母体腹壁混合信号,主要分为两类:一类是模版相减法,针对心电信号在时域中的特点,利用母体腹壁混合信号的相关信息生成其中包含的MECG 成分模板,然后将其抑制;另一类是盲源分离法,该方法基于空间技术,通过使用相关源信号的空间分布信息提取FECG.针对原始母体腹壁混合信号,运用这两大类腹部源方法能够提取FECG,但其中仍残留有MECG成分等噪声.

2.2 FECG提取原理

为从母体腹壁混合信号中提取高质量的FECG,本文提出一种使用信噪比正则化LightGBM 的FECG 提取方法,如图2所示.

图2 使用信噪比正则化LightGBM的FECG提取方法

2.3 信噪比正则化LightGBM 模型

LightGBM[14]是对梯度提升决策树的高效实现框架,在不损失预测准确率的前提下具有更快的训练速度、更高的效率和更低的内存消耗.LightGBM 用于解决回归问题,通常采用MSE 损失函数作为目标函数,其定义如下:

其中,L(θ)表示损失函数,xi表示输入向量,yi表示相应的目标值,f(xi;θ)表示在输入向量xi和网络参数θ条件下的LightGBM网络的输出.

由2.2 节的分析可知:MSE 损失函数不能直接表征提取得到的FECG 的质量.为此,本文在传统LightGBM模型的目标函数中增加FECG 的信噪比作为正则项,构建信噪比正则化LightGBM模型,其目标函数优化为

其中,L(θ)为损失函数,本文选择MSE 损失函数,其定义如式(6)所示;R(θ)为正则项,表示FECG 的信噪比,其定义如式(8),即

其中,f(xi;θ)表示在输入向量xi和网络参数θ条件下的LightGBM 网络的输出,(yi-f(xi;θ))表示FECG 估计.λ为加权系数,用于控制损失项和正则项的权重.

根据式(7)和式(8),信噪比正则化LightGBM 模型优化后的目标函数为

由于胎儿心电信号信噪比越高表示FECG 质量越好,所以λ取负值.改进后的目标函数的最小化同时反映了MECG成分的最优估计和FECG的最佳质量.

2.4 FECG信噪比

FECG信噪比的计算方法如下[18].

步骤1使用传统QRS检测算法[19]确定FECG 的R峰位置.以R峰位置为基准将FECG 分为等长的L段,每段均含有一个完整的QRS 波群.构建一个K行L列的矩阵MK×L,其中,K为每段采样点数.

步骤2基于互相关系数估计的信噪比如下:

步骤3基于特征值分析估计的信噪比如下:

其中,λi是矩阵MTM的特征值,λ1是矩阵MTM的最大特征值.

SNRcor和SNRsvd越高,说明FECG 质量越高.在高信噪比条件下,SNRcor和SNRsvd都具有很高的估计精度,但是,在低信噪比条件下,SNRcor的估计精度要明显优于SNRsvd,这是由于SNRcor估计方法不依赖信号成分的精确估计[16].因此,本文选择SNRcor作为信噪比正则化LightGBM模型的正则项.

3 FECG提取方法

4 实验结果与分析

4.1 实验数据

本文使用PhysioNet 2013 挑战赛[20]SET-A 中的7 组真实腹部源心电数据进行实验,每组数据中包含4路腹壁混合信号,其采样频率为1 000 Hz,采集时间为1 min.在A15中截取一段长为2 000个采样点(40~42 s)的数据绘制于图3(纵坐标表示相对幅度,横坐标表示采样点).

图3 A15(40~42 s)预处理后数据

在图3 中,虚线框1~3 分别显示了MECG 成分与FECG部分重叠、不重叠和完全重叠的情况.

4.2 性能评价方法

主观评价通过观察FECG 波形是否理想和MECG成分残留情况来分析FECG提取方法的性能.

客观评价方法如下.

(1)临床评价指标

使用传统QRS 检测算法[19]确定提取得到的FECG的R 峰位置,并依据PhysioNet 2013 挑战赛[20]SET-A 给定的FECG 的R 峰的标准位置,计算灵敏度(Se)、阳性预测值(PPV)和F1分数[21,22]:

其中,TP(True Positive)、FP(False Positive)和FN(False Negative)分别表示正确检测的、错误检测的和漏检的FECG 的R 峰位置个数.灵敏度(Se)、阳性预测值(PPV)和F1分数的值越高,表示性能越好.

(2)信噪比指标

采用如2.4 节所述SNRcor和SNRsvd评价提取得到的FECG质量.

4.3 本文方法的实验结果与分析

本文所有实验采用的计算机CPU 为Intel Core i7-9700K,CPU主频为3.60 GHz,内存为32 GB,操作系统为Windows 10 专业版,编程工具为Python和Matlab R2019a,机器学习库使用Scikit-Learn和Lightgbm3.3.0.

采用第3 节所述的使用信噪比正则化LightGBM 的FECG 提取方法,对4.1 节所述真实腹部源心电数据进行实验.首先对原始母体腹壁混合信号进行噪声抑制,然后使用FastICA 分离得到MECG 估计(t)和FECG估计(t),参数设定为源数量n=4.选取A15第40~42 s的实验结果绘制于图4.

由图4 可知,信号经FastICA 分解后输出的独立成分中,前两个独立成分为噪声,第3 个独立成分含有较好形态的MECG,选择其作为MECG 估计(t),第4 个独立成分含有较为明显的FECG,选择其作为FECG 估计(t).进一步仔细观察图4 中的第4 路信号,可以发现其中残留了明显的MECG 成分和其他噪声,需要对其进行进一步抑制.

图4 A15(40~42 s)经FastICA分解得到的独立成分

使用信噪比正则化LightGBM 模型进一步抑制FECG 估计(t)中残留的MECG 成分.使用网格搜索法进行参数优化后确定的模型参数见表1.选取A15第40~42 s的实验结果绘制于图5.

图5 A15(40~42 s)经FastICA-信噪比正则化LightGBM提取的FECG

表1 信噪比正则化LightGBM模型参数

由图5 可知,与FastICA 分离得到的FECG 估计(t)相比,在MECG 成分与FECG 成分部分重叠、不重叠和完全重叠(虚线框1~3)情况下,经FastICA-信噪比正则化LightGBM 均能提取得到的清晰完整的FECG,且其中残留的MECG成分明显减少,FECG质量更高.

采用4.2 节所述客观评价方法对经FastICA和经FastICA-信噪比正则化LightGBM 提取得到的FECG 进行计算,结果分别见表2和表3.

表2 使用FastICA的FECG提取方法的性能评价

表3 使用FastICA-信噪比正则化LightGBM的FECG提取方法的性能评价

由表2和表3 可知,使用FastICA 直接提取的FECG质量较低,需进一步抑制其中残留的MECG 成分和其他噪声.与使用FastICA 的FECG 提取方法相比,使用FastICA-信噪比正则化LightGBM 提取得到的FECG 的各项性能指标均有显著提升,其中SNRcor平均提高了2.9 dB,SNRsvd平均提高了2.7 dB,PPV 平均提高了10.8%,F1分数平均提高了6.7%,Se 在接近99%的情况下也平均提高了1.3%.这充分表明使用信噪比正则化LightGBM 模型能有效抑制残留的MECG 成分和其他噪声,提取高质量的FECG.

综上所述,主观和客观性能评价都充分表明本论文提出的使用信噪比正则化LightGBM 的FECG 提取方法能够从母体腹壁混合信号中提取得到完整清晰的FECG,且其质量明显高于使用FastICA直接提取的FECG.

4.4 对比实验结果与分析

为进一步验证本文提出的使用信噪比正则化LightGBM 的FECG 提取方法,使用4.1 节所述真实心电数据进行实验,首先对原始母体腹壁混合信号进行噪声抑制,然后分别进行如下对比实验.

实验1:分别使用TFBSS,TFBSS-LightGBM和TFBSS-信噪比正则化LightGBM 提取FECG,选取A15第40~42 s的实验结果绘制于图6.

图6 A15(40~42 s)对比实验1

实验2:分别使用RobustICA,RobustICA-LightGBM和RobustICA-信噪比正则化LightGBM 提取FECG,选取A15第40~42 s的实验结果绘制于图7.

图7 A15(40~42 s)对比实验2

实验3:分别使用FastICA,FastICA-LightGBM和FastICA-信噪比正则化LightGBM 提取FECG,选取A15第40~42 s的实验结果绘制于图8.

其中,TFBSS参数设定为n=4,Nf=256,Nt=256,tol=1256,RobustICA 的参数设定为prewhi=true,FastICA的参数设定为n=4;信噪比正则化LightGBM 的参数如表1 所示;除不含目标函数加权系数λ这个参数外,传统LightGBM 的其余参数与信噪比正则化LightGBM 的参数一致.

由图6~图8可知:

图8 A15(40~42 s)对比实验3

(1)使用TFBSS,RobustICA和FastICA 直接提 取FECG,在MECG 成分和FECG 成分部分重叠(虚线框1)的情况下,TFBSS,RobustICA和FastICA 均未能有效抑制MECG成分;

(2)采用传统LightGBM 抑制MECG 成分后,在MECG 成分和FECG 成分部分重叠、不重叠和完全重叠(虚线框1~3)情况下,TFBSS-LightGBM,RobustICALightGBM和FastICA-LightGBM 均较为有效地抑制了MECG成分;

(3)采用信噪比正则化LightGBM 抑制MECG 成分后,在MECG 成分和FECG 成分部分重叠、不重叠和完全重叠(虚线框1~3)情况下,TFBSS-信噪比正则化LightGBM、RobustICA-信噪比正则化LightGBM和FastICA-信噪比正则化LightGBM 均有效抑制了MECG 成分和部分噪声,且其性能分别优于TFBSS-LightGBM,RobustICA-LightGBM和FastICA-LightGBM,这表明信噪比正则化LightGBM 模型比传统LightGBM 模型更适用于FECG提取.

采用4.2 节所述临床评价指标和信噪比指标计算方法分别对实验1~3 提取得到的FECG 进行计算,对每种方法在7 组数据集上实验结果的客观性能评价指标取平均值,如表4所示.

由表4可知:

表4 FECG提取方法性能对比(平均值)

(1)使用TFBSS,RobustICA和FastICA 直接提取的FECG的客观评价指标均不太高,其质量相对较低;

(2)分别使用TFBSS-LightGBM,RobustICA-LightGBM和FastICA-LightGBM 三种方法提取的FECG,相对于使用TFBSS,RobustICA和FastICA直接提取的FECG,其客观评价指标有所提高,这说明盲源分离方法结合Light-GBM是有效的,其中,FastICA-LightGBM方法优于TFBSS-LightGBM和RobustICA-LightGBM方法;

(3)分别使用TFBSS-信噪比正则化LightGBM,RobustICA-信噪比正则化LightGBM和FastICA-信噪比正则化LightGBM三种方法提取的FECG,其客观评价指标明显提高,这说明本论文提出的信噪比正则化LightGBM模型在性能上优于传统LightGBM模型,更适用于FECG提取,其中,FastICA-信噪比正则化LightGBM 提取的FECG 的客观评价指标最高,这说明FastICA-信噪比正则化LightGBM方法的性能优于其他FECG提取方法.

综上所述,本文提出的使用信噪比正则化Light-GBM 的FECG 提取方法无论在主观视觉评价还是在客观性能指标上都明显优于其他传统的FECG提取方法.本文提出的信噪比正则化LightGBM 模型比传统Light-GBM模型更适用于FECG提取,采用本文提出的信噪比正则化方法有效提高了FECG提取方法的性能.

5 总结

本论文提出一种使用信噪比正则化LightGBM 的FECG 提取方法.针对母体腹壁混合信号,首先使用传统滤波方法进行噪声抑制,然后使用FastICA 分离得到MECG 估计和FECG 估计,再使用信噪比正则化Light-GBM 模型拟合MECG 成分与MECG 之间的非线性变换,抑制FECG 估计中残留的MECG 成分,得到高质量的FECG.实验结果表明,本文提出的使用信噪比正则化LightGBM 的FECG 提取方法是有效的,且无论在主观视觉效果还是在临床评价指标和信噪比评价指标上,均优于基于盲源分离的FECG 提取方法,也优于盲源分离结合传统LightGBM 的FECG 提取方法.本文提出的FECG 提取方法能够从母体腹壁混合信号中直接提取FECG,更便于临床应用.

除LightGBM 模型外,还有大量的机器学习模型被广泛应用于生物医学信号处理领域,因此,研究如何将本文提出的信噪比正则化方法与其他机器学习模型相结合,提取得到更高质量的FECG是下一步研究方向.

猜你喜欢
正则母体腹壁
J-正则模与J-正则环
蒲公英
π-正则半群的全π-正则子半群格
Virtually正则模
鱼刺致不典型小肠腹壁瘘并脓肿形成1例
腹壁缺损的重建方法与研究进展
故乡
腹壁缺损重建方法的研究进展
任意半环上正则元的广义逆
三种稠环硝胺化合物的爆炸性能估算及其硝化母体化合物的合成