陆云飞,陆 飞,方路平,葛慧青,潘 清
1(浙江工业大学 信息工程学院,杭州 310023) 2(浙江大学医学院附属邵逸夫医院呼吸治疗科,杭州 310016)
在重症监护室(Intensive Care Unit,ICU)中,机械通气(Mechanical Ventilation,MV)指的是急性呼吸衰竭患者需要呼吸机提供足够的通气支持来减少患者自身呼吸所做的功的过程.机械通气是危重病人重要生命支持手段,但是由于呼吸机参数设置不当或者患者自身存在的不同病情体质等原因,当患者的呼吸需求与呼吸机设置参数不匹配时,就会造成人机不同步[1].Thille等人提出有接近四分之一的重症病人在机械通气时存在着较高的人机不同步发生率[2],如此高的人机不同步发生率轻则导致患者呼吸困难,重则可能会导致患者膈肌和呼吸肌的结构损伤,进而导致吸气肌无力和脱机失败等一系列不良的临床结果[3,4].人机不同步可以被认为是显式的,即它可以在呼吸机屏幕上的流速和压力波形中观察到,但这需要操作者密切监控呼吸波形以及在机械通气方面有较高的专业知识.因此,有必要开发一种机械通气人机不同自动检测的方法,以提示医护人员对呼吸机设置进行优化,改善病人与呼吸机的协调性.
常见的人机不同步类型包括无效吸气努力(Ineffective inspiratory Effort during Expiratory phase,IEE)、双触发、周期过短、周期过长等.本研究主要针对IEE这一类型进行检测.IEE指的是患者在吸气努力后未触发呼吸机进行送气的过程,与IEE相关的因素包括吸气努力不足和呼气末固有正压(Positive End Expiratory Pressure,PEEP)的存在,后者增加了触发呼吸机所需的努力程度.
早期IEE自动检测主要基于波形特征的规则.Chen等人[5]在2008年提出了一种自动检测IEE的方法,认为可以通过在呼气相寻找流速极大值,然后在该极大值到呼气结束点之间寻找最小值,计算极大值和最小值之间的差值,并设定阈值,当差值大于所设阈值时,即满足公式(1):
Fdef>Fdef_th
(1)
则认为该次呼吸是无效吸气努力.其中Fdef为最大流速偏差,Fdef_th表示设定的最大流速偏差阈值.Thille等人[2]将IEE定义为在呼气阶段气道压力波形出现≥0.5 cmH2O的凹陷同时伴随着流速波形有凸起,并且之后没有开始新的呼吸周期.上述基于波形规则的算法不足之处在于最佳阈值的设置存在争议,针对不同的数据集会存在不同的最佳阈值;当病人存在咳嗽、打嗝或者吸痰等行为导致波形产生噪声时,该算法容易误判,对噪声较为敏感,鲁棒性较差.
近年来,也有一些研究应用随机森林(Random Forests,RF)和自适应增强(Adaptive Boosting,AdaBoost )等机器学习方法对IEE进行分类,主要通过提取时域波形的呼吸持续时间、吸气末流速、吸气末压力、吸气末潮气量等临床特征然后输入模型进行判别[6,7].上述机器学习方法缺陷在于所提取的特征仅仅是时域层面的特征,而部分IEE特征存在于频域层面,且提取的传统特征无法表现IEE波形复杂度、平均信息量高的特点,不能全面表征IEE形态特征.针对如何提取有效的IEE波形特征来充分挖掘呼吸波形的人机不同步信息,目前的研究还不太多.针对以上不足,本文提出了一种新的应用多尺度提特征的自动检测机械通气人机不同步方法.通过小波变换实现多尺度信号分离,对信号进行多分辨率分析,针对IEE波形序列波动的不规律性和不可预测性的特点提取不同尺度的非线性特征;通过使用分类器避免了阈值设置的问题.通过对实验结果的分析与比较,证明了该特征提取方法和分类算法的有效性,相比于现有算法性能更好,分类效果更佳理想,有望为临床工作提供有效辅助.
IEE指的是患者进行吸气努力而未触发呼吸机进行送气的过程.流速波形呼气相中因为吸气努力的存在而迅速上升,但是并未触发呼吸机进行送气,所以又转为呼气,流速波形在小幅下降后慢慢上升至归零,开始下一次呼吸.所以IEE在呼吸波形上主要表现为呼气相流速中有突起的同时伴随压力波形有凹陷[2].图1所示为IEE波形气道压力和流速示意图.
图1 典型无效吸气努力呼吸波形Fig.1 Typical ineffective inspiratory effort breathing waveform
图中共有5次呼吸,其中3次呼吸为IEE,箭头所指位置为无效吸气努力发生位置,此图为较为典型的波形示意图,实际情况可能会更加复杂.从图中可以看到IEE波形在呼气相和正常波形相比,其波形序列复杂度更高,相邻采样点变化幅度分布更不均衡,所以希望通过小波变换获得时-频域的熵值特征以及非线性特征来区分IEE和非IEE波形.
小波变换(wavelet transform,WT)[8,9]对信号在时域和频域上进行局部变换,能够有效地提取信号的时-频信息.不同长度的时间窗可以提供低频和高频分辨率,这使得小波变换成为一种适用于不规则数据模式识别的技术[10-12].连续信号x(t)的WT定义如公式(2)所示:
(2)
其中a和b分别为尺度因子(scale)和平移因子(translation).由于呼吸机波形数据是数字信号,为了适应数字信号处理,需要将连续小波变换离散化,通常使用离散小波变换(Discrete Wavelet Transform,DWT )[13]:
(3)
图2 小波分解树Fig.2 Wavelet decomposition tree
离散小波变换可以通过低通和高通滤波器将原始信号多级分解,形成小波分解树,其结构如图2所示.其中S为原始信号,g[n]表示高通滤波器,h[n]表示低通滤波器,A表示近似信号,D表示细节信号.
图3为使用Daubechies5小波基对呼气相流速波形进行6层离散波变换后的效果图.
其中图3(a)为原始图,图3(b)-(g)分别为d1-d6层小波子带图,图3(h)表示a6层子带图.从图中可以看到IEE特征在d5和d6层较为明显,d1和d2层主要表征细节信息,代表高频信号,而d6层则主要表征近似信息,代表低频信号.
图3 对呼气相进行6层小波分解示意图Fig.3 6-layer wavelet decomposition of the expiratory phase
基于IEE产生是由于患者在进行吸气努力后未触发呼吸机进行送气,所以在流速波形上会存在一个快速突起然后又下降的情况(如图1所示).我们认为两类波形在信号复杂度和变异性方面有明显的差异.因此,我们选取了一组反映序列信号复杂度和变异程度的特征,包括对每一层小波系数计算非线性熵值特征以及形态特征.其中熵值特征包括近似熵(Approximate Entropy,ApEn)[14,15]和模糊熵(Fuzzy Entropy,FE)[16,17].形态特征包括方差(Variance,Var)、四分位差(Interquartile,IQR)、平均绝对偏差(Mean Absolute Deviation,MAD)、庞加莱图中的短时标准偏差(SD1)和长时标准偏差(SD2).近似熵ApEn和模糊熵FE都是可以用于评价给定时间序列复杂度的方法;方差Var、四分位差IQR和平均绝对偏差MAD都可以用于衡量一组数据的离散程度;庞加莱图的SD1和SD2主要用于衡量一组数据短时程和长时程的变异程度.本研究主要提取特征的物理意义描述如表1所示.
表1 提取特征及描述Table 1 Extract features and descriptions
其中ApEn是一种可以量化时间序列不规则性的统计方法,新信息发生的可能性越高,时间序列越复杂,对应的近似熵越大.在心电信号中ApEn常用于对情绪进行分类.ApEn计算公式如公式(4)所示:
ApEn=Φm(r)-Φm+1(r)
(4)
其中,N表示序列长度,m表示相空间维数,r表示相似容限度,通常取r=0.2*std.
FE也用于衡量事物的不均匀性,在心电信号中该特征能够用于检测阻塞性睡眠呼吸暂停.FE计算公式如公式(5)所示:
(5)
Var表示一组数据的离散程度,计算公式如公式(6)所示:
(6)
式中Xi表示第i个序列值,n表示序列长度.
IQR可以体现各变量分散情形,其计算公式如公式(7)所示:
IQR=Q3-Q1
(7)
其中Q3表示第三四分位数,Q1表示第一四分位数.
MAD表示单变量数据集中样本差异性的稳健度量,计算公式如公式(8)所示:
(8)
其中m(x)表示序列的平均值.
SD1和SD2都是庞加莱图中参数,其计算公式分别如公式(9)-公式(12)所示:
(9)
(10)
(11)
(12)
为了提高所用分类器的性能,并减少所需的计算时间,本算法通过序列前向选择算法(Sequential Forward Selection,SFS)进行最佳特征选取[18].序列前向选择算法包括以下步骤:
a)所有的特征X1、X2、X3……XN都被单独应用到分类器中,以选择效果最佳的一种特征.假定最佳特征为Xi.
b)将效果最佳的特征 分别与剩下的特征Xi一一结合,选取效果最佳的一组特征.假定最佳组合为[Xi,Xj].
c) 将[Xi,Xj]与剩下的特征X1、X2、X3……Xi-1、Xi+1……Xj-1、Xj+1……XN一一结合,选取效果最佳的一组特征.
d) 重复执行步骤c,直到效果不再提升.
支持向量机(Support Vector Machine,SVM)[19,20]是在分类与回归分析中对数据进行分析的监督式学习分类识别方法.与其他分类器不同的是,SVM最大程度地降低了结构风险,而非经验风险[21,22].通过SVM的训练,使模式到类分离超平面的距离最大化[23].通过不同的核函数可以将数据映射成高维层面[24],如线性核函数(linear)、多层感知机核函数(Multilayer Perceptron,MLP),高斯径向基函数(Radial Basis Function,RBF),因而特别适用于从小样本中分析特征与类别间的非线性关系.支持向量机因为其结构简单,具有较好的鲁棒性,在对样本进行分类的场景中有着较多的应用[25,26].对于给定的训练样本数据集(xi,yi),i=1,…,n,x∈Rd,yi∈{-1,1},分类超平面方程可以表示为公式(13):
(w*x)+b=0
(13)
决策函数f(x)可以表示为公式(14):
(14)
其中K(xi,x)为核函数,ai代表拉格朗日乘子,b是SVM模型的偏置参数,核函数有多种类型:
(15)
K(xi,x)=exp(-g‖xi-xj‖2)
(16)
其中式(15)为多项式核函数,式(16)为RBF核函数.
本文提出的检测方案流程图如图4所示.由于IEE特征在流速波形中更为突出(如图1所示),一些研究只针对流速波形进行分析,降低算法复杂性[5].本研究采纳这一处理方式,只针对流速波形进行研究.
图4 算法流程图Fig.4 Algorithm flow chart
首先读取呼吸波形数据,通过寻找流速波形第一个过零点来确定呼气开始点,并认为该点到呼气结束为该次呼吸的呼气相.然后通过去除呼气相波形中的线性趋势来消除数据偏移对后期计算的影响.通过离散小波变换对呼气相流速波形进行6层分解,对各层小波系数进行特征提取,包括模糊熵、近似熵、样本熵、方差、平均绝对误差、四分位差、短时标准偏差以及长时标准偏差.利用序列前向选择算法选择最佳特征,最后应用SVM分类器对最佳特征进行分类,进而得到人机不同步分类结果.
本文实验数据来自浙江大学医学院附属邵逸夫医院ICU病房,共收集了17名(11名男性,6名女性)使用Puritan Bennett 840呼吸机(Covidien,美国)进行机械通气患者的数据,共计3298.48小时,患者平均年龄为64.5岁,所患主要疾病包括呼吸系统疾病、自身免疫性疾病、糖尿病等.从中筛选出60.92小时的数据,由5名低年资医生进行数据标注,后由2名高年资医生进行审核.标注时,我们不仅提供单次呼吸的波形给标注者,还提供它前后的多个波形,以及呼吸机设置参数和测量参数,以帮助标注者更好地理解这些波形所反映的人机不同步情况,使标注尽可能准确.最终所选数据集包括1032次IEE呼吸以及1031次非IEE呼吸.本研究得到浙江大学医学院附属邵逸夫医院伦理委员会批准(批准编号:20190916-16).
为了评估机械通气人机不同步分类性能,我们采用了包括灵敏度(Se)、特异性(Sp)、F1得分和准确率(Acc)4个评价指标来衡量.4个评价指标定义如公式(17)-公式(20)所示:
(17)
(18)
(19)
(20)
其中TP,TN,FN,FP分别为真阳性,真阴性,假阴性,假阳性的样本数.
为了验证本文提出的应用小波多尺度特征的机械通气人机不同步检测算法的有效性,本文采用了十折交叉验证法进行评价,采用MATLAB语言编程实现本文的算法.
在特征选取阶段,用基于RBF核函数的SVM对每种特征分别计算分类性能,结果如表2所示.
表2 单个特征分类性能Table 2 Classification performance using individual feature
从表2中可以看到,在每个特征单独作用时,SD1获得了单一特征值的最高准确率94.1%,该特征在区分IEE波形和其他的效果最佳,说明了在无效吸气努力波形中,前后两个采样点之间差值的离散程度要明显高于正常波形,数据分布相对比较分散,相邻两个采样点之间的差异程度要明显高于后者.总体来看,所选取的这些非线性特征在准确率上都能高于80%,都能够较好地反映IEE呼吸波形与非IEE呼吸波形的非线性动力学特性.
图5 IEE和非IEE波形SD1特征的分布箱型图Fig.5 Distribution box diagrams for the SD1 characteristic of the IEE and non-IEE waveforms
为了方便比较IEE和非IEE呼吸波形特征值的差异,绘制了d5层小波子带SD1和ApEn两种特征的分布箱型图,如图5和图6所示,另外绘制了7种特征的均值柱状图,如图7所示.由于篇幅所限,本文中仅展示了d5层小波子带的分布情况.从图5和图6箱型图中可以看出,对于大多数样本,IEE波形的SD1特征值和ApEn特征值明显大于非IEE波形,对比结果表明IEE发生时,其呼吸波形中的时间序列不规则度大于后者,波形更加复杂,相邻采样点之间的变化差异更大,产生新模式的概率也更高.图7所示表明在d5层小波子带中,IEE波形在SD1、SD2、MAD、Var、IQR这几个特征中差别显著,也证明了所选特征能够作为检测IEE的依据.
图6 IEE和非IEE波形ApEn特征的分布箱型图Fig.6 Distribution box diagrams for the ApEn characteristic of the IEE and non-IEE waveforms
图7 IEE与非IEE不同特征均值对比Fig.7 Comparison of the mean values of different characteristics between IEE and non IEE
当使用RBF作为核函数时,根据SFS算法描述,在利用SD1和剩余特征一一结合之后发现,效果最佳组合为SD1和ApEn,灵敏度和特异性达到了93.41% 和96.68%.再将SD1和ApEn与剩余特征一一结合之后发现,效果不再提升,所以认为RBF核函数下SD1和ApEn为最佳特征.本实验使用不同核函数的SVM分类器进行实验,分类结果如表3所示.从表3结果可以看出,相对于linear和MLP核函数来说,基于RBF的SVM分类器得益于较强的数据处理能力,拥有最佳的灵敏度和特异性,并且准确率和F1也是最高的.说明在该分类任务中,RBF核函数拥有最佳性能.
表3 基于不同核函数的SVM分类性能Table 3 SVM classification performance based on different kernel functions
表4 传统特征与本文所选取特征对比Table 4 Comparison between traditional features and the features selected in this paper
为了比较文献[7]中作者所提取的呼吸时长、吸气末流速、吸气末压力、吸气末潮气量等传统时域波形特征的分类效果,在本实验的数据集上基于文献所选取的特征结合SVM分类器进行了十折实验,结果如表4所示,表中数据为(均值±标准差).从表中可以看到基于本文所提出的特征在相同分类器情况下,分类效果优于传统特征,说明本文提出的特征提取方法能更加准确地提取IEE波形特征.
表5 不同算法结果比较Table 5 Comparison of results of different algorithms
本实验与文献所报道的几种算法进行了对比,结果如表5所示.其中,论文阈值为5.45 L/min,最佳阈值通过在2 L/min-8 L/min之间按步长为0.2 L/min进行阈值扫描获得,当阈值为6.6 L/min时,分类效果最佳.从表中可以看到,使用文献报道的阈值时,基于规则的算法的灵敏度和特异性较差,性能容易受到阈值设置参数的影响.基于本研究的数据集优化阈值后,灵敏度和特异性都有提升,但是和机器学习算法还是有明显差距.RF和AdaBoost的方法效果相近,都能达到一定的检测精度,其中RF的性能略高于AdaBoost,都能避免阈值设置的问题.本文提出的方案得益于多尺度小波变换,能够进行多尺度时频分析;在各个尺度上提取时域和非线性的特征帮助模型更加准确地表达IEE形态特性,分类效果较其他方法都有所提升.
本文提出了一种应用小波多尺度特征进行机械通气人机不同步检测的方法.利用小波变换具有多分辨率的特点,可以由粗到细地逐步提取信号特征,获得不同频率的下的信息,针对传统算法提取的波形特征无法很好地表现IEE特征的问题,本方法基于IEE波形复杂度、平均信息量高的特点,对不同频率下的信号提取包括模糊熵、近似熵、样本熵、方差、平均绝对误差、四分位差、短时标准偏差以及长时标准偏差特征,对特征通过SFS算法进行选择,最后用SVM分类器对特征进行分类,很好地解决了高频噪声干扰和阈值设置以及时频域特征提取的问题,并且提高了分类准确率,新的特征提取方法在实际表现中也体现了更佳的分类效果.考虑到标注的数据量较小,本研究选择适合于小样本分类的SVM作为分类器.SVM是一种适合于小样本分类的机器学习算法.借助非线性核函数,SVM在从小样本中提取类别与特征间的非线性关系方面具有较强的性能.在多项生理信号分析研究中,应用SVM模型可以在较小的数据集上取得较好的分类效果[27,28].
本文提出的方法虽然相较于现有算法准确率有一定优势,但是以下问题还需要进一步改进研究:特征的提取依赖于呼气点精确定位,目前对于复杂波形呼气点检测存在错检的情况;目前只选取流速波形进行研究,后期会考虑结合气道压力波形共同计算以及选择其他特征值以进一步提高分类精度.另外,人工标注的主观性可能导致部分标注不够准确.未来工作中应考虑添加食道压或膈肌电测量等参考信号辅助数据标注.经进一步验证和优化的算法有望在将来应用于呼吸机数据实时采集与监控系统或植入呼吸机固件中,实时检测人机不同步,提示医护人员.医护人员可根据自身经验对呼吸机做出调整,改善人机协调性,辅助病人治疗.