基于心电特征参数的心肌梗死疾病辅助诊断模型的建立*

2017-04-07 07:45张清丽苏士美尹咪咪张建华
郑州大学学报(医学版) 2017年2期
关键词:导联时限特征参数

张清丽,苏士美,尹咪咪,张建华,刘 莹

郑州大学电气工程学院 郑州 450001

基于心电特征参数的心肌梗死疾病辅助诊断模型的建立*

张清丽,苏士美#,尹咪咪,张建华,刘 莹

郑州大学电气工程学院 郑州 450001

#通信作者,女,1965年6月生,硕士,副教授,研究方向:信息的采集与处理,E-mail:smsu@zzu.edu.cn

心肌梗死;小波变换;logistic回归模型;支持向量机模型

目的:建立基于心电特征参数的心肌梗死疾病辅助诊断模型。方法:取PTB数据库中的158例心肌梗死患者为病例组,90例健康志愿者为对照组,提取这2组的ECG V5导联信号波形并进行预处理,用小波变换结合窗口函数的方法提取11个心电特征参数,采用独立样本t检验和精确概率法筛选特征参数,并进行归一化处理,建立logistic回归模型和支持向量机模型并比较其性能。结果:Logistic回归模型和支持向量机模型的诊断准确率分别为95.1%和96.0%。结论:Logistic回归模型和支持向量机模型对心肌梗死的分类诊断均具有重要的理论和临床价值。

心血管疾病是世界范围内严重危害人类健康的疾病,其发病率和死亡率在发展中国家日益升高。预计到2020年,全球超过80%的心血管疾病将发生在发展中国家[1]。急性心肌梗死具有发病速度快、致死率高、无预兆等特点,是威胁人类生命的重大疾病[2]。心肌梗死模型的开发应用是研究人类心肌梗死病理、诊断乃至治疗的基础[3]。该研究中作者首先对采集到的心电信号进行预处理并提取出特征参数,然后对筛选出的变量分别采用logistic回归方法[4]和支持向量机[5]建立心肌梗死疾病辅助诊断模型,并比较两种建模方法诊断的准确性,以期为临床诊断提供一个方便快捷的途径。

1 对象与方法

1.1 研究对象 取PhysioBank中PTB数据库中的158例心肌梗死患者为病例组,其中ST段电位偏移30例,早搏21例;90名健康志愿者为对照组,均无ST段电位偏移和早搏现象。提取上述研究对象数据库中的ECG V5导联信号,采样频率为1 000 Hz,持续时间为1 min。

1.2 特征参数的提取和筛选 利用PhysioBank开发的数据读取工具PhysioBank ATM下载数据并存储为MATLAB可读取的.mat或.txt格式。将下载的心电信号进行预处理,采用窗口宽度为490的中值滤波滤除基线漂移[6],采用巴特沃斯“49~51”的带阻滤波器滤除工频干扰,采用分解尺度为3的db5小波基进行小波去噪去除高频干扰,然后对预处理后的心电信号进行特征参数提取。利用mesh小波分解并结合自适应阈值的方法提取信号的R波峰点,以R波峰为基准,设置窗宽为100个采样点的宽度,并于其前后寻找Q波和S波,结合基线搜索QRS复合波的起点和终点(图1),提取出R波幅值、QRS时限以及RR间期共3个参数;然后利用斜率阈值法搜索P波和T波,提取出P波幅值和时限、T波幅值和时限以及PR间期、QT间期;最后,根据ST段电位测量点校正公式测量ST段的偏移电位,提取出ST段抬高和压低情况(只考虑ST段电位偏移量,不区分抬高和压低两种状态)。

应用SPSS 21.0,采用两独立样本t检验和Fisher精确概率法比较病例组和对照组特征参数的差异,检验水准α=0.05,用以筛选建模所用的自变量。

图1 ECG信号QRS点定位

1.3 Logistic回归法建模 采用SPSS 21.0实现logistic回归分析。其中,因变量选取为GROUP变量,自变量选用1.3筛选出的变量,回归方法选择“进入”(不再进行变量筛选)。其测试集为158例心肌梗死患者和90名健康志愿者的ECG V5导联信号。

2 结果

2.1 特征参数的筛选 结果见表1。由表1可见,除P波时限、T波时限、QRS时限外的8个参数均可作为建模分析变量。

表1 特征参数的差异性比较

*:精确概率法。

2.2 Logistic回归模型的建立 根据筛选的数据,建立的心肌梗死辅助诊断logistic回归模型表示为:GROUP=0.534-0.731×VR-2.436×VP-0.911×VT-0.001×TRR+0.006×TQT-0.008×TPR+0.538×|VST|+0.031×Np(1),其中VR是R波幅值,VP是P波幅值,VT是T波幅值,TRR是RR间期,TQT是QT间期,TPR是PR间期,|VST|是电位偏移,Np是早搏。将所有样本数据代入(1)计算,与原始数据进行比较并统计其准确率,结果如表2所示,其准确率为95.1%(236/248)。

表2 Logistic回归模型预测结果 例

2.3 支持向量机模型的建立 不同c值和g值组合下分类器的准确率变化见图2。经K-CV法选择,c和g的最优值分别为0.758和4。将50例测试集样本输入到训练好的支持向量机模型中进行模型仿真,结果见表3,支持向量机仿真模型测试结果准确率为96.0%(48/50)。

图2 不同c值和g值组合下分类器的准确率变化

表3 支持向量机模型的预测结果 例

3 讨论

基于MATLAB平台的支持向量机模型在疾病诊断、医学图像处理等方面的应用逐渐增多,它提供了完整的可编译执行文件和源代码。利用支持向量机进行分类时,其惩罚参数c和核函数参数g等是可调的,优化参数可大大提高分类器的性能。大量研究[7-8]表明,利用交叉验证可以得到最优的参数组合,最小化结构风险,提高泛化能力,并且可以有效避免一般神经网络的欠学习和过学习问题,提高支持向量机分类器的准确率。

急性心肌梗死是严重影响人类健康的常见病,近年来发病率逐渐升高并且有年轻化趋势[9],在心电图上主要表现为Q波异常和ST段电位偏离等。ECG V5导联信号距离心脏最近,信号最强,对前壁及全壁心肌梗死特征的反映较为显著。从表1可以看出,心肌梗死患者的R波、P波较对照组幅值降低,T波更为明显(样本数据中已发现很多T波倒置的病例),说明心肌梗死患者可能由于部分心肌的坏死而导致信号传导阻滞,因而整体信号能量偏弱;另外,病例组RR间期相对于对照组较短,即平均心率较对照组较快,PR间期由于与RR间期成正比也显示此特征,而QT间期相对于对照组较长;此外,心肌梗死患者经常有ST段电位偏移和心律不齐等情况产生,而对照组没有此特征。因此,可以得到的提示性信息是,心率过快、早搏、R波及P波振幅微弱、T波倒置、QT时限过长、ST段电位偏移超过0.1 mV是心肌梗死的心电图特征[10]。

该研究依据ECG V5导联心电参数特征分别建立了logistic回归模型和非线性的支持向量机模型来对心肌梗死患者和健康对照进行分类:首先从158例心肌梗死患者和90名健康志愿者的ECG V5导联信号中提取出11个特征参数;而后采用两独立样本t检验和确切概率法筛选出与分组变量相关性较强的8个参数用于模型的建立,其中支持向量机模型的建立过程中采用了K-CV法来选取最优的参数组合;最后对logistic回归模型和支持向量机模型的分类性能进行了评价,结果显示二者准确率均较高。支持向量机在分类上的优越性能已经得到了许多研究[11-13]的证实,然而该算法与神经网络[14]有着一样的缺点——黑箱模式,即由于非线性算法的组合而无法详尽地解释该模型工作的过程,在该研究中也无法直观地揭示与心肌梗死相关的特征参数的生理意义,而logistic回归模型则很好地弥补了这一点。

综上所述,logistic回归模型和支持向量机模型对心肌梗死的分类诊断均具有重要的理论和临床价值。

[1]高晓津,杨进刚,杨跃进,等.中国急性心肌梗死患者心血管危险因素分析[J].中国循环杂志,2015,30(3):206

[2]苏懿,王磊,张敏州.急性心肌梗死的流行病学研究进展[J].中西医结合心脑血管病杂志,2012,10(4):467

[3]徐鸿远,吴鲲鹏,李霖.急性心肌梗死患者近期预后模型的建立[J].临床心血管病杂志,2013,29(7):506

[4]秦正积,沈毅,崔晓莉,等.logistic回归在疾病多指标联合诊断中的应用[J].中国卫生统计,2014,31(1):116

[5]王江源,刘玉兰.支持向量机在急腹症智能诊断中的应用研究[J].中国卫生统计,2014,31(1):19

[6]BORTOLAN G,CHRISTOV I,SIMOVA I.Noise processing in exercise ECG stress test for the analysis and the clinical characterization of QRS and T wave alternans[J]. Biomedical Signal Processing Control, 2015,18:378

[7]尹金良,朱永利.支持向量机参数优化及其在变压器故障诊断中的应用[J].电测与仪表,2012,49(5):11

[8]徐晓明.SVM参数寻优及其在分类中的应用[D].大连:大连海事大学,2014.

[9]郑昕,李建军,杨跃进,等.近15年间急性心肌梗死患者的性别年龄演变趋势[J].中国循环杂志,2010,25(6):441

[10]吕佳仁.急性心肌梗死患者心电图特征分析[J].中国现代药物应用,2016,10(4):6

[11]CONFORTI D,GUIDO R.Kernel based Support Vector Machine classifiers for early detection of myocardial infarction[J].Optim Methods Softw,2005,20(2/3):395

[12]BERIKOL GB,YILDIZ O,OZCAN IT.Diagnosis of acute coronary syndrome with a support vector machine[J].J Med Syst,2016,40(4):84

[13]BAI YQ,HAN X,CHEN T,et al.Quadratic kernel-free least squares support vector machine for target diseases classification[J].J Comb Optim,2015,30(4):850

[14]王宏涛,孙剑伟.基于BP神经网络和SVM的分类方法研究[J].软件,2015,36(11):96

(2016-04-09收稿 责任编辑徐春燕)

Establishment of myocardial infarction disease-diagnosis model based on ECG characteristic parameters

ZHANGQingli,SUShimei,YINMimi,ZHANGJianhua,LIUYing

SchoolofElectricalEngineering,ZhengzhouUniversity,Zhengzhou450001

myocardial infarction;wavelet transform;logistic regression model;support vector machine model

Aim: To establish a myocardial infarction disease-diagnosis model based on ECG characteristic parameters. Methods: A total of 158 cases of myocardial infarction(case group) and 90 healthy volunteers(control group) in PTB database were chosen. ECG V5 lead signal waveforms of the 2 groups were extracted and preprocessed, 11 ECG characteristic parameters were extracted using wavelet transform combined with window function,among which, characteristic parameters were selected using independent samplettest and exact probability method, and normalized, and then the mathematical models were established based on logistic regression model and support vector machine(SVM) model, finally,the performance of the 2 models was compared.Results: The diagnostic accuracy of the logistic regression model was 95.1%,and that of the SVM model was 96.0%.Conclusion: Logistic regression model and SVM model are both of great value in classification diagnosis of myocardial infarction.

10.13705/j.issn.1671-6825.2017.02.011

R540.4

猜你喜欢
导联时限特征参数
基于视频图像序列的船用雷达目标检测和目标特征参数提取
回旋支闭塞引起孤立Ⅰ、aVL导联ST段抬高型心肌梗死2例并文献复习
基于ETAP软件的反时限定值分析
冕洞特征参数与地磁暴强度及发生时间统计
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
平行时空
基于交通特征参数预测的高速公路新型车检器布设方案研究
18导联动态心电图的应用价值研究
多类运动想象脑—机接口导联选择方法
急性心肌梗死冠脉造影与心电图相关性研究