基于CNN的心音特征融合分类方法*

2019-11-27 01:16:52韩威李昌刘厶元刘伟鑫邱泽帆
自动化与信息工程 2019年5期
关键词:心音收缩期训练样本

韩威 李昌 刘厶元 刘伟鑫 邱泽帆

基于CNN的心音特征融合分类方法*

韩威1,2李昌2刘厶元1刘伟鑫1,2邱泽帆2

(1.广东工业大学 2.广东省智能制造研究所 广东省现代控制技术重点实验室)

针对TFF1dCNN方法利用一维CNN分别对各心音片段的4个频带信号提取特征,可能无法充分提取各频带信号间相关信息的问题,提出TFF2dCNN方法。先将4个频带信号融合成二维信号;再由二维CNN进行特征提取和分类。实验结果表明,该方法提升了分类正确率。此外,还分析了心音样本的分类正确率与其包含的心动周期数的关系。

心音分类;心音特征融合;CNN

0 引言

据世界卫生组织统计,心血管疾病是全球第一大死因[1]。心音是诊断心血管疾病的主要医学信号,心音分类可为心血管疾病进一步检查提供初步线索。当前常用的心音听诊受医生经验、心理/生理等因素影响,无法保证诊断结果的准确性和可靠性。因此,心音自动分类近年来成为国内外研究热点[2-3]。与传统心音分类方法[4-5]依靠人工经验选择心音信号特征进行分类相比,深度学习方法从原始数据或高维特征数据中自动提取低维特征,可获得更好的心音分类效果,已成为主流心音分类方法[6-7]。

在2016年心音分类挑战赛中[8],Potes等提出的TFF1dCNN方法[9]获得第一名。本文对TFF1dCNN方法中的一维CNN(Convolutional Neural Network)分类流程进行改进,提出TFF2dCNN方法。

1 TFF1dCNN方法

TFF1dCNN方法提取124个时频特征输入Adaboost分类器;然后提取各心音片段的4个频带信号(25 Hz ~45 Hz,45 Hz~80 Hz,80 Hz~200 Hz及200 Hz ~400 Hz)输入一维CNN分类器;最后将2个分类器的结果融合决策得到心音分类结果。Adaboost和一维CNN融合分类示意图如图1所示。

图1 TFF1dCNN方法中Adaboost和一维CNN融合分类示意图

一维CNN分类器分类流程:每个频带信号先分别经一维CNN提取特征;再由全连接层进行特征融合运算;最终输出分类结果。此分类流程利用一维CNN分别对每个频带信号提取特征,可能无法充分提取各频带信号之间的相关信息,造成需由多个频带信号才能准确表达的心血管疾病易被误判,从而影响心音分类效果。为此,本文提出TFF2dCNN方法。

2 TFF2dCNN方法

2.1 心音特征提取

本文提出的TFF2dCNN方法采用与TFF1dCNN方法相同的预处理和特征提取流程,如图2所示。

图2 心音特征提取流程图

图2中心音信号预处理流程:以1000 Hz采样率对心音信号进行重采样;并对采样信号进行25 Hz ~400 Hz带通滤波;采用Springer等[10]提出的方法将心音信号分割为若干心动周期。一次完整的心动周期由第一心音(S1)、收缩期(systole)、第二心音(S2)和舒张期(diastole)4个状态组成。

图2中124个时频特征包括36个时域特征、36个频域特征和52个MFCC(Mel-Frequency Cepstrum Coefficient)特征。时频特征提取流程:各心动周期、第一心音、收缩期、第二心音、舒张期等的时长均值和标准差,各收缩期与心动周期的时长之比、各舒张期与心动周期的时长之比、各收缩期与舒张期的时长之比等的均值和标准差,共计16个与心音时长相关的时域特征;各收缩期与第一心音的平均绝对振幅之比、各舒张期与第二心音的平均绝对振幅之比等的均值和标准差,各第一心音、收缩期、第二心音、舒张期幅值偏度的均值和标准差,各第一心音、收缩期、第二心音、舒张期幅值峰度的均值和标准差,共计20个与心音信号幅值相关的时域特征;先将各第一心音、收缩期、第二心音和舒张期的信号分解为9个频段(25 Hz ~45 Hz,45 Hz ~65 Hz,65 Hz ~85 Hz,85 Hz ~105 Hz,105 Hz ~125 Hz,125 Hz ~150 Hz,150 Hz ~200 Hz,200 Hz及~300 Hz及300 Hz ~400 Hz),再计算每个频段信号中值功率的均值,共计可得36个频域特征;计算各第一心音、收缩期、第二心音、舒张期信号的MFCC,选择前13个MFCC,则共计可得52个MFCC特征。

图2中各心音片段的4个频带信号提取流程为:先从每个第一心音开始选取时长为2.5 s的信号作为一个心音片段;再将心音片段分解至4个频带信号。根据预先统计,最长的心动周期不超过2.5 s,因此一个心音片段能覆盖一次完整的心动周期信号。由于每个第一心音都会产生一个心音片段,因此一段心音信号的心音片段数与其心动周期数相等。

2.2 心音分类模型

在心音分类中,本文仍然采用TFF1dCNN方法中的Adaboost分类模型(如图1所示),仅采用二维CNN分类器对其一维CNN分类模型进行改进。本文提出的TFF2dCNN方法的分类模型如图3所示。其中二维CNN分类器的分类流程为:先将4个频带信号融合成二维信号;再由二维CNN运算进行特征提取;然后经全连接层运算;最终输出心音分类结果。

图3 TFF2dCNN方法的分类模型示意图

3 心音分类实验

3.1 实验数据和评价指标

本文实验数据集来源于CinC2016[11],此数据集有3240个心音样本,分为正常(2575个)和异常(665个)2大类。

采用敏感性(Se)、特异性(Sp)和平均正确率(MAcc)来衡量心音分类效果。Se和Sp分别表示异常样本和正常样本被正确预测的概率;MAcc为Se和Sp的算术平均值,是最终的评价指标。

3.2 分类结果

每次实验随机选择若干心音样本进行训练,其余样本用于测试。本文以完整的心音样本为单位划分训练集和测试集,这样可确保来自同一心音样本的所有心音片段只能被分为训练集或测试集。

3.2.1 分类性能

为更好地评估分类效果,本文采用不同训练样本占比(训练样本数占总样本数的比例)进行实验。具体包括:从训练样本占比为2%(2%异常样本和2%正常样本)开始,每次增加2%的训练样本,直到训练样本占比达到10%;然后每次增加20%的训练样本,直到训练样本占比达到90%。为获得稳定的分类结果,每个训练样本占比实验重复10次,最终的分类结果是这10次重复实验的平均值和标准差。表1给出了TFF2dCNN和TFF1dCNN两种方法的分类结果。

表1 两种方法的分类结果

由表1可以看出,本文采用基于二维CNN的分类模型代替TFF1dCNN方法中基于一维CNN的分类模型后,分类结果MAcc增大。此外,随着训练样本量增加,分类性能也随之提升。

3.2.2 心动周期数与分类性能的关系

一个心音样本被分割为若干心音片段,每个片段开始于每个心动周期的第一心音,这意味着每个心音样本的片段数等于其心动周期数。数据集中所有心音样本包含的心动周期数在2~109。训练样本占比为90%的情况下,统计心动周期数与分类正确率的关系,如图4所示。

图4 心动周期数与分类正确率的关系

由图4可以看出,样本的心动周期数越多,越有可能被正确分类。这是由于更多的心动周期能提供更多的分类信息。

4 结语

本文提出的TFF2dCNN方法先将4个频带信号融合;再通过二维CNN运算提取心音特征,有利于提取各频带信号之间的相关信息,提高了分类正确率。此外,心音样本中心动周期数越多,其被正确分类的可能性就越大。

[1] www.who.int/mediacentre/factsheets/fs317/en/

[2] Clifford G D, Liu C, Moody B E, et al. Recent advances in heart sound analysis [J]. Physiological Measurement, 2017, 38(8): E10-E25.

[3] 雷志彬,陈骏霖.基于全连接LSTM的心肺音分离方法[J].自动化与信息工程,2018,39(6):25-30.

[4] Redlarski G, Gradolewski D, Palkowski A. A system for heart sounds classification [J]. PloS one, 2014, 9(11):e112673.

[5] Whitaker B M, Suresha P B, Liu C. Combining sparse coding and time-domain features for heart sound classification [J]. Physiological Measurement, 2017, 38(8):1701-1729.

[6] Dominguez-Morales J P, Jimenez-Fernandez A F, Dominguez-Morales M J, et al. Deep neural networks for the recognition and classification of heart murmurs using neuromorphic auditory sensors [J]. IEEE Transactions on Biomedical Circuits & Systems,2018,12(1):24-34.

[7] Maknickas V, Maknickas A. Recognition of normal–abnormal phonocardiographic signals using deep convolutional neural networks and mel-frequency spectral coefficients [J]. Physiological Measurement, 2017, 38(8): 1671–1684

[8] http://physionet.incor.usp.br/challenge/2016/

[9] Potes C, Parvaneh S, Rahman A, et al. Ensemble of feature-based and deep learning-based classifiers for detection of abnormal heart sounds[C]. 2016 Computing in Cardiology Conference (CinC). IEEE, 2016: 621-624.

[10] Springer D, Tarassenko L, Clifford G. Logistic regression- HSMM-based heart sound segmentation [J]. IEEE Transactions on Biomedical Engineering, 2016,63(4):822- 832.

[11] Liu Chengyu, Springer David, Li Qiao, et al. An open access database for the evaluation of heart sound algorithms [J]. Physiological Measurement, 2016, 37(12):2181-2213.

Classification Method of Heart Sound Feature Fusion Based on CNN

Han Wei1,2Li Chang2Liu Siyuan1Liu Weixin1,2Qiu Zefan2

(1.Guangdong University of Technology 2. Guangdong Institute of Intelligent Manufacturing, Guangdong Key Laboratory of Modern Control Technology)

The TFF1dCNN method uses one-dimensional CNN to extract the features of four frequency bands signal of each heart sound segment, and there is a problem that the relevant information between each frequency band may not be fully extracted. This paper proposes the TFF2dCNN method. The four frequency bands signal are firstly combined into a two-dimensional signal, and then the features extraction and classification are carried out by two-dimensional CNN. Experimental results show that the proposed method improves the classification accuracy. In addition, this paper also analyzes the relationship between the classification accuracy of heart sound and the number of cardiac cycles it contains.

Heart Sound Classification; Heart Sound Features Fusion; Convolutional Neural Network

国家自然科学基金项目(61803107);广州市科技计划项目(201803020025,201906010036);广东省科学院人才项目(2019GDASYL-0105069)。

韩威,男,1987年生,博士研究生,助理研究员,主要研究方向:心音信号处理、声学传感与检测。

刘厶元(通信作者),男,1994年生,硕士研究生,主要研究方向:生物医学信号处理。E-mail: lsy_gudt@sina.com

猜你喜欢
心音收缩期训练样本
老年单纯收缩期高血压降压标准与治疗原则
人工智能
基于双阈值的心音快速分段算法及其应用研究
双声道心音能量熵比的提取与识别研究
基于香农熵的心音信号检测方法研究
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
电视技术(2016年9期)2016-10-17 09:13:41
基于稀疏重构的机载雷达训练样本挑选方法
二维心音图特征提取与识别方法的研究
图学学报(2014年2期)2014-03-06 05:42:39
调压方治疗老年单纯收缩期高血压阳亢络阻证90例
中医研究(2013年9期)2013-03-11 20:27:34