基于遗传算法与支持向量机的EMD改进算法

2015-02-17 10:27:14曾建梅李冠迪
重庆理工大学学报(自然科学) 2015年11期
关键词:端点脉搏遗传算法

张 兢,杨 超,曾建梅,李冠迪

(重庆理工大学电子信息与自动化学院,重庆 400054)

基于遗传算法与支持向量机的EMD改进算法

张 兢,杨 超,曾建梅,李冠迪

(重庆理工大学电子信息与自动化学院,重庆 400054)

针对传统经验模态分解的端点效应问题,提出了一种适用于脉搏信号分解的基于遗传算法和支持向量机的经验模态分解改进算法。该方法运用支持向量机对时间序列的两端进行延拓,并引入遗传算法使得延拓更加合理,分解结果的频率更加单一。仿真和对脉搏信号分析的实验结果表明:该方法能够有效抑制端点效应。

遗传算法;支持向量机;经验模态分解;端点效应;脉搏信号

脉搏信号作为生理信号的一种,蕴含着大量的生理信息,但脉搏由于生理、心理差异,以及环境和时间的不同,会导致其信号变化,而传统的分析方法都存在各自的局限。经验模态分解(empirical mode decomposition,EMD)是由Huang等[1]提出的一种分析非线性、非平稳信号的新方法,该方法被越来越多的学者应用于脉搏信号的分析。然而,EMD分解得到的信号在2个端点位置难免出现发散现象,即EMD的端点效应。端点效应是影响该方法准确度的主要因素之一[2]。针对EMD的端点效应问题,国内外学者进行了大量研究,并提出了一系列抑制端点效应的方法,如假定极值点法、加权极值点延拓、波形特征匹配延拓、基于神经网络的延拓和基于多项式拟合延拓等[3-4]。这些方法对端点效应的抑制都有一定的效果,但也存在各自的问题,效果不是十分理想[5-6]。

为了更好地分析脉搏信号在各个频率分量下的特征,本文提出了一种基于支持向量机(support vector machine,SVM)对时间序列进行预测以实现时间序列从两端向外延拓,同时通过遗传算法(genetic algorithm,GA)对SVM参数进行优化来达到提高预测精度以及优化EMD分解过程的的改进算法。仿真和脉搏信号分析实验结果表明:该方法能在很大程度上改善EMD的端点效应,并能够有效提取信号在不同频率段的特征值。

1 基于GA_SVM的端点效应处理

1.1 SVM基本原理

支持向量机是近年来提出的一种基于统计学习理论发展起来的可训练的机器学习方法,其主要思想是将低维空间的非线性问题通过映射到高维空间,使得非线性问题变为线性问题[7-8]。支持向量机在实际寻优问题中可用如下回归模型求解[9-10]:

其中:x为训练样本;αi为Lagrange乘子;b为常量阈值;k(x,xi)为支持向量机的核函数。

选择不同的核函数可以得到不同的SVM。本文采用实际中广泛应用并且有效的一种核函数——径向基(RBF):

所谓预测,其实是一种通过机器对已知数据的学习来建立未来数据的模型,从而实现预测的方法。预测结果的理想与否与选择的参数有关,这2个参数就是SVM的正规化参数γ和核函数参数σ[11-12]。

1.2 GA_SVM

SVM的提出者Vapnik等在研究中发现:不同的核函数对SVM的性能影响不大,而正规化参数γ和核参数σ对模型的性能影响十分关键[7]。为了自适应地选取合适的正规化参数和核参数,本文选用目前较成熟且寻优效果较好的遗传算法(genetic algorithm,GA)[13-15]。

为了尽量消除目标函数的端点效应,提取信号在各个频率分量下准确的特征值,依据IMF频率单一性(即每个IMF分量的瞬时频率尽可能为一个常量),将适应度函数定义如下:

1.3 算法思路及步骤

首先对信号进行EMD分解,计算出所有分量的瞬时频率,求出所有分量瞬时频率的方差总和S0,并初始化支持向量机的正规化参数和核参数;然后对时间序列两端进行延拓,再对其进行EMD分解,求出所有分量瞬时频率的方差总和Si;最后运用遗传算法改变正规化参数和核参数,经过淘汰选取得到使S最小的最优化的正规化参数和核参数。

GA_SVM的思路是:通过遗传算法优化得到一组参数(γ,σ),使得适应度函数最小。具体步骤如下:

1)初始化参数(γ,σ),并将(γ0,σ0)作为遗传算法种群的初始状态;

2)根据参数(γ0,σ0),运用SVM分别对信号两端进行预测,延长时间序列的长度,并进行EMD分解;

3)计算出所有IMF分量的瞬时频率及瞬时频率的方差,并求出所有方差的总和Si;

4)判断是否达到最优,是则输出最优化结果;否则,重复步骤2)、3)。

2 仿真实验结果及分析

根据脉搏信号的频率主要分布在0.1~40 Hz,且主要分布在10 Hz以下,构造仿真序列。其主要由频率为1 Hz和2 Hz脉搏跳动成分和一个0.02 Hz低频漂移构成,波形及理论分量如图1所示。

图1 X(t)为原始信号,其中X1(t)、X2(t)、X3(t)分别是X(t)的3个分量

运用原始EMD对仿真序列进行分解,将分解结果与理论值相减得到如图2所示的误差比较。从图1可以看出:计算得到的3个分量的整体误差在1左右,第1个和第2个分量在中间部分的误差趋于0,但在端点处的误差大于0.5。这是由于:EMD算法在端点处的极值包络线拟合存在误差,开始时不太明显,随着分解的进行,误差会越来越大(例如,第3个分量的误差),这就是EMD分解固有的缺点(即端点效应)。

利用本文提出的改进方法对仿真序列两端不断进行延拓,然后进行EMD分解,选取出最优结果。同样将其分解结果与理论值进行比较,得到GA_SVM EMD的误差如图3所示。

通过对比图2、3发现:3个分量的误差范围都有不同程度的减少,其中第1个分量的变化最为明显,通过延拓的方式,使得整体误差减小了很多。

图2 原始EMD的误差

图3 GA_SVM EMD的误差

本文算法主要是改进EMD算法分解结果的单一分量这一特性(此特性由1.2节的适应度函数决定),为了更好地表明本文算法的性能改进,通过分别计算各分量瞬时频率的方差,将本文提出的方法与传统EMD方法进行对比,如表1所示。相比原始算法,本文提出的算法瞬时频率的方差减小了10倍。由此可见,本文算法性能在原始算法的基础上有了很大程度的改进。

表1 传统EMD与GA_SVM EMD比较

3 脉搏信号分析

利用本文提出的基于遗传算法与支持向量机的EMD改进算法对健康人体的脉搏信号进行分解。脉搏采集系统利用动脉血液中血氧饱和度透光性的不同会带来透光性的差异的原理,使用2个波长为940 nm的红外led,以一个发射、一个接收的方式来测量人体脉搏。在发射信号不变的情况下,透光性差异会导致接收到的光信号的强弱不同,从而产生的电流不同。通过放大电路将这个电流信号转变为电压信号并放大,这就是原始的脉搏信号;然后通过STM32f103T8单片机对原始信号进行AD采样,根据脉搏信号的频率特点,采样频率为200 Hz;最后将采样得到的脉搏信号通过USB传输给PC[16-17]。采集对象为健康大学生,通过其他脉搏血氧仪测得脉搏为82次/min。被测者静坐于测试台前,将手指轻放在检测板上指定位置,待信号稳定后,开始采集信号。将采集到的脉搏信号作为实验样本,其波形如图4所示。

图4 脉搏信号波形

首先,利用原始EMD对采集到的脉搏信号进行分解;然后,利用本文提出的GA_SVM EMD对其进行分解;最后,将2种算法的分解结果放在一起进行对比。由于采样频率较高,分解得到的前2个分量均为高频噪声,所以选用第3到第8分量进行对比,对比结果如图5所示。从图中可以看出:虽然第3个分量频率仍然较高,含有一些高频噪声,但有些不是有用信号。图中虚线部分为原始算法的分解结果,从第4个分量开始可逐渐明显地看出原始算法分解得到的结果越来越不具有周期性,频率的单一性越来越差。这是由于端点效应逐步向内扩散,分解次数越多即频率越低,误差越大。相比虚线部分,实线为本文提出的算法,虽然也表现出了一定的端点效应,但仍然相比原始算法有了较大改进,即使是频率很低的第7个分量(即误差最大的分量),也表现出了很好的周期性。

图5 脉搏信号分解结果)

4 结束语

本文提出了一种抑制经验模式分解过程中端点效应的改进方法,其目的在于克服EMD方法中出现的端点效应,尽可能地使分解结果的频率更加单一。首先,采用EMD算法对信号进行分解,计算出频率分量的总和,然后不断优化预测延拓和分解计算,使EMD分解能够有效地进行,得到所有分解分量频率更加单一的结果。实验结果表明:本文提出的基于遗传算法与支持向量的EMD改进算法能够更好地处理EMD端点处的变化趋势,使得处理后进行EMD分解得到各个IMF与原信号的构成信号之间的误差更小,各个分量特征更加明显。改进算法能够很好地克服EMD分解过程中的端点效应问题,准确地实现了EMD分解。将该算法运用于脉搏信号分解,可以有效提取出信号在不同频率段的特征信息,为后续研究奠定了基础。通过增加延拓的长度可以逐渐改善端点效应,但是当增加到一定长度后,改善效果不再明显,同时,算法的运行时间会大为增加。

[1]Huang N,Shen Z,Long S,et al.The empirical mode decomposition and Hilbert spectrum for nonlinear and non -stationary time series analysis[J].Proc of the Royal Society of London,1998,454(1971):903-995.

[2]张子良,李世平.应用加权法处理EMD方法中的边界问题[J].计量与测试技术,2008,35(8):34-36.

[3]王艳超,杨立才,刘澄玉.基于模板匹配和镜像延拓的两阶段经验模态分解算法[J].山东大学学报,2012,42(6):69-73.

[4]王艳超.TM_EMD的脉搏信号多模态特征情感识别方法[D].济南:山东大学,2013.

[5]朱正.Hilbert-Huang变换及其在目标方位估计和水声通信中的应用研究[D].哈尔滨:哈尔滨工程大学,2013.

[6]Wu ZhaoHua,Huang N E.Ensenmble empirical mod decomposition:a noise assisted data analysis method.Advance in Adaptive Data Analysis[J].2009(1):1-41.

[7]李艳,奚溪,徐菲菲,等.燃料成分分析及基于LSSVM对锅炉效率的预测[J].热科学与技术,2014,13 (1):56-60.

[8]VladimirN Vapnik.统计学习理论的本质[M].张学工,译.北京:清华大学出版社,2000.

[9]李阳.多核学习SVM算法研究及肺结节识别[D].长春:吉林大学,2014.

[10]范昕炜.支持向量机算法的研究及其应用[D].杭州:浙江大学,2003.

[11]李丽娟.最小二乘支持向量机建模及预测控制算法研究[D].杭州:浙江大学,2008.

[12]林琳,金焕梅,陈虹,等.基于多核SVM-GMM的段语音说话人识别[J].吉林大学学报:工学版,2013,43 (2):504-509.

[13]葛继科,邱玉辉,吴春明,等.遗传算法研究综述[J].计算机应用研究,2008,25(10):2911-2915.

[14]吴景龙,杨淑霞,刘承水.基于遗传算法优化支持向量机短期负荷预测方法[J].中南大学学报:自然科学版,2009,40(1):180-184.

[15]朱伟,石超峰,李楠.基于遗传算法优化参数的支持向量机的再生混凝土的抗压强度预测模型[J].中外公路,2014,34(1):311-313.

[16]李国军.多波长法无创测量血红蛋白浓度的研究[D].绵阳:西南科技大学,2013.

[17]Yan M,Go S,Tamura H,et al.Communication system using EOG for persons with disabilities and its judgment by EEG[J].Artificial Life and Robotics,2014,19(1):89 -94.

(责任编辑杨黎丽)

Improved EMD Method Based on Genetic Algorithm and Support Vector Machine

ZHANG Jing,YANG Chao,ZENG Jian-mei,LI Guan-di
(College of Electronic Engineering and Automation,Chongqing University of Technology,Chongqing 400054,China)

Aiming at the end effects problem of EMD(empirical mode decomposition),this paper put forward an end effects suppression method based on genetic algorithm and support vector machine. The method used support vector machines for extending both ends of the time series and introduced genetic algorithm which made the extension more reasonable and the decomposition results more satisfactory.By studying the sequence of simulation and pulse signal,the result shows that this method can reduce the end effect effectively.

genetic algorithm;support vector machine;empirical mode decomposition;end effects; pulse signal

TN911.6

A

1674-8425(2015)11-0101-05

10.3969/j.issn.1674-8425(z).2015.11.017

2015-07-20

国家自然科学基金资助项目(11242006);重庆市科技创新能力建设计划项目(CSTC2013kjrc-tdjs40012)

张兢(1965—),女,重庆人,教授,主要从事物联网和信号处理方面研究。

张兢,杨超,曾建梅,等.基于遗传算法与支持向量机的EMD改进算法[J].重庆理工大学学报:自然科学版,2015(11):101-105.

format:ZHANG Jing,YANG Chao,ZENG Jian-mei,et al.Improved EMD Method Based on Genetic Algorithm and Support Vector Machine[J].Journal of Chongqing University of Technology:Natural Science,2015 (11):101-105.

猜你喜欢
端点脉搏遗传算法
非特征端点条件下PM函数的迭代根
不等式求解过程中端点的确定
用心感受狗狗的脉搏
金桥(2018年2期)2018-12-06 09:30:14
《今日评说》评今日浙江 说时代脉搏
基于51系列单片机的穿戴式脉搏仪的设计
电子制作(2017年14期)2017-12-18 07:07:50
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
参数型Marcinkiewicz积分算子及其交换子的加权端点估计
基于遗传算法和LS-SVM的财务危机预测
统计与决策(2017年2期)2017-03-20 15:25:24
近红外可穿戴设备中脉搏波的呼吸率检测