便携心电传感器的心房肥大诊断研究

2014-09-20 08:22陶泳任陈冠雄沈海斌
传感器与微系统 2014年9期
关键词:超平面错误率非对称

陶泳任, 陈冠雄, 沈海斌

(1.浙江大学 超大规模集成电路设计研究所,浙江 杭州 310027;2.杭州易和网络有限公司,浙江 杭州 310012)

0 引 言

随着科学技术的发展,人们的生活水平得到显著提高,人们更加关心健康问题,尤其是高血压、心脏病等问题,这些疾病非常普遍,也常出现致命的危险情况[1]。便携式心电传感器技术[2]在保健、治病领域是极具实用价值的,让人们及时获知自己身体状况,并及时获得治疗。现代智能传感器系统与以往传统传感器显著不同之处在于:现代传感器包含了比较完整的计算系统,能够在微小的设备上实现信号采集、信号处理等功能。心房肥大[3]是一种重要的心脏疾病。心房肥大分为左心房肥大、右心房肥大、双房肥大。Cortes C等人根据统计学理论提出的支持向量机(su-pport vector machine,SVM)学习方法[5],近年来受到了国内外学术界的广泛重视,SVM本质是根据训练样本集构造出最优分类超平面,使得样本集可以被该超平面尽可能正确地分开,并使离超平面最近的Vector与超平面之间的距离最大。选择适用于心房肥大识别的核函数、扩展其算法,让SVM在心房肥大识别特定领域发挥得更出色。本文所研究的算法适用于便携式心电传感器的应用。

1 小样本情况下的分类器

分类器的分类准确率常与训练样本数据量密切相关,由于心房肥大数据匮乏,故对小样本情况进行研究。文中使用MGH/MF数据库中32例左心房肥大心电数据和100例正常心电数据作为训练和识别的数据[5]。在Matlab中对比了逻辑分枝判断、模糊推理、神经网络、统计模型4种不同分类方法在小样本训练情况下的分类正确率。实验结果如表1所示。

表1 4种方法性能对比

逻辑分枝判断法是最早用于心电信号分类的方法,这种方法模仿心电图(ECG)专家对心电信号的诊断,对噪声比较敏感。

模糊推理[6]中需要求解隶属函数,而隶属函数求解没有客观的评定标准,使得模糊推理在心电信号的识别中受到限制。

选取三层的神经网络[7],使用BP神经网络算法,并将神经网络用于识别。

神经网络和SVM都在心电识别中有广泛的应用,神经网络具有较强的容错性和鲁棒性,但神经网络隐含层层数和网络节点数的选取没有一定的理论依据,这也影响了神经网络的发展。SVM是基于统计学习理论和结构风险最小化原则的分类器,是针对小样本学习问题的一个理论框架。SVM对模式分类的准确率一般要高于神经网络。因此,采用SVM来实现心电诊断,以充分发挥SVM在模式识别上的优势。

2 基于SVM的分类器融合

2.1 选择核函数

数据集是在Matlab的Libsvm[8]下进行训练的,仍然使用32例左心房肥大数据和100例正常心电数据,使用了不同的参数经过优化的核函数来找到最适用于心房肥大识别的映射函数,实验结果表明:高斯核函数的SVM产生了最少的错误率,实验结果如表2所示。后文中分类器融合是基于高斯SVM基础上进行研究。

表2 4种算法准确率比较

2.2 构建融合分类器

为了在总体上达到比单独使用某一种分类器更好的性能,将不同的分类器结合起来,发掘各自的优点。由于不同的分类器适应于不同的模式[9],本文还将构建的分类器与其他融合的分类器进行了比较,证明所设计的分类器是适用于心房肥大识别的。

设计融合分类器的目标是让输出结果有更高的可信度,放弃那些离SVM超平面距离比较近的Vector的分类,这些心电的诊断不适合让自动分类器得出结论,还需要心电图专家的更复杂的诊断,降低分类器错误率,以此来提高分类器的可信度。

定义分类器拒绝分类的区域为拒绝域,示意图如图1所示,在超平面一边为-1,在超平面另一边为1,在靠近超平面的区域设定一个拒绝域,在拒绝域范围内的Vector不作分类。

图1 拒绝域示意图

接着要研究权衡拒绝域设置的问题。直观上可以知道拒绝域越大,分类的准确率越高,当拒绝域包含了所有Vector空间,则分类器对所有Vector都进行拒绝,此时可认为分类准确率达到100 %;拒绝域越小,分类器的分类准确率会下降,当拒绝域趋向于0时,在超平面附近的Vector会出现错误分类错误的情况。从2个方面进行实验:拒绝域对称性、拒绝域阈值计算。

3 实验与分析

3.1 对称拒绝域

选择与超平面的距离为{0,0.1,0.2,0.4,0.7}的对称超平面,形成拒绝域。实验结果如图2所示,描述了拒绝域阈值与分类准确率的关系。

图2 拒绝率与错误率关系图

3.2 非对称拒绝域

选择与超平面的距离为{0,0.1,0.2,0.4,0.7}的正反方向两个超平面,不同阈值两两组合形成非对称拒绝域。实验结果如图3所示,描述了拒绝域阈值与分类准确率的关系。

图3 拒绝率与错误率关系图

3.3 对称与非对称拒绝域比较

对称拒绝域、非对称拒绝域,阈值、错误率之间的关系如图4所示。在保证高准确率、高可信度的情况下,选择较小的拒绝域,因此,非对称拒绝域是较好的选择。

图4 对称与非对称阈值比较

3.4 与其他分类器的比较

第二节中通过SVM与其他分类模式的比较,展现了SVM在小样本识别上的优势。这里在基于GSVM的基础上,证明SVM-R比SVM与其他分类器融合在心房肥大识别上更具优势。选取SVM和逻辑回归(logistic regression,LR)融合的分类器SVM-LR[10],SVM和K最近邻(K-nearest neighbor,K-NN)算法融合的分类器SVM-KNN分类器[11]作为比较对象。选取不同拒绝率,比较分类错误率。实验结果如表3所示。

选择非对称拒绝域,选择合适的拒绝阈值能达到较好的分类正确率与可信性,该分类器适合于心房肥大的诊断。

4 结 论

本文比较了基于统计模型的分类方法与其他的分类方法,小样本情况下,统计模型在小样本训练情况下优化得更好,而且,本文将SVM与拒绝域分类器进行融合,使得心房肥大的诊断结果更加具有可信度,减少因诊断错误产生的医疗事故的可能性。将SVM-R分类器应用到便携式心电传感器系统中,实现便携式心房肥大识别是非常适用的。

表3 4种分类器比较

参考文献:

[1] 孙 燕,毛羽青,尹东屏,等.盐城地区心脑血管疾病发病率特征及其预报方法初探[C]∥第 28 届中国气象学会年会论文集,2011.

[2] Chi Y M,Jung T P,Cauwenberghs G.Dry-contact and noncontact biopotential electrodes:Methodological review[J].IEEE Reviews in Biomedical Engineering,2010,3:106-119.

[3] 张夏琳,卢喜烈.心房心室肥大的心电图诊断[J].江苏实用心电学杂志,2013,22(3):643-652.

[4] Cortes C,Vapnik V.Support-Vector networks[J].Machine Learning,1995,20(3):273-297.

[5] Goldberger A L,Amaral L A N,Glass L,et al.PhysioBank,Phy-sioToolkit,and PhysioNet:Components of a new research resource for complex physiologic signals[DB/OL]:MGH/MF.[2000—06—13].http:∥circ.ahajournals.org/cgi/content/full/101/23/e215].

[6] Pavlopoulos S,Kyriacou E,Koutsouris D,et al.Fuzzy neural network-based texture analysis of ultrasonic images[J].Engineering in Medicine and Biology Magazine,IEEE,2000,19(1):39-47.

[7] Purushothaman G,Karayiannis N B.Quantum neural networks (QNNs):Inherently fuzzy feedforward neural networks[J]. IEEE Transactions on Neural Networks,1997,8(3):679-693.

[8] Sun F,Belatreche A,Coleman S A,et al.Evaluation of LibSVM and mutual information matching classifiers for multi-domain sentiment analysis[C]∥The 23rd Irish Conference on Artificial Intelligence and Cognitive Science,Dublin City University:Compu-ter Science Research Institute,2012:106-118.

[9] 刘遵仁,吴耿锋.一种新的基于约简的多分类器融合算法[J].计算机工程与应用,2012,48(34):11-16.

[10] Chang Y I.Boosting SVM classifiers with logistic regression[J/OL].[2003—03-01].http:∥www.stat.sinica.edu.tw/library/c_tec_rep/pdf,2003.

[11] Uyar A,Gurgen F.Arrhythmia classification using serial fusion of support vector machines and logistic regression[C]∥4th IEEE Workshop on Intelligent Data Acquisition and Advanced Computing Systems:Technology and Applications,IDAACS 2007,IEEE,2007:560-565.

猜你喜欢
超平面错误率非对称
全纯曲线的例外超平面
涉及分担超平面的正规定则
非对称干涉仪技术及工程实现
以较低截断重数分担超平面的亚纯映射的唯一性问题
小学生分数计算高错误率成因及对策
一种基于支持向量机中分离超平面求取的算法*
正视错误,寻求策略
解析小学高段学生英语单词抄写作业错误原因
非对称负载下矩阵变换器改进型PI重复控制
降低学生计算错误率的有效策略