程遥++万遂人
【摘 要】 本文对72例高血压临床数据展开研究,通过BP神经网络结合临床数据中包含的中医西医的检查结果,对高血压病诊断结果的等级分层和用药情况进行预测分析,通过对10例预测样本分析,达到了88%的准确度,并对不同的BP神经网络函数进行比较,找到效果更优的函数设置。
【关键词】 BP人工神经网络 高血压 诊断 预测
【Abstract】 Hypertension is a very common disease, but reasons that cause the disease is complicated, this paper focus on classification and prediction of the hypertension. We also do the compare between different function sets to find a much better way.
【Key words】 BP Artificial neural network Hypertension Diagnose Predict
1 BP人工神经网络原理
BP人工神经网络也叫反向传播算法(Back-Propagation)是一种监督式的学习方法,其主要思想为输入向量,已知与其对应的输出样本为,学习的目的是用网络的实际输出和实际值之间的误差来修改权值,使得它们之间的误差平方和达到最小,尽可能的接近[1]。
2 实验建模方法
2.1 数据预处理
数据处理是建模过程的重要的步骤,数据处理的主要目标是针对数据源中数据的不规范性、二义性、重复性和不完整性等问题进行修正[2]。本文所采用的高血压临床数据样本主要存在数据缺失和错误的问题,对出现缺失和错误的样本采取删除处理,92例数据中共处理20例数据。
2.2 数据选择和转换
原始数据库包含200多个数据项,但我们并不需要使用所有的数据项,并不是所有的数据都直接影响我们的输出结果,我们需要能够直接影响输出结果的数据项。最终确定了年龄、性别、饮酒、食盐量、既往病史、头晕、胸痛、血糖、血压、尿酸、高血压分级、危险分层、用药种类等37个项目作为建模分析所需的数据项。其中32个为BP人工神经网络的输入数据项,5个为输出数据项,输入数据项包含基本信息、中医望闻问切检查项、西医实验室指标和生活习惯等数据项,输出项为高血压分级和高血压危险等级分层以及药品种类。
数据转换工作是对原始数据进行二次处理的过程,把原始分布的数据进行分层、编号、转换处理。数据转换的工作有两个目的,首先转换数据使得数据特性更加适合建模,其次在一定程度上可以优化模型,使结果更加准确和稳定。例如:对年龄进行分层并进行编号,对身高体重参数采用BMI体重指数代替并进行分层编号处理等。本文对37个数据项中的13个进行了转换处理,包括年龄、身高体重、实验室检查指标以及用药种类。
2.3 模型建立
本文的数据样本经过处理之后一共有72组数据,其中62组作为训练数据,10组作为预测数据。每一组数据都有32个BP人工神经网络输入数据项,5个输出数据项。相对应的BP神经网络的输入层有32个节点,输出层有5个节点。实验中采用MATLAB平台建立模型,MATLAB提供了神经网络的基本函数,可直接利用函数进行建模。实验通过newff函数可以对网络进行创建,在newff中需要对四类参数进行设定,分别是:输入数据的最大最小值,层节点数,转移函数和BP人工神经网络训练函数。网络创建之后,要通过TRAIN函数对网络进行训练,本文采用62训练样本,训练次数设定为20000,训练步长为0.05,全局最小误差为0.0001。
3 实验结果
我们通过对10组数据进行预测,每一组数据有5个输出项,分别为高血压诊断分类(3项),用药种类(2项)。在给出结果之前,本文创新的针对newff函数的参数进行了比对分析,发现训练函数为trainscg,转移函数为(tansig,tansig,purelin)的设置效果更优。图1和图2为输出误差分析图,分别对应5个输出项,图中0刻度代表0误差,越接近0刻度说明预测结果越准确。
从图1和图2中我们可以发现,相比于其他函数组合的网络模型误差分析,此模型的误差输出总体上更优,统计得出预测结果达到88%的准确度,全局最小误差为0.0001的情况下,网络用时19秒。
4 结语
本文的研究对人工神经网络在高血压诊疗方面的成功应用提供了有力的支持。对于医学数据来说,通过数据形式的转换,把原始的指标值通过归一化、分类编号等处理所建立的网络模型性能更好。对于BP人工神经网络中不同的训练函数设定会对网络模型的性能产生影响,通过实验发现共轭梯度trainscg训练函数在网络预测表现更好。对于BP人工神经网络中不同的转移函数设定会对网络模型的性能产生影响,通过实验发现(tansig,tansig,purelin)的函数组合在网络模型预测中表现更好。
参考文献:
[1]医学数据挖掘[M].高等教育出版社,2006.
[2]苏新宁.数据仓库和数据挖掘[M].清华大学出版社,2006.endprint