基于BP神经网络和概率神经网络的健康水平预测与监测

2020-11-09 07:26霍健瑜刘楚妍关正奇
价值工程 2020年30期
关键词:BP神经网络

霍健瑜 刘楚妍 关正奇

摘要:为实现“以健康为中心”的居民健康水平全过程测控策略,建立公共卫生与环境健康水平的动态监测机制。利用BP神经网络模型,拟合各影响因素与健康水平的关系,对健康水平进行预测并评估。通过数据检验,可见基于BP神经网络的居民健康水平预测模型误差很小,能实现较好的评估。利用训练出的BP神经网络构建异常识别模型,并基于概率神经网络改进原有模型,完成对影响健康水平因素异常值的识别,实现对全体居民生命周期健康水平的持续的、动态的监测。

Abstract: In order to realize the "health-centered" measurement and control strategy of residents' health level in the whole process, a dynamic monitoring mechanism of public health and environmental health level is established. The BP neural network model is used to fit the relationship between various influencing factors and the health level, and to predict and evaluate the health level. Through data inspection, it can be seen that the prediction model of residents' health level based on BP neural network has very small errors and can achieve better evaluation. The trained BP neural network is used to construct an anomaly recognition model, and improve the original model based on the probabilistic neural network to complete the identification of abnormal values of factors that affect the health level, and achieve continuous and dynamic monitoring of the life cycle health level of all residents.

關键词:健康状况预测;异常值识别;BP神经网络;概率神经网络

Key words: health status prediction;outlier recognition;BP neural network;probabilistic neural network

中图分类号:G448                                        文献标识码:A                                  文章编号:1006-4311(2020)30-0190-03

0  引言

由于工业化时代的到来和发展,人们不仅遭遇了严重的水污染、空气污染、垃圾围城等现代环境问题,同时身体层面也被不同疾病困扰。依靠“治病为中心”的末端应对方式已无法解决这些问题,因而需要采取“以健康为中心”的全过程监测策略。在以健康为中心的社会卫生健康共治系统里,建立公共卫生与环境健康水平的动态评估机制,能够对全体居民全生命周期健康水平进行持续的、动态的监测。

目前,国内学者对健康水平的研究主要集中在两方面:第一,多数研究仅针对健康水平的调查,对健康水平的预测和识别研究较少,且没有实现动态监测功能,不能及时发现健康水平异常情况,不利于引导居民提升自我健康管理意识与能力,实现更高水平的全民健康。第二,多数研究未能全面考虑健康水平影响因素,造成健康水平预测结果普适性较差。

本文,从生活、环境(诸如空气污染、垃圾围城等问题)、卫生、医疗、文体等多方面因素入手,通过BP神经网络,拟合多个影响因素和健康水平之间的关系,对健康水平进行预测和评估。利用训练出的BP神经网络构建异常识别模型,并基于概率神经网络改进原有模型,完成对影响健康水平因素异常值的识别,建立具有动态监测功能的健康水平评估模型。BP神经网络和概率神经网络均能够考虑到历史信息对未来的影响,同时神经网络本身也具有较强的非线性映射能力,能够很好地拟合出多个因素和健康水平之间的关系。

1  BP神经网络健康水平预测模型

1.1 健康水平影响因素的选取

综合考虑生活、环境(诸如空气污染、垃圾围城等问题)、卫生、医疗、文体等方面因素,影响因素选取如下:①参加健身活动人数。参加健身活动人数增多,居民的身体素质水平提高,居民健康水平提高。②工业废气排放量、空气中可吸入颗粒物日均值。工业废气排放量或空气中可吸入颗粒物日均值越大,居民生存环境空气质量越差,呼吸道感染等慢性病患病率提高,居民健康水平降低,反之,居民健康水平提高。③个人卫生支出占总支出的比重。在不考虑通货膨胀的情况下,个人卫生支出占总支出的比重约小,一定程度上可说明居民身体健康,即居民健康水平越高。④城市生活污水处理率。城市生活污水处理率提高,减少黑臭水体,形成优美宜居的生产生活环境,居民健康水平提高。

1.2 健康水平影响因素预处理

1.2.1 数据标准化

在數据分析之前,我们通常需要先将数据标准化,利用标准化后的数据进行数据分析。具体方法,将样本数据的原始值x通过标准化映射成在区间[0,1]中的值x',其公式为:

经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。

1.2.2 异常值的剔除

异常数据的剔除采用拉依达准则,即3σ准则。当偏差大于3σ,该数据为异常值,异常判断标准如下:

剔除完后的值即为正常值,利用剔除异常值后的数据进行后续分析。

1.3 模型的建立

1.3.1 训练集和验证集

总共有100组的参加健身活动人数、工业废气排放量、空气中可吸入颗粒物日均值、个人卫生支出占总支出的比重、城市生活污水处理率和月份的时间序列数据,将前70组作为训练学习样本,后30的数据做为验证样本。即训练集为前70组数据,后30组为验证集。

1.3.2 BP神经网络的参数

设置的BP神经网络预测模型参数如表1所示。

1.3.3 BP神经网络预测结果

图1是BP神经网络预测模型的回归效果,拟合优度的系数R到了0.97808,说明了BP神经网络对于流量预测比较准确。为防止过拟合,MATLAB采用的方法是把数据划分成三分,training(训练),validation(验证),test(测试)。只有training数据参加训练,其他两部分数据不参加训练,用于检验。图1横坐标为目标值,纵坐标为神经网络的输出。四幅的点都在对角线附近上,说明没有过度拟合,拟合效果好。

1.4 健康水平的评估模型

根据综合健康素质得分,将健康水平分为四级,如表2所示。

根据健康水平的分级情况和误差得到评估结果如表3。

表3中居民综合健康素质等级大部分为优和良,从环境角度考虑,空气质量不达标、生活用水的达标率不足、生活污水的排放、工业过度生产和城市过多的垃圾废物,导致平均每日工业废气排放量增多以及生态环境的破坏,以至于环境中可吸入颗粒物均值增大,平均每日生活垃圾无害化处理率下降,造成居民出现不健康状况。

2  基于概率神经网络的监测

2.1 概率神经网络

利用训练出的BP神经网络构建异常识别模型,并基于概率神经网络改进原有模型,优化对健康水平异常值监测。利用概率神经网络强大的非线性分类能力,将故障样本空间映射到故障模式空间中,可形成一个较强容错能力和结构自适应能力的诊断系统从而提高故障诊断的准确率。

2.2 概率神经网络识别结果

本文中,影响因素与健康水平作为输入数据,利用拉依达准则判断异常事件的发生,对于30组样本数据,当偏差大于3σ时,该数据标记为异常情况,输出正常情况为1,异常情况为2。处理时随机加入100个正常样本数据,使用前70组数据作为输入样本,后30组样本作为验证样本。

图2中红色为实际分类,蓝色为预测分类。在100份数据中,仅出现一个样本预测失误,分类成功率为99%,效果比较理想。概率神经网络有效的监测出健康水平的异常值。

3  结论

本文通过对居民健康水平的预测,得出以下结论:①在BP神经网络预测居民健康水平的预测模型中,拟合优度的系数R达到了0.97808,没有过度拟合,达到了较好的拟合效果。根据健康水平的分级标准,评估居民的健康水平,引导健康水平较差的居民不断提升自身健康管理意识与能力。②在概率神经网络对异常值识别模型中,概率神经网络的误差几乎为零,容错能力强,准确率高,而且不存在局部最优的情况出现。基于概率神经网络的改进实现了健康水平动态监测功能,根据模型识别出的异常数据,对健康水平进行监测。

参考文献:

[1]王明俊,王萍,王玲.基于神经网络的男子体质健康预测模型研究[J].科学技术与工程,2009(22):6942-6945.

[2]孙颖,远雪霏.HMM的情绪模型对个体心理健康的预测及其功能实现[J].天津大学学报(社会科学版),2011,13(006):531-536.

[3]侯瑞.人工神经网络BP算法简介及应用[J].科技信息,2011(03):75,418.

[4]李勇,白云,李川.基于小波分析与BP神经网络的PM_(10)浓度预测模型[J].环境监测管理与技术,2016,28(5):24-28.

作者简介:霍健瑜(1998-),男,辽宁盘锦人,本科,研究方向为神经网络;刘楚妍(通讯作者)(1999-),女,河北石家庄人,本科,研究方向为信息科学。

猜你喜欢
BP神经网络
基于神经网络的北京市房价预测研究
提高BP神经网络学习速率的算法研究