基于BP神经网络的病毒性肝炎发病率预测

2023-06-13 14:32:47徐香朱家明
关键词:病毒性肝炎BP神经网络发病率

徐香 朱家明

摘  要:构建BP神经网络模型,对我国病毒性肝炎发病趋势进行预测.收集1990-2019年全国病毒性肝炎发病率的数据,分别构建ARIMA模型、支持向量回归、BP神经网络、ARIMA-SVR、ARIMA-BPANN模型,對病毒性肝炎发病率进行预测.实验结果表明,BP神经网络模型预测的效果最佳,得到测试集的拟合值和真实值的RMSE(平均残差平方和的平方根)和MAPE(平均绝对百分误差)分别只有0.427 3和0.385 8,远小于其他预测模型.

关键词:病毒性肝炎;发病率;BP神经网络;预测

[   中图分类号    ]R512.6[    文献标志码   ]  A

Prediction of Incidence Rate of Viral Hepatitis Based

on BP Neural Network

XU Xiang1,ZHU Jiaming2*

(1.The Fourth People's Hospital of Bengbu,Bengbu  233010,China; 2.School of

Statistics and Applied Mathematics,Anhui University of Finance and Economics,Bengbu  233030,China)

Abstract:The trend of viral hepatitis in China was predicted by modeling. First,collect the relevant data of the incidence rate of viral hepatitis in China from 1990 to 2019,and build ARIMA model,support vector regression,BP neural network,ARIMA-SVR,ARIMA-BPANN and other models to predict the incidence rate of viral hepatitis. The experimental results show that the prediction effect of BP neural network is the best,The RMSE (square root of the mean residual sum of squares) and MAPE (mean absolute percentage error) of the fitting value and the real value of the test set obtained by this model are only 0.427 3 and 0.385 8,respectively,which are far less than other prediction models.

Key words: viral hepatitis; incidence rate; BP neural network; forecast

2019年1-7月中国病毒性肝炎发病人数为934 295例,死亡人数为372人;2018年中国病毒性肝炎发病人数为1 280 015例,死亡人数为531人.病毒性肝炎的发病率与受病原体变异的速度有关,与易感者积累速度有关,还受环境的影响.[1]病毒性肝炎的发生从历史数据上看存在一定的规律,这有利于人们利用各种适用模型对其发病率进行预测,从而有效地为卫生部门主动防控工作提供有效参考.[2,3]本文以1990-2019年我国病毒性肝炎的年发病率为数据,研究BP神经网络模型对病毒性肝炎发病率的预测.

1 数据来源和研究方法

1.1 数据来源

本文数据来源:国家统计局官网(http://www.stats.gov.cn/tjsj/)年度数据中甲乙类法定报告传染病发病率,中国疾病预防控制局网站(http://www.nhc.gov.cn/jkj/pqt/new_list. shtml)全国法定传染病疫情概况.

1.2 研究方法

BP神经网络[4-9]作为一种模型,其运行模式是向前传递信号,反向传递误差.[10]在向前传递时,首先将数据录入到输入层,然后将输入层的数据传到隐含层进行处理,最后经过输出层输出.如果输出结果和预想期望的值不一样,那么会进入下一个过程,即反向传递.此时每一个层次作出相应的调整,包括模型中的权值以及不同层次之间的阈值,目的是进一步优化输出值,使其接近或等于期望值.[11]算法步骤为:

(1)输入输出维数和训练集的设置.

(2)数据归一化.

(3)确定网络结构和函数设定:首先设置BP神经网络的网络层数和各层节点数.基于1990-2019年病毒性肝炎发病率30年的数据,将输入层节点数设定为27,输出层神经元数设定为3,将学习函数设定为{'logsig','purelin'}、traincgp和learnwh.

(4)网络的建立和检验.用设定的训练集训练网络,测试集测试病毒性肝炎数据网络,反复执行第 (3)~(4) 步,以测试集的实际输出值和期望输出值的MSE最小为标准,找出最佳网络.

(5)评价模型预测效果.计算训练集原始数据(真实值)与预测结果(预测值)的平均绝对误差、均方误差、总方差;对2019-2021年数据预测值与原始数据进行误差分析,评价BP神经网络的预测效果.

2 结果与分析

2.1 BP神经网络模型对病毒性肝炎发病率的预测

BP神经网络模型对病毒性肝炎发病率的训练样本集进行训练,测试样本集的仿真结果和2019-2021年病毒性肝炎发病率预测结果见图1.在训练次数为5 000次,收敛误差为0.000 01,每迭十次显示一次的设定下,1990-2016年的网络模型对训练样本的拟合平均绝对误差、均方误差、总方差分别为0.419 7,0.294 3,7.945 5.对测试集的拟合情况和误差分析见表1和表2.由图2可知,BP神经网络训练集拟合模型的可决系数R=0.999 97,表明该模型拟合程度很好.

2.2 五个模型的比较

采用ARIMA、支持向量回归、BP神经网络、ARIMA-SVR、ARIMA-BPANN模型对病毒性肝炎发病率进行预测[11-14],模型拟合的RMSE分别为3.266 6,2.364 1,0.427 3,4.753 5,3.675 5;MAPE分别为2.494 9,2.296 9,0.385 8,4.531 5,2.964 1.组合模型中,RMSE(ARIMA-SVR)>RMSE(ARIMA-BPANN),MAPE(ARIMA-SVR)>MAPE(ARIMA-BPANN),组合模型中ARIMA-BPANN较优.在五种模型中,BPANN的RMSE和MAPE最小,预测值与真实值差距最小,拟合误差在真实值中占比最小,预测效果最好.

五种模型对2019-2021年的病毒性肝炎发病率的预测值与其真实值的对比见图3.初步看出,BP神经网络模型与SVR模型对病毒性肝炎发病率的预测值与病毒性肝炎发病率的真实值较为接近.

3 结论与研究展望

对传染病爆发及时有效的预测是传染病预测控制工作的重点,本文采用ARIMA、SVR、BP神经网络、ARIMA-SVR和ARIMA-BPANN模型分别对1990-2019年的病毒性肝炎发病率进行拟合,结果表明,BP神经网络模型的预测效果优于其他两种单一模型和两种组合模型.衡量我国各类肝炎流行程度的重要参考依据就是病毒性肝炎的发病率,流行病防控中心可以采用本文对病毒性肝炎发病率的模型合理预测其发病趋势.

病毒性肝炎的发展受公共政策、人口流动、气象条件等多种因素影响,如果将这些因素纳入模型,在更高维度上拟合数据,可以为流行病发病率分析、预測、预防提供更多有效参考.进一步研究病毒性肝炎的诱导病因以及这些病因所涉及的现实条件,为未来疾病防控提供参考.

参考文献

[1]付之鸥,周扬,陈诚,等.时间序列分析与机器学习方法在预测肺结核发病趋势中的应用[J].中国卫生统计,2020,37(2):190-195.

[2]Wah W,Das S,Earnest A,et al. Time series analysis of demographic and temporal trends of tuberculosis in Singapore[J],BMC public health,2014,14(1):1121.

[3]刘晓芬. 胶南市1990~2012年病毒性肝炎流行特征分析及预测研究[D].济南:山东大学,2014.

[4]吴越怡,朱家明,刘辛邑,等.基于BP神经网络对合金收得率影响因素的研究[J].河南科技学院学报:自然科学版,2020,48(5):57-64.

[5]李细荣,林硕.基于BP神经网络的地基压实度测量方法[J].牡丹江师范学院学报:自然科学版,2022(1):54-56.

[6]朱家明,燕惹弟,张航,等.基于BP神经网络对脱氧合金冶炼中元素收得率的预测[J].青海大学学报,2020,38(4):70-77.

[7]刘光宇,曹禹,黄懿,等.基于BP神经网络结构的图像压缩技术研究[J].牡丹江师范学院学报:自然科学版,2021(2):23-29.

[8]朱家明,马晓旭,陈荣燕,等.基于灰色关联度和神经网络对科创板拟上市企业估值的研究[J].齐齐哈尔大学学报:自然科学版,2020,36(5):79-83+94.

[9]刘文东,吴莹,艾静,等.BP神经网络在痢疾发病趋势预测中的应用研究[J].中国卫生统计,2012,29(6):801-804.

[10]侯少康,刘耀儒,张凯.基于IPSO-BP混合模型的TBM掘进参数预测[J/OL].岩石力学与工程学报:1-11[2020-06-10].

[11]刁秀芳,李望晨.基于SVM模型和ARIMA模型在拟合病毒性肝炎发病率中的应用[J].现代预防医学,2017,44(9):1545-1548.

[12]向超. 基于ARIMA-SVR组合模型的动力煤价格预测与实证研究[D].北京:对外经济贸易大学,2019,26-28.

[13]朱家明,段寒冰,王子健,等.基于ARIMA模型对北京垃圾分类对策的计量分析[J].中央民族大学学报:自然科学版,2020,29(2):49-56.

[14]朱家明,陈妍群,金静.基于ARIMA模型对我国外汇储备余额的预测分析[J].长沙理工大学学报:自然科学版,2020,17(1):92-97.

编辑:琳莉

猜你喜欢
病毒性肝炎BP神经网络发病率
多晒太阳或可降低结直肠癌发病率
中老年保健(2021年9期)2021-08-24 03:49:34
ARIMA模型在肺癌发病率预测中的应用
医学新知(2019年4期)2020-01-02 11:04:00
基于BP神经网络的旅行社发展方向研究
商情(2016年39期)2016-11-21 09:30:36
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
软件导刊(2016年9期)2016-11-07 18:25:50
BP神经网络算法在数值预报产品释用中的应用
科技视界(2016年20期)2016-09-29 14:15:12
在病毒性肝炎诊断中相关常规生化检验指标的应用价值分析
病毒性肝炎合并心肌损伤的临床研究
病毒性肝炎应用痰热清注射液联合西药治疗的可行性分析
凝血四项检测对病毒性肝炎的诊断价值评估及分析