基于优化的Elman神经网络的类流感的预测

2019-03-13 08:45:54胡红萍白艳萍
太原理工大学学报 2019年2期
关键词:个区流感宇宙

胡红萍,孙 强,白艳萍

(中北大学 理学院,太原 030051)

流行性感冒是一种由流感病毒引起的高传染性的急性呼吸道疾病。类流感疾病(Influenza-like illness,ILI)定义为除了流感外没有任何已知原因的发烧(体温为100 ℉[37.8 ℃]或更高)、咳嗽和喉咙痛。每年许多美国家庭遭受流感并承受因医疗费用增长而带来的经济负担。有效预测流感爆发的初期将使政府机构和卫生组织能够采取适当的行动来控制和治疗流感。

在美国,作为国家的健康保护机构的疾病控制和预防中心(CDC)提供流感监测系统以保护人们免受健康和安全威胁[1-2]。CDC的ILI数据提供了国家和地区ILI患者的数量、流感活动的加权值和非加权值。ILI的有效预测对于制定预防措施,帮助临床和医院管理者做出最佳的人员配置和储备决策是至关重要的。

已提出方法实现美国ILI活动的实时估计。过去几年最广泛使用的非传统方法是数字疾病监测系统:谷歌流感趋向(GFT)[3]。但GFT在2015年8月已关闭了,因此,需要新颖可靠的方法去预测流感,谷歌和其他研究者已提出了GFT的很多更新模型[2,4-9]。例如文献[2]采用自回归电子健康记录支持向量机(ARES)实现实时fILI(非加权类流感患者人数占某一区总患者数的百分比)的估计,与GFT和动态自回归模型相比较,ARES的性能有了很大的提高。

近年来,已经在股票市场和医药领域等时间序列预测方面采用了很多技术。人工神经网络是的广泛应用于很多领域的方法之一,例如BP神经网络[10-11],Elman神经网络[12-13],径向基神经网络[14-15],小波神经网络[16-17]。但人工神经网络的初始参数是任意的,这可能造成较大的误差。一些群智能算法被用来优化人工神经网络的参数以获得更高的准确率,例如粒子群(PSO)[18],人工蜂群算法(ABC)[19],鲸优化算法(WOA)[20]和多元优化器(MOV)[21].

本文取前3个星期的fILI作为Elman神经网络的输入,第4个星期的fILI作为Elman神经网络的输出,并采用改进的MVO(IMVO)优化Elman神经网络(IMVO-ERNN)的参数预测fILI.通过比较,IMVO-ERNN在预测ILI方面具有较好的性能。

1 多元优化器

2015年SEYEDALI et al受Multi-verse理论启发提出了多元优化器(Multi-verse optimizer,MVO).MVO算法也是一种基于种群的算法,其搜索过程分为勘探与开发两个阶段。Multi-verse理论的3个主要概念是白洞、黑洞和虫洞用来实现这些阶段,其中白洞和黑洞实现勘探搜索空间,并与虫洞辅助MVO开发搜索空间。

在MVO算法中,每个解类比于一个宇宙,解中的每个变量是宇宙中的物体。每个解分配一个正比于该解适应度函数值的膨胀率。

(1)

由于宇宙的多样性,每个宇宙有虫洞去任意的通过空间运输物体实现MVO算法的勘探阶段。基于每个宇宙的局部变化和提高膨胀率的高概率,在宇宙和最好的宇宙之间建立了虫洞通道,如下式(2)所示:

(2)

式中:Xj是最好宇宙的第j个参数;lbj和ubj分别是第j个参数的下界和上界;r2,r3,r4分别是小于1的任意非负数;RTD是行驶距离率;PWE是虫洞存在概率。PWE和RTD分别定义为

(3)

(4)

式中:PWE,min和PWE,max分别是PWE的最小值和最大值;l和L分别表示当前的迭代次数和总迭代次数;p定义为在所有的迭代中勘探准确数。

详细的MVO算法的伪代码见文献[21].

2 改进的MVO算法

在上述MVO算法的基础上,RTD是非线性递减函数,PWE是线性递增函数。本文中提出如下非线性递减函数代替式(4)所定义的RTD:

(5)

式中:l和L分别表示当前的迭代次数和总迭代次数;m是介于0和1之间的数。图1表示m从0.1到1、步长为0.1的RTD的变化情况。本文中,以m=0.5为例。这样MVO算法得到了改进,记为IMVO.

图1 m从0.1到1、步长为0.1的RTD的变化情况Fig.1 Varying condition of RTD with m from 0.1 to 1 and the step 0.1

3 实验部分

3.1 实验数据

本文所采用的数据来源于网址https:∥gis.cdc.gov/grasp/fluview/fluportaldashboard.html下载的美国从2002年第40周至2017年第36周共780周的由Health and Human Services(HHS)定义的10个区域的CDC类流感疾病(ILI)数据。从该网址上,可以看到每个区域的fILI,年龄分别在0~4岁,5~24岁,25~49岁,50~64岁,>65岁的ILI患者数,总的ILI患者数和该区域的受检查的总人数。

本文对10个区的fILI进行预测。采用前3天的fILI预测第4天的无加权的%ILI.

评价预测性能的指标有Pearson相关性(cpearson)[22],均方差误差(EMS)[15],相对均方差误差(ERMS)[15],平均绝对百分比误差(EMAP)[15],分别定义为:

(6)

(7)

(8)

(9)

式中,yi和xi分别表示实际值和预测值。

3.2 实验结果

在实验中预测fILI的训练数据为2002年第40周到2015年第40周的数据,测试数据为2015年第41周到2017年第36周的数据。

将MVO的参数RTD修改获得的改进的MVO(IMOV)优化ERNN的参数,得到模型IMOV-ERNN,用以准确预测美国CDC定义的10个区的实时fILI.利用多元线性回归模型(MLR),ERNN,MOV-ERNN和IMVO-ERNN进行比较,说明本文所提出的模型IMVO-ERNN是有效的。为方便讨论,分别将MLR、ERNN、MOV-ERNN和IMVO-ERNN成为model 1,model 2,model 3和model 4.

如表1所示的是10个区4个模型的预测值与实际CDC的fILI之间的评价指标EMS,ERMS,EMAP和Cpearson.表1还表明model 4适合区1、区2、区4、区5、区7、区8和区10的fILI预测,且具有最小的EMS,

表1 4个模型的美国10个区的评价指标Table 1 Evaluation index of four models for 10 regions of USA

4 结论

将MVO的参数RTD修改获得的改进的MVO(IMOV)优化ERNN的参数,用以准确预测美国CDC定义的10个区的实时fILI.用前3个星期的fILI预测第4个星期的fILI.通过与MLR,ERNN和MVO-ERNN进行比较,IMVO-ERNN在预测流感方面是有效的。这也就说明了,可以改进很多群智能算法或提出新的群智能算法优化人工神经网络的权值和偏差,预测传染病、股票指数、空气质量指数,同时也可以应用于医学、工程、模式识别等方面。

表2 4个模型下美国10个区的平均评价指标Table 2 Verage evaluation index of four models across 10 regions of USA

猜你喜欢
个区流感宇宙
宇宙第一群
百家讲坛(2020年4期)2020-08-03 02:01:25
冬春流感高发 加强防治最重要
这宇宙
秋季谨防牛流感
兽医导刊(2016年12期)2016-05-17 03:51:15
猪流感病的预防与治疗
宇宙最初的大爆炸
“流感”来袭等