黄国荣,张 林,王庆华,向 颖,许 斌,熊鸿燕
(第三军医大学军队流行病学教研室,重庆 400038)
9.11事件后,生物恐怖的威胁被各国政府和军队高度重视,现场应急队伍的建设和防护技术的研究重新成为工作重点,社会应对突发公共卫生事件的处置能力不断增强。针对生物战剂的高度危害效应,研究者们基本达成了共识,认为早期识别生物攻击并采取准确的应对策略和方法是控制生物威胁的关键任务。基于这种思维,近年来,国内外研究者针对炭疽和天花,以回顾性的流行病学调查资料为依据,以数学和计算机模型为平台探索了不同的预测模型,就袭击形式、规模以及反应方式的不同,预测控制效果的可行性。这些研究主要涉及疫苗措施的预测效果,为现场实际应用提供了科学依据[1-5]。生物恐怖袭击的现场处置内容除疫苗接种的措施外,现场的洗消处理更是一项艰巨的任务。其中,准确预测战剂的污染浓度和活力维持时间将为大规模的现场洗消任务提供重要依据,有利于实现及时反应、恰当反应和准确防护的目标。目前,传统的现场处置方法以经验性推论为依据,一般是根据气溶胶施放特点(点源或线源攻击),以及气溶胶持续作用时间、风速、气象转换因子等综合进行考虑,确定疫源地封锁和洗消的范围。这种方法准确度低,与实际状况相距很大,虽然可以作为参考数据,但也可能给具体措施的拟订带来不恰当的后果,可能出现处置不力或过度反应的现象。本研究以枯草杆菌为试验菌,在模拟的气溶胶实验室进行抗力分析,以表面环境条件下芽胞气溶胶消长规律为依据,用计算机神经网络工具建立抗力预测模型,以期为防护技术的信息化探索可行的方法。
制备枯草芽胞杆菌(ATCC 9372)芽胞悬液,并进行活菌计数,4℃保存备用;在气溶胶控制实验室控制箱内放置布片、瓦片、树叶、石片等材料样本,进行气溶胶喷雾,微生物气溶胶发生器(辽阳市康洁仪器研究所产品)向气溶胶柜(1 m3)中喷芽胞悬液(106~107cfu/mL)2 min,模拟气溶胶污染的空气环境。气溶胶发生流量为0.05 L/h,压力为0.03 MPa,温度为15~30℃,相对湿度为50%~80%。模拟的气溶滞留样本在模拟环境暴露15 min后收集。
在环境模拟箱中放置收集的气溶胶滞留样本,分别设定的不同环境条件(时间、温度、湿度和UVC强度)进行处理(见表1),完成暴露后收集样本,表面(1 cm×1 cm面积)采样后活菌计数。试验同时设置空白处理对照组,各试验点均重复3次。以上微生物试验操作均按照《消毒技术规范》[6]要求进行。
1.3.1 BP网络模型原理[7-9]在人工神经网络(ArtificialNeural Net work,ANN)的平台中,误差反向传播方法(Back Error Propagation,BP)是最稳定、成熟的预测模型。其分为输入层、隐层和输出层,通过改变神经元中的权值w和阈值b来不断学习和训练神经网络完成特定的功能。其学习和构建机制如图1,隐层传递函数取正切S型(tansig)函数,输出层为线性(purelin)函数,则各层输出的计算公式如下:隐层输出:a1=tansig(w1 3 P+b1);网络输出:a2=purelin(w2 3 a1+b2)。
图1 BP网络计算模型Fig.1 Coputationalmodel ofBP artificial neural network
1.3.2 模型构建 构建程序:数据输入及网络初始化→神经网络训练→神经网络预测模型建立。以芽胞抗力测定的275个数据为依据,分层随机选择265个作为建模训练样本,再随机选择其中55个作为回顾性验证样本。另外10个作为前瞻性验证样本。用Matlab6.1语言编程,数据输入。输入矩阵P表示如下:
输出目标向量T值表示如下:
A:UVC强度;B:温度;C:湿度;D:表面材料;E:暴露时间;每个元素间用“;”隔开。
T为目标向量即消亡率赋值,与输入元素一一对应的芽胞存活情况相关,即活菌数0,赋值为0;活菌数1~4,赋值为1;活菌数5~9赋值为2;活菌数10~49,赋值为3;活菌数50~99,赋值为4;活菌数100~149赋值为5;活菌数150~199,赋值为6;活菌数200~299,赋值为7;活菌数≧300赋值为8。
网络初始化:
net=newff(PR[S1S2S3]{‘tansig’,‘tansig’,‘purelin’},‘train lm’),其中,PR为R×2维矩阵,表示R维输入矢量中每维输入的最小值与最大值之间的范围,S1、S2、S3为输入层、隐层、输出层的神经元数目;‘tansig’、‘purelin’为传递函数,trainlm为训练函数。抗力模型中S1为输入层,S2为隐层,S3为输出层。
设定网络迭代次数:net.trainParam.epochs参数为网络训练步数,即迭代次数,反复调整至训练误差下降至最小时(目标是0),其输出值与实际值符合率高。
网络训练:
通过建立的可训练BP网络、输入元素向量及目标向量,网络自适应训练和学习。
结果模拟:
T1′=sim(net,P);
T1′为模拟输出值:用模拟函数sim接收网络输入P,网络对象net,返回网络输出T1′。
预测模型建立:
计算网络模拟输出值T1与实际值T平均符合率,根据模型成立条件,若平均符合率>80%,则预测模型成立。
预测模型验正:
用上述构建的神经网络模型对55个试验数据进行预测,程序如下:
输入新变量,其中A1,n+1;B2,n+1;C3,n+1;…;LE,n+1为待预测案例的变量值。
网络预测:
T1=sim(net,P1);
T1为网络预测函数:通过建立起的网络,利用sim函数对未来进行预测。
计算预测结果:
将网络输出的平均预测值T1与已知真实值T进行比较,以求出预测平均符合率。
预测有两种方法,一种直接用T1′=sim(net,P)进行成批预测,另一种用T1=sim(net,P1)进行逐个预测,目的是检测神经网络模型的稳定性和可靠性。
模拟样本中芽胞活力的结果显示,环境温度在15~30℃,湿度50%~80%,UVC照射强度20~45μW/cm2,作用时间0.5~5 h的暴露条件下,枯草芽胞的生长规律发生了明显的变化,气溶胶滞留抗力的变化随着温度、湿度、UVC照射强度和暴露时间的变化呈现明显的消亡趋势,其中UVC的暴露对芽胞抗力的弱化最明显,叶片中芽胞气溶胶滞留抗力约强于其他表面。其规律见表1。
表1 实验组与对照组的菌落数Table 1 Colony numbers of experimental group and control group
2.2.1 模型设计及建立 模型输入层、隐层和输出层的节点设计直接影响模型的应用效果。根据芽胞抗力的影响因素及实验室研究数据的综合考虑,对输入层设立了5个节点;根据题的目标,即确定芽胞抗力,设立了1个输出节点;神经网络隐层节点的设立相对复杂。由于目前还没有统一标准,一般以仿真效果的不断调整,直至满意为依据。根据陈作炳等和尹念东的方法,隐层节点数(n1)与输入节点数(n)和输出节点数(m)相关,即n1=n+m+a(a为1~10之间的常数),或n1=mn。根据公式,本模型的隐层节点理论值为2~12。预备训练结果在隐层节点为8时,出现训练平滑曲线(见图2)。
图2 神经网络训练图形Fig.2 Traning flow-sheet of neural network
2.2.2 模型验证 网络构建完成后,在程序窗口用建模的55个数据样本,进行神经网络学习和训练,得出预测数值,预测结果见图3。其r值均在0.9以上,显示预测的效率高。55个试验数据一次批预测准确度达到100%。进一步用前瞻性样本进行验证,有效率达到91%(见表2)。
图3 数据与预测回归相关分析Fig.3 Association analysis of data and forecast results
表2 神经网络模拟预测结果Table 2 The predicted results of neural network
利用计算机神经网络模型工具箱构建微生物气溶胶抗力预测模型是创新性方法。近年来,随着生物信息学的发展,医学与计算机技术的联合应用技术展示出无限魅力,为疾病的预测和防治开辟了崭新的途径。Wein等[10]利用人群、环境、医疗资源、事件危害程度等因素的变化规律建立的吸入炭疽事件最佳应对决策数学模型;Fine等[11]利用决策分析数学模型评价并确立了针对人群中出现炭疽和疑似炭疽病人的诊断和治疗最佳方法。这些数学模型虽然具有典型的以数学理论为依据的设计和构思特点,与实际事件和相关量化数据有一定距离,但为疾病预测的理论研究奠定了基础。本研究以计算机软件Matlab6.1的神经网络工具箱为平台,以实际实验数据为模型输入资源。利用神经网络的强大综合智能分析,将温度、湿度、UVC照射强度和作用时间等环境相关特征的多重资料进行系统分析,建立芽胞抗力预测模型,从实用性和准确性方面具有明显的创新特色。为进一步将此模型扩展到多种病原体抗力预测应用建立了平台。
在研究中,实验室数据的质量直接影响到模型构建及其可靠性。因此,在实验条件的设计中根据生物袭击的一般条件要求,并反复与实际环境条件进行比对和验证,设定了相应的温度、湿度、UVC照射指标,使数据所建模型得以实用。
建模过程中材料选用、各层节点的设计和仿真效果调整是模型构建的关键步骤之一。除训练模型的材料外,模型输入层、隐层和输出层的节点设计直接影响模型的应用效果。本研究根据实验数据特征,输入层设立了5个节点;根据课题的目标,即确定消亡率,设立了1个输出节点;神经网络隐层节点的设立相对复杂。由于目前还没有统一标准,一般以仿真效果的不断调整,直至满意为依据。根据陈作炳等[12]和尹念东[13]的方法,隐层节点数(n1)与输入节点数(n)和输出节点数(m)相关,即(a为1~10之间的常数),或根据公式,本模型的隐层节点理论值为3或4。在模型训练时分别设立了2~12个隐层节点,根据模型仿真效果,最后定为8个节点。此时模型的稳定性和准确性最佳。对于建模过程中训练样本,一般要求大样本较好。从神经网络模型应用的角度,一般认为其样本量为其全部节点的2~10倍。根据本研究实际,样本应当在28~140个。本研究用160个样本进行建模训练,其数量符合要求。
以Matlab6.1为基础的神经网络为技术平台进行芽胞气溶胶滞抗力预测模型研究。根据研究目的、模拟环境条件和数据训练的平滑曲线等特征,设定了5个输入神经元,8个隐层节点和1个输出神经元。‘tansig’、‘purelin’为传递函数,train lm为训练函数,网络迭代100次。研究结果显示,此时模型的回顾预测效率达到100%,前瞻预测效率达到91%,具有良好的应用前景。当然其实际效果还有待在现场应用中予以评价。
[1] Bozzette SA,Boer R,Bhatnagar V,et al.A model for a smallpox-vaccination policy[J].N Engl J Med,2003,348(5):416-425.
[2] Diane C.Jamrog,Michael P,et al.Modeling Responses to Anthrax and Smallpox Attacks[J].Lincoln Laboratory Journal,2007,17(1):122-129.
[3] MeltzerM I,Damon I,LeDuc W,et al.Modeling Potential Responses to Smallpox as a BioterroristWeapon[J].Emerg Infect Dis,2001,7(6):959-969.
[4] Nishiura H and Tang IM.Modeling for a Smallpox-vaccination Policy against Possible Bioterrorism in Japan:The Impact of Long-lasting Vaccinal Immunity[J].Journal of Epidemiology,2004,14(2):41-50.
[5] 韩家信,熊鸿燕,张廷惠.炭疽病的诊断及危险度预测智能模型研究[J].中华流行病学杂志,2006,27(10):875-879.
[6] 中华人民共和国卫生部.消毒技术规范[S].2002:15-19.
[7] 许东,吴铮主编.基于MATLAB6.X的系统分析与设计—神经网络(第2版)[M].西安:西安电子科技出版社,2002:4-194.
[8] Kara S,Güven A and Oner AÖ.Utilization of artificial neural networks in the diagnosis of optic nerve diseases[J].Comput BiolMed,2006,36:428-437.
[9] Silva A,Cortez P,SantosMF,et al.Mortality assessment in intensive care units via adverse events using artificial neural networks[J].Artif IntellMed,2006,36:223-234.
[10] Wein LM,Craft DL and Kaplan EH.Emergency response to an anthrax attack[J].Proc Natl Acad Sci USA,2003,100:4346-4351.
[11] Fine AM,Wong JB,Fraser HS,et al.Is it influenza or anthrax?A decision analytic approach to the treatment of patients with influenza-like illnesses[J].Ann Emerg Med,2004,43:318-328.
[12] 陈作炳,艾春庭,夏雪峰.BP神经网络仿真软件[J].计算机仿真,2001,18:23-24.
[13] 尹念东.BP神经网络的应用设计[J].信息技术,2003,27:18-20.