北京地区肠道传染病与气象因素的关联性分析

2015-06-28 16:50张轩贺娟
长春中医药大学学报 2015年1期
关键词:北京地区训练样本传染病

张轩,贺娟

(北京中医药大学基础医学院,北京100029)

北京地区肠道传染病与气象因素的关联性分析

张轩,贺娟*

(北京中医药大学基础医学院,北京100029)

目的依据中医五运六气学说,研究北京地区肠道传染病发病与当年及1~3年前气象因素的关联性,并尝试建立气象预警模型。方法基于北京地区1970—2004年35年的气象数据和肠道传染病(包括细菌性痢疾、病毒性肝炎、伤寒副伤寒)发病数据,利用BP人工神经网络统计方法,建立“气象—肠道传染病”的预测模型,并筛选出影响发病的关键气象因子。结果利用当年及1,2,3年前的气象因素可分别建立肠道传染病发病的气象预测模型,预测精度均约为60%,其中贡献度较大的气象因素分别是当年的相对湿度,以及1~3年前的相对湿度和风速。利用上述当年~3年前的关键气象因子建模,其预测效果最佳,精度约为80%。结论北京地区肠道传染病发病不仅与当年的气候变化有关,还与1~3年前的气象变化具有相关性;利用当年~3年前(共4年)的气象因素建立预测模型,效果要优于单用某一年的气象因子所建模型。

北京;肠道传染病;气象;五运六气;三年化疫;BP人工神经网络

肠道传染病包括细菌性痢疾、霍乱、伤寒副伤寒、病毒性肝炎、脊髓灰质炎等,多好发于夏季。由于夏季气温高、湿度大,利于细菌繁殖,食物易受污染,直接影响了肠道传染病的发生和流行。肠道传染病的主要症状包括恶心、呕吐、腹痛、腹泻、食欲不振等胃肠道症状;以及发热、头痛、全身中毒等症状。其发病突然,症状严重,传染性很强,给人们的健康和生活造成很大威胁。由于气象因素可以作为传染病暴发和流行的前期指标,故近些年来对肠道传染病的研究[1-4],愈发重视从气象学角度进行探讨,旨在为其防治和发病预测提供依据。

中医运气学说是气象和疾病(尤其是传染病)相关的理论,集中体现了中医学“天人合一”的整体观思想,研究运气理论可以为现代传染病与气象关系的研究提供良好的借鉴和参考。该理论认为天时气候的变化规律对传染病的发生会产生影响,而这种影响不仅局限于当年的气候变化,还涉及近3年的气象变化情况,即“三年化疫”理论:通过3年前气候的异常变化,来预测及判断疫病的发生、发展及流行规律[5]。有学者[6]研究发现2003年SARS的流行,即是“三年化疫”作用的结果。因此,近些年来,有关传染病与前期气象因素关系的研究日益受到重视[7-9],而“三年化疫”理论正为前期气象研究的时间范围提供了有益的参考,将时间跨度延伸至3年前,这在现代气象医学研究领域是鲜有提及的[10]。因此,本研究选取北京地区1970—2004年35年的肠道传染病发病数据(注:肠道传染病包括3种数据资料完整的疾病,即细菌性痢疾、伤寒副伤寒、病毒性肝炎)及同期的气象数据,采用统计学方法分析肠道传染病与同期及前期(即当年~3年前)气象因素的相关性,并尝试建立肠道传染病发病的气象预警模型。

1 资料与方法

1.1 研究地点北京地区属于典型的暖温带半湿润大陆性季风气候,四季分明。春季干旱,夏季炎热多雨,秋季天高气爽,冬季寒冷干燥。风向有明显的季节变化。有学者[11]研究发现北京全年六气时段的实际气候特点与中医六气模式“厥阴风木、少阴君火、少阳相火、太阴湿土、阳明燥金、太阳寒水”特点基本符合,认为北京地区的气候特点比较适合于运气理论的研究。因此,本研究选择北京地区作为研究对象,并采用六气分段的方式处理数据,以期较为客观地分析气象因素与肠道传染病发病之间的关系。

1.2 资料来源北京市疾病预防控制中心提供1970—2004年记录存档的细菌性痢疾、伤寒副伤寒、病毒性肝炎的年度、逐月发病数据;以及北京市观象台提供的同期逐月测得的日平均气温、日平均风速、日降水量、日平均相对湿度、日平均水汽压5项基本气象因子的数据。

1.3 数据处理有学者[12]研究发现“初运始于立春”与北京地区的实际气候较为吻合,故本研究从每年立春日起运,将一年划分为六个时段。即初之气(立春—春分,约为2—3月)、二之气(清明—小满,约为4—5月)、三之气(芒种—大暑,约为6—7月)、四之气(立秋—秋分,约为8—9月)、五之气(寒露—小雪,约为10—11月)、终之气(大雪—大寒,约为12—次年1月)。以六气时段为单位,统计1970—2003年34年间各时段内气温、风速、降水量、相对湿度、水汽压,以及肠道传染病发病数的平均值(注1:肠道传染病逐年六段发病数即为细菌性痢疾、伤寒副伤寒、病毒性肝炎3种疾病逐年六段发病数之和;注2:因缺少2005年1月份的数据资料,无法统计2004年终之气的各组数据,故本研究六段数据研究截止到2003年)。

1.4 统计方法由于人工神经网络具有独特的信息存储方式、良好的容错性、大规模的非线性并行处理方式以及强大的自组织、自学习和自适应能力[13],故近些年来,该方法广泛应用于“气象—肠道传染病”关系的研究中[14-16]。针对肠道传染病数据的非线性特点,本研究将采用BP人工神经网络模型分析当年、1,2,3年前不同时间段的气象因子与肠道传染病发病的相关性,进而建立气象预警模型。

具体方法为:首先利用当年、1,2,3年前的气象因子分别建立4个肠道传染病发病的气象预测模型。即模型1:选择1973—2003年5个当年气象因子的六段均值数以及1973—2003年肠道传染病的六段发病数进行统计;模型2:选择1972—2002年5个1年前气象因子的6段均值数以及1973—2003年肠道传染病的6段发病数进行统计;模型3:选择1971—2001年5个2年前气象因子的六段均值数以及1973—2003年肠道传染病的六段发病数进行统计;模型4:选择1970—2000年5个3年前气象因子的六段均值数以及1973—2003年肠道传染病的六段发病数进行统计。各模型将气象因子作为输入变量,肠道传染病发病数作为输出变量,各自包含186组数据,按照统计学常规且默认的7∶3比例随机抽取数据进行训练及预测,分析各气象因子与肠道传染病发病的关系并建立气象预测模型。然后在4个模型中选择预测效果较好(即预测精度高于50%)的时间段中贡献度最大的气象因子,如上法建立模型5,分析不同时间范围内的气象对肠道传染病发病的影响。以上统计分析均采用SPSS 17.0统计软件完成。

2 结果

2.1 肠道传染病的发病特点

2.1.1 肠道传染病的年发病特点1970—2004年北京地区肠道传染病报告发病总数为3 433 261例,平均每年发病数为98 093例。在1972—1975年间肠道传染病呈高发态势,之后有所下降,到80年代初略有回升;自20世纪80年代末肠道传染病发病开始明显下降,在1990—2004年间发病数基本稳定在31 763例/年左右。见图1。

图1 北京地区1970—2004年肠道传染病年发病趋势

2.1.2 肠道传染病的六段发病特点肠道传染病高发集中于三之气,占总发病数的40%,四之气其次,占总发病数的30%。初之气和终之气的发病最低。见图2。

图2 北京地区1970—2003年六气时段肠道传染病发病趋势

2.2 肠道传染病与气象因子的BP人工神经网络模型分析

2.2.1 当年气象与肠道传染病发病(模型1)结果显示:模型1的训练样本占数据的73.7%,测试样本占数据的26.3%。训练相对错误值为0.436,测试相对错误值为0.468,均小于1,模型建立成功。其中训练样本和测试样本的预测精度均接近60%,预测结果尚可。见表1。将各项输入变量的重要性系数进行标准化计算发现,对肠道传染病发病的影响程度超过50%的气象因子只有日平均相对湿度,其对肠道传染病发病的影响最大。见表2。

2.2.2 1年前气象与肠道传染病发病(模型2)结果显示:模型2的训练样本占数据的71.0%,测试样本占数据的29.0%。训练相对错误值为0.452,测试相对错误值为0.499,均小于1,模型建立成功。其中训练样本和测试样本的预测精度均接近60%,预测结果尚可。见表1。将各项输入变量的重要性系数进行标准化计算发现,对肠道传染病发病的影响程度超过50%的气象因子是:日平均相对湿度和日平均风速。其中相对湿度对肠道传染病发病的影响最大,其次是风速,见表2。

2.2.3 2年前气象与肠道传染病发病(模型3)结果显示:模型3的训练样本占数据的68.8%,测试样本占数据的31.2%。训练相对错误值为0.353,测试相对错误值为0.316,均小于1,模型建立成功。其中训练样本和测试样本的预测精度均接近70%,预测结果优于前2个模型,见表1。将各项输入变量的重要性系数进行标准化计算发现,对肠道传染病发病的影响程度超过50%的气象因子是:日平均风速和日平均相对湿度。其中风速对肠道传染病发病的影响最大,其次是相对湿度,见表2。

2.2.4 3年前气象与肠道传染病发病(模型4)结果显示:模型4的训练样本占数据的69.9%,测试样本占数据的30.1%。训练相对错误值为0.588,测试相对错误值为0.335,均小于1,模型建立成功。其中训练样本的预测精度大约接近50%,测试样本的预测精度大约接近70%,预测结果不如模型3。见表1。将各项输入变量的重要性系数进行标准化计算发现,对肠道传染病发病的影响程度超过50%的气象因子是:日平均相对湿度和日平均风速。其中相对湿度对肠道传染病发病的影响最大,其次是风速,见表2。

2.2.5 3年前~当年气象与肠道传染病发病(模型5)鉴于上述4个模型均建立成功,且预测结果良好(预测精度基本高于50%),故采用当年、1,2,3年前这4年中贡献度最大的气象因子(即当年的相对湿度,1,2,3年前的相对湿度和风速),共同建立肠道传染病发病的预测模型,即模型5。

结果显示:模型5的训练样本占数据的71.0%,测试样本占数据的29.0%。训练相对错误值为0.383,测试相对错误值为0.149,均小于1,模型建立成功。其中训练样本的预测精度大约接近70%,测试样本的预测精度大约接近90%,预测结果最佳,见表1。将各项输入变量的重要性系数进行标准化计算发现,对肠道传染病发病的影响程度超过50%的气象因子是:2年前日平均相对湿度和日平均风速,以及3年前的日平均相对湿度。其中2年前的平均风速对肠道传染病发病的影响最大。见表3。

表1 模型结果汇总

表2 4个模型中的重要气象因子(重要性>50%)

表3 模型5中各气象因子的重要性

3 讨论

目前,关于单个传染病与同期气象变化关系的研究较多,而系统性传染病(如:肠道系统传染病、呼吸系统传染病、虫媒传染病等)与同期,特别是前期气候变化关系的研究报道较少。其中肠道传染病是我国急性传染病中发病数最多,流行面最广,影响群众生活最普遍的一组疾病[17],因此,本研究以北京地区为例,基于中医运气理论,运用BP人工神经网络统计学方法,回顾性分析了肠道传染病发病与同期,尤其是前期气象因素之间的相关性,并建立气象预警模型,时间范围由当年跨至3年前,以期为现代肠道传染病的预防提供新思路。

本研究结果发现:1)在1970—2004年间,北京地区肠道传染病高发于1972—1975年间,以1975年为最。1975年为天符年,依据运气理论,该年份气候变化剧烈,传染病易呈高发、高死亡特点。2)肠道传染病高发于三之气和四之气,此时正值6—9月间,气候炎热,潮湿多雨,在这种湿热交蒸的气候环境下,易形成湿热病邪侵袭人体导致本病的发生。中医也正是从这个角度来认识本病的,并确立了清热、祛湿两大传统治法。3)利用当年、1、2、3年前的气象因素皆可成功建立预测模型,说明北京地区1970—2004年肠道传染病的发病不仅与其当年的气象变化有关,而且与1~3年前的气象变化均有关联。这提示研究传染病的发病,不应忽视前期气候变化的影响。4)在利用当年、1、2、3年前气象因素分别建立的4个模型中,预测效果最好的是模型3,即利用2年前的气象因子来预测肠道传染病的发病情况,其训练样本和测试样本的预测精度均接近70%。该结果在一定程度上佐证了“三年化疫”理论的客观性,并且提示所谓“三年化疫”之“3年”并非固定的预测之数,而是约数。如《素问遗篇·刺法论》[18]云:“假令甲子,刚柔失守,……次三年作土疠,……晚至丁卯,早至丙寅,土疫至也。”指出根据“早至”“晚至”的不同,疫病发生可归咎于发病时间之前的第2年或第3年的气候异常。5)上述4个模型的结果还提示了平均相对湿度对肠道传染病发病的重要影响,不论在同期还是前期;而前期中的平均风速也是影响肠道传染病发病的重要气象因素,这与其他报道[19-20]结果相一致。风邪作为伏邪发病与肠道传染病之间关系密切,虽然早在《黄帝内经》中便已有论述[18],但其机制还有待于深入探讨。6)本研究最后选取同期及前期(即当年~3年前)中的重要气象因子,共同建立肠道传染病发病的预测模型(即模型5)。结果发现该模型的预测效果最佳,训练样本的预测精度约为70%,测试样本的预测精度接近90%。这提示利用当年~3年前(共4年)的气象因素建立预测模型,效果要优于单用某一年的气象因子所建模型。7)模型5发现在前4个模型显示的重要气象因子中,影响肠道传染病发病的最重要的气象因子是2年前的风速和相对湿度及3年前的相对湿度,其中2年前的风速贡献度最大。该结果提示,可以尝试利用2年前的平均风速和平均相对湿度以及3年前的平均相对湿度等前期气象因子来预测北京地区肠道传染病的发病情况。

本研究的创新点在于:1)研究设计思路上的创新:除了分析当年气象因素对肠道传染病发病的影响,还依据运气理论,尤其是“三年化疫”理论,重点探讨了3,2,1年前这些前期气象因素对肠道传染病发病的影响,并建立了气象预警模型。2)研究结果中的创新:本研究不仅揭示了肠道传染病发病与前期气象变动之间存在的某些确切关联,提示在现代传染病的研究中应重视前期气候变化,尤其不要忽略2~3年前的气象变动对传染病发病可能造成的影响;而且从前期气象因素入手建立传染病的预测模型,在时间上促进了预警系统关口的前移,提高了预测的及时性,凸显了预测的超前性特征;并且发现利用多年的气象因子建模,效果可能会优于单用某一年的气象因子所建模型。

不过,本研究仍具有一定的局限性:由于资料有限,研究只选择了5个基本气象因子作为研究对象,而肠道传染病也只包含细菌性痢疾、伤寒副伤寒、病毒性肝炎这3种最常见、最为高发的肠道类传染病,研究指标有限。而且,传染病的发生除受自然因素影响外,还受社会、经济等诸多因素的影响。因此,在接下来的研究中,笔者认为应扩大入选的气象指标,并引入气象综合参数等概念,参考能反映气象综合变动的数学模型;扩大传染病数据库,增大样本量;选用适当的统计学方法分析不同时间段的气象变化对各类系统传染病的影响;并且对影响传染病发病的各种混杂因素进行分析和评估,恰当估量出不同传染病的气象因素影响权重,以期建立精度更高的“传染病—气象”预测模型。

[1]贾蕾,黎新宇,刘桂荣,等.北京气象因素与细菌性痢疾发病关系的研究[J].现代预防医学,2007,34(13):2470-2471.

[2]黎新宇,王全意,贾蕾,等.北京市伤寒发病率与气象因素关系研究[J].首都公共卫生,2007,1(2):91-93.

[3]HARPER S L,EDGE V L,SCHUSTER-WALLACE C J,et al. Weather,water quality and infectious gastrointestinal illness in two Inuit communities in Nunatsiavut,Canada:potential implications for climate change[J].Ecohealth,2011,8(1):93-108.

[4]ZHOU X,ZHOU Y,CHEN R,et al.High temperature as a risk factor for infectious diarrhea in Shanghai,China[J].J Epidemiol,2013,23(6):418-423.

[5]苏颖.中医运气学[M].北京:中国中医药出版社,2009:93.

[6]顾植山.“三年化疫”说非典[J].中国中医基础医学杂志,2003,9(12):1-3.

[7]汤巧玲,付帮泽,黄羚,等.北京市感染性腹泻与气象及六气的关联性研究[J].中医杂志,2013,54(7):570-572.

[8]张轩,贺娟.北京地区1990年-2004年流行性腮腺炎发病与气象因素的相关性研究[J].中华中医药杂志,2014,29 (5):1740-1745.

[9]苏颖.五运六气探微[M].北京:人民卫生出版社,2014: 173.

[10]KUHN K,CAMPBELL-LENdRUM D,HAINES A,et al.U-sing climate to predict infectious disease epidemics[J].Geneva:WHO,2005.

[11]张德山,高思华,李鸿涛,等.北京地区中医六气的气候分析[J].中医研究,2010,23(9):1-3.

[12]刘玉庆,高思华,张德山,等.从北京市60年气象资料看王冰注释运气计算模式的谬误[J].北京中医药大学学报,2010,33(12):813-816.

[13]孙振球.医学统计学[M].北京:人民卫生出版社,2007: 478.

[14]刘文东,吴莹,艾静,等.BP神经网络在痢疾发病趋势预测中的应用研究[J].中国卫生统计,2012,29(6):801-804.

[15]关鹏,何苗,周宝森.基于BP人工神经网络的病毒性肝炎发病率自回归预测模型[J].中国卫生统计,2003,20(5): 269-271.

[16]张振开,黄运能,黄少新,等.伤寒副伤寒与气象及地质因素关系的BP神经网络模型研究[J].预防医学情报杂志,2009,25(3):201-203.

[17]魏承毓.我国肠道传染病的基本状况与防制对策[J].中国公共卫生,2004,20(1):126-128.

[18]王洪图,贺娟.黄帝内经素问白话解[M].北京:人民卫生出版社,2004:424.

[19]马师雷,贺娟,高思华.从六气角度探讨病毒性肝炎与气象因子的相关性及疾病预测模型[J].中华中医药杂志,2012,27(4):823-827.

[20]汤巧玲,刘宏伟,高思华,等.从六气角度探讨北京市痢疾发病与气象变动的关联性[J].中华中医药杂志,2012,27 (4):938-942.

Correlation analysis on gastrointestinal diseases and meteorological variables in Beijing

ZHANG Xuan,HE Juan*
(School of Preclinical Medicine,Beijing University of Chinese Medicine,Beijing 100029,China)

ObjectiveAccording Chinese medicine theory“five circuits and six qi”to study the correlation between the incidence of gastrointestinal diseases in Beijing area and meteorological factors in current year and the past three years based on theory of Yunqi,so as to establish meteorological forecasting model.MethodsThe back-propagation artificial neural net-work was conducted using data on five basic meteorological factors and data on incidence of gastrointestinal diseases(including dysentery,typhoid fever and paratyphoid fever,viral hepatitis)in Beijing area,for the period 1970-2004.ResultsAll predictive models using meteorological factors during the corresponding year and one to three years ago can be successfully established and the forecast accuracy were nearly 60%.Additionally,the meteorological factors with largest contribution include average relative humidity in the current year,and average relative humidity as well as average wind speed in one to three years ago.The model using these vital meteorological factors has shown a relatively high accuracy rate 80%.ConclusionThe incidence of gastrointestinal diseases in Beijing is related to meteorological variables in current year and the past three years.Furthermore,the predictive models suggest that the use of a collection of meteorological variables spanning from three years ago to the present is superior to the use of data from only a single year using.

Beijing;gastrointestinal diseases;weather;five circuits and six qi;pestilence occurring after three years;BPartificial neural network

R256.34

:A

:2095-6258(2015)01-0105-05

2014-07-27)

10.13463/j.cnki.cczyy.2015.01.036

国家自然科学基金项目“北京地区60年疫病发生、气象变动规律性与五运六气理论关联性研究”(81072896)。

张轩(1987-),女,博士研究生,主要从事五运六气学说研究。

*通信作者:贺娟,女,教授,博士研究生导师,电话-(010)64287003,电子信箱-hejuan6428@sina.com。

猜你喜欢
北京地区训练样本传染病
《传染病信息》简介
传染病的预防
3种传染病出没 春天要格外提防
明清北京地区传统色彩嬗变与成就探析
人工智能
呼吸道传染病为何冬春多发
金元明时期北京地区古桥研究概述
歌华发布
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究