邯郸市麻疹发病率与气象因素之间的关系研究

2014-08-30 01:28王清果丽平李燕霞
河北医药 2014年9期
关键词:共线性曲线拟合邯郸市

王清 果丽平 李燕霞

·调查研究·

邯郸市麻疹发病率与气象因素之间的关系研究

王清 果丽平 李燕霞

目的探讨邯郸市麻疹发病和气象因素之间的关系。方法收集1972至2010年邯郸市麻疹疫情资料、气象资料和人口资料,采用EpiData3.0进行“双重录入”,用SPSS 17.0统计分析软件建立数据库,对数据进行统计分析。结果气象参数的共线性诊断结果显示,本组气象因子数据容差最小为0.014,方差膨胀因子最大达69.998。开展麻疹疫苗计划免疫之前麻疹月发病率没有拟合出理想的模型曲线,之后呈三次模型曲线,方程为=3.361-0.039X -1.441*10-7X3。麻疹和10个气象因素之间均不呈线性关系。麻疹月发病率与月平均风速之间得到曲线拟合方程=-28.349+48.241X-26.554X2+5.011X3。结论邯郸市麻疹月发病率的模型曲线为三次模型曲线,月平均风速是影响麻疹发病率的主要气象因素。

麻疹;发病率;气象因素;曲线估计;曲线拟合

气象因素与人体健康之间有着密切的联系,早在两千多年前的中国医书《黄帝内经》中就有记载。近年来随着科技的发展,人们对传染病与气象因素之间的关系研究已越来越深入。研究表明,传染病的发生和出现经常与气候变化有关[1]。本文通过1972年至2010年间气象因素与麻疹发病率关系的研究,查找科学的统计分析方法,探讨影响麻疹发病的关键气象因子。

1 对象与方法

1.1 调查对象

1.1.1 疫情资料:1972至2010年邯郸市麻疹病例按月报告发病数和发病率资料,由邯郸市疾病预防控制中心疫情信息科提供。

1.1.2 人口资料:1972至2010年邯郸市人口资料,由邯郸市统计局提供。以常住本地人口的病例纳入统计。

1.1.3 气象资料:1972至2010年邯郸市气象资料,包括月平均气温、月平均气压、月平均相对湿度、月平均风速、月日照时数、月总降雨量、月极端最高气温、月极端最低气温、月小型蒸发量、月平均总云量等10个气象因素,由邯郸市气象局提供。

1.2 方法

1.2.1 建立数据库:将疫情数据、气象资料和人口资料数据采用EpiData进行“双重录入”,再由SPSS导入,建立数据库。

1.2.2 资料分析:用SPSS 17.0统计分析软件对数据进行统计学处理、相关分析、曲线估计、曲线拟合、因子分析、主成分多元回归分析等。

2 结果

2.1 气象参数 经正态性检验,10个气象因素中月日照时数和月平均总云量服从正态分布,其他8个气象因素均不服从正态分布。做气象参数的共线性诊断,本组气象因子数据容差最小为0.014,方差膨胀因子最大达69.998。

2.2 麻疹发病情况 1972年1月至2010年12月39年间,邯郸市报告麻疹病例167 389例,平均月报告发病率为4.91/10万。经单样本 Kolmogorov-Smirnov检验发现,P<0.001,发病呈偏态分布;极差为304.04,四分位数间距为0.710。1972年至1977年麻疹发病水平较高,最高达304.04/10万。1978年开始开展麻疹计划免疫工作,随之麻疹月发病率出现明显下降。1978年至2009年发病水平始终维持在2.5/10万以下,2010年3~5月份发病率突然增高,最高达5.65/10万。2~5月份为发病高峰,占总发病数的63.46%。见图1。

图1 邯郸市1972至2010年麻疹发病情况

2.3 曲线估计 将麻疹疫苗计划免疫前后的麻疹发病率所构成的曲线趋势,分段进行曲线估计。结果发现两段麻疹月发病率的三次模型的决定系数R2值均最大,计划免疫前的R2值为0.076,F值为1.854,P=0.146,模型没有统计学意义;计划免疫后的R2值为0.141,F值为21.423,模型有统计学意义(P<0.01)。所以认为,本次分析计划免疫之前麻疹月发病率没有拟合出理想的模型曲线,计划免疫之后麻疹月发病率呈三次模型曲线,得到方程=3.361-0.039X -1.441*10-7X3。

2.4 曲线拟合 将1972至2010年的麻疹月发病率作为因变量,将10个气象因素分别作为自变量,进行曲线拟合,进一步研究气象因素与麻疹月发病率的定量关系。在10个方程中,除月极端最低气温和麻疹月发病率拟合为二次方程外,其他9个气象因素和麻疹月发病率均拟合为三次方程。月平均风速、月极端最高气温的R2值分别为0.177、0.076,P值均小于0.001,故认为月平均风速的曲线拟合结果较理想。麻疹月发病率与月平均风速的三次方程曲线关系得到拟合方程=-28.349+48.241X-26.554X2+5.011X3。

3 讨论

国内外学者尝试用不同的统计方法去探讨传染病和气象因素之间的关系,包括多元线性回归、时间序列泊松回归、Spearman等级相关分析、等级聚类分析、多元时间序列分析方法、曲线拟合、互相关分析等[2-6]。

检索文献显示,关于气象因素和传染病月发病率之间关系的研究方法问题,Spearman等级相关分析是较常用的一种[7,8]。但根据邯郸市的麻疹月发病率和气象资料首先绘制散点图,再进一步做曲线拟合,结果发现邯郸市麻疹月发病率和气象因素之间均不呈线性关系,且对麻疹月发病率资料进行正态化处理后也如此,故不适合采用Spearman等级相关分析。目前多元线性回归分析方法已被广泛应用于因果关系的研究中。它是研究一个应变量与多个自变量之间的线性相关与回归的方法。但是如果对变量的条件不加任何考虑,盲目地应用多元线性回归分析往往得不到理想的结果,甚至导致错误的结论。因此对其适用条件和各变量间的关系进行研究是非常有意义的。本研究气象参数共线性诊断结果显示,容差最小的为0.014,方差膨胀因子最大的达69.998。经验表明,容差<0.1,方差膨胀因子(VIF)>10,说明自变量间存在严重的多重共线性。共线性造成的主要后果是自变量对预测变量的估计不可靠,精度和稳定性大大降低,严重影响回归分析的效果。因此,多重共线性问题是回归分析中需注意的一个重要方面,做多元回归分析时有必要进行共线性诊断[9]。由于上述原因,作者认为本文不能直接做多元回归分析,而是通过曲线拟合找出气象因素和麻疹月发病率之间的数量关系,并用函数关系式表达出来。

多重共线性问题的解决办法之一是进行因子分析或主成分分析,用提取的因子或主成分代替原变量进行回归分析。因子分析是近年来非常流行的多元变量统计方法,它是将大量的彼此可能存在相关关系的变量,转换成较少的彼此不相关的综合指标,达到降维的效果,且各综合指标代表的信息不重叠。对本课题的气象参数做KMO统计量和Bartlett球型检验,其KMO值为0.839,Bartlett球形度检验P值小于0.01,表示气象参数十分适合做因子分析。因子分析结果显示,从10个气象因素中可提取到两个主因子Z1和Z2,其特征根分别为λ1=5.591,λ2=2.381,且对总方差的累积贡献率为79.717%。以麻疹月发病率作为因变量,以主因子Z1和Z2作为自变量,采用逐步回归分析,发现两个主因子Z1、Z2和麻疹月发病率之间建立起了多元回归方程,且方程有统计学意义,但其调整R2值太低(0.028),拟合效果较差,提示气象因素对麻疹发病的影响在其总的影响因素中所占的比例较小。

从曲线估计结果可以看出,开展计划免疫前麻疹月发病率没有拟合出理想的模型曲线,计划免疫后麻疹月发病率呈三次模型曲线,提示计划免疫对麻疹月发病率的影响非常大,已经改变了其曲线特征。从曲线拟合结果得出,麻疹月发病率与月平均风速的曲线拟合结果较理想,二者之间呈三次方程曲线关系,且得到了拟合方程,提示月平均风速是影响该病的主要气象因素。而有学者报道长春地区的麻疹发病率与平均蒸发量、平均降水量和年平均气压相关[7],福州市的麻疹发病率和月平均湿度之间得到了多元直线回归方程[10],浙江省绍兴市的气温、相对湿度与麻疹发病具有一定的相关性[11]。研究结论的不同,也许是因地域差异所致,或许还有其他未探明的原因,有待于进一步探讨。

1 陈伟文,谭雪芳,崔楚平,等.云浮市呼吸道和消化道传染病发生与气象因素的关系探讨.热带医学杂志,2008,8:623-625.

2 Fang LQ,Wang XJ,Liang S,et al.Spatiotemporal Trends and Climatic Factors of Hemorrhagic Fever with Renal Syndrome Epidemic in Shandong Province,China.PLoS Negl Trop Dis,2010,4:789.

3 Xiao D,Long Y,Wang SQ,et al.Spatiotemporal distribution of malaria and the association between its epidemic and climate factors in Hainan,China.Malaria Journal,2010,9:185.

4 Zhou SS,Huang F,Wang JJ,et al.Geographical,meteorological and vectorial factors related to malaria re-emergence in Huang-Huai River of central China.Malaria Journal,2010,9:337.

5 Wen YZ,Guo WD,Fang LQ.Climate Variability and Hemorrhagic Fever with Renal Syndrome Transmission in Northeastern China Environmental Health Perspectives,2010,118:915-920

6 Huang F,Zhou SS,Zhang SS.Temporal correlation analysis between malariaand meteorological factors in Motuo County,Tibet.Malaria Journal,2011,10:54.

7 李秀昌,孙健,胡亚男.长春地区气候与传染病间关系分析.中国卫生统计,2010,27:66-69.

8 曲波,关鹏,周宝森,等.干旱地区气象因素对常见传染病疫情影响的研究.中国医科大学学报,2004,33:35-39.

9 丁元林,孔丹莉,毛宗福.多重线性回归分析中的常用共线性诊断方法.数理医药学杂志,2004,17:299-300.

10 郑能雄,林云钦,郑高,等.福州市主要传染病与气象因素关系的研究.医学动物防制,2004,20: 275-278.

11 屠春雨.气象因素与麻疹发病关系的研究.中华流行病学杂志,2004,25:826.

10.3969/j.issn.1002-7386.2014.09.058

056001 河北省邯郸市中心血站(王清);河北省邯郸市疾病预防控制中心(果丽平、李燕霞)

果丽平,056008 河北省邯郸市疾病预防控制中心;

E-mail:181957562@qq.com

R 511.1

A

1002-7386(2014)09-1404-03

2013-11-13)

猜你喜欢
共线性曲线拟合邯郸市
中国人民银行邯郸市中心支行
邯郸市
不同阶曲线拟合扰动场对下平流层重力波气候特征影响研究*
银行不良贷款额影响因素分析
中国人民银行邯郸市中心支行
邯郸市
基于MATLAB 和1stOpt 的非线性曲线拟合比较
浅谈Lingo 软件求解非线性曲线拟合
文氏图在计量统计类课程教学中的应用
——以多重共线性内容为例
不完全多重共线性定义存在的问题及其修正建议