基于MF-DCCA的呼吸道疾病与大气污染物相关性分析

2021-02-26 01:17黄毅郑凯莉彭立平刘春琼杨艺池
大气与环境光学学报 2021年1期
关键词:永定区张家界市系统疾病

黄毅,郑凯莉,彭立平,刘春琼,杨艺池

(1 江西财经大学统计学院, 江西 南昌 330013;2 吉首大学数学与统计学院, 湖南 吉首 416000;3 吉首大学旅游与管理工程学院, 湖南 张家界 427000;4 吉首大学生物资源与环境科学学院, 湖南 吉首 416000)

0 引 言

随着我国经济快速发展,城市化进程加速,大气污染问题已经成为人类无法回避的现实问题[1]。愈加严重的大气污染不仅给人类生活带来不便,更是带来了巨大的健康问题[2],使得居民面临更高的心血管系统、呼吸道系统等疾病的患病风险[3,4]。PM2.5、SO2作为大气中重要的污染物,其浓度的高低对呼吸道疾病发病率具有一定影响,探索它们与呼吸道疾病患病人数的相关性,可以为呼吸道系统疾病的防治工作提供科学依据。

目前, 国内外诸多学者对大气污染物与呼吸道系统疾病的关系,应用各种方法模型进行了深入研究。陶燕等[5]采用半参数广义相加模型(A semi-parametric generalized additive model,GAM)对兰州市空气污染对居民呼吸道疾病日住院人数的影响进行评价, 发现PM10、SO2、NO2均有一定的滞后效应。欧阳飞云等[6]利用广义相加模型对长沙市某医院儿童肺炎住院人数与大气污染的关联性进行探讨,发现SO2、PM2.5及PM10浓度与该儿童医院肺炎住院人数呈正相关,且对男童的影响较女童大。吴一峰等[7]运用分布滞后模型对社区上呼吸道疾病与大气污染物进行分析,得到SO2、PM2.5及NO2均可增加上呼吸道疾病门诊量,SO2和NO2的效应可能以急性为主,且PM2.5的滞后效应更为明显。

上述文献所建立的模型,都是建立在线性均衡的分析模式上。但是,大气污染是一个相对复杂多变的动力系统,其对应时间序列变化上表现出复杂的非线性和分形特征[8,9],大气污染物与众多影响因素的复杂关系作用可能影响大气污染与呼吸道系统疾病日住院人数的相互关系,使得大气污染物浓度和呼吸道疾病日住院人数时间序列存在非线性特征。因此,基于线性模型的研究视角不能有效阐述二者之间的相关性,也无法细致刻画大气污染与呼吸道系统疾病日住院人数之间复杂的交互关系。而基于多重分形理论的多重分形消除趋势波动交叉互相关分析法(Method of multifractal detrended cross-correlation analysis,MFDCCA),另辟蹊径,以非线性的视角对不同时间尺度上时间序列的相关性进行定量分析。目前该方法已经广泛应用于金融股票[10,11]、能源市场[12,13]、大气污染[14,15]等领域。因此,将该方法运用到呼吸道系统疾病住院人数与大气污染物PM2.5、SO2浓度序列相关性的研究是可行的。

张家界地处湖南省西北部,属武陵山区腹地,由于其地貌奇特,山水秀丽,深受国内外游客喜爱。近几年由于人们生活水平和消费观念的改变,高速公路节假日免费通行,法定假期的增加及景区门票降价等政策贯彻落实,周末和节假日大量游客自驾到张家界旅行观光,旅游活动中通过汽车尾气、餐饮烹饪等向大气排放了更多的PM2.5和SO2。张家界市作为一个生态旅游城市,绿色植被覆盖面积在90%以上且无大型工业,因此张家界市大气中的PM2.5、SO2污染物浓度更多地受尾气的排放及餐饮烹饪业增加的影响。与此同时张家界市呼吸道疾病住院人数逐年上升,是否受大气中的PM2.5、SO2污染物浓度的影响呢?本文采用MF-DCCA 方法对张家界市永定区呼吸道系统疾病住院人数与大气污染物PM2.5、SO2浓度序列的相关性分析,探讨了不同季节下相关性的多重分形特征,以期加深人们对大气污染与呼吸道疾病交叉相关性的理解,为相关部门在确定呼吸道疾病防治方面提供依据。

1 研究方法

1.1 交叉相关性检验函数

选取2 列时间序列{xi}、{yi},i=1,2,··· ,N。交叉函数为

交叉相关函数检验函数为

相关性统计量Qcc(m)在分布上服从自由度为m 的卡方分布χ2(m)。

1.2 多重分形消除趋势交叉波动分析方法

Podobink 和Stanley[16]于2008 年对去除趋势波动分析法(Detrended fluctuation analysis method, DFA)进行了推广, 提出去趋势互相关分析法(Detrended cross-correlation analysis, DCCA),该方法可以用来分析两个时间序列的相关性。同年Zhou[17]将DCCA 与多重分形消除趋势波动分析法(Multifractal detrended fluctuation analysis method,MFDFA)相结合,提出多重分形消除趋势交叉波动分析方法(MF-DCCA)。其具体步骤如下:

首先,对大气污染物浓度序列{xi}(i = 1,2,··· ,N)和呼吸道疾病日住院人数序列{yi}(i = 1,2,··· ,N)进行累计离差处理,得到累计离差序列{X(t)}、{Y(t)}

其次,将累计离差序列{X(t)}、{Y(t)}等分为T(n) = int(N/n)个连续且不重叠小区间。反向再次对时间序列进行等分,从而共有2T(n)个长度相等的小区间。并通过最小二乘法对每个小区间进行直线拟合,得到该小区间的局部趋势信号v(t)和v(t)。

再次,对每个时段内进行降趋势处理,得到降趋势协方差为

第四,计算整个样本的q 阶降趋势协方差函数为

发现波动函数Fq(n)与n 存在以下关系Fq(n) ∝nh(q),h(q)是广义Hurst 指数。如果h(q)为一固定常数,那么此时对应的时间序列在演化过程中表现为单分形特征;如果h(q)不是常数,那么此时对应的时间序列在演化过程中表现为多重分形特征。同时如果h(q) >0.5,说明该时间序列具有长期持续性特征,即时间序列在演化过程中具有“惯性”特征,过去演化趋势在未来会大概率得到延续。

再经勒让德变换,得到多重分形谱α −f(α)。其中,α 为研究数据的奇异程度,∆α=αmax−αmin为多重分形谱宽度,∆α 值越大,表明两组时间序列相关性的多重分形特征越显著。∆f = f(αmin)−f(αmax)表示两组数据在相互影响下处在高数值和低数值的比例。当∆f >0,表明一组数据在另一组数据影响下,更容易出现较高的数值;当∆f <0 时,情况相反。

2 数据来源

以2014 年6 月1 日-2016 年5 月31 日张家界市永定区大气污染物PM2.5、SO2浓度数据与呼吸疾病门诊住院人数为研究对象。大气污染物PM2.5、SO2浓度数据源自生态环境部实时发布平台http://106.37.208.233:20035/,张家界市共有4 个站点,其中城区站点为永定新区和电业局,景区及周边站点为袁家界和未央路。同步收集同时段张家界永定区新农合报销门诊病例,将肺部感染、急性支气管炎、慢性支气管炎、支气管肺炎和急性上呼吸道感染门诊住院人数[18],作为本研究呼吸系统疾病的研究数据,并按住院日期进行汇总,作为呼吸道系统疾病每日住院人数时间序列。呼吸道系统疾病门诊住院人数与大气污染物PM2.5、SO2浓度数据详情见图1。

表1 给出了各时间序列的基本统计量。由表1 可知,由于PM2.5浓度离散性较大,浓度数值波动剧烈,其变异系数最大。而呼吸系统疾病人数变异系数接近零,表明呼吸道系统疾病患病人数相对较稳定,数据变化不大。从数据结构的偏度和峰度来看,呼吸道系统疾病以及PM2.5、SO2数据呈现“尖峰胖尾”的分布。各时间序列的JB 统计量均大于临界值5.94,拒绝原假设,各数据分布不是常见的正态分布。

表1 张家界市永定区呼吸道系统疾病以及PM2.5、SO2 数据基本统计量Table 1 The basic statistics about respiratory diseases and PM2.5,SO2

3 结果分析

3.1 呼吸道系统疾病与大气PM2.5、SO2 的交叉相关性检验

图1 呼吸道系统疾病(a)以及PM2.5 (b)、SO2 (c)数据Fig.1 Data of respiratory diseases(a)and PM2.5 (b),SO2 (c)

首先验证张家界市永定区呼吸道系统疾病与大气PM2.5、SO2浓度数据是否存在交叉相关性。分别计算PM2.5与呼吸道疾病以及SO2与呼吸道疾病的交叉相关统计量Qcc(m)。从图2 中可看出各自交叉相关统计量Qcc(m)均在卡方分布χ2(m)临界值的上方,表明呼吸道疾病患病人数与大气中PM2.5、SO2污染物序列存在相关性。

图2 呼吸道系统疾病与大气PM2.5 (a)、SO2 (b)的交叉相关性检验Fig.2 Cross-correlation test between respiratory diseases and PM2.5 (a),SO2 (b)

3.2 呼吸道系统疾病与大气PM2.5、SO2 的交叉相关性多重分形分析

运用MF-DCCA 对2014 年6 月1 日-2016 年5 月31 呼吸道系统疾病与PM2.5、SO2浓度在不同时间尺度下的相关性进行多重分形分析,图3 给出了其分析结果。由图可以看出,呼吸道系统疾病与大气PM2.5、SO2浓度的h(q)是关于q 的函数,这说明在一定时间尺度上,呼吸道系统疾病与大气PM2.5、SO2浓度之间的相关性具有非线性、复杂的多重分形特征。当q 从−20 变化到20 时,呼吸道系统疾病与大气PM2.5的h(q)由1.23 递减到0.7,呼吸道系统疾病与大气SO2的h(q)由1.44 递减到0.79,均大于0.5。这表明张家界永定区呼吸道系统疾病与大气PM2.5、SO2浓度之间存在长期持续性特征,意味着在一定时间尺度上,大气PM2.5、SO2浓度的上升(下降)会导致未来一段时间呼吸道系统疾病患病人数的上升(下降)。从复杂性理论视角来说,呼吸道系统疾病患病人数对当地大气PM2.5、SO2浓度变化具有敏感性和依赖性。

图3 呼吸道系统疾病与大气PM2.5、SO2 的Hurst 指数(a)和多重分形谱(b)Fig.3 Hurst index(a)and multifractal spectrum(b)of respiratory diseases and PM2.5,SO2

此外,呼吸道系统疾病与大气PM2.5、SO2浓度相关性的α −f(α)曲线呈现上凸抛物线形状。就多重分形强度∆α 而言,呼吸道系统疾病与大气PM2.5的∆α 为0.63,小于呼吸道系统疾病与大气SO2的0.75。这表明张家界永定区呼吸系统疾病患病人数变化受SO2的影响,要强于大气PM2.5的影响。同时,对∆f 而言,呼吸道系统疾病与大气PM2.5的∆f <0,多重分形谱α −f(α)表现为右偏,呼吸道系统疾病患病人数变化受大气PM2.5的影响,大概率地出现低数值,有下降趋势;呼吸道系统疾病与大气SO2的∆f >0,多重分形谱表现为左偏,呼吸道系统疾病患病人数变化在大气SO2影响下,更大几率出现高数值,有上升趋势。这意味着张家界市政府在制定预防呼吸道系统疾病措施时,要更多地考虑到大气SO2的防治工作。

3.3 呼吸道系统疾病与大气PM2.5、SO2 的交叉相关性多重分形特征来源分析

为深入理解呼吸道系统疾病与大气PM2.5、SO2之间的相互作用,对其相关性多重分形特征的来源进行探索。通常认为多重分形特征是由时间序列的长期持续性和尖峰胖尾的分布特性导致。可通过相位随机构造替换序列来识别尖峰胖尾分布对多重分形的贡献大小。与原始序列相比,如果替换序列的多重分形强度∆α 变小了,则说明数据尖峰胖尾分布是产生多重分形特征的原因之一,反之则认为没有影响。同时,也可通过重构随机序列来识别长期持续性对多重分形的影响大小。如果随机序列的多重分形强度∆α 与原始序列相比发生变化,那么长期持续性特征一定是导致时间序列具有多重分形特征的原因之一。

通过相位随机替代与随机重构法,对呼吸道系统疾病与大气PM2.5、SO2的原始时间序列进行替换和随机变换,并对得到的时间序列再次进行MF-DCCA 计算。为保证研究的严谨性,对上述过程重复50 次,取α与f(α)的均值。如图4 所示,与原始序列相比,呼吸道系统疾病与大气PM2.5、SO2变换序列相互作用的多重分形谱宽度明显变窄,同时随机序列变化更为明显,说明呼吸道系统疾病患病人数与大气PM2.5、SO2相关性的多重分形受到长期持续性和尖峰胖尾分布的共同作用,但在不同时间尺度上的长期持续性影响是其主要动力来源。长期持续性机制表明,呼吸道系统疾病患病在一定时间尺度上,受大气PM2.5、SO2影响具有滞后效应,这种滞后不同于马尔科夫过程的指数衰减方式,而是一种幂律形式的缓慢衰减。

3.4 呼吸道系统疾病与大气PM2.5、SO2 交叉相关性四季的多重分形分析

由于受气象条件影响,大气PM2.5、SO2浓度在不同季节上波动情况会呈现出不同的特征。前文已经探讨了呼吸道系统疾病患病人数与大气PM2.5、SO2之间相关性具有非线性、复杂的多重分形特征,那么这种特征在四季又是如何表现的呢?进一步,运用MF-DCCA 对呼吸道系统疾病患病人数与大气PM2.5、SO2交叉相关性的四季特征进行分析。

图4 呼吸道系统疾病与大气PM2.5 (a)、SO2 (b)不同序列的多重分形谱Fig.4 The multifractal spectra α −f(α)for relation of respiratory diseases and PM2.5 (a),SO2 (b)

图5 呼吸道系统疾病与大气PM2.5、SO2 相互作用的春季(a)、夏季(b)、秋季(c)、冬季(d)多重分形谱Fig.5 The multifractal spectra α −f(α)for relation of respiratory diseases and PM2.5,SO2 in spring(a),summer(b),autumn(c)and winter(d)

图5 给出了呼吸道系统疾病患病人数与大气PM2.5、SO2之间相关性在四季中的多重分形谱。从图中可以看出,呼吸道系统疾病患病人数与大气PM2.5、SO2之间多重分形谱最宽在夏季,此时多重分形特征最强。这可能是由于张家界地区夏季多雨潮湿且闷热,高温使得局地空气质量下降,大气PM2.5、SO2浓度有所上升,加上城市热岛环流效应,大气中污染物不易扩散,从而对慢性呼吸道疾病患者造成负担,易于出现病情复发,所以夏季呼吸道系统疾病患病人数在大气PM2.5、SO2浓度影响下,数据范围波动大,多重分形特征强。

呼吸道系统疾病患病人数与大气PM2.5相关性的多重分形谱两端高度差∆f 在春季、秋季和冬季小于0,呈右勾形状,说明张家界市永定区呼吸道系统疾病患病人数在大气PM2.5污染物影响下,下降的概率大于上升的概率,总体有下降的趋势。呼吸道系统疾病患病人数与大气SO2相关性的多重分形谱两端高度差∆f在秋季表现出为正值,对应多重分形谱图呈现左勾形状,表明在秋季张家界市永定区呼吸道系统疾病在大气SO2影响下,更容易出现较高的患病人数,有上升趋势。因此,相关部门要在秋季注意防范大气SO2污染引起的相关呼吸道疾病。

4 结 论

通过对张家界永定区呼吸道系统疾病患病人数与大气PM2.5、SO2之间相关性分析,得到以下结论:

1)根据MF-DCCA 分析结果,张家界市永定区呼吸道系统疾病患病人数与大气PM2.5、SO2的交叉相关性具有长期持续性多重分形特征,具体表现在一定时间尺度上,呼吸道系统疾病患病人数与大气PM2.5、SO2的相关性随时间变化不遵循马尔科夫过程,即不随时间呈现指数快速衰减,而是一种幂律形式的缓慢衰减。

2)张家界市永定区呼吸道系统疾病患病人数在大气SO2影响下波动范围大,且更容易处于较高数值,因此张家界市政府在制定预防呼吸道系统疾病措施时,要更多的考虑到大气SO2的防治工作。

3)呼吸道系统疾病患病人数与大气PM2.5、SO2相关性的多重分形受到长期持续性和尖峰胖尾分布的共同作用,但在不同时间尺度上的长期持续性影响是其主要来源。

4)从四季来看,夏季由于慢性呼吸道疾病容易复发,从而使得呼吸道系统疾病患病人数与大气PM2.5、SO2的多重分形特征相对强于其他季节。

猜你喜欢
永定区张家界市系统疾病
“稀奇古怪”的牛老师
福建省龙岩市永定区社前村天后宫山门舞楼
牙周病及伴系统疾病相关牙周病的临床诊治
传承红色基因的有心人——记张家界市永定区中共党史联络组常务副组长赵宗山
织 嫁 歌
阻塞性睡眠呼吸障碍与全身多系统疾病关系的研究进展
伴有系统疾病的老年缺牙患者可摘局部义齿修复过程中的护理
永宁 永定区退休医生坚持16年为边远乡村群众送医送药
在湖南省张家界市召开弘扬老区精神座谈会纪念红军长征胜利80周年
ROS介导的炎症反应与中枢神经系统疾病