空间大数据支持下的霍乱环境影响要素分析及预测

2023-01-03 11:44曹春香钟少波王丹萍崔腾飞康建荣
地理空间信息 2022年12期
关键词:环境要素构架宏观

徐 敏,曹春香,钟少波,王丹萍,崔腾飞,康建荣

(1. 中国科学院空天信息研究院 遥感科学国家重点实验室, 北京 100101;2. 江苏师范大学 地理测绘与城乡规划学院, 江苏 徐州 221116;3. 北京市科学技术研究院 北京城市系统工程研究中心,北京 100035;4. 中国科学院大学, 北京 100049)

遥感、地理、气象等空间大数据能够科学、客观地提供陆地和海洋相关环境要素数据,且具有安全、不受地理环境条件限制、覆盖面广、可持续重复观测等优点,可以为包括霍乱在内的传染病时空传播研究提供丰富的长时序环境监测数据[1-4]。如果能够探析沿海地区霍乱主要环境影响要素,就可以根据环境影响要素对霍乱疫情影响的时间滞后性效应,利用遥感数据提取表征海洋及陆地环境变化的时空变量,构建沿海地区霍乱发病风险评估模型,实现霍乱疫情的早期预测,将使霍乱防控更加主动、预防和控制措施更加及时有效。

1 研究区及数据

1.1 研究区概况

浙江省地处中国东部沿海,位于欧亚大陆与西北太平洋的过渡地带27°01′~31°10′N,118 °01′~123°08′E 之间,东邻东海,北接长江三角洲。浙江省东西和南北向的贯穿距离均为450 km 左右,全境面积为10.18万km2,境内地形起伏较大,山地丘陵占70.4%,平原占23.2%,河流湖泊占6.4%。浙江省拥有较长的海岸线,全长达2 253.7 km,沿海共有岛屿2 161 个,浅海大陆架约22.27 万km2。浙江省属于典型的亚热带季风气候区,季风显著、四季分明、气温比较适中且雨量充沛,受东亚季风影响,降水有明显的季节变化,全省年平均降水量在980~2 000 mm,年平均日照时数1 710~2 100 h,年平均气温15~18℃,极端最高气温33~43℃,极端最低气温-2.2~17.4℃。

浙江省历来是中国常发霍乱疫源地,自1962年埃尔托霍乱输入以来,霍乱疫情时起时伏,每隔一些年份都会出现较大规模的暴发流行。进入21 世纪以来,浙江省的霍乱水平一直处于持续低流行水平,发病率稳定在1/10 万以下,但在2001 年和2005 年曾出现过两次小高峰,其中2005年的爆发主要集中在嘉兴、湖州等地区,共有300 余人感染霍乱。图1 是浙江省各县市2001—2008年霍乱病例的空间分布,浙江省的霍乱发病病例大多发生在沿海或近海地区,以杭州、嘉兴为代表的钱塘江流域周边地区在此期间均有霍乱病例出现。研究从全球遥感产品数据中提取对霍乱弧菌繁殖与生长相关的海表面温度(SST)、海表面高度(SSH)以及海水叶绿素浓度a(Chla)等海洋遥感参数,利用单向缓冲区分析法获取以浙江省大陆地区海岸线向海洋方向40 km 宽度的整个浙江省近海海域作为遥感监测区域,如图2所示。

图2 海洋环境要素卫星遥感数据获取区域示意图

1.2 数据来源及预处理

从中国气象科学数据共享服务网(http://cdc.cma.gov.cn/)收集了1999—2008年间中国地面气候标准值月值数据集,该数据集主要来源于各省、市、自治区气候资料处理部门逐月上报的《地面气象记录月报表》的信息化资料。气候数据的原始文件类型为ASCII码文件,包括中国722个基本、基准地面气象观测站的汇总数据。首先,对各气候要素数据进行了缺失数据处理,删除原始文件中含有表示空白或现象未出现的值(32 744~32 744)以及表示缺测值(32 766~32 766)的站点记录;其次,将ASCII 文件数据转换为以各要素标准单位的浮点型数据;然后,提取1999—2008年间浙江省范围内各站点的月均气温、降水量数据;最后,利用“反距离权重内插法”(in⁃verse distance weighted,IDW)对浙江省各气候要素点图层进行了空间插值处理,得到了1999—2008年浙江省月均气温、降水量的栅格图层,如图3 和图4 所示,分别为插值后生成的浙江省2008年6月平均气温及降水量栅格图。

图3 浙江省2008年6月平均气温插值图

图4 浙江省2008年6月平均降水量插值图

使用的遥感参数包括海表面温度、海表面高度以及海水叶绿素浓度。SST 产品数据为由美国物理海洋学分布式档案中(physical oceanography distributed ac⁃tive archive center,PO.DAAC)发布的PFSST 数据集V5版本,V5 版本的PFSST 数据校正了V4 版本中存在的受气溶胶严重影响的区域存在偏差、高纬度海冰区域数据应用受限等问题,产品包括全球4 km、9 km、18 km、54 km 分辨率的每天、5 d、7 d、8 d、月平均的SST 数据,投影方式为圆柱型等距离投影。本文使用的是4 km空间分辨率的全球月平均数据产品。全球范围内可达到的精度为0.3~0.5℃,全球范围内的数据共有8 192×4 096 个像素。SSH 产品数据来自于1992年美国航空航天局(NASA)和法国空间局(CNES)联合发射的TOPEX/Poseidon 卫星及2001 年12 月发射的其后续卫星Jason-1。Jason-1的卫星轨道与TOPEX/Poseidon卫星完全相同,覆盖范围为66°S~66°N,周期为9.915 d。本文使用的是SSH数据的全球月平均海表面异常(SSHA)产品,空间分辨率为1/3°。由法国AVISO (archiving validation and interpretation of satel⁃lite oceanographic data)分发,其中2002 年前的产品由TOPEX/Poseidon 卫星数据反演,而2002 年以后的产品由Jason-1卫星反演。海水叶绿素浓度数据为Sea⁃WiFS的全球月均Chla产品,空间分辨率为9 km。Sea⁃WiFS 是美国国家宇航局于1997 年9 月发射的海洋水色卫星(SeaStar)携带的海洋宽视场扫描仪。Sea⁃WiFS拥有8个探测波段,均在可见光和近红外区,除了第7和第8波段的波段宽度为40 nm外,其余6个波段的波段宽度均为20 nm,它提供有关全球生物光学性质的定量数据。美国航空航天局提供了1998年至今的所有SeaWiFS卫星的Chla产品数据下载。

2 研究方法

2.1 基于环境影响要素的霍乱预测模型

广义线性模型是线性模型的扩展,通过联结函数建立响应变量的数学期望值与线性组合的预测变量之间的关系,其特点是不强行改变数据的自然度量,数据可以具有非线性和非恒定方差结构。研究利用广义线性模型的方法建立浙江省霍乱发病数与气候环境要素以及海洋环境要素的定量关系模型来进行霍乱预测。由于环境要素对于霍乱发病的影响还具有一定的滞后性,选取当月以及一个月前的降水量、气温、海表面温度、海表面高度、海水叶绿素浓度共10个环境因子作为模型的指示因子,建立浙江省月发病数的预测模型如下[5]:

式中,Cholt为第t月份霍乱发病数的期望值;SSTt和SSTt-1分别为第t月份和t-1 月份海表面温度;SSHt和SSHt-1分别为第t月份和t-1 月份海表面高度;OCCt和OCCt-1为第t月份和t-1 月份的海水叶绿素浓度;Raint和Raint-1为第t月份和t-1 月份的平均降水量;Temt和Temt-1为第t月份和t-1月份的平均气温;a0为常量;a1…a10为各预测变量的系数。

浙江省的霍乱发病数据是呈泊松分布,因此,利用自然对数函数作为联接函数,上式可以转化为[4]

2.2 基于宏观环境-SIR构架的霍乱预测改进模型

新增霍乱病例感染的途径主要有2 种:一是通过自然水体环境的传播(即一次传播),这主要是由各水文、气候等环境要素所决定;另一种是人-人传播(即二次传播),主要通过饮食被已感染人群粪便、分泌物等污染的水源或者食物而感染,许多群体性霍乱疫情的爆发都是由二次传播所引起的。因此,在建立霍乱预测模型时,不仅要考虑自然环境要素的影响,还需考虑已感染患者对霍乱发病的影响。宏观环境-SIR就是基于这一传播过程设计的传染病预测建模构架[6]。

单位时间内新增感染者的数量由已感染人群和环境因子共同决定。由于部分患者在经过一段时间治愈后将在已感染人群中移除,假设只有一个月以内的新增患者对当前霍乱发病有影响,即Cholt-1的影响,则t时刻新增霍乱病例数可表示为:

式中,f(Cholt-1)为t-1 时刻霍乱感染者数量对新增霍乱病例的影响;g(MarcoEnvi)为环境因子对新增霍乱病例的影响。

我们用以自然数为底数,环境因子之间的线性组合为指数的函数用来表示环境因子对霍乱发病的影响g(MarcoEnvi),可表示为:

将式(1)代入式(2),得到的考虑二次传播后的基于宏观环境-SIR构架的霍乱预测改进模型可表示为:

由于Cholt与Cholt-1是以感染率为系数的线性关系,因此,模型中f()函数应该为自然对数函数,则预测模型可表示为[5]:

式中,采用log(Cholt-1+1)而不是log(Cholt-1)来表示一个月前霍乱发病数的自然对数函数f(Cholt-1),是因为自然对数函数的定义域需大于0。

3 结果与分析

3.1 预测模型参数估计

利用1999—2007年的浙江省霍乱月发病数以及提取的当月以及一个月前的降水量、气温、海表面温度、海表面高度、海水叶绿素浓度的值作为两个预测模型的样本数据,采用最大似然估计法分别对基于环境影响要素的霍乱预测模型和基于宏观环境-SIR构架的霍乱预测改进模型进行优化拟合,得到的模型参数估计结果分别如表1和表2所示。

表1 基于环境要素的霍乱预测模型参数估计

表2 基于宏观环境-SIR构架的霍乱预测改进模型参数估计

以0.05 作为模型各预测变量拒绝假设检验的阈值,则进入基于环境要素的霍乱预测模型的预测变量有前一个月的海表面温度、当月的海表面高度、当月和前一个月的海水叶绿素浓度、前一个月的降水量、当月和前一个月气温等7 个变量,因此,基于环境要素的霍乱预测模型可以表示为:

进入基于宏观环境-SIR构架的霍乱预测改进模型的预测变量有当月和前一个月的海表面温度,当月和前一个月的海表面高度,当月和前一个月的海水叶绿素浓度,当月和前一个月气温,以及前一个月霍乱发病数等9个变量,改进后的预测模型可以表示为:

3.2 模型评价

将1999—2007年各月的模型变量值分别代入基于环境要素的霍乱预测模型以及基于宏观环境-SIR构架的霍乱预测改进模型中,得到模型拟合预测值曲线与观测值曲线的对比如图5、6所示。两个模型预测值的动态趋势与实际观测值基本一致,但是,基于环境要素的霍乱预测模型在霍乱流行期的预测值普遍要小于实际观测值,模型的拟合优度R2只有0.16;而基于宏观环境-SIR构架的霍乱预测改进模型由于考虑了已感染人群对霍乱二次传播的影响,模型拟合优度R2提高到0.84,模型的拟合效果要远远好于前者,尤其是在2001—2005年两次霍乱暴发的小高峰时期,与实际观测值十分接近,但是总体上存在过估计现象,即预测结果略高于实际观测值。

图5 基于环境要素的霍乱预测模型拟合值与实际观测值对比

图6 基于宏观环境-SIR构架的霍乱预测改进模型拟合值与实际观测值对比

分别利用赤池信息量(akaike information criteri⁃on,AIC)和贝叶斯信息量(bayesian information crite⁃rion,BIC)两个统计量来定量比较两个预测模型的拟合效果,在回归模型中,这两个值都是越小越好。计算结果如表3所示,基于宏观环境-SIR构架的霍乱预测改进模型的两个统计量的值都要小于完全基于环境要素的预测模型,表明基于宏观环境-SIR构架的霍乱预测改进模型拟合效果要更好。

表3 两个模型AIC及BIC统计量对比

3.3 精度验证

分别利用完全基于环境要素的预测模型(模型1)和基于宏观环境-SIR构架的霍乱预测改进模型(模型2)对2008年浙江省各月的霍乱发病数进行预测,得到的预测结果值与实际值对比如图7所示。

图7 模型预测值与实际值的时序分布对比

2008 年浙江省霍乱发病数总体比往年要少,1~5 月份都没有霍乱病例,首例霍乱病例发病时间在6 月份,这与考虑二次传播的模型预测结果一致,而基于环境要素的模型所预测的首例病例发病时间为5月份,比实际情况提前了一个月。在所有的月份里,两个模型的单月预测值与实际值的绝对误差都小于3,预测结果与实际观测值都比较接近,月发病数的实际值都落入预测值的95%置信区间内,且累计预测值绝对误差分别为15 和13,表明两个模型的预测效果比较可靠,基于宏观环境-SIR构架的霍乱预测改进模型效果要略好于完全基于环境要素的预测模型。

研究同时使用均方根误差(RMSE)定量分析两个模型对浙江省2008年各月霍乱发病数的预测精度,计算公式如式(9)所示。

式中,̂ 与yi分别为第i个月的模型预测霍乱发病数与实际霍乱发病数;为实际霍乱发病数的均值;n为验证样本的数量。结果表明完全基于环境要素的预测模型RMSE 为1.8,基于宏观环境-SIR 构架的霍乱预测改进模型的RMSE 为1.7,基于宏观环境-SIR 构架的霍乱预测改进模型要比完全基于环境要素的模型预测精度略高。

4 结 论

利用空间大数据研究了环境要素对霍乱疫情的影响机制,分析了沿海地区影响霍乱发病的主要气象和海洋环境要素,并以浙江省为实验区基于海洋遥感参数以及气温和降水量等环境影响要素建立了浙江省霍乱预测模型。同时考虑霍乱的二次传播性,借鉴宏观环境-SIR 构架的思想,在原模型中加入前一个月的霍乱发病数作为预测变量,建立了基于宏观环境-SIR 构架的霍乱预测改进模型。结果表明海洋环境参数对浙江省霍乱发病数有显著的影响,且具有一定的滞后性,利用拟合优度指标对两个模型分别进行评价的结果表明基于环境要素的霍乱预测模型在霍乱流行期的预测值普遍小于实际观测值,模型的拟合优度R2只有0.16,而基于宏观环境-SIR构架的霍乱预测改进模型由于考虑了已感染人群对霍乱二次传播的影响,模型拟合优度R2提高到0.84,模型的拟合效果要远远好于前者。利用建立的预测模型对2008 年浙江省霍乱月发病数进行预测,并用实际发病数进行结果验证,结果也表明基于宏观环境-SIR构架的霍乱预测改进模型效果要优于完全基于环境要素的预测模型。

猜你喜欢
环境要素构架宏观
建筑安装造价控制核心要点构架
急诊PCI治疗急性心肌梗死的护理探索构架
宏观审慎框架下货币政策工具的选择
高可靠全平台ICT超融合云构架的设计与实现
略论意象间的主体构架
会计视角的管理会计学管理属性探析
宏观与政策
金融的生态特性、环境要素与法律环境
基于组织生态理论的科技企业创业环境构成要素模型研究
宏观审慎金融监管及发达国家相关政策研究