基于RS的新疆自治区高温人口暴露研究

2023-07-05 17:47高可攀
科技风 2023年18期
关键词:随机森林

摘 要:根据近年来新疆气候公报可知,新疆的平均气温正在逐年升高,尤其是夏季的持续性高温对新疆的人口健康和经济发展造成了损害。本文以新疆为研究区,在GEE平台上利用MODIS产品和高程数据通过随机森林算法进行回归预测,得出2022年夏季新疆近地表气温。将格网尺度的近地表气温栅格数据和人口数量栅格数据相结合,分析新疆2022年高温人口暴露的空间分布特征。结果表明:(1)利用随机森林算法预测近地表气温,预测的结果精度较高,RMSE和R2分别达到了2.16℃和0.86;(2)高温人口暴露空间分布与人口密度空间分布呈现高度的一致性,即人口密度高的区域,高温人口暴露程度也相对较高;(3)新疆高温人口暴露的中高暴露区大都集中在城市群,如乌鲁木齐市、喀什市、和田市等。克孜勒苏柯尔克孜自治州、伊犁哈萨克自治州等地区存在人口集中分布在高温区的现象,高温对人的实际危害较为严重。

关键词:随机森林;近地表气温;高温人口暴露;GEE平台

2022年夏季,全球大范围再受高温侵袭,包括中国在内的多数北半球国家出现了40℃以上的极端高温,中国多地最高气温突破历史值。极端高温给人类健康带来了严重的负面影响。已有研究表明,全球范围内的高温事件发生频次、强度、持续时间、涉及范围都在不断地增加[1],这增加了人类受高温迫害的风险。

以往关于温度的研究大多采用覆盖度有限的观测数据或时间序列较短的瞬时遥感数据,无法解决新疆高寒和荒漠等人迹罕至区域地温数据缺失的问题。近年来,随着遥感和地理信息系统(GIS)技术的迅速发展,采用遥感(RS)和GIS技术结合估算人口及社会经济数据的空间化是目前最为重要的手段之一[2]。谷歌地球引擎(GEE)平台通过专用云存储提供大量的MODIS遙感影像,可以处理大范围覆盖的长时间序列影像[3]。因此,本文将在GEE平台上,结合新疆气象站点提供的气温数据,开展新疆高温人口暴露度的研究。

1 数据和方法

1.1 研究区概况

新疆自治区地处欧亚大陆腹地,地理坐标为73°20′E~96°25′E、34°15′N~49°10′N,该区域深居内陆、距海遥远,加之受高山阻拦的影响,来自海洋的水汽很难到达,因此形成了以大陆性干旱气候为主的气候类型[4]。新疆地域辽阔、地形复杂,气象观测站点稀少且分布不均。

除此之外,地形地貌还对新疆自治区的人口分布格局造成了影响,其人口分布十分不均衡。根据研究表明,新疆人口主要分布在绿洲及绿洲边缘地区,绿洲面积占新疆总面积4.2%的大小,居住着全疆95%以上的人口[5]。

新疆作为温度变化显著、人口众多的自治区,研究分析该地的高温人口暴露情况,对于该地区的高温危害监测与治理具有重要意义。

1.2 数据

1.2.1 遥感数据

本文使用的遥感数据包括MODIS产品和ASTER GDEM数据,均来自GoogleEarthEngine云平台(http://earthengine.google.com/)。MODIS产品的时间范围选取2022年6~8月,具体包括:每日地表温度数据(MOD11A1),空间分辨率为1km×1km;归一化植被指数(MOD13A2),空间分辨率为1km×1km;地表反照率数据(MCD43A4),空间分辨率为500m×500m。ASTER GDEM数据的时间范围为2022年6~8月,数据的水平和垂直精度均为7~50m,水平分辨率为30m。

1.2.2 其他数据

人口数量数据和人口密度数据均来自Worldpop网站(https://hub.worldpop.org/),本文采用2020年格网化人口计数和密度数据集,分辨率为100m×100m。

新疆自治区近地表气温数据来自国家气象科学数据中心(https://data.cma.cn/),本文选取2022年6~8月新疆近地表日最高气温。

2 研究方法

2.1 随机森林反演近地表气温

本文的自变量为地表温度数据(LST)、归一化植被指数(NDVI)、地表反照率数据(Albedo)、高程数据(Altitude),随机森林算法过程总结为如下步骤:(1)将自变量作为数据集D输入;(2)将数据集划分为训练集和测试集;(3)从数据集D中随机选取多组训练样本D1,D2……Di作为根节点,分裂训练多棵回归树;(4)依据均方误差最小原则对回归树中的节点进行分裂至无法再进一步分裂,重复该操作生成多棵回归树;(5)随机森林预测气温的结果为每棵决策树通过简单平均法得到的结果;(6)精度评价。

2.2 高温人口暴露评估

2.2.1 基于人口暴露强度的高温暴露风险评估

根据Kousa等[6]提出的人口暴露风险评估模型,本文认为,人口暴露强度的大小来自人口密度和高温风险在时空上的重叠,即通过格网尺度的人口密度与气温之积作为指标,来评价新疆自治区高温人口暴露情况。计算公式如下:

PEi=pdiTi(1)

PEi代表第i个单元格内高温人口暴露度强度,Ti代表第i个单元格内的平均温度(此处温度的选取为每月的月均气温),pdi代表i个单元格内各时段的人口密度。

2.2.2 不同温度下的人口变化情况

按照月份进行分类统计,将一个月内出现在某像元上的最高温度设为该像元的月最高温,统计出现在该温度下的人口数量占总人口的比重,从而更好地反映高温对人的影响。具体计算方法如下:

propj=∑ni=1popijpop(2)

其中propj代表在温度j下的人口占总人口的比例,popij代表在温度j下格网i中的总人口数目,n代表满足温度为j的格网总数,pop代表新疆总

人口数目。

2.2.3 基于人口加权的高温暴露风险评估

通过人口加权的高温人口暴露模型[7],能更好地反映高温对人群的实际影响,具体计算方法如下:

PTi=∑nj=1(TijPij)/POPi(2)

其中PTi代表第i个地级市的人口加权气温,Tij代表第i个地级市的第j个单元格内的平均气温,Pij代表第i个县地级市的第j个单元格内的人口数量,POPi代表第i个地级市的总人口数量。人口加权气温与平均气温的差异度计算方法如下:

δi=(PTi-Ti)/Ti×100%(3)

其中δi为两种气温算法的差异度,PTi为第i个县的加权人口气温,Ti为第i个地级市的平均气温。

3 结果分析

3.1 气温估算精度评价

选择2022年6~8月气象站点提供的新疆月平均气温进行近地表气温预测精度验证,其中R2越大,RMSE越小,表明预测值与实测值的偏离程度小,模型模拟的效果就相对较好。根据随机森林算法预测气温精度(图1)可知,决定系数R2为0.86,均方根误差RMSE为2.16℃,总体精度较高,该随机森林模型可运用于新疆自治区的近地表气温预测。

3.2 基于人口暴露强度的高温人口暴露评估

将2022年夏季新疆高温人口暴露风险空间分布按照暴露严重程度划分为五级,依次为无风险、低风险、中风险、高风险,重度风险。根据高温人口暴露风险空间分布可得出结论,新疆自治区夏季不同时段人口暴露空间分布大致相似,高温暴露风险高的区域主要集中在几个城市群,如喀什市、和田市;新疆天山附近的乌鲁木齐市同样具有高暴露风险。

3.3 不同温度下的人口变化情况分析

根据2022年新疆夏季暴露于某一温度的累计人口占比(图2)可以看出,整个新疆6月份暴露在30℃以上的人口占总人口比重的52.49%,暴露在35℃以上的人口占总人口数量的5.18%,超过一半的人口暴露在高温下;7月份暴露在30℃以上的人口占总人口比重的80.44%,暴露在35℃以上的人口占总人口数量的16.88%,绝大多数人口暴露在高温下,高温对人的影响非常大;8月份暴露在30℃以上的人口占总人口比重的42.38%,暴露在35℃以上的人口占总人口数量的1.03%,将近一半的人口暴露在高温下,但是暴露在极端高温下的人口比重明显下降。

3.4 基于人口加权的高温人口暴露评估

下表给出了2022年新疆夏季典型区域人口加权温度与随机森林模拟出的气温差异度超过10%的区域,偏差较大说明存在人口集中分布在高温地区或者低温地区的现象。新疆6~8月差异度分别为1.4%、2.23%、4.54%。由此可以看出,整个夏季新疆的人口加权温度都高于实际近地表气温,说明新疆自治区人口集中分布在高温地区,新疆的高温对人的实际危害情况较为严重。

4 结论与讨论

本文通过随机森林算法计算了新疆近地表气温,并通过遥感的手段将气溫进行空间化。根据人口暴露强度、不同温度下的人口变化指标、人口加权的高温暴露程度这三个指标,分析新疆高温人口暴露风险,结论如下:

(1)采用随机森林模型反演近地表气温的方法可以弥补部分地面气象站气温数据缺少的不足,同时证明了随机森林在遥感数据处理研究中的可利用性和优越性。新疆夏季三个月气温≥35℃的地区面积共计约140.77万平方千米,占新疆总面积的84.8%,说明新疆受高温侵袭十分严重。

(2)新疆高温人口暴露的中高风险区域主要集中几个城市群,如喀什市、和田市、乌鲁木齐市等,这几个城市群也是人口集中分布的区域,高温人口暴露风险与人口密度分布存在高度的正相关性,即人口越密集,高温人口暴露风险程度越高。

(3)采用人口加权高温监测指标能够更合理地评估人口暴露于高温的程度。2022年6~8月,新疆分别有11、16和15个地区存在人口集中分布在高温地区的现象。尤其是克孜勒苏柯尔克孜自治州、伊犁哈萨克自治州、喀什地区和博尔塔拉蒙古自治州这四个区域存在极为严重的人口处于高温区的现象。

参考文献:

[1]CowanT,PurichA,PerkinsS,et al.More Frequent,Longer,and Hotter Heat Waves for Australia in the TwentyFirst Century[J].Journal of Climate,2014,27(15):58515871.

[2]杨眉,王世新,周艺,等.DMSP/OLS夜间灯光数据应用研究综述[J].遥感技术与应用,2011,26(1):4551.

[3]邹业斌,柴明堂,杨娟,等.基于GEE的干旱区流域湿地水体时空动态变化特征分析——以宁夏平原为例[J].测绘通报,2023,551(02):914.

[4]杨振,雷军,段祖亮,等.新疆人口的空间分布特征[J].地理研究,2016,35(12):23332346.

[5]李宗英.1990—2017年新疆人口的时空动态及影响因素研究[D].新疆学,2021.

[6]Kousa A,Kukkonen J,Karppinen A,et al.A model for evaluating the population exposure to ambient air pollution in an urban area.Atmospheric Environment,2002,36(13):21092119.

[7]伏晴艳,阚海东.城市大气污染健康危险度评价的方法,第四讲:大气污染的暴露评价,第二节:大气扩散模型及人口加权的大气污染暴露评价(续四).环境与健康杂志,2004,21(6):414416.

作者简介:高可攀(2002— ),女,江苏靖江人,本科在读,研究方向:遥感科学与技术。

猜你喜欢
随机森林
随机森林算法在中药指纹图谱中的应用:以不同品牌夏桑菊颗粒指纹图谱分析为例
基于随机森林的登革热时空扩散影响因子等级体系挖掘
基于随机森林的HTTP异常检测
个人信用评分模型比较数据挖掘分析
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
基于奇异熵和随机森林的人脸识别
基于随机森林算法的B2B客户分级系统的设计