孟庆岩,谷艳春,郝丽春,胡蝶,张颖,张琳琳
1.中国科学院遥感与数字地球研究所,北京 100101
2.福州大学福建省空间信息工程研究中心,福州 350000
3.海南省地球观测重点实验室,海南三亚 572029
4.河南理工大学测绘与国土信息工程学院,河南焦作 454000
5.中国科学院大学资源与环境学院,北京 100049
数据库(集)基本信息简介
数据库(集)名称 三亚市热异常遥感监测数据集数据作者 孟庆岩、谷艳春、郝丽春、胡蝶、张颖、张琳琳数据通信作者 孟庆岩(mengqy@radi.ac.cn)数据时间范围 2008-2017年地理区域 三亚市(18°09′34″-18°37′27″N、108°56′30″-109°48′28″E)空间分辨率Landsat 5:30/120 m Landsat 7:30/60 m Landsat 8:30/100 m数据量 4.05 MB数据格式 *.vsdx,*.jpg,*.png, *.py, *.shp数据服务系统网址 http://www.sciencedb.cn/dataSet/handle/700基金项目海南省自然科学基金(417219);海南省重大科技计划(ZDKJ2016021);四川省科技计划(2018JZ0054);海南省重大科技计划(ZDKJ2017009)。数据库(集)组成本数据集主要包括7个文件夹,每个文件夹的内含文件格式和命名方式如下:1.封面图文件夹:内含命名为封面图*.jpg格式的数据;2.三亚市边界图文件夹示意图:内含格式为*.jpg的三亚市边界示意图数据;
数据库(集)组成3.数据处理流程图文件夹:内含命名为数据处理流程图*.vsdx格式的数据;4.2008-2017年三亚市年度热异常提取结果图文件夹:内含2008-2017年*.png格式的逐年三亚市年度热异常提取结果图;5.2008-2017年三亚市年度热异常提取结果元数据文件夹:内含2008-2017年*.shp格式的逐年三亚市年度热异常提取结果元数据;6.代码文件夹:内含本数据集处理流程用到的*.py格式代码;7.三亚市矢量边界文件夹:内含*.shp格式的三亚市边界数据。
热异常是指由自然因素和人类活动中的热排放导致环境温度异常升高的现象[1]。城镇化进程的快速推进可带动经济发展,但同时也对水资源、局部气候、生存环境等产生了一系列负面效应。据统计,近100 a来,全球的年平均气温上升了0.7-1℃,而大城市的平均气温则上升了2-3℃,北京、上海、东京等世界性大都市的年均气温比郊区高出2℃,夏季高出6℃左右[2]。与物质污染带给环境的影响不同的是,物质污染是由污染物引起的,可以通过具体方法和措施得到控制,而热异常则不同,它主要来源于热源,有能源消耗则会产生热异常[3]。因此,热异常是不可避免的。针对此类现象,国内外学者已经做了大量探索和研究,例如Wu和Chen等通过监测不同地区的核电站热流排放情况评估热异常强度和对周边环境的影响[4-5]。Liu和Xia等基于热异常产品,通过利用不同方式提取工业热源[6-7];Zhang等利用Landsat数据对首钢搬迁前后的热环境进行探索和分析[8]。还有一部分学者利用城市热岛强度与气温间的关系评估城市热异常[9-10]。可见,热异常已被人们广泛关注,并成为研究热点。但以往关于热异常的大量文献多针对工业城市,或有工业污染的地方,针对非工业城市的热异常研究还较少。而热异常不仅存在于工业城市,还存在于非工业城市。因此,针对非工业城市,如何有效快速提取热异常区,如何缓解改善热异常具有重要研究意义。
三亚市作为我国唯一一个热带滨海旅游城市,其生态环境保护尤显重要。恰逢海南省推进“国际旅游岛”建设,作为海南旅游发展龙头的三亚正以国际化标准致力于打造“一港两地”的国际性滨海旅游城市。但伴随着三亚市城镇化的不断发展,城市热异常对城市环境的影响日益突出。因此,针对三亚城市建设和区域、环境、植被等特点,开展具有针对性的城市热异常研究,对三亚城市建设、规划布局、环境保护均具有重要意义。
综上,针对如何监测三亚市热异常区,并提取热异常区等问题,本文基于长时间序列的Landsat数据,利用辐射方程传输法获取地表温度信息,结合改进的箱线图法提取相应高温异常区,通过统计分析高温异常区的年度出现频率,得到城市热异常区。该方法不仅能够准确大面积获取城市热异常区,且相较于其他方法,可以有效避免潜在热异常的影响。
三亚市位于北纬 18°09′34″-18°37′27″,东经 108°56′30″-109°48′28″,地处海南省最南端,主要以旅游业和农业为主,是海南省第二大城市。作为海南省最重要的旅游城市之一,其城市环境一直是广大群众关注的热点。但随着城市的不断发展与扩张,城市热异常现象日益加剧,因此,选取三亚市市辖区作为研究区,研究示意图如图1所示。
图1 三亚市边界示意图
本文以2008-2017年间所有云量小于30%的Landsat 5、Landsat 7和Landsat 8数据为主要数据源(获取网址:https://glovis.usgs.gov)。本文温度反演所用到的波段及其空间分辨率如表1所示,其中,因Band11运行出现问题文中Landsat 8温度反演用到的是波段10。表2为本文所用影像的具体时间信息。
表1 温度反演所用波段信息
表2 数据集所用影像日期
首先对Landsat数据进行拼接、裁剪、重投影等数据预处理。其中Landsat 7 ETM+影像因有条带,需在数据预处理基础上再进行去条带处理。其次用辐射方程传输法反演地表温度和改进的箱线图法提取高温异常区,得到高温异常区空间分布图。最后,为避免漏判现象,借鉴Liu等[6]提取工业热源的思路,以频率大于60%为热异常区的标准统计分析热异常出现的频率,得到高温异常区频率空间分布图。同时,统计城市热异常区的总面积,具体数据处理流程如图2所示。
图2 数据处理流程图
1.3.1 地表温度反演
基于Landsat卫星影像,根据Landsat数据热红外波段的增益值与偏置值计算相应表观辐射亮度值;然后,利用影像植被覆盖度估算地表比辐射率;最后,根据Planck反函数和Landsat预设的定标系数计算地表温度。具体实现如下:
(1)表观辐亮度计算
表观辐亮度计算是将影像像元灰度值转换成相应热辐射强度的过程。利用 ENVI软件中的辐射定标(Radiometric Calibration)工具将影像的像元灰度值转换为辐射亮度值。
(2)地表比辐射率估算
地表比辐射率表征地面物体的电磁波辐射的一种能力。基于影像的近红外波段和红光波段,根据公式(1)计算归一化植被指数NDVI[11]。
式中:TMNIR为影像的近红外波段反射率;TMRed为影像的红光波段反射率。
其次,利用影像植被覆盖度估算地表比辐射率。由于地表物质结构具有差异性,因此针对不同地物类型,其相应的地表比辐射率计算方式也不同。大致可分为3种类型:水体、城镇和自然表面。而水体像元的地表比辐射率很高,与黑体的比辐射率较为相似,因此,在估算水体比辐射率时常被赋值为 0.995,自然表面和城镇像元的地表比辐射率估算分别根据公式(2)和公式(3)计算[12-14]:
式中:eSurface代表自然表面像元的地表比辐射率;eBuilding代表城镇像元的地表比辐射率;PVege代表植被覆盖度,计算方法如公式(4)所示[15-16]:
式中:NDVI是影像的归一化植被指数,NDVIVege是影像中纯植被像元的NDVI值,NDVISoil是影像中纯土壤像元的NDVI值。当某个像元的NDVI大于0.70时,PVege取值为1;当NDVI小于0.05时,PVege取值为0;当NDVI介于0.05-0.7之间时,则分别将NDVIVege和NDVISoil取值0.70和0.05,并利用上式估算影像的植被覆盖度。
(3)地表温度计算
基于热红外波段的表观辐亮度和地表比辐射率计算结果,根据辐射传输方程反推地表热辐射亮度,如公式(5)所示:
式中:B(TSens)是地表热辐射亮度;L是行星亮度温度值;L↑和L↓分别是大气上行辐射和大气下行辐射,可根据Landsat卫星过境时间、兴趣区中心经纬度、大气模式及传感器类型等获得,具体参数可通过NASA相关网页直接获得(http://atmcorr.gsfc.nasa.gov/);τ为大气路径透过率,可由NASA相关网页查询获取;ε为地表比辐射率。
利用Plank反函数结合Landsat预设的定标常数K1和K2计算地表真实温度[17-18],如公式(6)所示:
式中:TSurface是地表真实温度;K1和K2为Landsat预设的定标常数,可从影像头文件中获取。
为避免多时相数据带来的影响,将多时相地表温度数据逐像元进行归一化处理,具体实现如公式(7)所示:
式中:Image代表归一化处理后的影像像元值,像元值处于0到1之间;X代表影像地表温度值;Xmax和Xmin分别代表影像地表温度的最大值与最小值。
1.3.2 基于改进的箱线图法提取热异常
改进的箱线图法共有5个统计量,分别为上下四分位数、上下非异常值截距线及中位数。其中,上下非异常值截距线用于区分正常值与异常值,处于非异常值截距线之内的数据为正常值,否则为异常值。该方法与统计学中最常见的箱线图法不同之处主要有两点:一是引入鲍利系数,将鲍利系数以“1”的形式作为样本数据的偏度调控乘数。当数据集是正态分布时,鲍利系数集中在0附近,当数据是右偏态分布时,鲍利系数取值为1;当数据是左偏态时,鲍利系数取值为-1。二是利用半四分位距计算非异常值截距线,可以更好地适用于具有偏态的数据[19]。该方法的具体实现如下:
(1)获取上下四分位数以及半四分位距
通过IDL程序逐像元获取地表温度数据,然后利用SPSS软件获取相应数据的上下四分位数和中位数,即将数据从小到大排序后,分别处于25%、50%和75%位置的数值。
之后,基于根据四分位数相应的数值,利用EXCEL软件计算上下半四分位距,如公式(8)和公式(9)所示[20]:
式中:SIQRdown和SIQRup分别为箱体长度的上下界限,即改进的箱线图的上下半四分位距;Q1、Q2和Q3分别为样本数据的上四分位数、中位数和下四分位数。
(2)计算非异常值截距线
非异常值截距线包括非异常最大值截距线和非异常最小值截距线,用来判定样本数据是否为异常值。用非异常最大值截距线作为是否是热异常值的判断依据,若样本数据超出此值,则判定其为热异常值,即可能存在热异常现象。样本数据偏离极端异常值截距线外侧越远,说明其热异常现象就越严重。其实现过程如公式(10)、公式(11)和公式(12)所示:
式中:Bc是鲍利系数,介于-1到1之间;SIQRup和SIQRdowm分别为箱体的上下半四分位距。
式中:fup和fdown分别为箱体的非异常最大值截距线和非异常最小值截距线,当样本数据集中某一数据大于fup时,则归为热异常值;当样本数据集中某一数据小于fdown时,则归为冷异常值。
最后,利用ArcGIS软件逐像元筛选大于非异常最大值截距线的值。
1.3.3 基于热异常频率提取热异常区
热异常区的地表温度往往高于周边地表温度,形成局部热岛现象,且其出现的频率一般大于由其他因素引起的热异常出现的频率。因此,基于热异常提取结果,统计分析年度热异常区出现的频率。为避免漏判现象,当某一热异常区出现的频率大于60%时,则判定为城市热异常区,具体实现如公式(13)所示:
式中:flocal代表热异常出现的频率;ilocal代表局部某一热异常区一年出现的次数;nlocal代表一年中整体热异常区出现的总次数。
为进一步探究城市热异常区的分布范围,统计分析2008-2017年热异常出现的频率,将提取频率大于60%的区域作为这10年的城市热异常区,具体实现如公式(14)所示:
式中:fglobal代表10年中热异常出现的频率;iglobal代表局部某一热异常区10年中出现的总次数;nglobal代表10年中整体热异常区出现的总次数,即取值为10。
使用上述步骤完成2008-2017年三亚热异常空间分布产品数据集,图3是三亚市10年热异常区空间分布产品示例图。
图3 2008-2017年三亚市热异常区空间分布结果图
本数据集通过以下几方面进行质量控制:
为验证方法有效性,利用Google地球可以查看往年影像的优势进行统计2008-2017年逐年工厂区总个数和改进的箱线图法识别的工厂区个数及工厂区个数,以此间接验证方法的可靠性。具体方法为:首先,在Google地球上逐年圈出工厂区并统计个数;其次,把改进的箱线图法识别的热异常转为kmz格式数据,加载到Google地球里并逐年统计其在工厂区的个数;最后,一个工厂区包含一个或多个工厂,将改进的箱线图法识别出的工厂统计到所属工厂区,统计工厂区个数,该工厂区个数与Google地球里圈出的工厂区个数之比为精度。由于有些工厂停产或排放的热量不足以达到热异常的范围,或某些人为原因致使小领域温度达到热异常范围,以及人工判读工厂的误差,都会影响最终精度,其具体逐年精度如表3。
表3 2008-2017年三亚市热异常区提取精度表
本数据集以三亚市为研究区,基于长时间序列的Landsat数据,结合改进的箱线图法进行热异常提取的成果可为城市规划与建设和生态质量评价等提供数据产品服务,为三亚市的居住环境舒适度提供参考标准。
此外,通过利用遥感技术对城市热异常进行监测和评价,可有助于减轻城市发展对环境的压力,促进环境保护和治理,为三亚国际岛建设提供技术参考。该数据集的长时间序列城市热异常产品和技术也可在其他城市中进行推广和应用。