基于Maxent模型和GIS的马缨丹在中国的适生区预测

2020-11-25 08:55张华纬阎波杰李志鹏
生态与农村环境学报 2020年11期
关键词:环境变量适生区降水量

张华纬,赵 健,阎波杰,邹 杰,李志鹏②

(1.福州大学空间数据挖掘与信息共享教育部重点实验室,福建 福州 350108;2.福建省农业科学院数字农业研究所,福建 福州 350001;3.闽江学院海洋学院,福建 福州 350108)

马缨丹(Lantanacamara)是世界十大恶性杂草之一[1],已入侵超过50个国家。马缨丹主要生长在高温潮湿且阳光充足区域,对土肥条件要求较低[2],繁殖能力强,能快速形成高密度的片状覆盖区,植株产生的化感物质可起到抑制其他植物生长的作用,易形成单优势群落,对入侵地区动植物生存繁衍构成巨大威胁,严重破坏当地生态系统结构[1];同时,马缨丹能直接或间接导致农田、果园和牧草减产,损害农林业及畜牧业发展,造成农业经济损失。马缨丹目前广泛分布于福建、广东、广西、云南、海南、四川和台湾等地,并有继续扩散的趋势[3],于2010年被列入《中国第二批外来入侵物种名单》[4],也被世界自然保护联盟(International Union for Conservation of Nature, IUCN)列为世界上“100种最具有破坏力的入侵物种”之一。马缨丹的危害极为严重,预测和模拟其潜在分布区可有效评估其入侵趋势及范围,为建立入侵植物预警机制,提高快速响应和防控管理能力提供科学依据[5]。

对外来入侵物种适生性进行预测分析,主要采用的模型有BIOCLIM、CLIMEX、遗传算法(genetic algorithm for rule-set production,GARP)和最大熵(maximum entropy,MaxEnt)模型等[6]。MaxEnt模型利用最大熵方法对物种存在数据的地理分布进行建模,是一种利用已知部分信息对未知信息进行预测或推断的通用方法[7-8],如基于MaxEnt模型预测水葫芦[9]和豚草[10]等入侵植物潜在分布区。与CLIMEX和GARP等模型相比,MaxEnt模型不仅考虑气候因子对物种潜在分布的影响,同时还考虑海拔、地形和土地利用类型等非气候因素的影响,能较精确预测大部分外来入侵生物潜在分布区,预测结果与物种实际分布情况最接近[11]。现阶段,MaxEnt模型是与GIS结合效果最好且具有较高预测精度的生态位模型[6]。

目前,对马缨丹的研究主要包括植物生物学特征、化感作用和生物防治等方面[12],而对适生区方面研究较少。李嘉昊等[13]对海南省主要陆生入侵植物适生性进行研究,但研究范围较小,未能覆盖国内已知的马缨丹分布范围。LÜI[14]采用层次分析法(analytic hierarchy process,AHP)和模糊决策法对中国马缨丹潜在分布区进行预测,但AHP法是定量风险分析技术和方法,不能进行适生区的评级和可视化[15]。MaxEnt模型考虑了马缨丹生存所需的气候、海拔、温度、降雨量和土地利用类型等环境因素,可以提高适生区预测的准确性和真实性[16]。以马缨丹分布和环境因素数据为数据源,筛选对马缨丹生存影响较大的环境因素,基于MaxEnt模型和地理信息技术对马缨丹在中国的适生区进行预测,并结合ArcGIS 10.3软件分析其空间分布规律,为我国马缨丹入侵监控和防治管理提供科学依据。

1 材料与方法

1.1 马缨丹分布点数据

马缨丹分布点数据主要来源于中国外来入侵物种数据库(http:∥www.chinaias.cn/)、全球生物多样性信息交换所(https:∥www.gbif.org/)、中国数字植物标本馆(http:∥www.cvh.ac.cn/)和公开发表的相关文献,并通过GPSspg网站(http:∥www.gpsspg.com/maps.htm)获取分布点经纬度坐标。共获取全国马缨丹分布数据479条,由于数据采集时间和人员不同,使得采集数据可能在采样时间和地点上存在高相似性。采用ArcGIS 10.3软件剔除重复数据,最终获得281条分布数据。马缨丹主要适生区为广东、广西、海南、香港、澳门、贵州、云南和福建,浙江、江西、江苏、安徽、湖南、湖北、重庆和四川等省份也有分布,其他地区分布点极少。

1.2 软件、环境和地理数据

软件:MaxEnt 3.3.3k和ArcGIS 10.3软件。

环境变量数据:从Worldclim世界气候数据库(https:∥www.worldclim.org/)中选择1970—2000年19个生物气候变量:年平均温度(bio1)、平均日较差(bio2)、等温性(bio3)、温度季节性变动系数(bio4)、最热月最高温度(bio5)、最冷月最低温度(bio6)、温度年较差(bio7)、最湿季度平均温度(bio8)、最干季度平均温度(bio9)、最暖季度平均温度(bio10)、最冷季度平均温度(bio11)、多年平均降水量(bio12)、最湿月份降水量(bio13)、最干月份降水量(bio14)、降水量季节性变动系数(bio15)、最湿季度降水量(bio16)、最干季度降水量(bio17)、最暖季度降水量(bio18)和最冷季度降水量(bio19)。2040—2060年未来气候情景由全球气候模型(global climate models,GCMs)生成。未来气候数据在一定程度上取决于假定的大气中温室气体浓度,采用联合国政府间气候变化专门委员会(Intergovernmental Panel on Climate Change,IPCC)的全球耦合模式比较计划第5阶段(Coupled Model Intercomparison Project Phase 5,CMIP5)公布的CCSM4模型预估的RCP2.6情景[17],该情景假设21世纪末全球气温平均升高1 ℃。

除19个生物气候变量外,研究还采用海拔、坡度、坡向和土地利用类型4个变量。海拔数据为2009年美国航空航天局和日本经济产业省(METI)联合推出的数字高程模型,下载自中国科学院计算机网络信息中心地理空间数据云平台(http:∥www.gscloud.cn/)。坡度和坡向图根据数字高程模型采用ArcGIS 10.3软件制作。土地利用类型数据为2015年全国遥感土地利用分类数据,下载自地理国情监测云平台(http:∥www.dsac.cn/DataProduct/Index/200804),采用2008年全国遥感监测土地利用分类体系,分为耕地、林地、草地、水域、建筑用地和未利用地6种。

基础地图数据(中国行政区划数据):1∶6 000万标准中国地图(自然资源部标准地图服务系统,http:∥bzdt.ch.mnr.gov.cn/)。

1.3 研究方法

1.3.1环境变量相关性分析和筛选

为降低环境变量冗余度,提升MaxEnt模型运行速度,采用SPSS 22.0软件中多重共线性检验对相互之间存在一定相关性的环境变量进行筛选[18-19]。当任意2个环境变量之间的Pearson相关系数绝对值>0.8时,比较2个变量在MaxEnt模型中贡献度,保留贡献度较高的环境变量。

根据环境变量之间相关性和贡献度分析结果,选取平均日较差、温度季节性变动系数、最热月份最高温度、最冷月份最低温度、最湿季度平均温度、多年平均降水量、降水量季节性变动系数、高程和土地利用类型12个环境变量对马缨丹适生区分布进行预测(表1)。

表1 环境变量之间多重共线性检验Table 1 Multi-collinearity test among environmental variables

1.3.2MaxEnt模型预测

将筛选后的马缨丹分布数据和环境数据同时导入MaxEnt软件中,随机选择75%的物种分布数据作为训练集,其他25%的分布数据作为测试集[20]。模型预测结果可分为真阳性(模型预测物种存在且实际物种也存在的单元数)、假阳性(模型预测物种存在,但实际物种并不存在的单元数)、真阴性(模型正确预测物种不存在且实际物种也不存在的单元数)和假阴性(模型预测物种不存在,但实际物种存在的单元数)4种,由这4种数据可以计算数据的灵敏度(真阳性率)和特异度(真阴性率)。以“1-特异度”(假阳性率)为横坐标,灵敏度为纵坐标绘制受试者工作特征曲线(receiver operating characteristic curve, ROC曲线),计算曲线下面积(the area under ROC curve, AUC)作为模型预测精度的检验标准。ROC曲线绘制采用MaxEnt 3.3.3k软件。

1.3.3环境变量对适生区的影响

采用刀切法(jackknife)测试各气候条件和地形因素对马缨丹空间分布的重要程度和影响力[21]。具体步骤是运算过程中依次剔除一个环境变量,使用剩余环境变量重新建模,对缺省的环境变量与遗漏误差之间进行相关性分析,确定各环境变量对模型预测结果的影响。如果一个环境变量的缺省导致遗漏误差显著升高,正规化训练增益值(regularized training gain)变大,表明该环境变量对模型预测结果的影响显著[10]。

1.3.4马缨丹适生区等级划分

参照雷军成等[22]的适生区等级划分方法,结合来源文献中对马缨丹分布点发生程度的描述,将利用MaxEnt模型预测得到的马缨丹分布区适生等级分为高适生区(0.5~<1)、中适生区(0.25~<0.5)、低适生区(0.05~<0.25)和非适生区(0~<0.05)4个等级。

2 结果与分析

2.1 MaxEnt模型预测能力验证

MaxEnt模型预测的准确度和可靠性可采用训练集和测试集数据的ROC曲线进行检验(图1)。图1显示,数据集的ROC曲线远离随机预测模型的ROC曲线,且多次重复运行的平均AUC值为0.953,标准差为0.006,明显高于随机预测模型的AUC值(0.5),表明结合现有马缨丹分布数据和筛选后的环境变量,MaxEnt模型能较好预测马缨丹在中国的潜在分布,其预测结果是可靠的。

图1 马缨丹的ROC曲线Fig.1 ROC curve for Lantana camara

2.2 马缨丹适生区与环境变量的关系

采用刀切法分析环境变量对马缨丹适生区的影响。如图2所示,最冷月份最低温度(bio6)正规化训练增益最大,表明各地区最冷月份最低温度对预测马缨丹分布的影响最大,多年平均降水量(bio12)、最干季度降水量(bio17)和温度季节性变动系数(bio4)正规化训练增益值也较高,而最热月份最高温度(bio5)、高程(alt)和土地利用类型(lan)正规化训练增益值较小。对马缨丹分布预测影响最大的环境变量为低温因素,其次为降水量,高温、高程和土地利用类型的影响较小,而坡向(aspect)对马缨丹的分布预测几乎没有影响。因此,对最冷月份最低温、温度季节性变动系数、多年平均降水量和最干季度降水量这4个主要环境变量与马缨丹存在概率的相关性开展研究。

bio2为平均日较差,bio4为温度季节性变动系数,bio5为最热月份最高温度,bio6为最冷月份最低温度,bio8为最湿季度平均温度,bio12为多年平均降水量,bio15为降水量季节性变动系数,bio17为最干季度降水量,bio18为最暖季度降水量,alt为海拔,aspect为坡向,lan为土地利用类型。图2 环境变量对马缨丹在中国分布的重要程度Fig.2 Importance analysis of environmental factors for Lantana camara in China

最冷月份最低温度与马缨丹存在概率的关系见图3。

图3显示,最冷月份最低温度高于5 ℃时,马缨丹存在概率在0.5以上;温度低于5 ℃时,其存在概率急剧下降;温度低于-10 ℃时,其存在概率接近0,无法生存。ZHANG等[23]通过试验发现,马缨丹在温度升高条件下会显著生长,并伴有化感作用,但容易受霜冻、低温的影响。笔者研究结果与之一致。

温度季节性变动系数与马缨丹存在概率的关系见图4。温度季节性变动系数是根据月平均温度与月平均温度标准差的比值,计算某段时间的温度变化量。图4显示,温度季节性变动系数小于600时,马缨丹存在概率在0.5以上,而随着温度季节性变动系数增大,即温差逐渐增大,其存在概率逐渐下降。

图4 温度季节性变动系数与马缨丹存在概率间的关系Fig.4 Relationship between temperature seasonality and presence probability of Lantana camara

多年平均降水量与马缨丹存在概率之间的关系见图5。图5显示,多年平均降水量为1 350~3 000 mm时,马缨丹存在概率大于0.5;多年平均降水量小于1 100 mm时,马缨丹存在概率迅速减小;多年平均降水量小于500 mm时,其存在概率接近0。马缨丹存在概率随最干季度降水量增加而增大,并在110 mm时达到最大,之后其存在概率逐渐下降,当最干季度降水量大于200 mm时,其存在概率稳定在0.2(图6)。

图5 多年平均降水量与马缨丹存在概率间的关系Fig.5 Relationship between annual precipitation and presence probability of Lantana camara

图6 最干季度降水量与马缨丹存在概率间的关系Fig.6 Relationship between precipitation of driest quarter and presence probability of Lantana camara

2.3 马缨丹在中国的适生区的预测分析

马缨丹在中国的适生区预测结果见图7。如图7所示,马缨丹在中国的高适生区面积占全国陆地面积的8.6%,主要位于广东、广西、香港、福建、海南和云南西南部,高适生区年平均气温大多在20 ℃ 以上,最高气温为35 ℃以上且全年雨水充沛,高适生区范围与马缨丹存在概率较高区间的气候情况基本吻合。中适生区面积占比为10.1%,主要位于云南中部和东部地区、贵州、湖南和江西南部地区、四川与重庆交界处以及浙江、江苏和上海小部分地区。低适生区基本以秦岭-淮河线为界,界线以南除高、中适生区外,其他地区基本为低适生区,其面积占比为27.8%;而界线以北除陕西中部部分地区外,其他地区均为非适生区,其面积占比为53.5%。

图7 马缨丹在中国的适生区预测Fig.7 Potential suitable habitats of Lantana camara in China

2.4 未来气候条件下马缨丹的潜在适生区

在2040—2060年未来气候条件下,四川东南部和重庆西南部交界地区新增大片中适生区(图8)。马缨丹高、中和低潜在适生区面积共计占全国陆地总面积的48.1%,相比于1970—2000年气候条件下马缨丹在全国的适生面积有所增加,增加1.6个百分点(表2)。与1970—2000年气候条件相比,未来气候条件下低适生区面积增加较大,增加1.7个百分点。该地区位于四川盆地,降水丰富,温度适宜,在未来气候条件下,气温普遍上升,导致低适生区转为中适生区。由于气温上升,未来气候条件下四川、重庆、湖北、安徽、江苏和河南等地区分布的马缨丹低适生区面积会进一步扩大。

图8 未来气候条件下马缨丹在中国的适生区预测Fig.8 Potential suitable habitats of Lantana camara in China under the future climate scenario

表2 不同气候环境下马缨丹适生区面积Table 2 The percentage of the suitable area for Lantana camara in different climate environment

3 讨论

生态位模型主要有CLIMEX、BIOCLIM、MaxEnt和GARP模型等。CLIMEX模型是通过物种已知分布与气候条件相结合预测物种潜在分布,同时能分析气候对物种生长发育的影响,评估生物在新栖息地的适生能力[24]。但CLIMEX模型纳入的中国气候数据不全,且该模型未使用非气候因子对物种适生区进行预测,导致预测结果有局限性。BIOCLIM模型主要利用已有物种分布资料,从中提炼出物种环境因子的限定范围,探索物种在研究区域的适生性[25]。但BIOCLIM模型所用环境变量相互独立,这与实际情况相违背,容易造成环境包络区范围不准确[26]。GARP模型基于已知物种分布数据和环境数据,采用遗传算法规则研究物种定殖区环境特征与潜在分布区的关系,从而预测入侵物种的潜在适生区[27]。GARP模型要求的样本量少,运算速度快[27],但容易忽略地理类型、植被覆盖和寄主等非气候因子对物种适生区分布的影响。与CLIMEX、BIOCLIM和GARP模型相比,基于MaxEnt模型和地理信息系统预测入侵生物空间分布的精度更高,是目前应用最广泛的生态位模型[6]。

笔者研究结果显示马缨丹适生区位于30° N以下(图7)。DAY等[28]研究发现马缨丹全球分布范围主要集中在30° N~20° S之间,而未来可能会扩散到35° N~35° S之间。因此马缨丹在中国还未达到其最大分布范围,还有继续扩散的可能。除有研究记录的发生地外,马缨丹在浙江、江西、湖南、贵州、四川和重庆等省份均有易被马缨丹入侵的区域。笔者研究发现在秦岭-淮河线以北,陕西中部地区也有低适生区。通过与地形图对比发现,该区域位于关中盆地,平均海拔仅400 m,远低于南北两侧的秦岭和黄土高原,土质肥沃,水源丰富,最冷月份平均气温高于四周高海拔地区,结合马缨丹喜温喜湿和繁殖种子量大的生物学特性,从而形成相对独立的马缨丹低适生区。这与LÜI[14]预测陕西西安为马缨丹适生区的结果一致。

笔者研究预测华南和福建沿海地区都属于马缨丹高适生区。马缨丹已经成功入侵中国,发生范围广泛,防控形势非常严峻,需采取科学治理方法控制马缨丹继续繁衍扩散,阻止其蔓延;对于潜在适生区,须做好马缨丹防控工作。对马缨丹低、非适生区也不能放松对马缨丹入侵监测,因为未来马缨丹全球分布范围可能会扩散到35° N~35° S之间,目前不适生或适生程度较低的地区可能随着气候变化而转变为马缨丹适生区[28]。在2040—2060年未来气候条件下(图8),马缨丹低、非适生区主要集中在四川、重庆、湖北、安徽和河南等省份,适生区明显呈向北延伸趋势。造成马缨丹入侵、扩散的因素有很多,笔者研究选择的环境变量主要为与温度和降水量有关的生物气候变量、高程、地形因子和土地利用类型,未考虑土壤类型和人类活动等因素,这可能造成马缨丹适生区预测结果存在一定偏差,今后应综合考虑马缨丹生物学特性和群落特征,进一步提高其适生区预测准确度。

猜你喜欢
环境变量适生区降水量
成都市年降水量时空分布特征
未来气候条件下天麻适生区预测及时空变化分析
珍贵用材树种红椿4个变种栽培的潜在气候适生区预测*
腐烂茎线虫在山西省的适生区预测
从桌面右键菜单调用环境变量选项
1961—2018年高密市降水量变化特征分析
彻底弄懂Windows 10环境变量
基于MaxEnt模型的绍兴市香榧潜在适生区研究
1956—2014年铁岭县降水变化趋势分析
1970—2016年吕梁市离石区降水量变化特征分析