基于MaxEnt模型预测梅的潜在适生区分布

2024-02-26 03:07陈伊能刘志刚于婷廖海周嘉裕
中国野生植物资源 2024年1期
关键词:适生区经纬度面积

陈伊能,刘志刚,于婷,廖海*,周嘉裕**

(1.西南交通大学 生命科学与工程学院,四川 成都 610031;2.马边彝族自治县林业局,四川 乐山 614600)

梅(Prunus mumeSieb. et Zucc.)隶属于蔷薇科(Rosaceae)李属(PrunusL.),是传统中药乌梅的基原植物,以近成熟果实入药[1]。乌梅入药最初于《神农本草经》中有记载,其富含柠檬酸、维生素、黄酮类等化学成分,具有生津止渴、调节肠胃、增进食欲、治疗寒热、增强免疫力等功效[2-3],广泛用于食品与医药领域。本草中记载的梅栽培地分布较为广泛,魏晋时期《名医别录》记录梅原产于湖北西北部,并引种至陕西南部,四川北部;晋代《蜀都赋》记述四川是梅的重要产地;宋代《本朝图经》及明代《本草纲目》记载襄汉、川蜀、江淮、岭南等南方地区均为梅的分布产地[1]。梅产地的不断扩大能够满足临床需要,但若盲目进行引种和种植区扩大,将对梅生产的合理布局产生不利影响,甚至破坏梅的道地性而导致乌梅品质不佳。由此,对梅开展生态环境适应性研究,并以此指导其合理种植具有重大现实意义。

以MaxEnt等为代表的生态位模型是利用物种现有分布点信息,对物种潜在分布区进行预测,从而能够更好地建立物种保护区以及进行合理的人工栽培地域规划,现已应用于多种植物的适生区分析与引种指导工作[4-8]。项目组于2020年6月开始进行了野外实地考察,在此期间进行文献查阅以及植物数据库查询,整理出梅在中国的现有分布信息资料,利用最大熵(MaxEnt 3.4.1)模型和地理信息系统ArcGIS 10.8软件确定影响梅地理分布的主导环境因子及其影响程度,以此为依据预测梅不同程度适生区,分析其潜在地理分布格局,并预测未来气候模式下梅适生区分布的变化,以期为梅资源的可持续利用提供参考。

1 数据来源与方法

1.1 梅分布数据

梅的分布点数据分别来源于3个部分:①实地考察梅生长地,通过经纬度查询-坐标拾取系统(https://jingweidu.bmcx.com/)输入分布点地名初步得到经纬度数据;②通过查阅“梅、青梅、酸梅、梅子与乌梅”等关键词阅读相关文献,记录经纬度或对已知地名进行经纬度查询并记录;③于中国植物数字标本馆CVH(https://www.cvh.ac.cn/)、全球生物多样性信息平台GBIF(https://www.gbif.org/)、中国植物图像库PPBC多平台(http://ppbc.iplant.cn/)搜索查询梅在中国境内的分布点和具体相关经纬度数据。基于以上方法,获得1980 ~ 2022年间348份原始分布数据(同时包含野生资源与人工种植分布数据),除去重复采样和采集地不详的标本信息(例如样本的位置信息为**省份),收集具体到县的地理信息,筛选得到172个具有明确经纬度信息的梅分布点,分布于22个不同省市自治区(表1)。

表1 梅分布数据Tab.1 Distribution occurrences of Prunus mume in China

1.2 环境变量数据

利用世界气象数据库WorldClim(https://worldclim.org/)下载32个环境因子变量(表2)。

表2 32个环境因子对梅的初步预测Tab.2 Preliminary prediction of 32 environmental factors for Prunus mume

选用3个时期:当前(1970 ~ 2000年)及未来2个时期(2021 ~ 2040年和2041 ~ 2060年)环境数据,分辨率均为2.5’。未来气候情景采用CMIP6发布的BCC-CSM2-MR气候变化模型,其中SSP1-2.6(SSP126)代表低强迫情景,即2100年辐射强迫约稳定在2.6 W·m-2;SSP5-8.5(SSP585)代表高强迫情景,即2100年辐射强迫约稳定在8.5 W·m-2。通常认为,较SSP126模式,SSP585模式下的温室气体浓度和排放量均较高,未来环境温度越高[6];同时,SSP585的碳排放强度也更强[7]。利用国家基础地理信息系统网站(http://nfgis.ns-di.gov.cn)下载1 : 100万全国矢量地图数据,描绘梅在中国境内的分布点,并进行当前与未来时期的适生区分析。

1.3 数据处理

1.3.1 经纬度信息数据处理

将172个分布点的经纬度数据信息导入到Arc-GIS中进行数据分析,首先删除重复的经纬度数据记录,随后用SDM Toolbox v2.5工具去除自相关点,再通过“缓冲区”工具进行空间过滤检验(缓冲半径为10 km)[8],最终筛选确定154个梅分布点的经纬度数据信息。

1.3.2 环境因子优化

由于环境因子的高相关性可能导致模型的过拟合现象,删除相关性高的环境因子有助于提高模型的准确性。通过对154个分布点的32种环境变量开展SPSS分析,参考邹萌等[5]的筛选方法,选用SPSS 20.0软件编制32种环境因子的相关矩阵,评价两两之间的Spearman系数,若Spearman系数 ≥0.8,则视作环境因子之间具有高相关性。如果环境因子间的Spearman系数 ≥ 0.8,则保留贡献率更高的环境因子;同时,删除贡献率 < 0.3的环境因子(表2)。最终从中删除bio17、bio4与tmin1等23种环境变量,从而形成优化后的环境因子集合。最后,通过ArcGIS提取优化后的环境因子数据,以ASCⅡ格式储存,为后续导入MaxEnt中运算做准备。

1.3.3 MaxEnt模型预测

优化后的环境因子数据添加于MaxEnt 3.4.1软件,采用不同的训练/测试集(80/20、75/25和70/30),运算次数为500次,输出格式为 .asc,输出类型选择Logistic,重复运算10次,其余参数默认设置[5,9-10]。

采用3种指标(AUC值、KAPPA值与TSS值)评估MaxEnt模型的准确性[11]。AUC值为受试者工作特征曲线(Receiver operating characteristic curve,ROC)下包围的面积,范围为0 ~ 1,AUC值越大说明模型准确性越高,即所选取的环境因子与梅的地理分布呈高度正相关。AUC值分为5个等级:不合格(0 ~ 0.6)、较差(0.6 ~ 0.7)、中等(0.7 ~ 0.8)、良好(0.8 ~ 0.9)和优秀(0.9 ~ 1)[8]。KAPPA值反映其预测与事实匹配的程度,即通过预期准确度控制随机准确度。取值范围为-1 ~ 1,当KAPPA统计量为1表明预测模型理想,小于或等于0表示模型预测效果弱于随机模型[11]。TSS值为真实技能统计量,范围为-1 ~ 1,其值越接近于1表示完全有能力区分适宜和不适宜的栖息地,而小于或等于0表明表现不优于随机。最后,在最优模型下,刀切法确定不同环境因子的贡献率大小,及得到各环境因子的响应曲线图。

1.4 适应性分布区划分

将MaxEnt模型预测结果导入ArcGIS 10.8软件,采用人工方法对梅适生区进行分级,将适生等级分为非适生区、低适生区、中适生区与高适生区等4类,其适应指数分别为:0 ~ 0.06、0.06 ~ 0.23、0.23 ~ 0.51与0.51 ~ 1.00[5]。

2 结果与分析

2.1 数据及环境变量筛选

项目组通过实地考察调研,获知梅在四川省马边、大邑与巴中等地区分布较广,其中在马边的大风顶山区发现了一株树龄超过200年的梅古树,表明梅在四川省有较长的种植历史。最终确定的154个梅分布点集中于长江以南地区,这与梅的本草考证及当前种植区域相吻合。

2.2 预测的有效性

为了获得最好的MaxEnt模型,我们利用bio14等9种环境变量,分别选择3种训练/测试组合,并分别用AUC,KAPPA与TSS等3种不同指标评价模型的预测精度。AUC测试结果显示,3种不同的训练测试集均能取得较高的AUC值(≥ 0.909),初步表明构建的MaxEnt模型具有较高的可信度。其中,当训练/测试组合为75/25时AUC值最高,达到0.915;而当训练/测试组合为70/30与80/20时,AUC值分别为0.909与0.913(表3)。

表3 3种训练/测试组合的模型评价Tab.3 Model evaluation metrics under three gradient training/test sets

通常认为,当KAPPA值大于0.6时,模型即具有显著一致性,且该值越大,模型的预测精度越高[12]。分析结果显示,3种训练/测试组合均能取得较高的KAPPA值(≥ 0.764),其中75/25组合的KAPPA值最高(0.841)。而当TSS值大于0.8时,模型对数据的区分能力达到较高水平[13-14]。比较3种训练/测试组合,只有80/20组合的TSS小于0.8(TSS = 0.799),70/30与75/25组合均超过0.8,其中75/25组合的TSS值最高,为0.871(表3)。综合3种训练/测试组合的分析结果,由于75/25组合均能够取得最高的AUC,KAPPA与TSS值,因此被选择构建MaxEnt模型,以用于梅的适生区预测。

2.3 环境因子贡献率分析

利用刀切法确定各环境因子对物种潜在分布适生区的影响程度大小,从中找到影响物种分布的关键环境因子[5]。如图1所示,不同环境因子对梅分布产生不同程度的影响。最冷月最低气温bio6的训练得分最高,超过了1.20,表明该环境变量是影响梅分布的最重要环境因子;年降水量bio12、最暖季降水量bio18与年温差bio7的训练得分分别为1.13、1.07与1.07,说明它们对梅分布影响为次重要;而最干月降水量bio14与平均昼夜温差bio2的训练得分分别为0.98与0.96,表明相较于其它环境因子,这两种也是较为重要的环境因子。

图1 环境因子的刀切图Fig.1 Prediction of Prunus mume distribution by environmental factors

图1显示,当不存在bio7时,正规化训练增益下降最大,从侧面反映该因子是影响梅分布的关键因子之一。综上,bio6、bio12、bio18、bio7、bio14与bio2是影响梅分布的关键环境因子。

随后,计算不同环境因子对梅分布的贡献率,确定共有5个环境因子的贡献率大于3%,即最干燥月降水量bio14(35.0%)、年降水量bio12(35.0%)、最冷月最低气温bio6(14.5%)、年温差bio7(6.8%)与最暖季降水量bio18(3.3%),该结果与刀切法结果基本吻合,表明降水量与温度是影响梅分布的重要环境因素(表4)。

表4 9个环境因子对梅的潜在分布贡献率Tab.4 Potential distributional contribution rate of nine environmental factors to Prunus mume

2.4 主要环境因子

分析单环境因子的响应曲线,明晰各环境因子与梅生存概率之间的相关性,从而确定物种的适宜生境范围。选择0.5为存在概率的阈值[4],重点分析bio14、bio12、bio6、bio7和bio18等贡献率最高的5种关键环境因子(图2)。

图2 生物气候变量响应曲线Fig.2 Response curves of environmental variables

对梅而言,最冷月最低气温bio6(图2A)的适生范围为1.4 ~ 12.1℃;当其为10.1℃时,梅适生概率最大,达到71.47%,说明温度对梅生长有较大的影响。年降水量bio12(图2B)的变化在1 020.8 ~4 125.0 mm之间;当其为2 416.7 mm时,梅适生概率最大,达到66.62%,这说明降水充裕对梅生长是有利的。当最干燥月降水量bio14(图2C)在11.3 ~104.0 mm之间梅生长良好;当其为14.1 mm时,梅可能处于最佳生长状态,生长概率达到60.40%。

最暖季降水量bio18(图2D)适生阈值为510.8 ~ 2 043.0 mm;当其为715.1 mm时,梅适生概率最大,达到67.20%,说明在高温季节降水充裕对梅生长有利。梅倾向较低的年温差值bio7(图2E),该阈值为29.1℃以下时生长良好,当其为22.4℃时,梅适生概率最大,可达到62.35%。

2.5 梅的适应性划分

按照4级分类,统计梅在各省的潜在分布,结果见表5。梅的高适生区分布在长江以南地区,主要集中于四川、重庆、贵州、广西、广东、云南等地区,另外在浙江、台湾等区域也有分布,其面积为746 968 km2,占全国总面积的7.78%。梅的中适生区分布较广,面积为1 632 507 km2,集中于云南、湖南、湖北、江西、四川等地区,占全国总面积的17.01%。梅的低适生区面积为741 588 km2,占全国总面积的7.73%。

表5 梅在各省的潜在分布区域面积Tab.5 Potential distribution area of Prunus mume in each province

2.6 未来适宜生境地区的变化

在SSP126气候情景下(表6),梅的潜在适生区呈现波浪式增加的趋势。相较于当前适生区,高适生区面积于2021 ~ 2040年间下降74 451 km2,其中四川、贵州、西藏、广西和云南缩减面积最多,分别为37 233 km2、42 404 km2、13 680 km2、12 733 km2和12 388 km2,而江西南部、江苏南部、上海、湖南南部、福建中部和浙江东部面积增加分别为6 962 km2、4 951 km2、3 118 km2、4 863 km2、29 485 km2和4 301 km2,但总体增加面积幅度不大,可见高适生区有向我国东南部转移的趋势,低适生区与适生区面积分别下降7 952 km2和60 602 km2。因西南地区部分高适生区转为中适生区,中适生区面积少量增加为8 442 km2。到2041 ~ 2060年间,云南、贵州进一步大规模缩减46 310 km2与28 246 km2,贵州、河北、安徽、江苏、上海的高适生区几近消失,高适生区面积下降高达141 012 km2,低适生区下降了23 496 km2。值得关注的是,在北京、河北、天津与山东等地出现了大量的潜在中适生区,即中适生区面积增加185 061 km2,从而适生区面积增加了44 049 km2。

表6 不同气候情景下梅在中国的潜在适生区面积Tab.6 Prediction of suitable growing areas of Prunus mume in China under different climate scenarios

在SSP585气候情景下(表6),梅的潜在适生区呈现与SSP126相似的变化趋势。2021 ~ 2040年间,因西藏、云南与贵州分别减少11 146 km2、45 627 km2、56 352 km2,整体高适生区面积下降71 954 km2,且其面积位置变化规律与SSP126同时期的高适生区迁移位置相似,而中适生区和总适生区面积下降26 182 km2与98 137 km2,仅低适生区面积增加57 990 km2,这是由于河南中部、安徽和江苏北部有部分中适生区转为低适生区。2041 ~ 2060年间,因云南与贵州高适生区面积大规模恢复,相较于当前的高适生区(746 968 km2),面积增加了37 312 km2。中适生区和适生区面积也分别增加17 001 km2与54 313 km2,仅低适生区面积下降42 583 km2,因为2021~ 2040年间的低适生区更新为中适生区,且中适生区出现向北拓展的趋势,特别是山东南部、北京、河北与天津等部分地区新增了中适生区。总体而言,2种气候情景下,到2041 ~2060年间,适生区面积均出现波浪式不同程度增加以及北移的趋势,分别为当前的101.85%和102.28%。

3 讨论

3.1 当前适生区预测的分析

项目组在前期收集较完整的梅分布点信息,这有助于提高MaxEnt模型的预测准确性;同时,为了避免过拟合现象,删除了重复的分布点,并设置缓冲过滤,有助于降低样本的空间自相关[15-16];第三,对环境变量开展相关性分析与筛选,减少相关性较强的环境变量,降低机器学习模型的复杂性[17];最后,采用AUC、KAPPA和TSS等3个评价指标综合判断预测结果,获得最优模型。结果表明,75/25的集合能够取得最优的预测效果。预测结果显示,四川、云南、贵州、广西与广东等地区是梅的高适宜种植区域。这些地区与梅的现有分布信息较为吻合,例如,四川与广东地区均为梅种植大省,出产的梅品质最好。值得注意的是,西藏、重庆、台湾、香港、福建与海南等地区的部分区域,也被划归为梅的高适宜区,这将为梅的引种提供理论基础。

3.2 气候变量与梅的关系

在环境变量中,降水和温度对梅的分布影响最大,表明气候因素是影响梅生长的关键因素。温度变量中,最冷月最低气温bio6扮演最重要的角色,当其为10.1℃时,梅的适生概率最大。考虑到梅分布区域的最冷月主要在1月和2月,此时梅处于盛花期,适宜的温度有利于梅花器官的形成,促进营养生长向生殖生长的转换[18]。另外,当年温差bio7约22.4℃时,梅适生概率达到62.35%,这与梅适生区分布信息是吻合的。梅主要集中在长江以南地区,该区域具有明显的季节变化,但温度变化较温和[1]。降水变量中,当年降水量bio12约2 416.7 mm时,梅适生概率达到66.62%;最干燥月降水量bio14约14.1 mm时,梅适生概率达到60.40%;当最暖季降水量bio18约715.1 mm时,梅适生概率达到67.20%,以上结果表明,梅喜光喜暖湿润气候,怕旱又怕涝,所以降水量充足但不过量的条件对梅生长十分有利[19],若温度过低又常为阴雨天,将会影响梅花芽和胚的发育,影响花粉散发,最终严重影响梅坐果率[21]。

3.3 未来气候情景下梅在中国适生区的变化

在SSP126和SSP585等2种气候情景下,分别对2021 ~ 2040年和2041 ~ 2060年这2个时期进行梅适生区预测分析。结果表明,在未来40年内,梅分布范围均呈现先减少再增加的趋势,并在2060年达到最大,推测温度对梅生长有着关键影响,温度适当升高可加快物候过程,增加土壤养分提高梅的生长速度和大小。该结果也与贡献率分析结果相吻合,即温度是影响梅生长的关键因子,温度升高会导致适生区的范围增加。相似结果也出现在川贝母(Fritillaria cirrhosaD. Don)[8]、紫斑牡丹[Paeonia rockii(S. G. Haw & Lauener) T. Hong & J. J.Li][21]、猕猴桃(Actinidia chinensisPlanch.)[22]与槟榔(Areca catechuL.)[23]等植物的研究中,它们在温室气体排放增加的情景下,适生区面积增加。

在未来气候模式下,梅适生区出现北扩的趋势,其中,北京、河北、天津与山东等长江以北地区新增中适生区,辽宁出现了低适生区。由此,到本世纪中叶,这些区域可能出现新的梅种植区。潘浪波等[7]与Zhang等[21]研究也发现类似北移现象,随着未来气温的升高,薄壳山核桃[Carya illinoinensis(Wangenheim) K. Koch]、滇牡丹(Paeonia delavayiFranch.)和紫斑牡丹等一些物种会移向高纬度或高海拔,推测这可能是物种的一种适应机制,但具体原因有待进一步阐明。

4 总结

本文基于梅现有分布区的环境因子数据,通过MaxEnt 3.4.1和ArcGIS 10.8等工具,成功筛选影响梅生长的关键环境因子,并预测梅的现有及未来潜在适生区,以上研究成果对梅资源的可持续利用以及为梅种植的合理规划布局奠定了理论基础。

猜你喜欢
适生区经纬度面积
气候变化下中国蒟蒻薯科箭根薯的地理分布格局预测
未来气候条件下当归适生区预测及时空变化分析
怎样围面积最大
最大的面积
巧用面积法解几何题
气候变化下濒危植物半日花在中国的潜在分布
基于经纬度范围的多点任务打包算法
巴拉圭瓜多竹适生区分布研究
巧用面积求坐标
自制中学实验操作型经纬测量仪