基于MaxEnt模型的大豆蚜全球潜在地理分布分析

2022-06-09 10:27马世炎于洪春赵奎军谢桐音
昆虫学报 2022年5期
关键词:环境变量适生区物种

马世炎, 于洪春, 赵奎军, 谢桐音

(东北农业大学农学院, 哈尔滨 150030)

大豆是世界农业贸易中最重要的油料作物之一,是最主要的植物油和植物蛋白提供者,其中含有的蛋白质是饲料中的重要原料,也是重要的工业原料(尹小刚和陈阜, 2019)。大豆蚜Aphisglycines属半翅目(Hemiptera)蚜科(Aphididae),是大豆主要害虫之一,危害后使大豆表现出叶片卷曲变形、节间缩短、植株生长迟缓等症状。大豆蚜发生数量过多时,会使大豆减产,造成严重的经济损失(林存銮等, 1992; Kimetal., 2008)。目前,化学农药是防治大豆蚜的主要方法,长期使用会产生许多负面效果,如误杀天敌、污染环境、危害农作物、破坏生态系统平衡。1998年在中国绥化地区大豆蚜的大发生使大豆减产率达30%,减产大豆高达1.125亿kg(孙博等, 2000)。2003年大豆蚜在美国爱荷华州、俄亥俄州、南达科塔州首次暴发,造成严重损失(Ragsdaleetal., 2004)。2004年黑龙江省大豆蚜发生面积达139.30万hm2,占全省大豆种植面积的40%,严重影响了大豆生产(王春荣等, 2005)。

大豆蚜作为亚洲本土害虫,在中国、俄罗斯、印度、印度尼西亚、日本、韩国、马来西亚、菲律宾、泰国、越南都有分布(Quimio and Calilung, 1993; Takahashietal., 1993; Van Den Bergetal., 1997; 刘健和赵奎军, 2007; Junetal., 2013)。在21世纪初,大豆蚜先后入侵到了美国和加拿大。2009年,大豆蚜已经分布于美国的30个州和加拿大的3个省(Ragsdaleetal., 2011)。因此,开展对大豆蚜潜在地理分布的研究,对大豆蚜的全球分布预测和防控工作都有重要意义。

生态位模型是以生态位理论为基础,对已知的物种分布数据和其关联的环境变量进行分析,根据相应的算法构建模型,判断物种生态需求,将运算结果投射至不同地理空间中进行物种潜在分布预测(Sillero, 2011; 朱耿平等, 2013)。 Phillips等(2006)以最大熵原理为基础建立了预测物种地理分布的最大熵法生态位模型(maximum entropy niche-based modeling, MaxEnt),可作为统计推断的工具预测物种的潜在分布区。MaxEnt模型只需要物种存在点的数据,即使在分布数据不全时仍能得到较理想的效果,因其预测能力优越而在各领域被用于物种潜在分布区预测(Elithetal., 2006)。MaxEnt也被广泛应用于植保领域的病虫鼠草地理分布预测和外来入侵物种定殖的可能性预测。例如,王茹琳等(2021)利用MaxEnt模型对柑橘木虱Diaphorinacitri在中国西南地区的潜在地理分布范围进行预测;秦誉嘉等(2019)利用MaxEnt模型对迁飞性害虫草地贪夜蛾Spodopterafrugiperda在中国的入侵扩散动态进行分析;刘洋和石娟(2020)用MaxEnt揭示了气候变化对埃及吹绵蚧Iceryaaegyptiaca在中国适生区的影响。

目前对大豆蚜的研究主要集中在其生物学特性和防治方法上(樊东等, 2020),对大豆蚜潜在分布的研究较少。Venette和Ragsdale(2004)利用Climex对比美国与大豆蚜广泛分布的5个城市哈尔滨(中国)、首尔(韩国)、札幌(日本)、大阪(日本)和埃查格(菲律宾)的气候条件,得出美国东部地区的环境条件非常适宜大豆蚜的生长和繁殖的结论。但目前尚未有利用MaxEnt模型结合全球气候变化,对大豆蚜的全球潜在地理分布进行预测的研究。因此本研究使用MaxEnt模型模拟大豆蚜的全球潜在地理分布,同时运用刀切法和环境变量响应曲线评估影响大豆蚜分布的环境因子,分析二者之间的关系,为大豆蚜的预测预报和有效防控提供参考。

1 材料与方法

1.1 物种分布点收集

通过查阅国内外公开发表的文献和查询全球生物多样性信息服务平台GBIF (https:∥www.gbif.org/)获取大豆蚜的分布数据,获取的分布数据会存在重复和过度采样的问题(卢小雨等, 2019),去除重复和无效的坐标点后共获得全球范围内有效的大豆蚜分布数据300条。为降低采样偏差对模型精度的影响,利用ArcGIS的统计分析功能保留相互空间分辨率大于2.5 arcmin的分布点,最终保留104条大豆蚜的全球分布数据用于预测。

1.2 环境变量

昆虫属于变温动物,温度对其发育非常重要,通过对昆虫起始发育温度和有效积温的测定,可以推测出昆虫的分布和不同地区世代数。环境变量在大小差异的空间尺度下作用于物种的分布,在相对较大的尺度下,物种间的相互作用常被弱化,气候变量起主要的作用(Hortaletal., 2010)。 过多气候变量容易增加生态空间的维度,对模型预测不利(Peterson, 2011; 朱耿平等, 2014)。为分析大豆蚜在全球范围的适生性,选择19个生物气候变量用于初始模型的构建。使用来自于WorldClim中心(http:∥www.worldclim.org)的数据,空间分辨率为2.5 arcmin。根据初次运行模型后环境变量对大豆蚜分布贡献率的大小,只保留贡献率大于0.8的环境变量。用ArcGIS软件提取大豆蚜已知分布点的19个变量的值,用Origin软件对贡献率大于0.8的环境变量数据进行Pearson相关性分析。将数据导入,选择描述统计中的相关系数分析,计算变量之间的相关性(表1),去掉相关系数绝对值大于0.8且贡献率较小的环境因子。经过以上程序,最终保留了6个贡献率高的环境变量(表2)用于建立最终模型。

表1 环境变量之间的Pearson相关系数Table 1 Pearson correlation coefficients between environmental variables

表2 本研究选用的6个环境变量的名称、代码和单位Table 2 Names, codes and units of six environmental variables selected in this study

1.3 模型构建

MaxEnt软件(版本3.4.1)为开源软件,来源于https:∥biodiversityinformatics.amnh.org/open_source/maxent/网站。构建模型步骤如下:1)将大豆蚜的分布数据和19个环境变量导入MaxEnt建立初始模型,在初始模型中设置“random test percentage”为25,选择Jackknife法计算变量贡献率,其他均设置为默认值;2)参照1.2节中方法选择最终用于建模的环境变量;3)将大豆蚜分布数据和已筛选好的环境变量导入MaxEnt重新进行建模,随机选取75%的大豆蚜分布点用于训练模型的建立,25%的分布点用于验证模型准确性。选择Jackknife法(Jackknife test)、绘制响应曲线(create response curves)和自动特征运算规则(auto features),重复迭代方式为“subsample”,重复训练次数设置为10次,应用阈值规则选择“10 percentile training presence”,预测结果使用“Logistic”格式和“asc”文件类型输出。

由于MaxEnt模型得出的结果为物种的适生性概率,为得到大豆蚜适生等级,需利用ArcGIS加载MaxEnt模型得到的ASC格式的数据将其转化为栅格,获取大豆蚜的全球生境适宜度指数。适宜度指数代表了物种对环境的适宜程度,利用自然间断点分级法,将适宜度划分为4个适生等级:高度适生区、中度适生区、低度适生区和非适生区。

2 结果

2.1 大豆蚜的全球潜在地理分布预测结果

预测结果(图1)显示,高度适生区主要为亚洲的中国(黑龙江省、吉林省、辽宁省、北京市、天津市、河北省、山东省、山西省、河南省、安徽省、江苏省、上海市、浙江省、湖北省、湖南省、江西省)、日本、韩国、朝鲜,北美洲的加拿大(安大略省)、美国(明尼苏达州、威斯康星州、宾夕法尼亚州、纽约州、佛蒙特州、新泽西州、特拉华州、华盛顿哥伦比亚特区、西弗吉尼亚州、俄亥俄州、印第安纳州、伊利诺伊州、艾奥瓦州、密苏里州),以及欧洲的意大利、格鲁吉亚等。

图1 大豆蚜全球潜在地理分布[审图号: GS(2022)1437号]Fig. 1 Potential geographical distribution of Aphis glycines in the world [Map Approval No.: GS(2022)1437)]

中度适生区主要为亚洲的中国(四川省、重庆市、贵州省、广东省、福建省、广西壮族自治区),北美洲的加拿大(爱德华王子岛省、新不伦瑞克省、新斯科舍省)、美国(密歇根州、缅因州、新罕布什尔州、内布拉斯州、南达科他州、堪萨斯州、俄克拉荷马州、阿肯色州、田纳西州、西弗吉尼亚州、弗吉尼亚州、南卡罗莱纳州、北卡罗莱纳州)以及欧洲的克罗地亚、波黑、塞尔维亚、罗马尼亚和乌克兰。

低度适生区主要为亚洲的中国(云南省、海南省、台湾省、香港特别行政区、澳门特别行政区)、印度、缅甸、孟加拉国、老挝、越南、马来西亚、新加坡、所罗门群岛、印度尼西亚、马来西亚和巴布亚新几内亚,大洋洲的澳大利亚,北美洲的加拿大(艾伯塔省、萨斯喀彻温省、魁北克省、纽芬兰-拉布拉多省)、美国(佐治亚州、佛罗里达州、得克萨斯州)和墨西哥(塔毛利帕斯州、塔瓦斯科州),南美洲的哥伦比亚、秘鲁、巴西、厄瓜多尔、委内瑞拉、法属圭亚那、玻利维亚、巴拉圭、乌拉圭、阿根廷,非洲的刚果共和国、马达加斯加岛以及欧洲的德国、法国、波兰、捷克、斯洛伐克、乌克兰、摩尔多瓦、白俄罗斯、立陶宛和俄罗斯。

2.2 环境变量的重要性

刀切法检验能显示环境变量对大豆蚜分布增益的贡献大小,利用刀切法对大豆蚜环境变量进行相关性分析,得到6个环境变量对大豆蚜分布的影响结果(图2)。最暖季度降水量(Bio18)和最暖季度平均温度(Bio10)模型增益分别1.2和1.0,具有较高的正则化增益,对大豆蚜分布增益贡献大,说明这2个变量具有对模型预测最有用的信息,对该模型有显著意义,也说明这两个变量对大豆蚜分布影响最大。最湿季度平均温度(Bio08)模型增益在0.8以上,月平均昼夜温差(Bio02)和最干月降水量(Bio14)增益均为0.4以上,对大豆蚜分布也有较大的贡献。当缺少温度季节性变化标准差(Bio04)变量时,模型增益减少最多,说明它具有最多其他变量所没有的影响大豆蚜分布的信息,对模型的精确度具有不可替代的作用。

图2 刀切法评估影响大豆蚜分布的环境变量Fig. 2 Evaluation of environmental variables affecting the distribution of Aphis glycines by Jackknife test环境变量信息见表2。下同。For environmental variable information, see Table 2. The same below.

2.3 环境变量对大豆蚜分布的影响

对主导环境变量的响应曲线显示(图3),当最暖季度降水量(图3: A)低于243.08 mm时大豆蚜的存在概率低于0.33,随着降水量的增高其存在概率迅速升高,在280.21 mm时存在概率最高。根据存在概率在0.33以上为大豆蚜生长的适宜范围,最暖季度降水量的适宜范围约为243.08~735.68 mm。当最暖季度平均温度(图3: B)低于15.22℃时,大豆蚜的存在概率低于0.33,随着温度升高存在概率逐渐增加,在21.51℃时达到最高值,存在概率最高。根据存在概率在0.33以上为大豆蚜生长的适宜范围,最暖季度平均温度适宜范围为15.22~27.03℃。月平均昼夜温差(图3: C)适宜范围为8.71~13.19℃,最适宜值为11.32℃。温度季节性变化标准差(图3: D)适宜范围为641.63~1 657.79,最适宜值为1 005.83。最湿季度平均温度(图3: E)适宜范围为14.95~29.95℃,最适宜值为21.27℃。最干月降水量(图3: F)适宜范围为1.79~201.22 mm,最适宜值为59.19 mm。

图3 大豆蚜对主导环境因子响应曲线Fig. 3 Response curves of Aphis glycines to dominant environmental variablesA: 对最暖季度降水量(Bio18)响应曲线Response curves to precipitation of warmest quarter (Bio18); B: 对最暖季度平均温度(Bio10)响应曲线Response curves to mean temperature of warmest quarter (Bio10); C: 对月平均昼夜温差(Bio02)响应曲线Response curves to mean diurnal range [mean of monthly (max temp-min temp)](Bio02); D: 对温度季节性变化标准差(Bio04)响应曲线Response curves to temperature seasonality (standard deviation×100)(Bio04); E: 对最湿季度平均温度(Bio08)响应曲线Response curves to mean temperature of wettest quarter (Bio08); F: 对最干月降水量(Bio14)响应曲线Response curves to precipitation of driest month (Bio14). X坐标为环境变量变化范围,Y坐标表示物种存在概率;蓝色为标准差。The X-axis represents the range of environmental variables, and the Y-axis represents the probability of presence. The blue curve represents standard deviation.

2.4 大豆蚜潜在分布模型的准确性检验

遗漏率(omission rate)可以评估模型差别以及过度拟合的信息,对数据在特定阈值上评估,如测试遗漏率与理论遗漏率一致,则证明模型构建效果良好。如果测试遗漏率过高于或过低于理论遗漏率,表明建模数据存在空间自相关(赵佳强和石娟, 2019)。根据MaxEnt模型重复计算10次得出均值后输出的遗漏率曲线(图4: A)可以看出,样本的遗漏率与预测遗漏率基本吻合,表明模型构建的效果很好,建模数据无空间自相关。

图4 评估大豆蚜潜在地理分布模型的精度分析Fig. 4 Accuracy analysis of the model evaluating the potential geographical distribution of Aphis glycinesA: 遗漏率Omission rate; B: 受试者工作特征曲线(ROC曲线)Receiver operating characteristic curve (ROC curve).

受试者工作特征曲线(receiver operating characteristic curve, ROC曲线)分析方法是通过诊断阈值的改变,获得多对真(假)阳性率值。随后以假阳性率为横坐标,真阳性率为纵坐标,最终绘制成ROC曲线,计算ROC曲线下的面积即AUC值,用以反映诊断试验的价值。该方法对未知分布信息不加限制,与其他模型相比有更明显的优势而被广泛应用(Phillips and Dudik, 2008)。一般认为AUC值大于0.9时诊断价值较高(王运生等, 2007),ROC曲线所示(图4: B),模型AUC值为0.959,标准差为0.014,表示本次对大豆蚜潜在地理分布模型的构建达到较高的标准。

3 结论与讨论

3.1 样本量对模型构建的影响

MaxEnt模型相比于其他模型,无论在物种分布点较多还是较少的情况下均表现出色(Wiszetal., 2008; 朱耿平等, 2014),对样本量的要求不高(陈新美等, 2012)。样本量的大小对MaxEnt模型预测物种空间分布的精度影响不大,在样本量较小时,精度不稳定,随着样本量的增大,MaxEnt模型的预测精度越来越稳定。样本量在90以后,AUC标准差小于0.05。样本量达到120以后,模型精度趋于稳定(陈新美等, 2012)。本研究为降低数据过度采样偏差对模型精度影响,最终筛选出104条大豆蚜分布数据用于预测。

3.2 大豆蚜的全球潜在地理分布

预测结果显示,大豆蚜适生区主要分布在海拔较低的地区,海拔高度是影响大豆蚜分布的因素之一。大豆蚜的适生区包含了亚洲的东北平原、华北平原、长江中下游平原、西西伯利亚平原、恒河平原,欧洲的东欧平原,非洲的刚果盆地,北美洲的密西西比平原,南美洲的亚马逊平原、拉普拉塔平原以及大洋洲澳大利亚东部沿海低海拔地区。非洲高原分布广,平均海拔在600 m以上,北部是撒哈拉沙漠。澳大利亚西部是高原地形,西南部是澳大利亚沙漠,荒漠化、半荒漠化严重,降水量小。因此,大豆蚜在这些地区的适生度低、适生区面积小。

纬度是影响各地区气候类型的基本因素,一般来说纬度越低,气温越高。因此,纬度可能是限制其分布的一个因素。预测结果显示大豆蚜潜在地理分布虽广,但最适宜生长的分布区较为集中,高度适生区主要集中在25°~50°N之间的亚洲东部和北美洲东部。因此,接下来可以着重研究大豆蚜集中分布区的小范围生境,有助于揭示大豆蚜的生态特征。

3.3 环境变量对大豆蚜潜在地理分布的影响

李长锁等(2015)研究发现当降雨量大时,大豆蚜的种群数量增长受到明显的抑制。最暖季度降水量(Bio18)和最暖季度平均温度(Bio10)这两个环境变量与大豆蚜潜在地理分布的关系最为密切。模型预测结果表明:最暖季度降水量为280.21 mm时大豆蚜存在概率最高,当最暖季度降水量超过735.68 mm时,大豆蚜存在概率较低(图3: A)。最暖季度平均温度的适宜范围为15.22~27.03℃,当最暖季度平均温度高于30℃时,大豆蚜存在概率仅为0.12(图3: B)。与徐蕾等(2011)报道的大豆蚜在温度为15~25℃范围内繁殖能力随温度的升高而增强,在温度偏低或偏高时,繁殖能力会受到显著抑制的结论一致。

3.4 加大检疫力度,降低国际间因大豆农产品的贸易带来的全球传播风险

大豆作为国际贸易中的重要农产品,国际间的跨国运输比较频繁。模型预测显示除南极洲外,各洲都有大豆蚜的适生地区,大豆蚜在全球传播的风险持续存在。为使进口国的国内植物免受大豆蚜侵害,应加大检疫力度,降低国际间因大豆农产品的贸易带来的全球传播风险。

影响大豆蚜分布的因素有很多,模型预测只考虑了非生物因素,并没有考虑生物因素对物种分布产生的影响,得到的生态位预测结果比现实的生态位更宽。为使预测结果更加精准,后续研究应考虑大豆蚜寄主植物分布、大豆种植制度以及天敌等对其分布的影响。

猜你喜欢
环境变量适生区物种
基于物种分布模型的画稿溪国家级自然保护区桫椤保护现状及影响因素*
基于MaxEnt和ArcGIS的乌檀生长适应性区划研究
从桌面右键菜单调用环境变量选项
气候变化下濒危植物半日花在中国的潜在分布
彻底弄懂Windows 10环境变量
回首2018,这些新物种值得关注
电咖再造新物种
巴拉圭瓜多竹适生区分布研究
世界上的15个最不可思议的新物种
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析