基于最大熵模型模拟西印度洋剑鱼栖息地的时空分布

2022-09-25 09:46唐未王学昉吴峰李渊
海洋学报 2022年10期
关键词:印度洋栖息地物种

唐未,王学昉,,吴峰,,李渊

( 1. 上海海洋大学 海洋科学学院,上海 201306;2. 国家远洋渔业工程技术研究中心,上海 201306;3. 大洋渔业资源可持续开发教育部重点实验室,上海 201306;4. 农业农村部大洋渔业资源环境科学观测实验站,上海 201306;5. 自然资源部第三海洋研究所,福建 厦门 361005)

1 引言

剑鱼(Xiphias gladius)是一种高度洄游性鱼类,广泛分布于三大洋热带和亚热带海域[1],常被金枪鱼延绳钓商业船队所兼捕[2]。除经济价值以外,剑鱼作为一种海洋顶端捕食者在中上层生态系统中发挥着重要作用[3],探究其迁移规律和栖息地利用的基础研究一直备受关注[4-6]。

物种分布模型(Species Distribution Model, SDM)是渔业生态学家和管理者评估和管理海洋生物栖息地和分布的重要工具[7],已有数个研究使用栖息地适宜性指数(Habitat Suitability Index, HSI)模型[8]、广义加性模型(Generalized Additive Model, GAM)[4]、广义线性模型(General Linear Model, GLM)[9]和多物种矢量自回归时空模型(Multi-species Vector-Autoregressive Spatio-Temporal Model, VAST)[10]等模拟预测剑鱼在不同海域的栖息地适宜性。这些方法有的需要基于丰富的专家经验进行判断,有的要求高质量的物种出现数据作为支撑,而剑鱼作为兼捕渔获物,其生态学信息和丰度数据在印度洋海域都十分匮乏,导致需要使用更为合适的建模方法进行栖息地量化的尝试[11-12]。

最大熵模型(Maximum Entropy Model, MaxEnt)是基于最大熵原理预测物种地理空间分布的模型[13],是一种基于“仅出现”预测“未知分布”的机器学习方法[14]。MaxEnt只需要使用“仅出现”数据(“presence-only” 数据),就能利用高效简明的数学方法来模拟物种的栖息地适宜性,同时具有一种明确的“正则化”机制来防止模型过拟合,在降低数据精度要求的前提下,仍具有很高的预测精度[14-15]。目前MaxEnt已被广泛应用于海洋鱼类、鲸豚类、底栖生物、珊瑚等物种分布的预测研究[16-19]。

因此,本研究将利用MaxEnt对西印度洋剑鱼栖息地适宜性进行建模模拟,以获取该海域剑鱼栖息地适宜性的时空变化特征和海洋环境关键影响因素,旨在为西印度洋海域剑鱼种群的可持续利用和科学管理提供必要参考信息。

2 材料和方法

2.1 研究区域概况

研究区域为西印度洋,范围为30°N~40°S,30°~80°E(图1)。在该区域内,营养物质丰富,浮游生物大量繁殖[20],是剑鱼重要的产卵场和栖息场所[21],但海洋环境受到季风和洋流的强烈影响,温度、盐度和混合层深度等带有显著的季节性变化[22-25]。其鲜明的环境特征造就明显的干湿季节,湿润季节通常从5月底开始,持续到11月;干旱季节从11月底一直持续到翌年4月[26]。

图1 2017-2019年渔业观察员记录的西印度洋剑鱼渔获站点(黑点)的分布状况Fig. 1 Distribution of swordfish fishing stations (black dots) in the western Indian Ocean recorded by fishery observers during 2017 to 2019

2.2 数据来源

2.2.1 基于渔业观察员的物种出现数据

本研究选择2017-2019年中国印度洋金枪鱼延绳钓渔业观察员数据中记录的1 017条剑鱼渔获作为物种出现数据,包括作业年份、月份、捕捞位置等。

2.2.2 海洋环境数据

其他海域的研究表明,剑鱼的时空分布主要受海表温度(Sea Surface Temperature, SST)、海面高度(Sea Surface Height, SSH)、叶绿素a(chlorophylla, Chla)浓度、混合层深度(Mixed Layer Depth, MLD)和海表盐度(Sea Surface Salinity, SSS)等海洋环境因素的影响[4-6,8-10]。因此本研究拟采用这5种海洋环境因子用于构建栖息地模型。环境数据均来自于哥白尼海洋环境监测服务中心(Copernicus-Marine Environment Monitoring Service, CMEMS) (https://resources.marine.copernicus.eu)。其中混合层深度数据的原始数据时间分辨率为月,空间分辨率为(1/12)°;海表温度、海表盐度、叶绿素a浓度和海面高度原始数据时间分辨率为月,空间分辨率为(1/4)°。

2.3 模型构建

2.3.1 数据预处理

输入到MaxEnt的各数据图层必须是同一分辨率以便匹配使用。因此使用ArcMap10.4软件将环境数据输入进行栅格叠加并求平均值,全部转换成(1/4)°×(1/4)°的空间分辨率,数据的空间范围为30°N~40°S,30°~80°E。时间上按照各年干湿季节为间隔转换。利用ArcMap10.4软件将环境数据图层转换为ASCII栅格数据。将剑鱼渔获位置的经纬度数据转换为csv格式保存。

2.3.2 MaxEnt构建与预测

使用软件MAXENT3.4.1(http://biodiversityinformatics. amnh.org/open_source/maxent/),随机将剑鱼样本中80%的出现点设置为训练集,剩余20%的出现点作为测试集,重复计算10次,以消除随机性,并去除重复数[15,17,19],结果以Logistic格式输出,绘制响应曲线,使用刀切法分析环境因子与剑鱼栖息地适宜性的相互关系。以训练模型灵敏度与稳定性相等(Equal Training Sensitivity and Specificity, ESS)时的剑鱼栖息地适宜性值为阈值,衡量测试点的遗漏率[27],区分适宜栖息地和非适宜栖息地,从而检验剑鱼出现点未被模型预测到的比率。

使用受试者工作特征曲线(Receiver Operating Characteristic Curve, ROC)的曲线下面积(Area Under Curve, AUC)的大小作为评估MaxEnt预测准确度的指标[14]。在物种分布模型预测准确度评估时,一般考虑范围为0.5~1的AUC值,0.5为随机模型的AUC值,AUC值越大则表明模型预测的准确度越高,通常AUC值大于0.7时,该模型即可当作良好的预测模型[28]。

通过模型中的Jackknife检验模块,分析不同时期各环境因子对剑鱼栖息地适宜性的贡献率,通过比较仅存在某环境因子和不存在该环境因子时的得分大小,来评估其对剑鱼栖息地适宜性的重要性。

根据MaxEnt输出的(1/4)°×(1/4)°栅格点上的栖息地适宜性数值,采用ArcMap10.4软件绘制模型模拟的西印度洋剑鱼栖息地适宜性分布地图。

3 结果与分析

3.1 模型预测能力评价

如表1所示,研究期内各季的AUC值均显著大于0.5,表明MaxEnt预测结果显著优于随机分布模型。同时每个季节的训练数据和测试数据得到的AUC值都高于0.9,说明采用的环境变量对剑鱼的栖息地选择具有重要作用,得到的栖息地适宜性模拟结果具有很好的区分能力,模型模拟的结果优异,可用于西印度洋剑鱼栖息地适宜性分布的研究。

表1 模型预测评价及主要验证参数Table 1 Main parameters for model evaluation and test

ESS 值的结果表明,大部分剑鱼出现点都分布在模型识别的适宜区域内(图2),但湿季的模型遗漏率均值(12.9%)高于干季的模型遗漏率均值(7%,表1)。

3.2 剑鱼栖息地时空分布及季节差异

图2展示了模型模拟的西印度洋海域剑鱼潜在栖息地的时空分布变化状况,可以发现湿季和干季的适宜区域范围存在着显著的差别:干季都集中于马达加斯加北面和东面(图2a至图2c),而湿季则明显向北半球转移,到达索马里东部,扩散至阿拉伯海区域(图2d至图2f),且总体分布范围要大于干季。剑鱼栖息地适宜性指数的空间分布也呈现出相似格局,2017-2018年湿季分布范围大于干季且向南北分散(图3d、图3e),但2019年湿季在30°S水域则未出现适宜性区域(图3f),而所有情景下高适宜性的区域(HSI>0.7)都表现出较为集中的特征(图3)。将剑鱼出现点所对应的栅格值提取并进行统计发现:研究期内湿季的HSI总体水平要高于干季,差距不大且各年间变化不一;但2018年干季是一个例外,其均值约为0.75,显著高于其他各季0.55左右的水平(图4)。

3.3 环境因子的重要性

从环境因子在各季MaxEnt贡献率中可发现(表2),SST的贡献率最高,平均为41.36%,2019年干季贡献率最高,达到54.93%。SSS的贡献率位居其次,平均为22.12%,2017年湿季贡献率最高,达到33.67%。SSH的平均贡献率最低,仅为8.83%,但在不同年份和季节的差异很大。

根据Jackknife检验可知(表3),不包含SST和SSS的平均得分低于不包含Chla浓度、SSH 和MLD 3项。在只包含某个环境因子的得分上,只包含SSS和MLD 的平均得分要高于只包含SST、Chla浓度和SSH 的得分。因此,研究期内SST是影响西印度洋剑鱼栖息地适宜性变化的首要影响因子,SSS和MLD是次要影响因素。

3.4 环境因子的响应曲线及最适范围

本研究选取MaxEnt模拟的研究区域内所有栅格HSI最大的前10%作为剑鱼的最适宜栖息地,计算得到干季研究区域内剑鱼最适宜栖息地的SST为25.8~31.6℃,SSS为34.4~35.9,MLD为0.1~24.9 m;湿季研究区域内剑鱼最适宜栖息地的SST为25.6~30.5℃,SSS为34.8~36.4,MLD为13.1~54.1 m。从剑鱼栖息地适宜性变化的主要环境因子的影响曲线可知(图5),湿季与干季剑鱼栖息地SSS的最适范围

差异不大,而湿季剑鱼对SST的耐受范围要更宽一些,且倾向于更深的MLD环境。

图2 2017-2019年西印度洋剑鱼实际出现点与潜在栖息地的分布Fig. 2 Distribution of actual occurrence points and potential habitat of swordfish in the western Indian Ocean from 2017 to 2019

?

图3 2017-2019年西印度洋剑鱼栖息地适宜性指数分布Fig. 3 Distribution of swordfish habitat suitability index in the western Indian Ocean from 2017 to 2019

图4 2017-2019年干季和湿季西印度洋剑鱼栖息地适宜性指数比较Fig. 4 Comparison of habitat suitability index for swordfish in the western Indian Ocean during the dry and rainy seasons from 2017 to 2019

表2 2017-2019年各季最大熵模型中环境因子的贡献率 (%)Table 2 The contribution rate (%) of environmental factors in the seasonal maximum entropy model from 2017 to 2019

表3 2017-2019年各季Jackknife检验结果得分Table 3 The seasonal result score of Jackknife test from 2017 to 2019

4 讨论

4.1 最大熵模型及其对渔业兼捕物种的适用性

SDM作为在生态学、生物地理学和分类学等方面用来预测物种潜在分布的重要和常用工具[29-31],在许多领域都发挥着重要作用,随着技术发展也开发了许多不同方法,如生物气候分析系统模型(Bioclimate Analysis System Model, BIOCLIM)[32]、广义线性模型[33]、广义加性模型[34]、人工神经网络(Artificial Neural Networks, ANN)[35]和随机森林(Random Forests, RF)[36]等,这些模型都需要出现/非出现数据作为物种的发生记录[37]。

图5 主要环境因子对剑鱼栖息地适宜性指数的响应曲线Fig. 5 Response curves of main environmental factors to swordfish habitat suitability index

但是对于大量的海洋生物类群而言,很难在复杂的海洋环境中获取可靠的非出现数据[38]。因此,像MaxEnt这类利用仅出现或出现/伪缺失信息的算法可能非常有用[14-15]。特别当数据量有限时,MaxEnt就是一种良好的替代方法[14],甚至在某些时候表现更好[39-40]:如Tittensor等[18]通过MaxEnt和生态位因子分析(Environmental Niche Factor Analysis, ENFA)两种方法对全球范围的石珊瑚栖息地适宜性进行模拟,结果表明MaxEnt的效果一直优于ENFA;Monk等[19]使用包括MaxEnt、ENFA和BIOCLIM等在内的10种利用仅出现数据的建模方法对海洋底栖鱼类的栖息地进行模拟预测,其结果鼓励使用“仅出现”数据的方法,尤其是用MaxEnt来模拟底栖鱼类的栖息地;Reiss等[41]使用了包括GLM和MaxEnt等9种方法对20种底栖动物的分布进行模拟,结果表明MaxEnt的表现最为优异。剑鱼属于金枪鱼延绳钓渔业的兼捕渔获物,多数船队的渔捞日志数据质量较差,但由于在一定空间范围内记录出现点的精度要求很低,导致这类数据的可信度会大幅提高。本研究中模型预测能力的两个评价指标AUC值和模型遗漏率都支持MaxEnt能够为剑鱼这类非目标鱼种的栖息地模拟提供可靠工具。

4.2 剑鱼的栖息地利用和环境偏好

本研究表明,海表温度是影响西印度洋剑鱼栖息地适宜性的主要因子,海表盐度和混合层深度是重要影响因子,而海面高度和叶绿素a浓度能够对剑鱼栖息地适宜性产生影响。这与北印度洋海域利用GAM和增强决策树(Boosted Regression Trees, BRT)对剑鱼分布和环境要素之间的关系研究结果相比,无论是环境因子的适宜范围还是剑鱼栖息地的偏好区域都很相似[42]。但是本研究发现,环境因子的重要性排序在干季和湿季会存在一定差异。

鱼类分布和洄游与温度密切相关[21],而剑鱼具有昼夜垂直移动的行为,白天通常在较深的水层活动,夜间移动到较浅水层[43]。因此,SST作为最容易获取的环境因子,在许多渔业研究中被采用[4-6,9-10]。本研究结果表明,西印度洋区域剑鱼栖息地的适宜温度范围存在湿季和干季的差异,这与剑鱼进行产卵、索饵洄游和越冬洄游的时间选择和主动选择适宜温度的行为基本一致[44-45]。剑鱼的季节性纬向迁移也受到海温季节性变化的影响[8],干季由于季风洋流沿着阿拉伯海北部向西南方向与索马里暖流交汇,使赤道附近海域温度升高形成聚集区,且随着赤道逆流向东扩散[26];湿季受到南赤道环流影响,使剑鱼在30°S附近仍有分布区,同时索马里寒流向北运动,季风洋流在阿拉伯海海域向东运动[26],使剑鱼迁移至较温暖的阿拉伯海海域。

一些研究表明,海表盐度与混合层深度对剑鱼分布有重要影响[42],而印度洋西部和东部之间存在着盐度差[22],导致剑鱼的栖息地经向上分布有较为明显的差异。湿季在北印度洋,向东的西南季风将阿拉伯海的高盐水体输送至孟加拉湾[25];在南印度洋,湿季受到赤道与8°S之间的南赤道逆流影响,加上东南风,使高盐海水向赤道西部移动且向南北方向扩散[24]。海表盐度的变化与本研究中不同季节剑鱼栖息地的时空分布特征基本一致。混合层深度受到温度和盐度的影响[42],本研究中剑鱼栖息地主要分布在混合层相对较浅的区域。但同一年内湿季和干季之间存在较为明显的倾向差异,湿季剑鱼对混合层的深度倾向深于干季。受季风和环流影响,湿季西印度洋10°N以北海域存在一个较明显的深混合层碗状结构,迫使剑鱼向南选择栖息地;而干季剑鱼倾向于更浅的混合层,在赤道至20°S之间的海域成为主要栖息地[20]。强烈的季风触发表层和次表层营养物质的活化,从而导致叶绿素a浓度增加[42]。营养物质的增加,吸引了丰富的浮游生物。印度洋剑鱼主要捕食对象为中层鱼类和头足类,而头足类可以在浮游生物丰富的地方觅食[46]。因此,由于生理需求和饵料的可获得性,剑鱼倾向于在环境条件的适宜值范围内进行迁徙[42]。

4.3 不足与展望

本研究利用MaxEnt对西印度洋剑鱼栖息地适宜性分布进行模拟预测,探讨了剑鱼在栖息地选择中的环境偏好。MaxEnt是找到在一定限制条件下熵最大的概率分布作为物种栖息地的最优分布[15]。所以限制条件的选取对模型的准确度必然存在影响。本文只选取了相关研究中常见的环境因子进行分析,建议在未来的研究中纳入更多的环境变量进行建模。另外,西印度洋作为世界上海洋生产力最高的区域之一,由于大气条件的季节性变化,初级生产力会受到海洋-大气交换的强烈影响[46],进而通过食物网的作用影响剑鱼饵料生物的分布,间接影响到剑鱼的迁移和空间分布,而目前对理解这些生物类群响应物理-生物过程的具体机制仍存在很大的局限性[47]。最后,印度洋是一个复杂的海区,同时具有复杂的气候模态[26],造就了不同的生物地理省[48],在后续研究中应该对研究区域进行更加细致的划分。

致谢:感谢中国远洋渔业数据中心和中国金枪鱼延绳钓渔业观察员为本研究提供西印度洋剑鱼渔获物的观察员数据,有力支持了剑鱼最大熵模型的建模过程,谨致谢忱!

猜你喜欢
印度洋栖息地物种
北极新海冰制造项目
与南亚高压相联的欧亚大陆-印度洋经向环流
回首2018,这些新物种值得关注
电咖再造新物种
BEAN SCENES
去印度洋
世界上的15个最不可思议的新物种
疯狂的外来入侵物种
印度洋上接“嫦娥”回家:远望3号船精确测控探月三期试验返回器顺利再入返回侧记
何群:在辛勤耕耘中寻找梦想的栖息地