基于RF和GAM模型的南极磷虾资源分布与环境因子关系研究❋

2021-07-07 03:00刘俊超贾明秀冯卫东刘长东黄六一
关键词:磷虾水深水温

刘俊超, 贾明秀, 冯卫东, 刘长东❋❋, 黄六一

(1.中国海洋大学水产学院, 山东 青岛 266003; 2.中国水产有限公司, 北京 100160)

南极磷虾通常指南极大磷虾(Euphausiasuperba),是生活在南大洋中的一种甲壳类浮游生物,分布于南大洋水域,围绕南极分布,聚集区主要位于陆架边缘、冰架边缘以及岛屿周围海域[1-3]。南极磷虾作为世界上资源量最大的生物资源,也是一种潜在的巨大蛋白资源,使其成为渔业发达国家关注的焦点[4]。据估计,南极磷虾年生物量约为(6.5~10)×108t,为实现南极磷虾资源可持续发展,南极海洋生物资源养护委员会(Convention for the Conservation of Antarctic Marine Living Resources, CCAMLR)认为,在不影响南极生态系统条件下的最大捕捞量应为(4~6)×106t[5]。南极磷虾的商业捕捞开始于20世纪60年代,前苏联率先对南极磷虾进行资源调查与试捕。此后,日本、德国、波兰等国家相继开展了南极磷虾资源的调查研究与捕捞。中国于20世纪80年代对南极磷虾项目进行考察,2010年由“开利轮”和“安兴海轮”两艘远洋捕捞船首次进行南极磷虾的捕捞生产活动,当年累计捕捞1 956 t。2011年派出5艘远洋捕捞船捕捞南极磷虾16 014 t,之后捕捞产量逐年上升。

由于南大洋复杂的海域环境及多种环境和生物因子对南极磷虾时空分布的影响,导致其单位捕捞努力量渔获量(Catch per unit effort, CPUE)年际间波动较大,渔场变动规律不易把握。王荣等[6]研究发现南极磷虾分布具有集群性的特点,其聚集区通常由大片的集群构成,且各磷虾集群的大小不同,呈斑块状分布。环境因素对南极磷虾丰度及空间分布影响显著,如Gareth等[7]研究发现,在秋季南极Marguerite海湾南极磷虾垂直分布于整个海域。南极磷虾栖息地的水温变化通常较小。朱国平等[8]对南极磷虾渔场的大尺度分析发现,南奥克尼群岛水域南极磷虾适宜的海表温度范围为0.1~1.8 ℃,最适范围为0.5~1.5 ℃。国内外一些学者对局部海域研究时发现南极磷虾的分布具有明显的季节和年际变化,Siegel[9]认为,获取食物和躲避捕食者是导致南极磷虾季节性分布变化的主要原因,这两个因素也被认为是引起南极磷虾集群分布的主要原因[10-11]。南极海域在冬季分布着大片的海冰,有研究表明南极磷虾CPUE年际变动随海冰面积的增加而减少[12]。贾明秀等[13]在分析南极磷虾空间分布与环境因子的关系时发现,水温和水深对南极磷虾CPUE有显著影响。

广义可加模型(Generalized additive model, GAM)通过对预测变量进行独立的平滑处理,并以加性方式来计算预测变量对响应变量的影响程度,广泛应用于南极磷虾资源分布与环境因子关系的研究中[8,14-16]。南大洋复杂的海域生态系统及多种环境和生物因子对南极磷虾分布的交互影响,GAM模型不易发现影响南极磷虾分布的主导因子。随机森林模型(Random forest, RF)通过构建一定数量的决策树并且按照相应准则对生成的决策树进行组合生成随机森林,由于生成决策树具有随机性的特点,因此可用于模拟多重非线性关系[17]。应用随机森林模型分析南极磷虾CPUE与环境因子之间的关系,能够计算各环境因子对南极磷虾CPUE的影响大小,便于发现影响南极磷虾空间分布的主导因子。

南设得兰群岛和象岛位于南极半岛北部,岛屿周边海域是南极磷虾的主要捕捞作业渔场。本研究基于中国水产有限公司“龙腾”号大型拖网加工船2015—2019年在南设得兰群岛周边海域作业的渔捞日志数据,应用RF和GAM模型分析南极磷虾CPUE与环境因子之间的关系,为南极磷虾渔场预测和高效开发提供参考。

1 材料与方法

1.1 研究区域与数据来源

本研究基于“龙腾”船2015—2019年在南极半岛北部的南设得兰群岛和象岛附近海域的渔捞日志数据。“龙腾”船为大型拖网加工船,全长107.61 m,宽19.0 m,总吨位7 765.0。渔捞日志数据包括单网次渔获量(t)、起放网经纬度、表层水温(℃)、作业水深(m)、拖速(kn)和拖曳时长(min),作业时间主要为1—7月。计算起放网位置的中点作为各网次的作业位置,捕捞作业位置如图1所示。剔除记录错误的网次,剩余3 394个有效网次用于本研究分析。

图1 “龙腾”渔船作业位置和对数转换的南极磷虾CPUEFig.1 Fishing sites of “Long-teng” boat and catch per unit effort(CPUE) by log-transformation

渔捞日志记录了可能影响南极磷虾分布的表层水温和作业位置因子,本研究还分析水深(m)、离岸距离(km)对南极磷虾分布的影响。水深数据来源于美国NOAA网站(https://www.ngdc.noaa.gov/)公布的ETOPO1数据;离岸距离通过Arcgis10.5软件的临近点分析工具获得。本研究中,CPUE定义为1 h的捕捞量(见公式1),经对数转换的CPUE基本符合正态分布(见图2),作为模型分析的反应变量,CPUE计算公式如下:

图2 经对数转换的南极磷虾CPUE直方图与正态分布曲线Fig.2 Histograms and normal distribution curves of catch per unit effort(CPUE) by log-transformation

(1)

式中:C为单网次总捕捞量(t);E为单网次总作业时间(h);CPUE单位为t/h。

1.2 研究方法

经度、纬度、表层水温、水深和离岸距离为模型分析的解释变量。首先采用方差膨胀因子(Variance inflation factor,VIF)对5个解释变量进行多重共线性分析,剔除显著共线的解释变量。5个变量的VIF值均小于5,多重共线性不显著(P>0.05)。

RF是由Breiman[18]开发的一种机器学习模型,对于具有多维度变量的大数据处理较快,并具有较强的适应性。由于随机森林是有许多随机构建的决策树组合在一起所得到的,因此RF模型适用于量化复杂的非线性关系,其预测结果不受异常值和冗余数据的影响,并且不会产生明显的过拟合现象。RF模型建模时由参数Ntree和mtry来定义决策树与随机特征的数量,其中,Ntree的值通过与误差的关系图来确定;本研究中,mtry不进行赋值,使用默认的输入变量数的1/3,当变量小于3时取1[19]。RF模型通过计算对输入数据集中变量的重要性进行排序,计算公式如下:

(2)

式中:Vi表示解释变量Xi对随机森林模型的解释率;SXi表示Ntree棵树的随机森林中,被Xi分裂的节点集合;G(Xi,v)表示Xi在分裂节点v的基尼信息增益,用以选择最大信息增益的解释变量。

GAM模型是广义线性模型(Generalized linear model, GLM)非参数扩展,通常用于构建解释变量与响应变量之间的非线性关系[20],当所构建的函数自由度为1时,表示反应变量与预测变量为线性关系;自由度大于1,表示反应变量与预测变量为非线性关系,自由度值越大则非线性关系越显著。本研究中GAM模型可表示为:

log(CPUEi)=s1(lon)+s2(lat)+s3(temp)+s4(depth)+s5(dshore)+εi。

(3)

式中:s为样条函数;lon表示经度;lat表示纬度;temp表示表层水温;depth表示水深;dshore表示离岸距离;εi表示残差项。

本研究把数据按75%∶25%分为拟合数据集和测试数据集,基于模型对测试数据的拟合精度(R2)和均方根误差(RMSE)两个指标评估两个模型的拟合性能。RF和GAM模型分别使用R软件的“randomForest”和“mgcv”包计算。

2 结果

2.1 渔捞日志数据

“龙腾”渔船2015—2019年在48.1亚区的作业位置主要位于布兰斯菲尔德海峡以及象岛与南设得兰群岛之间海域,总捕捞产量为64 082 t。南极磷虾CPUE空间分布显示,布兰斯菲尔德海峡南极磷虾CPUE资源密度高于象岛与南设得兰群岛之间海域(见图1)。象岛与南设得兰群岛之间海域捕捞次数为554次,CPUE变动范围在1.04~46.45 t/h,平均为(11.93±0.31) t/h。布兰斯菲尔德海峡捕捞次数为2 840次,CPUE变动范围在1.16~114.00 t/h,平均为(17.95±0.23) t/h。从CPUE年际均值变化来看,2015—2019年南极磷虾年平均CPUE大致呈逐渐上升趋势,其中2018和2019年CPUE值较高,分别为(21.30±0.54)和(21.42±0.46) t/h(见图3)。南极磷虾平均CPUE随表层水温的升高近似呈逐渐降低趋势,当表层水温在-2.5~-2.0 ℃和-2.0~-1.5 ℃范围内时,南极磷虾平均CPUE值较高,分别为(19.59±0.73)和(19.12±0.41) t/h(见图4)。当水深小于1 000 m时,南极磷虾平均CPUE值较高,表明此深度范围内南极磷虾资源密度较大(见图5)。从南极磷虾平均CPUE与离岸距离关系来看,在离岸距离为4~14 km和44~54 km和74~94 km范围内,南极磷虾平均CPUE较高,分别为(18.21±1.06)、(19.26±0.53)和(18.26±1.63) t/h(见图6)。

图3 “龙腾”渔船作业海域南极磷虾年平均CPUE和 作业次数比例的年间变化(均值±标准差)Fig.3 The annual average CPUE and operation frequency ratio of krill in the Antarctic where "Long-teng" fishing boat operates(Mean±SE)

图4 “龙腾”渔船作业海域南极磷虾平均CPUE随表层 水温变化和作业次数比例变化(均值±标准差)Fig.4 The annual average CPUE with the change of sea surface temperature and operation frequency ratio of krill in the Antarctic where “Long-teng” fishing boat operates(Mean±SE)

图5 “龙腾”渔船作业海域南极磷虾平均CPUE随水深 变化和作业次数比例变化(均值±标准差)Fig.5 The annual average CPUE with the change of water depth and operation frequency ratio of krill in the antarctic where “Long-teng” fishing boat operates(Mean±SE)

图6 “龙腾”渔船作业海域南极磷虾平均CPUE随离岸距离 变化和作业次数比例变化(均值±标准差)

2.2 RF与GAM模型结果

1 000次重复交叉验证结果显示RF模型的拟合精度(R2=0.331 4±0.000 7, RMSE=0.248 1±0.000 2)优于GAM模型(R2=0.170 2±0.000 7,RMSE=0.276 1±0.000 2)(见图7)。

RF模型通过优化Ntree值来提高模型的拟合精度和减少模型拟合时间,结果显示,当Ntree值在600之后模型误差趋于稳定(见图8),因此在拟合模型时设置Ntree=600。RF模型利用自变量重要性评价指标和偏相关图来提高模型的可解释性。本研究中各环境因子对南极磷虾CPUE影响程度结果表明,水深、经度与纬度的变量重要性要高于表层水温和离岸距离(见图9)。

(虚线为1∶1参考线,实线为拟合的模型趋势线。The dotted line is the 1∶1 reference line,and the solid line is the fitted model trend line.)图7 RF和GAM模型散点拟合图Fig.7 Scatterplots of RF and GAM models fitting results

图8 决策树数目与误差关系图Fig.8 Relationship diagram of Ntree and error

(lon:经度longitude;lat:纬度latitude;temp:表层水温sea surface temperature;depth:水深water depth;dshore:离岸距离offshore distance.)

RF模型的偏依赖图显示南极磷虾CPUE和各环境因子之间的相关性。结果表明:南极磷虾CPUE在研究区域随经度变大而逐渐减小(见图10a);纬度与南极磷虾CPUE分布的关系呈波动分布,当纬度在63.0°S—63.5°S之间时,南极磷虾CPUE随纬度降低而升高,且大部分作业位置的纬度都位于该范围内,当纬度大于63.0°S时,南极磷虾CPUE随纬度降低而逐渐减小(见图10b);表层水温与南极磷虾CPUE整体上呈负相关关系,当表层水温在-2~-1 ℃时,南极磷虾CPUE随表层水温升高而逐渐降低,当表层水温在-1~0 ℃时,南极磷虾CPUE变化不大(见图10c);水深范围在0~1 000 m时,南极磷虾CPUE随水深增加呈逐渐增加趋势,当水深在1 000~1 500 m范围内时,南极磷虾CPUE迅速下降,当水深大于1 500 m时,水深对南极磷虾CPUE的影响程度达到最小,并基本保持不变(见图10d);离岸距离对南极磷虾CPUE影响呈现多峰非线性关系(见图10e)。

GAM模型结果显示,南极磷虾CPUE与经度呈极显著负相关关系(P<0.01,见图11a);纬度与南极磷虾CPUE呈极显著非线性相关关系(P<0.01,见图11b);南极磷虾CPUE与表层水温呈极显著线性相关关系(P<0.01,见图11c);水深与南极磷虾CPUE呈极显著相关关系,且80%以上的作业位置水深都小于1 000 m(P<0.01,见图11d);当作业位置的离岸距离在5~30 km范围内时,南极磷虾CPUE与离岸距离呈极显著正相关关系,有70%以上的作业位置的离岸距离在30~60 km之间,在此范围内CPUE与离岸距离呈极显著负相关关系(P<0.01,见图11e)。

图11 环境因子对CPUE影响的GAM分析结果图Fig.11 Plot of environment variable on GAM model influenced by CPUE

3 讨论

3.1 南极磷虾CPUE与环境因子关系

南极磷虾是一种生活于冷水环境的浮游动物,对海水温度变化极为敏感。1~2 ℃的水温变化往往会影响南极磷虾的分布[21],当水温升高后,海冰逐渐消融,南极磷虾随海冰消退而向大陆架移动;当水温下降后,南极磷虾可能仍停留在夏季的高丰度区,也可能分散到海冰下或潜伏至海底[22]。朱国平等[23]利用GAM模型分析南乔治亚岛南极磷虾渔获率与海水表温的关系,发现当海水表温在0.5~2.0 ℃范围内时,南极磷虾渔获率随表温增加而成上升趋势。Trathan等[2]认为南乔治亚岛周围南极磷虾数量与水温存在近线性关系,即当水温小于2.25 ℃时,南极磷虾高丰度出现在低水温区域。本研究RF模型结果显示南极磷虾CPUE与表层水温呈负相关关系,南极磷虾CPUE高值出现在-2~-1 ℃之间,结合南极磷虾CPUE与表层水温数据进行空间匹配发现,该水温范围内有超过95%的作业位置位于布兰斯菲尔德海峡,而在象岛与南设得兰群岛之间的作业水温大多介于-0.4~1.2 ℃之间,其原因可能是由于南极绕极流带动底层水涌升,涌升区中心水温略高于涌升区外水温,并且水温随纬度升高而降低[24]。本研究作业海区主要位于布兰斯菲尔德海峡及象岛与南设得兰群岛之间海域,在空间上具有不连续性,表明不同海域的南极磷虾对水温的适宜性不同。南极日照时间随季节变动具有很大差异,并且光照的强弱往往会影响南极磷虾的进食和新陈代谢速率。Teschke等[25]在实验室条件下对南极磷虾进行了光照模拟实验,结果表明光照对于南极磷虾生理生长会产生周期性的影响;Seear[26]从分子学角度分析发现不同光照周期对南极磷虾控制蜕壳、摄食以及游动的基因表达具有显著影响。朱国平等[23]研究发现,南极磷虾平均作业水深在500~1 000 m时,CPUE较高。在本研究中南极磷虾的作业位置主要分布在水深小于1 000 m的海域,RF和GAM模型结果都显示,当水深小于1 000 m时,南极磷虾CPUE与水深呈极显著正相关关系,水深影响光照强度,故表明水深和光照的交互作用对南极磷虾分布有显著影响。阮超等[27]研究发现南极磷虾渔场在南设得兰群岛的东北部海域较为集中(61°S—64°S、58°W—60°W)。本研究RF和GAM结果都表明,在62.5°S—63.5°S、58°W—60°W范围内,南极磷虾CPUE值相对较高,其原因可能是南设得兰群岛与南极半岛之间的洋流使得该海域浮游植物丰度增加,丰富的饵料资源促使南极磷虾密度增高。同时,南极磷虾为游泳能力较弱的浮游动物,适宜栖息于大陆架及岛屿边缘,这与之前研究结果吻合[1-3,24]。Klevjer等[28]分析南极磷虾在斯科舍海的分布和群集特征与离岸距离的关系,将离岸距离分为四类(0~50 km、50~100 km、100~200 km、大于200 km),发现在整个调查区域内,南极磷虾生物量丰富的海域会聚集形成大而密集的群体,并且这种聚集趋势随离岸距离的减小而增大。陈吕凤等[29]在分析南设得兰群岛水域CPUE与离岸距离关系时发现,在不同水域环境下,离岸距离对南极磷虾CPUE的影响具有差异性。本研究中GAM模型结果显示南极磷虾CPUE与离岸距离在整体上呈极显著正相关关系,与之前研究结果的差异可能是由于本研究主要集中在近岸海域,研究尺度较小,无法探究离岸距离对南极磷虾分布的大尺度影响。

南极磷虾数据通常来源于科学调查数据和渔业生产数据。前者所获得的南极磷虾数据具有准确度高、调查全面及调查站位具有随机性等优点,可较准确的分析南极磷虾空间分布与环境因子之间的关系。然而,由于南极特殊的地理位置,科学调查数据一般有空间尺度较小,站位数量少及时间不连续等不足之处[16,30]。中国自2010年开始,每年都在南极海域进行南极磷虾生产作业,同时捕捞范围不断扩大,故渔业生产数据具有时间连续性、空间尺度大、调查站位多等优点。但是,渔业生产数据测量的环境因子少、数据准确度底、调查站位密集且不具有随机性。渔业生产数据是科学调查数据的有效补充,渔业生产数据可验证基于科学调查数据模型的准确性,渔业生产数据与科学调查数据的有机结合,可更有效的分析南极磷虾分布与环境因子的关系,为南极磷虾渔场渔情预报提供更准确的科学参考。

3.2 模型分析

RF模型在环境评价和陆地生物资源研究中应用较多[16,31-33],目前在渔业资源分布研究中应用较少。RF模型进行回归分析受离群值影响较小,在随机干扰较多的情况下表现稳健[18]。相较于传统回归方法,GAM模型被认为是一种信息更为丰富的工具[34],但GAM模型通过加性方式来计算预测变量对响应变量的影响程度,即将多个环境变量综合进行分析,在模型拟合时可能会忽略环境变量之间的交互作用,而RF模型通过构建随机决策树,在训练时能够检测环境变量之间的相互影响。本研究中GAM与RF模型预测结果的差异性可能是由于两种模型计算方法不同及环境变量之间的交互作用引起的。由于数据获取的原因,本研究只分析了经度、纬度、表层水温、水深和离岸距离对南极磷虾分布的影响。南极磷虾捕食者(如鲸)和饵料生物分布、洋流等因子都是影响南极磷虾分布的重要因子,如朱国平等[35]研究发现南极磷虾较小集群与海况呈负相关,原因可能是南极磷虾通过形成小规模集群来躲避捕食者;Atkinson等[36]发现夏季南极磷虾资源分布与浮游植物丰度呈正相关关系,因此,食物来源可能是影响南极磷虾空间分布的重要因素。随着南极磷虾数据获取的不断完善,科学数据和渔业生产数据的有机结合,影响南极磷虾分布的重要环境和生物因子不断引入到模型中,会不断提升模型的预测精度。

4 结语

本研究基于龙腾船2015—2019年的渔捞日志数据,应用RF和GAM模型分析了南设德兰群岛和象岛周围海域南极磷虾CPUE与环境因子之间的关系。GAM模型分析结果表明,南极磷虾CPUE与表层水温呈极显著线性负相关关系,与经度、纬度、水深以及离岸距离呈极显著非线性关系。RF模型结果显示,南极磷虾CPUE受水深、经度以及纬度影响较大,且RF模型拟合度优于GAM模型。综合两种模型结果表明,不同海域的南极磷虾对水温的适宜性不同,南极磷虾CPUE高值相对集中于62.5°S—63.5°S、58°W—60°W范围内,在水深小于1 000 m时,南极磷虾CPUE随水深增加而逐渐升高,表明在南设得兰群岛和象岛周围海域的南极磷虾适宜栖息于较浅海域。RF模型在量化环境因子和南极磷虾CPUE关系时,将数据分为若干组,这种典型的局部优化行为在处理多变量和变量间具有交互作用时表现优异,未来在分析海洋生物资源分布与环境因子关系研究中具有广阔应用前景。

猜你喜欢
磷虾水深水温
某轻型卡车水温偏高的分析及验证
磷虾真是“虾无敌”
南极磷虾粉在水产饲料中的应用
强大的磷虾
基于PLC的水温控制系统设计
基于DS18B20水温控制系统设计
趣图
“美味”的磷虾
别克商务车发动机水温高
国内首套l0米水深海管外防腐检测装置研发成功