朱浩朋,伍玉梅,唐峰华,靳少非,裴凯洋,崔雪森
采用卷积神经网络构建西北太平洋柔鱼渔场预报模型
朱浩朋1,2,伍玉梅2,唐峰华2,靳少非3,裴凯洋4,崔雪森2※
(1. 上海海洋大学海洋科学学院,上海 201306;2. 中国水产科学研究院东海水产研究所农业农村部远洋与极地渔业创新重点实验室,上海 200090;3. 闽江学院海洋学院,福州 350108;4. 上海海洋大学信息学院,上海 201306)
对远洋渔场资源和位置进行预报可以为远洋渔业生产及管理提供重要信息。该研究针对西北太平洋柔鱼渔场,利用海洋表面温度遥感信息和中国远洋渔船生产资料,基于深度学习原理,选取卷积神经网络构建西北太平洋柔鱼渔场预报模型。根据不同月份、不同通道构建了多种数据集,用于训练渔场预报模型。训练结果表明,4个通道组合的数据集的训练结果最优,渔汛早期(7—8月)、中期(9月)和后期(10—11月)测试集准确率分别为80.5%、81.5%和81.4%。以2015年的真实渔场数据对模型进行验证,模型的平均召回率为82.3%,平均精确率为66.6%,F1得分平均值为73.1%,预测的高产渔区与实际作业的高单位捕捞努力量渔获量区基本匹配。该研究构建的渔场预报模型可以获得较好的准确率,可为其他鱼种的渔场预报模型构建提供思路。
卷积神经网络;模型;渔业;西北太平洋;柔鱼
柔鱼()属于头足类,主要分布于太平洋、印度洋、大西洋温带与副热带海域,是西北太平洋的主要商业性开发性鱼种之一[1]。全球对西北太平洋柔鱼的商业性开发始于1974年,作业方式以钓捕为主,而中国对柔鱼的捕捞则起步于20世纪90年代,历经30 a的高速发展,远洋鱿钓产业已经是中国远洋渔业的一个重要组成部分[2],截至2017年中国鱿钓渔船总数高达706艘,历史最高产量高达78 860万kg,已经是全球产业和规模最大的国家[3],但是资源开发能力与远洋鱿钓渔业强国的目标尚有一定的差距,渔场预报技术的不足就是主要原因之一[4]。准确而高效地进行渔场预报,可以节省寻找渔场的时间,提高捕捞地效率,有助于减少渔业生产成本,对中国渔业生产的发展有着重要意义。
鱼类渔获量受资源量大小的影响,渔场渔汛的形成也与周边环境变化有关。因此,通过不同的海洋环境因子建立渔场预报模型是当前进行渔情预报的一个常用手段。遥感技术的普及使得获取大范围的海洋信息成为可能,为渔场预报模型的建立提供了便利。在众多渔场预报模型中,贝叶斯方法是一种较为常用的单一环境因子建模方法。樊伟等[5]以海洋表面温度与叶绿素共同建立了金枪鱼贝叶斯概率模型。在此基础上,崔雪森等[6]尝试使用朴素贝叶斯思想,增加了西北太平洋柔鱼渔场预报模型的输入因子维度。回归模型也是一种较常见的建模方式[7-8],如Solanki等[8]利用广义相加模型(Generalized Additive Model,GAM)进行了阿拉伯海域的渔业资源预测研究。随着海洋遥感技术的发展,海洋环境数据的种类越来越丰富,获取方式越来越便捷,使多环境因子共同构建模型提高渔场预报准确率成为了可能。利用一系列规则对数据分类的决策树算法[9-10]有利于构建多环境因子的柔鱼渔场预报模型,其中崔雪森等[11]利用分类回归树进行渔场模型的构建,便于分析复杂多因子,而在此基础上产生的随机森林模型,在渔场预报中也得到了应用。随着计算机技术的进步,人工神经网络在渔场预报建模型中也得到了越来越多的应用,在西北太平洋柔鱼[12]、东南太平洋茎柔鱼[13]、南太平洋长鳍金枪鱼[14]、中西太平洋鲣鱼[15]等不同海域不同鱼种渔场预报取得了一定的成效。针对西北太平洋柔鱼渔场模型应用方面,近年来关注较多的是栖息地指数(Habitat Suitability Index,HSI)模型[16-17]。Tian等[18]通过定量研究对比了以作业努力量和单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE)为基础的HSI模型,并研究适合柔鱼渔场形成的海洋环境,方学燕等[19]在对比基于作业努力量与CPUE的HSI模型基础上优化了智利外海茎柔鱼渔场预报模型。尽管上述渔场预报模型的结构或便利或复杂,但多为弱分类器或多个弱分类器的简单组合。另外,由于传统模型在输入数据的维度上存在限制,所以多选取渔区对应经纬度坐标的单个点的环境数据在空间上进行抽取,从而使得渔场环境数据的空间信息难以得到充分利用。近年来出现的卷积神经网络(Convolutional Neural Network,CNN)是图像识别的重要方法之一,是近几年深度学习领域的研究热点,具备自动提取图像特征,兼顾空间信息,建模能力强,可通过图形处理器(Graphics Processing Unit,GPU)获取超强的计算能力,降低网络复杂度,有效抑制过拟合等优点[20]。
目前,深度学习在渔场预报方面的研究鲜见报道。鉴于卷积神经网络其在图像特征提取和分类等复杂问题方面取得的成功,本研究基于深度学习原理,以渔区周边区域的环境数据及时空信息为输入数据,在考虑柔鱼生物学特征和渔场时空特性情况下,构建卷积神经网络的西北太平洋柔鱼渔场预报模型,并对渔场预报效果进行检验,以期望在大数据背景下运用深度学习方法提高远洋渔场的认识水平,拓宽预报模型构建思路,提高人工智能方法在远洋渔业领域的应用能力。
研究区域位于西北太平洋海域(35°N~48°N,145°E~165°E),该海域有着比较特殊的海洋环境,温差随季节变化较大,平均季节温差最高可达13 ℃[21],亲潮寒流与黑潮暖流的交汇。柔鱼一般随暖流做向北洄游,会在黑潮与亲潮的交汇区形成渔场[22],同时,该海域也是中国鱿钓渔船在太平洋的主要活动水域(图1)。根据世界粮农组织2015年渔业和水产养殖统计年鉴[23],太平洋的柔鱼渔获量占全球总渔获量的64%,其中西北太平洋这一海域的鱿鱼渔获量占全太平洋柔鱼产量的36%,是世界鱿鱼产业不可或缺的一部分。从地理位置上看,西北太平洋更接近于中国;从柔鱼产量上来说,西北太平洋是中国柔鱼产量最高的海域,占中国柔鱼总产量的43%[23]。
图1 西北太平洋柔鱼渔场分布
本研究中柔鱼渔获数据来自于中国远洋渔业分会鱿钓工作组提供的西北太平洋柔鱼的生产信息日报,时间范围是2000—2015年的7—11月,数据包含作业日期、经度与纬度、渔获量、船数等。
环境数据来自美国航空航天局(National Aeronautics and Space Administration,NASA)网站提供的中分辨率成像光谱仪(Moderate-resolution Imaging Spectroradiometer,MODIS)卫星传感器获取的海洋表面温度(Sea Surface Temperature,SST)三级海洋环境数据产品,该数据精度和可靠性得到认可[5,15,17],且拥有较高的时空分辨率(时间分辨率为8 d,空间分辨率是0.08°× 0.08°)。该数据相较于一些传统方法的1°×1°的空间分辨率以及每月的时间分辨率能更好的满足渔场预报实用性的要求,且其获取来源可靠稳定,数据质量较高,有利于模型构建完成后的业务化应用。
1.3.1 生产数据预处理
单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE,103kg/d)表示渔业资源状况及其丰度的常用指标。本研究将柔鱼生产数据以0.5°×0.5°的网格为最小渔区进行统计,根据渔区网格内的渔获数据计算8 d内的平均CPUE,如式(1)所示
式中Catch为一个渔区内的总渔获量,103kg;Effort为一个渔区内所有船的总作业天数,d。
另外,将2000—2015年网格(0.5°×0.5°)CPUE样本按月份分组,分别计算15 a中每个月份CPUE样本数据的中位数,然后分别将各年份中该月各个渔区网格CPUE与该中位数进行比较。若渔区CPUE高于该中位数,则将其定义为高产渔区;反之,定义为低产渔区。
1.3.2 数据集构建
数据集的每个样本由2个部分组成,一是多通道二维灰度图像,像素为65×65;二是渔区类型标签,以高产渔区或低产渔区(设高产渔区为1,低产渔区为0)作为每个样本的标签,整个数据集中80%的样本数据作为训练集,其余的20%作为测试集。其中单个样本各通道代表意义如下:
1)第一通道为SST二维图像数据。以渔区为中心,首先根据经纬度以及时间范围将柔鱼渔获数据与海洋表面温度数据SST相匹配,然后按照像素大小65×65以渔区为中心提取海洋表面温度图像,以此作为数据集单个样本的第一通道(图2a)。
2)第二、三、四通道分别表示经度、纬度和作业月份,为了与第一通道的数据在维度上匹配,需要将这3个输入数据从零维标量扩展为像素65×65的二维张量。
以经度为例,首先根据样本集中渔获数据经度信息确定其经度最大变动范围(145°E~170°E),再生成一幅行列65×65的二维灰度图像,依据当前样本中网格中心经度在最大经度范围中的相对位置,在灰度图像上将相对位置的上方像素的值填充为1,下方像素的值填充为0,如第二通道图像表示的经度为145 °E加上像素值为1的部分在图像中所占的比例与最大、最小经度差值的乘积(图2b)。利用上述方法,对样本中纬度信息(图 2c)和月份信息(图2d)也作同样的处理,从而将零维时空数据扩充成二维张量信息,使SST图像、经纬度及月份在形式上统一,作为不同通道的输入数据供给模型训练。
图2 某一样本的4个通道数据示意图
1.4.1 数据增强方法
因为有效柔鱼生产数据的数据量较小(不足6 000条),为了增加训练样本的数量以及多样性(噪声数据),提升模型鲁棒性,减少模型对某些属性的依赖程度,本研究通过SST图像小角度随机旋转(±10°之间)、图像中心点随机偏移(±0.1个经纬度)等方法对数据集进行扩充,使样本量扩充至29 084条,每个点位的实际渔获量数据分别对应以该点位为中心的行列为65×65的SST,空间跨度大于5个经纬度。与此相比,小范围内随机旋转或偏移所带来的偏差影响像素数目小于整个样本像素总数的2%,在可接受范围内。
1.4.2 AlexNet网络模型结构
本研究选择AlexNet网络模型结构,因其简单易实现,而且通过随机失活(Dropout)层可以有效防止过拟合[24]、通过局部响应归一化层(Local Response Normalization,LRN)增强模型的泛化能力。AlexNet网络模型结构[25]主要包含5个卷积层和3个全连接层,在第1、2、5层卷积层后各存在1层池化层和1层标准化层,1、2层全连接层后各存在一层Dropout层,使用的激活函数为Relu。
1.4.3 渔场概率计算方法
模型中全连接层输出的是一个二维向量,代表模型根据权重计算的高产渔区、低产渔区对应的线性预测值,然后通过Softmax函数将这2个值转化为0~1之间的概率值,其计算如式(2)所示。
1.4.4 训练方案及评价指标
不同季节柔鱼渔场环境有较大的变化,根据Fan等[26]结论,本研究将数据集依据月份不同进行分组,即分为7—8月、9月和10—11月3组,分别称为渔汛早期、渔汛中期和渔汛后期。同时,本研究采取7—11月不分组进行训练,方便与季节分组的方案进行对比,选择较优的训练集季节组合。
在此基础上,为了考察通道数量对模型性能的影响,本研究对不同输入通道进行了4种组合,即单个通道(仅SST)、2个通道(即SST与月份)、3个通道(SST和经纬度)和4个通道(SST、经纬度和月份),最终确定最优的训练方案,模型训练结果评价指标是所有样本中预测结果正确的比例即准确率(Accuracy),计算如式(3)所示。
式中TP为真实高产渔场被正确预测为高产渔场的渔区个数,FN为真实高产渔场被错误预测为低产渔场的个数,FP为真实低产渔场被错误预测为高产渔场的个数,TN为真实低产渔场正确预测为低产渔场的个数。
1.4.5 模型预报效果检验
通过计算模型预测结果的精确率(Precision)、高产渔场的召回率(Recall)、F1得分(F1-score)来检验模型在实际应用中的效果,精确率、召回率、F1得分分别是预测为高产的渔场中预测结果正确的比例、高产渔场被准确预测出来的比例、综合衡量精确率与召回率的一个指标。其计算如式(4)~式(6)所示。
按照柔鱼产卵孵化的高峰期,可以分为冬春生群体、秋生群体2个种群[1,27],西北太平洋的柔鱼主要是冬春生群体,无论是秋生还是冬春生群体一般都会随季节做南北洄游,西北太平洋柔鱼的早期幼体一般生活在35°N以南的黑潮逆流海区,9月份柔鱼会进入索饵洄游期,向北或东北进入黑潮和亲潮交汇区,随着柔鱼群体生长成熟,开始进入产卵洄游期,秋季成熟的雄性个体在10 —11月份向南洄游产卵,雌性个体成熟得较晚,于11月开始向南产卵洄游[28-29]。在柔鱼洄游的不同阶段,柔鱼适宜的栖息环境不同。单就SST而言,7—8月、9月和10—11月的最适宜温度分别为16~21 ℃、14~19 ℃和11~17 ℃,但7—8月CPUE与SST呈正相关关系,9月SST仅在低温范围呈正相关,而10—11月为负相关[30]。
鉴于此,为了分析柔鱼生长阶段及洄游规律对模型精度的影响,以2组数据集进行训练对比结果,一组是训练集不按月份进行分组,即以7—11月整体参与训练,另一组是根据柔鱼洄游的规律将训练数据分组为7—8月(渔汛早期)、9月(渔汛中期)、10—11月(渔汛后期)3个数据集进行训练,通道数量为4个,训将练数据输入基于Python语言构建的Alexnet网络模型,学习率设置为0.000 1,训练集每完成100次迭代,计算1次测试集准确率。经过训练集的80 000次迭代后,7—8月、9月、10—11月3组数据的测试集准确率分别达到80.5%、81.5%和81.4%(图3),之后不再提高,3组数据间的训练效果差别较小,但相较于同等条件训练的不分组数据集(7—11月)的74.4%,测试集准确率的提升幅度均大于6.1个百分点。因此,在构建西北太平洋的渔场预报模型时,柔鱼的洄游规律是必须要考虑的因素之一,本研究中将7—8月、9月、10—11月的数据集分开训练是合理的。
柔鱼是一种高度洄游的鱼种,每年都往返于西北太平洋南部亚热带的产卵场与北部索饵场之间的海域。在该海域的经度方向上,CPUE也会发生较大的变化,通常由西向东CPUE呈逐渐减少的趋势[26]。根据1995—2001年的调查结果,140°~150°E、150°~165°E和165°~180°E区域的平均CPUE分别为2.41、1.94和1.18×103kg/d。纬度方向上同样与CPUE有关。全年来看,柔鱼CPUE大体上会随着纬度的增加而增加,但从季节上来看,在7—9月期间随着纬度的升高而增加,而到了10—11月份,CPUE随着纬度的增加而减少[26-27]。
注:训练集每完成100次迭代,计算1次测试集准确率。
为了验证时空信息对CPUE的影响以及对模型准确率的影响,在得到月份组合方式构建数据集的基础上,分别利用4种不同通道组合构建数据集训练,即SST+经纬度+月份、SST+经纬度、SST+月份、SST单个通道,结果如图4所示。总体上,每个月份组合中都是4个通道测试集的准确率均明显优于3、2、1个通道,准确率之差最高达到7.9个百分点。在4个通道组合的模型中,7—8月数据的测试集准确率为80.5%,9月的数据集为81.5%,10—11月的数据集为81.4%,模型输入因子中在加入经纬度、月份通道后,模型准确率提高将近7个百分点。本研究结果与Fan等[26]研究结果吻合,可见时间、空间位置信息是预测柔鱼渔场变动不可缺少的重要因素。
图4 7—11月不同通道组合的测试集准确率
海洋表面温度与空间信息都是影响渔场时空分布的重要因子[31],对比海洋表面温度、叶绿素浓度、海表面高度、盐度等几种海洋环境因子,SST是对柔鱼资源丰度及分布影响最大的关键因子,而且SST会影响到柔鱼的南北洄游[32]。Shen等[33]的研究表明,在西北太平洋鱿钓渔场,叶绿素a的含量与SST有很好的相关性,而叶绿素a能反映浮游植物的生长状况,因此SST通过影响叶绿素a的含量间接影响柔鱼在这一水域的摄食。而且,太平洋柔鱼的生产效率也直接与SST密切相关,太平洋鱿钓渔船在7月份之前一般产量较低,而7—8月以后柔鱼随着暖水的北上而向北洄游,使得暖水侧渔获量增加,在10月份的冷水南下后冷水一侧的柔鱼渔场增加,渔获量增加[34]。由厄尔尼诺与南方涛动(El Niño-Southern Oscillation,ENSO)现象引起的SST变动也会使渔场发生有规律的移动[35],以上的研究证明SST这一环境因子对柔鱼渔场的影响较大,是建立柔鱼渔场预报模型所必需的重要因素。鉴于此,本研究预报因子选择SST一种海洋环境数据及其时空信息,在所有月份的训练中取得了至少80.5%的测试集准确率,只包含SST的单通道数据的训练也取得了至少74.4%的测试集准确率,不仅验证了海洋表面温度与时空信息是影响渔场时空分布的重要因子这一结论,而且说明了利用单海洋环境因子SST构建渔场预报模型的可行性。
传统渔场预报方法中,朴素贝叶斯分类器需要假设环境因子对渔场的形成具有相互独立的影响[6],栖息地适宜性指数模型是建立在一个基本假设之上即鱼群会出现在环境条件适宜的区域,而不会在环境条件不适宜的区域出现,基于计算机领域高速发展而出现的人工神经网络方法的渔场预报研究至少需要2种环境因子[14-15],并且仅仅考虑渔区一点的海洋环境信息,忽略了渔区周围海洋环境空间特征,而基于卷积神经网络的预报模型避免了过往模型对环境数据空间信息利用率不足的局限性,与传统预报模型相比有着一定的优势。
为了与传统方法的预报模型进行对比,直观展示卷积神经网络构建柔鱼渔场预报模型的方法在预测准确率上的优势,本研究选择随机森林算法构建渔场预报模型,输入变量与构建基于卷积神经网络的预报模型相同(SST、经度、纬度和月份)及数据,训练结果如表1所示。在变量种类相同的情况下,随机森林算法的测试集准确率要低于本研究的卷积神经网络方法,测试集准确率的差值在8.5~22.6个百分点之间。
表1 AlexNet与随机森林算法的测试集准确率对比
为了检验模型的实际应用效果,将2015年7—11月的SST、经度、纬度和月份共4个通道数据作为验证数据集输入训练好的卷积神经网络模型,得到各月份研究区域每个坐标柔鱼CPUE超过历年同月份CPUE中位数即高产渔场的概率,然后将概率图与验证数据对应日期范围内的实际CPUE叠加(图5)。结果显示,每个月的高产渔场高概率值区域与相同日期的高CPUE渔区分布大体一致,并且随时间的推移,高概率值区域的移动趋势与西北太平洋渔船作业渔区的移动趋势也基本吻合。根据验证数据集输入模型得到的预测结果与2015年7—11月西北太平洋实际渔获数据计算模型评价指标(表2),模型对真实渔场的平均精确率为66.6%,平均召回率为82.3%,F1得分平均数为73.1%,该模型在预测高产渔场时准确率较高,对低产渔场的预测准确率有待模型的进一步优化,综合精确率、召回率对模型预报效果进行评价的指标F1得分达到了预期,均说明以卷积神经网络构建西北太平洋柔鱼渔场预报模型具备一定的可行性。
图5 2015年7—11月模型预报结果与实际生产的对比
表2 2015年7—11月本研究模型实际应用效果检验
本研究利用西北太平洋柔鱼历史生产数据以及海洋表面温度(Sea Surface Temperature,SST)遥感数据,结合渔场的时空信息,制作了训练集,根据深度学习原理构建了基于AlexNet网络模型的柔鱼渔场预报模型,检验了训练效果,并利用真实渔场数据进行了实际验证,结果表明:
1)按照柔鱼洄游规律,训练集被分为渔汛早期、渔汛中期和渔汛后期3组数据集后,分别得出80.5%、81.5%和81.4%的测试集准确率,而不分组数据集的测试集准确率为74.4%。由此可见,考虑柔鱼洄游特性后,渔场预报测试集的准确率提升幅度均大于6.1个百分点,因此构建西北太平洋柔鱼渔场预报模型时结合柔鱼洄游的规律的研究成果,将有助于预报模型准确率的提高。
2)在最优月份组合方式的基础上,对比分析了SST+经纬度+月份、SST+经纬度、SST+月份和SST单个通道4种不同通道数据集的训练结果,4个通道数据集的测试集准确率均明显优于第三、二、一通道,测试集准确率之差最高为7.9个百分点。
3)本研究中基于单环境因子及其时空信息建立的预报模型最高达到了81.5%的测试集准确率,优于传统模型的训练效果,而且根据2015年的实际柔鱼渔场信息预报的高产渔区与实际作业高单位捕捞努力量渔获量(Catch Per Unit Effort,CPUE)区基本吻合,预报的高产渔区随月份移动的趋势也与实际渔获数据高CPUE区域移动的趋势相吻合。
本研究基于AlexNet网络模型构建的柔鱼渔场预报模型的训练结果一方面验证了海洋表面温度与时空信息是影响渔场时空分布的重要因子这一结论,另一方面证实了利用SST单环境因子遥感图像构建渔场预报模型的可行性,表明AlexNet网络模型在西北太平洋柔鱼渔场预报中具有一定的实用性和有效性。
[1]Murata M. Oceanic resources of squids[J]. Marine Behaviour and Physiology, 1990, 18(1): 19-71.
[2]唐峰华,陆良峰,朱金鑫,等. 我国北太平洋鱿钓渔业的现状、面临的问题及发展对策[J]. 渔业信息与战略,2013,28(1):14-19. Tang Fenghua, Lu Liangfeng, Zhu Jinxin, et al. Present situation, problems and development strategy for the North Pacific squid fishing fishery[J]. Fishery Information & Strategy, 2013, 28(1): 14-19. (in Chinese with English abstract)
[3]陈新军,钱卫国,刘必林,等. 主要经济大洋性鱿鱼资源渔场生产性调查与渔业概况[J]. 上海海洋大学学报,2019,28(3):344-356. Chen Xinjun, Qian Weiguo, Liu Bilin, et al. Productive survey and fishery for major pelagic economic squid in the world[J]. Journal of Shanghai Ocean University, 2019, 28(3): 344-356. (in Chinese with English abstract)
[4]陈新军. 世界头足类资源开发现状及我国远洋鱿钓渔业发展对策[J]. 上海海洋大学学报,2019,28(3):321-330. Chen Xinjun. Development status of world cephalopod fisheries and suggestions for squid jigging fishery in China[J]. Journal of Shanghai Ocean University, 2019, 28(3): 321-330. (in Chinese with English abstract)
[5]樊伟,陈雪忠,沈新强. 基于贝叶斯原理的大洋金枪鱼渔场速预报模型研究[J]. 中国水产科学,2006,13(3):426-431. Fan Wei, Chen Xuezhong, Shen Xinqiang. Tuna fishing grounds prediction model based on Bayes probability[J]. Journal of Fishery Sciences of China, 2006, 13(3): 426-431. (in Chinese with English abstract)
[6]崔雪森,唐峰华,张衡,等. 基于朴素贝叶斯的西北太平洋柔鱼渔场预报模型的建立[J]. 中国海洋大学学报:自然科学版,2015,45(2):37-43. Cui Xuesen, Tang Fenghua, Zhang Heng, et al. The establishment of Northwest Pacificfishing ground forecasting model based on naive bayes method[J]. Periodical of Ocean University of China: Natural Science Edition, 2015, 45(2): 37-43. (in Chinese with English abstract)
[7]Bo D, Cau L H, Thanh N D. Fishing ground forecast in the offshore waters of Central Vietnam (Experimental results for purse-seine and drift-gillnet fisheries)[J]. Vietnam National University Journal of Science: Earth and Environmental Sciences Edition, 2010, 26(2): 57-63.
[8]Solanki H U, Bhatpuria D, Chauhan P. Applications of Generalized Additive Model (GAM) to satellite-derived variables and fishery data for prediction of fishery resources distributions in the Arabian Sea[J]. Geocarto International, 2017, 32(1): 30-43.
[9]李航. 统计学习方法[M]. 北京:清华大学出版社,2012.
[10]陈雪忠,樊伟,崔雪森,等. 基于随机森林的印度洋长鳍金枪鱼渔场预报[J]. 海洋学报:中文版,2013,35(1):158-164. Chen Xuezhong, Fan Wei, Cui Xuesen, et al. Fishing ground forecasting ofin Indian Ocean based on random forest[J]. Acta Oceanologica Sinica: Chinese Edition, 2013, 35(1): 158-164. (in Chinese with English abstract)
[11]崔雪森,伍玉梅,张晶,等. 基于分类回归树算法的东南太平洋智利竹筴鱼渔场预报[J]. 中国海洋大学学报:自然科学版,2012,42(7/8):53-59. Cui Xuesen, Wu Yumei, Zhang Jing, et al. Fishing ground forecasting of Chilean jack mackerel () in the Southeast Pacific Ocean based on CART decision tree[J]. Periodical of Ocean University of China: Natural Science Edition, 2012, 42(7/8): 53-59. (in Chinese with English abstract)
[12]魏联,陈新军,雷林,等. 西北太平洋柔鱼BP神经网络渔场预报模型比较研究[J]. 上海海洋大学学报,2017,26(3):450-457. Wei Lian, Chen Xinjun, Lei Lin, et al. Comparative study on the forecasting models of squid fishing ground in the Northwest Pacific Ocean based on BP artificial neural network[J]. Journal of Shanghai Ocean University, 2017, 26(3): 450-457. (in Chinese with English abstract)
[13]汪金涛,高峰,雷林,等. 基于神经网络的东南太平洋茎柔鱼渔场预报模型的建立及解释[J]. 海洋渔业,2014,36(2):131-137. Wang Jintao, Gao Feng, Lei Lin, et al. Modeling of fishing grounds forbased on BP neural network in Southeast Pacific[J]. Marine Fisheries, 2014, 36(2): 131-137. (in Chinese with English abstract)
[14]毛江美,陈新军,余景. 基于神经网络的南太平洋长鳍金枪鱼渔场预报[J]. 海洋学报,2016,38(10):34-43. Mao Jiangmei, Chen Xinjun, Yu Jing. Forecasting fishing ground ofbased on BP neural network in the South Pacific Ocean[J]. Acta Oceanologica Sinica, 2016, 38(10): 34-43. (in Chinese with English abstract)
[15]陈洋洋,陈新军,郭立新,等. 基于BP神经网络的中西太平洋鲣鱼渔场预报模型构建与比较[J]. 广东海洋大学学报,2017,37(6):65-73. Chen Yangyang, Chen Xinjun, Guo Lixin, et al. Comparison of fishing ground of skipjack based on BP neural network in the Western and Central Pacific Ocean[J]. Journal of Guangdong Ocean University, 2017, 37(6): 65-73. (in Chinese with English abstract)
[16]Li Gang, Cao Jie, Zou Xiaorong, et al. Modeling habitat suitability index for Chilean jack mackerel () in the South East Pacific[J]. Fisheries Research, 2016, 178: 47-60.
[17]崔雪森,周为峰,唐峰华,等. 基于约束线性回归的柔鱼栖息地指数渔场预报模型构建[J]. 渔业科学进展,2018,39(1):64-72. Cui Xuesen, Zhou Weifeng, Tang Fenghua, et al. The construction of habitat suitability index forecast model offishing ground based on constrained linear regression[J]. Progress in Fishery Sciences, 2018, 39(1): 64-72. (in Chinese with English abstract)
[18]Tian Siquan, Chen Xinjun, Chen Yong, et al. Evaluating habitat suitability indices derived from CPUE and fishing effort data forin the Northwestern Pacific Ocean[J]. Fisheries Research, 2009, 95(2/3): 181-188.
[19]方学燕,陈新军,丁琪. 基于栖息地指数的智利外海茎柔鱼渔场预报模型优化[J]. 广东海洋大学学报,2014,34(4):67-73. Fang Xueyan, Chen Xinjun, Ding Qi. Optimization fishing ground prediction models ofin the high sea off Chile based on habitat suitability index[J]. Journal of Guangdong Ocean University, 2014, 34(4): 67-73. (in Chinese with English abstract)
[20]周飞燕,金林鹏,董军. 卷积神经网络研究综述[J]. 计算机学报,2017,40(6):1229-1251. Zhou Feiyan, Jin Linpeng, Dong Jun. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251. (in Chinese with English abstract)
[21]李占强. 全球常年周平均海表温度场构建及其在西北太平洋中的应用[D]. 大连:大连海洋大学,2014. Li Zhanqiang. Long-Term Weekly Average Field of Sea Surface Temperature and Used in Northwest Pacific[D]. Dalian: Dalian Ocean University, 2014. (in Chinese with English abstract)
[22]汪金涛. 大洋性经济柔鱼类渔情预报与资源量评估研究[D]. 上海:上海海洋大学,2015. Wang Jiangtao. Fishery Forecasting and Stock Assessment for Commercial Oceanic Ommastrephid Squid[D]. Shanghai: Shanghai Ocean University, 2015. (in Chinese with English abstract)
[23]Food and Agriculture Organization of the United Nations (FAO). Global capture production (Online query)[EB/OL]. 2015, http: //www. fao. org/fishery/topic/16140/en.
[24]Srivastava N, Hinton G E, Krizhevsky A, et al. Dropout: A simple way to prevent neural networks from overfitting[J]. Journal of Machine Learning Research, 2014, 15(1): 1929-1958.
[25]Krizhevsky A, Sutskever I, Hinton G E, et al. ImageNet classification with deep convolutional neural networks[C]//Neural information processing systems, 2012, 60(6): 1097-1105.
[26]Fan Wei, Wu Yumei, Cui Xueseng. The study on fishing ground of neon flying squid,, and ocean environment based on remote sensing data in the Northwest Pacific Ocean[J]. Chinese Journal of Oceanology and Limnology, 2009, 27(2): 408-414.
[27]马金,陈新军,刘必林,等. 北太平洋柔鱼渔业生物学研究进展[J]. 上海海洋大学学报,2011,20(4):563-570. Ma Jin, Chen Xinjun, Liu Bilin, et al. Review of fisheries biology of neon flying squid () in the North Pacific Ocean[J]. Journal of Shanghai Ocean University, 2011, 20(4): 563-570. (in Chinese with English abstract)
[28]Tian Siquan, Chen Xinjun, Chen Yong, et al. Standardizing CPUE offor Chinese squid-jigging fishery in Northwest Pacific Ocean[J]. Chinese Journal of Oceanology and Limnology, 2009, 27(4): 729-739.
[29]魏广恩,陈新军,李纲. 西北太平洋柔鱼洄游重心年际变化及预测[J]. 上海海洋大学学报,2018,27(4):573-583. Wei Guangen, Chen Xinjun, Li Gang. Interannual variation and forecasting ofmigration gravity in the Northwest Pacific Ocean[J]. Journal of Shanghai Ocean University, 2018, 27(4): 573-583. (in Chinese with English abstract)
[30]陈新军,田思泉. 西北太平洋海域柔鱼的产量分布及作业渔场与表温的关系研究[J]. 中国海洋大学学报:自然科学版,2005,35(1):101-107. Chen Xinjun, Tian Siquan. Study on the catch distribution and relationship between fishing ground and surface temperature forin the Northwestern Pacific Ocean[J]. Periodical of Ocean University of China: Natural Science Edition, 2005, 35(1): 101-107. (in Chinese with English abstract)
[31]唐峰华,史赟荣,朱金鑫,等. 海洋环境因子对日本海太平洋褶柔鱼渔场时空分布的影响[J]. 中国水产科学,2015,22(5):1036-1043. Tang Fenghua, Shi Yunrong, Zhu Jinxin, et al. Influence of marine environment factors on temporal and spatial distribution of Japanese common squid fishing grounds in the Sea of Japan[J]. Journal of Fishery Sciences of China, 2015, 22(5): 1036-1043. (in Chinese with English abstract)
[32]余为,陈新军,易倩,等. 西北太平洋柔鱼传统作业渔场资源丰度年间差异及其影响因子[J]. 海洋渔业,2013,35(4):373-381. Yu Wei, Chen Xinjun, Yi Qian, et al. Annual difference of abundance index and its influencing factors ofin traditional fishing grounds in the Northwest Pacific[J]. Marine Fisheries, 2013, 35(4): 373-381. (in Chinese with English abstract)
[33]Shen Xinqiang, Wang Yunlong, Yuan Qi, et al. Distributional characteristics of chlorophyll a and relation to the fishing ground in the squid fishing ground of the Northern Pacific Ocean[J]. Acta Oceanologica Sinica, 2004, 26(6): 118-123.
[34]唐峰华,樊伟,伍玉梅,等. 北太平洋柔鱼渔场资源与海洋环境关系的季节性变化[J]. 农业资源与环境学报,2015,32(3):242-249. Tang Fenghua, Fan Wei, Wu Yumei, et al. Seasonal changes of relationship between marine environment and squid fishing resources in North Pacific Ocean[J]. Journal of Agricultural Resources and Environment, 2015, 32(3): 242-249. (in Chinese with English abstract)
[35]唐峰华,靳少非,张胜茂,等. 北太平洋柔鱼渔场时空分布与海洋环境要素的研究[J]. 中国环境科学,2014,34(8):2093-2100. Tang Fenghua, Jin Shaofei, Zhang Shengmao, et al. Study for marine environmental elements on spatio-temporal distribution of neon flying squid in the North Pacific fishing ground[J]. China Environmental Science, 2014, 34(8): 2093-2100. (in Chinese with English abstract)
Construction of fishing ground forecast model ofusing convolutional neural network in the Northwest Pacific
Zhu Haopeng1,2, Wu Yumei2, Tang Fenghua2, Jin Shaofei3, Pei Kaiyang4, Cui Xuesen2※
(1.,,201306,; 2,,,,, 200090,; 3,,350108,; 4,,201306,)
To improve the accuracy and practicability of fishery forecast in the Northwest Pacific, a method of constructing a forecast model of squid was proposed based on the principle of deep learning. In this study, the data included the fishery catch data from the North Pacific squid fishing boat production information and the Sea Surface Temperature (SST) from the moderate-resolution imaging spectroradiometer, from July to November 2000-2015. According to the combination of different channels, four kinds of datasets were formed for the model training, including the single-channel dataset only containing SST; 2-channels dataset of SST and month; 3-channels dataset of SST, longitude, and latitude; 4-channels dataset of SST, month, longitude, and latitude. To match the data of the first channel in dimensionality, the three-input data of longitude, latitude, and month needed to be expanded from a 0-dimensional scalar quantity to a 2-dimensional tensor with pixels of 65×65 and regarded as the second, third, and fourth channel. Because of the insufficiency of effective fishery catch data, these datasets were enhanced by random rotation of the SST image with a small-angle between -10° and +10° and a random 0.1° offset of the image center in four directions, including north, south, east and west. The AlexNet was chosen as the structure of the Convolutional Neural Network (CNN) model, and it consisted of five convolutional layers, three max-pooling layers, and three fully-connected layers with a final 2-way softmax. Different from traditional fishery forecast methods, this method used the Graphics Processing Unit (GPU) to accelerate training, and its extraction of environmental features was automatically completed by computer. SST, latitude, longitude, and month were all factors that needed to be considered when constructing a fishing ground forecast model. The impact of these factors on the accuracy of the fishing ground forecast was compared and analyzed. The results showed that 1) According to the migration laws of squid, the datasets from July to November were divided into three sub-datasets, including July to August, September, and October to November. This way of month combination increased the testing accuracy by at least 6.1 percent points. The testing accuracies of three sub-datasets of July to August, September, October to November were much higher than that of the whole dataset (74.4%) from July to November. 2) The training result of the 4-channels dataset was the best, and the testing accuracy was significantly higher than that of others. The single-channel dataset only containing SST achieved the testing accuracy of at least 73.5%, which indicated that SST was the most important factor among the four factors of SST, longitude, latitude, and month. 3) The actual fishery catch data of 2015 was used to validate the accuracy of the forecast model, and precision and recall were chosen as the evaluation indexes of this model. The average precision, recall, and F1-score were 66.6%, 82.3%, and 73.1%, respectively. The predicted high-yield fishing areas basically matched the actual high-CPUE (Catch Per Unit Effort) areas, and the monthly movement trends of both were also basically consistent. 4) The training results were satisfactory, and the testing accuracy converged to about 80.5% after 80 000 iterations of training. The accuracy of three testing datasets with 4-channels dataset of July to August, September, and October to November was 80.5%, 81.5%, and 81.4%, respectively. It could be concluded that SST and its temporal and spatial information played an important role in the forecast of the Northwest Pacific squid fishery. And the training results demonstrated that it was feasible to construct a squid fishery forecast model by using a dataset of single environmental factor SST and CNN. It also could be concluded that the migratory laws of squid were significant and could not be ignored in the process of the fishery forecast model construction.
convolutional neural network; models; fisheries; Northwest Pacific;
朱浩朋,伍玉梅,唐峰华,等. 采用卷积神经网络构建西北太平洋柔鱼渔场预报模型[J]. 农业工程学报,2020,36(24):153-160.doi:10.11975/j.issn.1002-6819.2020.24.018 http://www.tcsae.org
Zhu Haopeng, Wu Yumei, Tang Fenghua, et al. Construction of fishing ground forecast model ofusing convolutional neural network in the Northwest Pacific[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(24): 153-160. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.24.018 http://www.tcsae.org
2020-08-05
2020-09-15
国家重点研发计划(2019YFD0901405);上海市自然科学基金项目(17ZR1439700);中国水产科学研究院基本科研业务费项目(2019T08);中国水产科学研究院院级基本科研业务费(2018GH13)
朱浩朋,主要从事柔鱼渔场预报研究。Email:zhuhaop_v@163.com
崔雪森,副研究员,主要从事渔业信息与遥感方向研究。Email:cui1012@sh163.net
10.11975/j.issn.1002-6819.2020.24.018
S931.3
A
1002-6819(2020)-24-0153-08