王德兴,罗静静,袁红春
渔船定位捕捞与环境因子的关联分析
王德兴,罗静静,袁红春
(上海海洋大学信息学院,上海 201306)
针对由于海洋环境数据及渔业作业数据急剧增长,难以提取有效信息来定位渔船捕捞区域的问题,提出捕捞量与环境因子关联分析算法,算法根据各属性值的支持度来分析环境因子的重要度:利用k-means算法,分别将海表温度、海面盐度、叶绿素浓度和捕捞量进行聚类分析并量化加以标记;然后将环境因子和捕捞量区间映射为单值属性构造相应的概念格;最后利用概念格的外延量化值记录渔船数量,分别得到以捕捞量高、中、低为决策属性的哈斯图,图中可较清晰地显示出捕捞量与环境因子之间的关联关系。实验结果表明,在海表温度为27.64~30.32oC、叶绿素浓度为0.0310~0.0479mg·m-3的区域,南太平洋长鳍金枪鱼捕捞量最高,且其属性组合的重要度最高。该算法可对渔船合理定位捕捞区域提供参考。
长鳍金枪鱼;捕捞量;环境因子;概念格;关联分析;渔船定位
长鳍金枪鱼(thunnus alalunga)作为高度洄游的大洋性鱼类,因其经济价值高,资源量较为丰富,已成为世界各个国家及沿岸地区的主要捕捞对象。中国远洋金枪鱼延绳钓渔业经过多年的发展历程逐渐壮大[1]。长鳍金枪鱼作为南太平洋延绳钓渔业的重要捕捞物种之一,目前已成为我国远洋渔业的重要组成部分,迫切需要对其进行可持续开发。在长鳍金枪鱼的实际生长环境中,不同区域的环境因子对其捕捞量具有重要的影响。
文献[2]以单位捕捞努力量渔获量(catch per unit effort, CPUE)为输出因子,建立6-4-1结构的人工神经网络模型,对南太平洋长鳍金枪鱼的渔场位置进行了准确的预报。文献[3]利用逐步回归的方法建立钓钩作业深度预测模型,通过统计和聚类分析的方法分析长鳍金枪鱼鱼获率与环境因子的关系。对于南太平洋长鳍金枪捕捞量与环境因子关系的分析,大多数采用传统数学分析方法、早期人工智能技术及地理信息系统(geographic information system, GIS)技术进行定量渔情预测。
我国自主研发的北斗卫星导航系统[4-5](BeiDou navigation satellite system, BDS)具有定位精度高、自动化、效益高等特点,为渔船捕捞提供了精确的导航定位手段。随着科技的发展,鱼类捕捞不再靠捕捞人员的经验。根据环境因子与捕捞量进行关联分析,对渔船定位捕捞海域具有重要意义。关联分析[6-7]旨在发现项目及之间有趣的关联,是描述数据库中数据项的属性和变量之间潜在关系的一种知识表示形式。
本文提出捕捞量与环境因子关联分析算法,对渔船定位捕捞与环境因子进行关联分析。采用概念格[8-9]作为数据分析工具,将长鳍金枪鱼捕捞量和环境因子作为属性构造相应的概念格。将内涵属性捕捞量量化为高、中、低3种,在概念格以长鳍金枪鱼捕捞量为主属性的哈斯图中,可清晰地找到捕捞量与环境因子的概念节点,以此来分析各内涵属性之间的关联关系,即南太平洋长鳍金枪鱼捕捞量与环境因子的关联关系;最后根据各属性的支持度,分析影响长鳍金枪鱼捕捞量的环境因子的重要度以及捕捞区域中合理的渔船数量,指导渔船合理定位捕捞区域。
有关概念格的知识可参阅文献[10-11]。
概念格中最主要的2种构造算法为批处理构造算法和渐进式构造算法。目前Godin算法[12]是最为典型的渐进式构造算法。
将长鳍金枪鱼捕捞量和环境因子作为概念格的属性并进行符号化标记。根据以上定义,采用渐进式构造算法,构造长鳍金枪鱼捕捞量与环境因子的概念格。
在概念格中,概念(all,Ø)是最高层次的顶部概念节点,代表没有具体特征、综合性最强的概念,其中all是概念格中概念的所有外延,对应每条船1个月的捕捞量,Ø表示概念内涵为空,即所有公共环境因子与长鳍金枪鱼捕捞量为空。在长鳍金枪鱼实际生长环境中,公共环境因子一般不为空。概念(Ø,all)是属性最详细的底部概念,具有所有属性特征,其中Ø表示概念的外延为空,all表示概念格中所有的内涵属性。由于环境因子不是1个固定的值,所以没有1个区域能够表示所有环境因子的范围。对于非顶点非底部概念节点,一般具有1个或1个以上的子(或超)概念节点,其概念节点的内涵是其子概念节点内涵中1组公共环境因子与长鳍金枪鱼捕捞量的属性值。以此将不同的环境因子与捕捞量范围表示在概念格上。
1)将环境因子海表温度、海面盐度、叶绿素浓度及和捕捞量等数据进行聚类分析,将聚类的结果范围以低、中、高升序排列,并采用符号标记。
2)将已标记的环境因子和捕捞量映射为概念格的单值属性,采用渐进式构造算法,将待插入的对象和概念格中全部的概念节点进行交运算:如果原概念格内节点内涵包含在新对象内涵之中,仅需要将其外延更新到包含新对象的原概念格内节点即可;如果新节点对象的内涵与概念格内节点内涵的交集没有出现过,则需要在概念格内新增概念节点;交集为空,不作任何修改,从而构造海洋环境因子和捕捞量的概念格。
3)在环境因子与捕捞量的概念格中,每个概念结点中的外延量化值记录了外延中对象的个数,首个记录从1开始,该记录对应概念外延中的首个渔船,记录依次加1递增。概念外延中最大记录对应的环境因子与捕捞量的关联分析支持度最大;介于最小记录和最大记录之间对应的关联分析,支持度的大小不同;最小记录对应的关联分析支持度最小,环境因子的重要度最低。
4)根据用户的兴趣目标,从概念格的顶部全概念开始从上往下作深度优先搜索。从概念的第1个直接子概念开始进行关联分析,首先判断该概念结点是否为空,如果该概念结点不为空,根据外延量化值记录的渔船数量的支持度,开始分析该概念的外延与其内涵属性之间的关联关系,即渔船数量及捕捞量与环境因子之间的关联分析。
5)如果该概念结点为空,则继续遍历该概念结点的兄弟概念结点,再判断此概念结点是否为空,如果不为空,则输出该概念节点外延与其内涵属性之间的的关联关系。以此类推,直到遍历了整个概念格为止。在概念格的Hasse图中,根据外延量化值的支持度大小,分析捕捞量与环境因子之间的关联关系,得到环境因子对捕捞量的重要度,从而合理定位捕捞区域。
以南太平洋长鳍金枪鱼渔业数据及海表温度、海面盐度和叶绿素浓度等环境数据作为实验数据,选取的经度在155oE~175oE之间。因数据众多,本文为了简化实验,选取时间为2015年的数据作为实验数据,如表1所示。南太平洋长鳍金枪鱼延绳钓渔业作业数据来源于中西太平洋渔业委员会(Western and Central Pacific Fisheries Commission, WCPFC),海洋环境数据来源于美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration, NOAA)环境数据库。空间分辨率为5o×5o。生产数据主要包括作业日期、作业产量;环境数据主要包括海表温度、海面盐度、叶绿素浓度等数据。
表1 长鳍金枪鱼捕捞量及环境因子原始数据示例
由于不同的环境因子与长鳍金枪鱼捕捞量有差异,其值的范围是不确定的。利用MATLAB软件将上述4个属性值分别进行k-means聚类分析为3类,其算法步骤如下:
1)在表1的每列数据集中,分别随机选取3个元素作为初始聚类中心。
2)对于数据集中剩下的元素,用欧式距离分别计算它们到3个类中心的相异度,按距离最近的准则将这些元素分别划归到距离它们最近的类。
3)根据聚类结果,再次计算3个类各自的中心,将每个类中所有元素对应的算术平均数作为新的中心点。
4)不断重复2)和3),直到这3个中心点不再变化。
将海表温度、海面盐度、叶绿素浓度和长鳍金枪鱼捕捞量分别划分为3个区间,按照依次增大进行量化分别以低、中、高加以符号标记,如表2所示;根据表2将聚类结果加以符号标记,如表3所示;根据表3,将原始数据在对应的范围以符号标记,如表4所示。
表2 环境因子与长鳍金枪鱼捕捞量的量化表示
表3 环境因子与长鳍金枪鱼捕捞量的聚类结果量化表示
表4 环境因子与长鳍金枪鱼捕捞量对应聚类范围的显示情况
根据概念格的定义以及捕捞量与环境因子关联分析算法,将每条船1个月捕捞量TID作为实验对象,将环境因子海表温度、海面盐度、叶绿素浓度及长鳍金枪鱼捕捞量作聚类分析处理并分别采用符号123123123123标记作为实验属性。根据表2构造以123为决策属性的海洋环境因子和长鳍金金枪鱼捕捞量的概念格。根据格中的每个概念统计外延中对象的个数,并将其量化值添加至原概念的外延中,此时外延表示渔船的数量,内涵表示环境因子和捕捞量。因内涵属性众多,概念格生成的哈斯图较为复杂,为避免造成观看混乱,分别将用户感兴趣的内涵属性123的概念节点形成3个单独的哈斯图,以便分析南太平洋长鳍金枪鱼捕捞量与环境因子的关联关系。因此得到概念格分别以321为决策属性的哈斯图,如图1、图2和图3所示。
图1 表3对应的概念格以H3为决策属性的哈斯图
图2 表3对应的概念格以H2为决策属性的哈斯图
图3 表3对应的概念格以H1为决策属性的哈斯图
在图1中,针对决策属性的长鳍金枪鱼最高捕捞量3,其表示范围是401.48~669.42t,在概念格的哈斯图中,最顶部全概念(all,Ø)节点包含全部渔船数量,而内涵属性为空,其内部隐藏含义为不包含属性捕捞量与环境因子,需从最顶部(all,Ø)节点开始向下遍历所有节点来分析内涵属性之间的关联关系,即长鳍金枪鱼捕捞量3与环境因子的关联关系。南太平洋长鳍金枪鱼捕捞量3与环境因子的关联分析如下:
第二层的概念节点按照外延的大小聚类分析可以分为3类。第一类,节点({15},{31});第二类,节点({7},{21})和节点({8},{11});第三类,节点({4},{31})和节点({4},{21})。
第一类节点({15},{31})表示捕鱼的渔船数量最多,捕捞量最高,满足条件海表温度3(27.64~30.32℃)和条件叶绿素浓度1(0.031~0.0479 mg·m-3)时,捕捞量达到最高3(401.48~669.42),即海表温度最高、叶绿素浓度最低时长鳍金枪鱼捕捞量最高,支持度为15/200,表示属性31的重要度最高。
第二类节点({7},{21})和节点({8},{11})表示捕鱼的渔船数量相差不大,支持度分别为7/200、8/200。满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)时,海面盐度为2(34.75~35.13g·kg-1)和1(33.79~34.74 g·kg-1)对捕捞量的影响不大。与节点({4},{31})相比,在叶绿素浓度为1(0.031~0.0479mg·m-3)时,海面盐度上升到3(35.14~35.74g·kg-1)时,渔船数量减少了近一半。表示在高产量区叶绿素浓度最低时,海面盐度2和1对捕捞量的影响相差很大,表示属性21和11的重要度次之。
第三类节点({4},{31})和节点({4},{21})表示渔船数量都为4,支持度为4/200,满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)时渔船数量相等,表示属性组合31和21的重要度最小。
第三层的概念为原始数据,其意义不大。
在图2中,针对决策属性长鳍金枪鱼中等捕捞量2,其表示范围是164.88~379.69t,南太平洋长鳍金枪鱼捕捞量2与环境因子的关联分析如下:
第二层的概念节点按照外延的大小通过聚类分析可以分为4类。第一类,节点({40},{1});第二类,节点({28},{3});第三类,节点({19},{2});第四类,节点({11},{3})和节点({13},{2})。
第一类节点({40},{1}),表示捕鱼的渔船数量最多,捕捞量最高,满足条件叶绿素浓度1(0.031~0.0479mg·m-3)时,长鳍金枪鱼捕捞量为2(164.88~ 379.69),即在叶绿素浓度最低1时长鳍金枪鱼捕捞量相对较高,支持度为40/200,说明在中产量区叶绿素浓度对长鳍金枪鱼捕捞量影响最大,表示属性1的重要度最高。
第二类节点({28},{3})表示有28条渔船进行捕捞,满足条件海表温度3(27.64~30.32℃)时,长鳍金枪鱼捕捞量为2(164.88~379.69),即在海表温度最高3长鳍金枪鱼捕捞量中等2,支持度为28/200,与节点({13},{2})相比,海表温度从3(27.64~30.32℃)降到2(23.81~27.56℃),渔船数量减少了15,说明海表温度越高捕捞量越高,其属性3的重要度次之。
第三类节点({19},{2})表示有19条渔船进行捕捞,满足条件海面盐度2(34.75~35.13g·kg-1)时,长鳍金枪鱼捕捞量为2(164.88~379.69),即在海面盐度中等2时长鳍金枪鱼捕捞量中等,支持度为19/200,表示属性2的重要度次之。
第四类节点({11},{3})和节点({13},{2})表示捕鱼的渔船数量相差不大,满足条件海面盐度3(35.14~35.74g·kg-1)和条件海表温度2(23.81~ 27.56℃)时,支持度分别为11/200、13/200,表示属性3和2重要度最小。
第三层的概念节点按照外延的大小通过聚类分析可以分为4类。第一类,节点({27},{31});第二类,节点({18},{21});第三类,节点({10},{31})、({12},{11})和({12},{21});第四类:节点({6},{33})和节点({7},{23})。
第一类节点({27},{31})表示捕鱼的渔船数量最多,满足条件海表温度3(27.64~30.32℃)和条件叶绿素浓度1(0.031~0.0479mg·m-3)时,长鳍金枪鱼捕捞量为2(164.88~379.69),即海表温度最高3叶绿素浓度最低1时,长鳍金枪鱼捕捞量较高2,支持度为27/200,与高产区图1中的第一类节点({15},{31})有共同的内涵组合31,表示该组合在高产量区和中产量区海表温度和叶绿素浓度对捕捞量的影响最大;海表温度最高3叶绿素浓度最低1时,捕捞量较高,其支持度分别为15/200、27/200,表示属性31的重要度最高。
第二类节点({18},{21})表示有18条渔船进行捕捞,满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)和条件海面盐度为2(34.75~35.13 g·kg-1)时,长鳍金枪鱼捕捞量为2(164.88~379.69),支持度为18/200,与节点({10},{31})相比,海面盐度从2(34.75~35.13g·kg-1)上升到3(35.14~35.74g·kg-1),而渔船数量减少了8,表示在中产量区叶绿素浓度最低时,海面盐度2和3对捕捞量的影响相差很大,与高产量区图1的节点({4},{31})和节点({8},{11})类似,其属性21的重要度次之。
第三类节点({10},{31})、({12},{11})和({12},{21})表示捕鱼的渔船数量相差不大,支持度分别为10/200,12/200,12/200,满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)时,海面盐度3(35.14~35.74g·kg-1)、1(33.79~34.74g·kg-1)和海表温度2(23.81~27.56℃)对捕捞量的影响不大,与高产量区图1的节点({4},{31})和节点({4},{21})类似,表示其属性31、11和21的重要度次之。
第四类节点({6},{33})和节点({7},{23})表示捕鱼的渔船数量相差不大,支持度分别为6/200、7/200,其属性33和23的重要度最小。
第四层的概念为原始数据,其意义不大。
在图3中:针对决策属性长鳍金枪鱼最低捕捞量1,其表示范围是0.167~159.23t,南太平洋长鳍金枪鱼捕捞量1与环境因子的关联分析如下:
第二层的概念节点按照外延的大小通过聚类分析可以分为四类。第一类,节点({114},{1});第二类,节点({66},{2})和节点({60},{2});第三类,节点({41},{3})、({38},{1})和({46},{3});第四类,节点({18},{2})和节点({27},{1})。
第一类节点({114},{1})表示捕鱼的渔船数量最多,捕捞量最高,满足条件叶绿素浓度1(0.031~ 0.0479mg·m-3)时,长鳍金枪鱼捕捞量为1(0.167~ 159.23),支持度为114/200,与节点({18},{2})相比,叶绿素浓度从1(0.031~0.0479mg·m-3)增加到2(0.082~0.159mg·m-3),其渔船数量也减少很多,表示叶绿素浓度越高其捕捞量越低,与图2的第一层第一类节点({40},{1})有共同的特点,表示在中产量区和低产量区叶绿素浓度对捕捞量的影响最大,叶绿素浓度越低其捕捞量越高,其支持度分别为40/200、114/200,表示属性1的重要度最高。
第二类节点({66},{2})、({60},{2})表示捕鱼的渔船数量相差不大,支持度分别为66/200、60/200,海表温度和海面盐度分别为2(23.81~27.56℃)和2(34.75~35.13g·kg-1),表示在低产量区海表温度2和海面盐度2对长鳍金枪鱼的捕捞量影响没有叶绿素浓度1高,与中产区图2的节点({28},{3})相似,表示属性2和2的重要度次之。
第三类节点({41},{3})、({38},{1})、({46},{3})表示捕鱼的渔船数量相差不大,支持度分别为41/200、38/200、46/200,说明海面盐度3(35.14~35.74g·kg-1)、1(33.79~34.74g·kg-1)和海表温度3(27.64~30.32℃),在低产量区对长鳍金枪鱼的捕捞量影响不大,与中产区图2的第二层第三类节点({19},{2})相似,表示属性3、1和3的重要度次之。
第四类节点({18},{2})和节点({27},{1})表示渔船数量分别为18、27,说明叶绿素浓度2(0.082~0.159mg·m-3)和海表温度1(17.42~23.31℃),在低产量区对长鳍金枪鱼的捕捞量影响最小,与中产区图2的节点({11},{3})和节点({13},{2})类似,表示其属性的重要度最小。
第三层的概念节点按照外延的大小通过聚类分析可以分为7类。第一类,节点({62},{21});第二类,节点({49},{21})和节点({45},{31});第三类,节点({32},{31})和节点({32},{11});第四类,({23},{23});第五类,节点({13},{12})和节点({13},{12});第六类,节点({10},{13})、({9},{31})、({8},{32})、({7},{13})和({7},{11});第七类,({4},{11})。
第一类节点({62},{21})表示渔船数量最多,有62条渔船进行捕捞,占总渔船数量的62/200,满足条件海表温度2(23.81~27.56℃)和条件叶绿素浓度1(0.031~0.0479mg·m-3)时,长鳍金枪鱼捕捞量为1(0.167~159.23),表示在低产量区海表温度中等叶绿素浓度最低时,长鳍金枪鱼捕捞量相对较高,支持度为62/200,与高产量区的节点({15},{31})和中产量区的节点({27},{31})相比,支持度分别为15/200、27/200、62/200,说明海表温度与叶绿素浓度的组合对捕捞量的影响最大,表示属性的重要度最高。
第二类节点({49},{21})和节点({45},{31})表示渔船数量相差不大,支持度分别为49/200、45/200,满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)时,海面盐度2(34.75~35.13g·kg-1)和海表温度3(27.64~30.32℃)对捕捞量的影响次之,与高产量区图1的节点({7},{21})、({8},{11})和中产量区图2的节点({18},{21})类似,表示其属性的重要度次之。
第三类节点({32},{31})和节点({32},{11})表示渔船数量都为32,支持度为32/200,满足条件叶绿素浓度都为1(0.031~0.0479mg·m-3)时,海面盐度对捕捞量的影响不大,与中产量区图2的节点({10},{31})、({12},{11})、({12},{21})类似,表示其属性的重要度次之。依此类推,其余节点表示属性重要度依次降低。
第四层的概念为原始数据,其意义不大。
首先,通常高产量区少中产量区较多低产量区最多,在图1长鳍金枪鱼捕捞量最高3中,第一类节点({15},{31})表示捕鱼的渔船数量最多,属性组合31的支持度为15/200,即在海表温度为27.64~30.32℃、叶绿素浓度都为0.031~0.0479mg·m-3时长鳍金枪鱼捕捞量最高。在图2长鳍金枪鱼捕捞量最高中,第一类节点({27},{31})表示捕鱼的渔船数量最多3属性组合31的支持度为27/200。在图3长鳍金枪鱼捕捞量最高1中,第二层第一类节点节点({62},{21})表示捕鱼的渔船数量最多,组合31的支持度为62/200,表示中高产量区海表温度和叶绿素浓度的组合对长鳍金枪鱼捕捞量的影响最大,即海表温度越高叶绿素浓度最低时捕捞量最高,表示属性组合31重要度最高。另外,图1的第一层第二类组属性组合11支持度为8/200,图2的第三层第二类属性组合21支持度为18/200,图3的第三层第二类属性组合21支持度为49/200,表示属性组合11、21重要度次之;依次类推,其余节点属性重要度依次减少。
其次,图2中第二层第一类节点({40},{1})表示捕鱼的渔船数量最多,支持度为40/200,即在叶绿素浓度都为0.031~0.0479mg·m-3时长鳍金枪鱼捕捞量最高。图3中第二层第一类节点({114},{1})表示捕鱼的渔船数量最多,支持度为114/200,说明在中低产区叶绿素浓度对长鳍金枪鱼捕捞量的影响最大,即叶绿素浓度最低时捕捞量最高,表示属性1(0.031~0.0479mg·m-3)重要度最高。图2的第三层第二类节点({28},{3})和图3的第三层第二类节点({66},{2})次之,其支持度分别为28/200、66/200,表示属性3(27.64~30.32 ℃)、2(23.81~27.56 ℃)重要度次之;依此类推,其余节点属性重要度依次减少。
综上,属性组合31即在海表温度为27.64~30.32℃、叶绿素浓度都为0.031~0.0479mg·m-3时长鳍金枪鱼捕捞量最高。属性3即在海表温度为27.64~30.32℃时长鳍金枪鱼捕捞量较高。海面盐度对长鳍金枪鱼捕捞量的影响较小,可能是受温度的影响,但在中产量区海面盐度2(34.75~35.13g·kg-1)时也有一些影响,捕捞量较高。本文的研究利用概念格的哈斯图展示环境因子与捕捞量之间的泛化和特化关系,根据各属性值的支持度,分析了影响渔场分布的海洋环境因子的重要度;并实现了渔船定位捕捞与环境因子的关联分析,以提高渔船的调度和捕捞效率。
本文提出了捕捞量与环境因子关联分析算法,对渔船定位捕捞与环境因子进行关联分析。采用 k-means算法分别将各属性值聚类,并构造相应的概念格。在概念格的哈斯图中,能够清晰地分析概念捕捞量与概念环境因子之间的关联关系,并根据各内涵属性的支持度来分析环境因子的重要度。研究表明,海表温度和叶绿素浓度是影响南太平洋长鳍金枪鱼捕捞量最重要因素。本文方法对北斗导航系统定位渔船的合理捕捞区域、对南太平洋的长鳍金枪鱼资源的合理开发提供了一种参考方法,能够提高渔情分析的效率。
[1] 陈锦淘, 戴小杰, 谷兵. 中国南太平洋长鳍金枪鱼业发展对策的分析[J]. 中国渔业经济, 2005(2): 49-51.
[2] 毛江美, 陈新军, 余景. 基于神经网络的南太平洋长鳍金枪鱼渔场预报[J]. 海洋学报, 2016, 38(10): 34-43.
[3] 宋利明, 谢凯, 赵海龙, 等. 库克群岛海域海洋环境因子对长鳍金枪鱼渔获率的影响[J]. 海洋通报, 2017, 36(1): 96-106.
[4] 杨元喜. 北斗卫星导航系统的进展、贡献与挑战[J]. 测绘学报, 2010, 39(1): 1-6.
[5] 吴海玲, 高丽峰, 汪陶胜, 等. 北斗卫星导航系统发展与应用[J]. 导航定位学报, 2015, 3(2): 1-6.
[6] 王德兴, 胡学钢, 刘晓平. 量化扩展概念格的属性归纳及多粒度规则挖掘[J]. 系统工程学报, 2009, 24(1): 54-61.
[7] 孙金鑫. 数据挖掘中的关联规则的研究[J]. 智能计算机与应用, 2018, 8(3): 132-135.
[8] 王德兴, 胡学钢, 刘晓平, 等. 基于量化扩展概念格的属性归纳算法[J]. 模式识别与人工智能, 2007, 20(6): 843-848.
[9] 王德兴, 杜润芝, 袁红春, 等. 导航电子地图中适宜比例尺的优选[J]. 导航定位学报, 2018, 6(2): 116-120.
[10] WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts, in ordered sets[M]. Dordrecht, Netherlands: Reidel, 1982: 445-470.
[11] WILLE R. Concept lattices and conceptual knowledge systems[J]. Computers and Mathematics with Applications, 1992, 23(6-9): 493-515.
[12] GODIN R, MISSAOUI R, ALAOUI H. Incremental concept formation algorithms based on Galois(concept) lattices[J]. Computational Intelligence, 1995, 11(2): 246-267.
Association analysis between fishing vessel positioning and environmental factors
WANG Dexing, LUO Jingjing, YUAN Hongchun
(College of Information Technology, Shanghai Ocean University, Shanghai 201306, China)
Aiming at the problem that it is difficult to extract effective information to locate fishing areas due to the rapid growth of marine environmental data and fishery operation data, the paper proposed an association analysis algorithm of catch and environmental factors which determines the importance of environmental factors according to the support of each attribute value: k-means algorithm was used to cluster and mark the sea surface temperature, sea surface salinity, chlorophyll a concentration and catch; and the intervals of environmental factors and catch were mapped into single-valued attributes to construct the corresponding concept lattice; then the extension quantified values were used to record the number of fishing vessels; finally, Hasse diagrams with the decision attributes of high, medium and low catch were obtained. The relationship of catch and environmental factors could be clearly viewed in the Hasse of concept lattice. Experimental result showed that the catch of the albacore tuna would be the highest when the sea surface temperature was ranged from 27.64 to 30.32oC and the Chl-a was varied from 0.0310 to 0.0479 mg·m-3, with the most importance of its attribute combination, which could provide a reference for reasonably locating the fishing areas for fishing vessels.
albacore tuna; catch; environmental factors; concept lattice; association analysis; fishing vessel positioning
P228
A
2095-4999(2019)04-0042-08
王德兴,罗静静,袁红春.渔船定位捕捞与环境因子的关联分析[J].导航定位学报,2019,7(4): 42-49.(WANG Dexing,LUO Jingjing,YUAN Hongchun.Association analysis between fishing vessel positioning and environmental factors[J].Journal of Navigation and Positioning,2019,7(4): 42-49.)
10.16547/j.cnki.10-1096.20190408.
2019-02-26
国家自然科学基金项目(41776142);上海市科委科技支撑项目(14391901400)。
王德兴(1968—),男,河北保定人,博士,副教授,研究方向为人工智能、数据挖掘等。
罗静静(1992—),女,江苏淮安人,硕士生,研究方向为数据挖掘。