基于AIS数据的海上电子围栏选址

2023-08-26 03:01崔志伟张宇琳张飞舟
导航定位学报 2023年4期
关键词:锚地围栏聚类

崔志伟,张宇琳,张飞舟,高 姗

基于AIS数据的海上电子围栏选址

崔志伟1,2,张宇琳1,张飞舟1,高 姗3

(1.北京大学 地球与空间科学学院,北京 100091;2. 32011部队,北京 100094;3. 中国自然资源航空物探遥感中心,北京 100083)

针对电子围栏在海洋交通管理应用中的选址粗放问题,利用船舶自动识别系统(AIS)数据聚类分析实现海上电子围栏的选址:通过数据清洗和特征抽取对AIS原始数据进行筛选,构建具有时序特征的属性数组;并采用改进的基于密度聚类(DBSCAN)算法对AIS数据进行聚类计算,挖掘分析出船舶的实际空间分布特征;然后给出海上电子围栏选址的具体方法和流程;最后以最小外接矩形方法获得研究区域电子围栏边界位置。实验结果表明,该方法获取的海上电子围栏在需求覆盖率、流速稳定性和靠近航道距离等方面的性能都有较大的提高,具有较为广阔的应用前景,可为港口的精细化、科学化管理提供技术支撑。

密度聚类(DBSCAN)算法;最小外接矩形;电子围栏;自动识别系统;有效性分析

0 引言

20世纪90年代初,为弥补船舶交通管理系统(vessel traffic service,VTS)和传统雷达在高精度定位、船舶唯一编码等方面的不足[1],加强全球海上交通管制,维护海上航行安全,欧、美等国家结合数字选择呼叫(digital selective calling,DSC)技术开始研究测试船舶自动识别系统(automatic identification system,AIS)[2]。1998年瑞典率先建成一个全国性的AIS系统,带动了国际AIS系统的建设发展。AIS系统的技术理念和运行模式由基站式逐步向网络化、信息化、智能化过渡,如今已形成天基、岸基和船载AIS系统共同提供船舶管理服务的局面。当前,我国海上经济迅猛发展,AIS系统每天产生海量具有时空属性的航迹数据,量级上也将从现在的吉(十亿)字节(gigabyte,GB)、太(万亿)字节(terabyte,TB)级逐步增长到拍(千万亿)字节(petabyte,PB)、艾(百亿亿)字节(exabyte,EB),乃至泽(十万亿亿)字节(zettabyte,ZB)级[3],为水上交通、海洋渔业、海洋生态、安全监视等[4-7]海上活动的动态监管提供数据基础。文献[8]通过对AIS数据降噪处理,并在模型中融合历史数据,提取了精度较高的船舶轨迹;文献[9]基于实时的AIS数据建立了航道交通拥堵的快速判定模型,实现了航道交通流量的实时监测和及时管控;文献[10]在分析大量AIS数据基础上,对船舶轨迹异常进行了归纳分类,并实现轨迹异常的自动检测;文献[11]采用深度学习的方法从实时AIS数据中提取特征,提高了渔业活动识别预测的准确性;文献[12]针对海上风电场在船舶航行、航路规划等方面产生的不利影响,提出了将电子围栏系统应用服务于海上风电场等重点监管海域的新型航海保障模式;文献[13]面向海运大数据统计分析需求,以港口、泊位为中心,以特定值为半径画圆,计算生成特定海域的电子围栏范围。目前海上电子围栏选址方法多为通过实地调研手工绘制,在选址精度和效率方面有待进一步提升,同时AIS数据挖掘研究成果却非常丰富;因此本文基于AIS数据开展海上电子围栏选址的研究,通过对AIS数据进行聚类处理,分析港口船舶停留的空间分布特征,并据此提出电子围栏建设的选址方法,为实现船舶精细化、科学化助航监管提供技术参考。

1 AIS数据

AIS数据包括静态信息、动态信息、航次相关信息和安全相关信息[14],如表1所示。其中,静态信息指由船名、船型、海上移动业务标识等构成的固定不变的信息。动态信息指由传感器获得的船舶地理位置(经度、纬度)、航向、航速、时间等船舶动态信息。航次相关信息指由人工输入的航线计划、预计达港时间、吃水、载货类型等信息。安全信息即对船舶航行安全构成影响的气象、告警、禁航等信息。

表1 AIS数据属性

AIS数据的挖掘主要可以分为时空模式挖掘、聚类、分类和时空异常检测等类型,本文通过对AIS数据进行数据清洗、特征抽取和聚类计算实现船舶空间特征的挖掘分析,并在此基础上对海上电子围栏的选址计算进行研究。

2 改进的DBSCAN聚类算法

算法主要步骤为:

6)标记出所有核心点、边界点和噪声点;

7)输出聚类结果。

3 基于改进DBSCAN算法的选址方法

3.1 选址流程

图1 选址流程

3.2 数据挖掘

3.2.1 数据清洗

由于数据在接收、传输过程中不可避免地受到环境、设备等因素的影响,AIS数据通常会存在信息重复、缺失、错误等问题。如天津港地理位置经度位于117°E—119°E之间,纬度位于38°N—40°N之间,而由于信息错误会出现航迹点坐标在上述范围之外的漂移点。为消除异常数据对后续AIS数据时空聚类的影响,本文对前后信息完全一致的重复数据、定位偏离正常地理范围的漂移数据和海上移动业务标识(maritime mobile service identify,MMSI)错误的噪声数据进行筛选或剔除。另一方面,本文研究主要基于静态船舶的空间分布特征来选取电子围栏的建设位置,须对航行船舶数据进行二次筛除。在风、流共同作用下,走锚船只实际漂移速度通常不大于2节[17];因此,以航速大于2节作为航行船舶数据的判断标准。AIS数据清洗相关属性可信范围如表2所示。

表2 AIS数据主要属性可信范围值

3.2.2 特征抽取

表3 特征抽取数据列表

3.2.3 聚类计算

3.3 选址计算

改进的DBSCAN聚类算法将符合邻域密度阈值的静态船舶点位聚类后分组为由一个个点簇构成的集合,可以准确呈现出不同海域不同船舶的停留需求。本文通过航道数据将研究区域划分为不同的子区域,在各子区域的所有需求集群中,分别查找需求量最大的集群,通过最小外接矩形方法计算集群边界作为电子围栏的近似范围,如图3所示为电子围栏选址计算的具体过程。

图3 电子围栏选址计算具体过程

3.4 选址有效性分析

4 实验与结果分析

表4 实验条件说明

图4 实验范围示意

图5 航迹点聚类结果

通过聚类挖掘可以看出,天津港大沽口北锚地、大沽口散化锚地、大沽口南锚地范围分别为12.9 km×4.6 km、5.5 km×4.2 km和7.4 km×4.3km,与实际锚地范围基本相符。船舶停泊在空间分布上总体呈现出规律性聚集的特点,如大沽口北锚地、大沽口散化锚地和大沽口南锚地等,而大沽口北锚地东侧海域虽未规划相应锚地范围,大型船舶依然呈现出较强的聚集性,03登船区北侧海域由于水深较浅,船舶以渔船为主,又呈现出较为明显的离散性。不难发现,天津港船舶停泊整体规范之外,对部分船只的停靠和管理还存在着薄弱环节,如十万吨级锚地的船舶虽聚集性较好,但未严格按照锚地进行停泊,而大沽口北锚地东侧海域船舶停留则缺乏有效的锚地规划和船舶管理措施,如图6所示。

图6 锚地规划范围

基于固定航道和船舶空间分布特征,在研究区域给出3个密度较大集群的最小外接矩形作为电子围栏的边界,如图7所示。

图7 电子围栏选址结果

对水深、底质、流速、距航道距离、需求覆盖率等5项评价指标进行两两比较,采用1~9标度表述其差别,通过构建判断矩阵求解各项权重值,最终获得5项评价指标对应的权重值,如表5所示。

表5 各项指标权重值

针对对比方案中各项评价指标按照有效性分别进行10分制评分,并通过式(4)加权计算其综合评分值,如图8所示。

图8 不同方案定量评分对比

可以看出:利用本文方法获取的选址方案总体性能更优,2种方案在水深、底质方面的条件基本吻合;而本文选址方案内流速更小,利于锚泊船只航行安全,并且整体离航道的距离更近,需求覆盖率更高。测试结果表明,该选址方法可以有效地帮助在研究区域内选择合适的位置建立电子围栏。

5 结束语

港口建设是我国深化对外开放的重要途径。随着大数据、物联网等新技术的发展应用,我国港航业机遇与挑战并存。为保障海上交通科学有序发展,海事部门构建了船舶自动识别系统、船舶交通服务系统、闭路电视监控系统等多元化管理手段,但依然存在船舶进出港口不报告、船舶停泊不进锚地等管理难点。本文基于AIS数据提出一种海上电子围栏选址的方法框架,采用改进的DBSCAN聚类算法对天津港大沽口锚地的停留船舶进行时空聚类分析,并在此基础上通过最小外接矩形方法找到电子围栏建设的合理位置。通过对比分析,利用本文方法得出的选址结果在流速、距航道距离和需求覆盖率等方面优势更明显。本文初步选取了天津港水域内静态船舶的AIS数据进行处理和研究,下一步将结合航行船舶AIS数据对电子围栏选址的影响进行深入研究。

[1] 牛健春. AIS在VTS船舶交通管理系统中的作用[J]. 航海技术, 2003(1): 38-39.

[2] 杨永康. 通用船舶自动识别系统(UAIS)性能和使用[J]. 航海技术, 2004(1): 21-24.

[3] 李德仁. 论时空大数据的智能处理与服务[J]. 地球信息科学学报, 2019, 21(12): 1825-1831.

[4] ZHANG L, MENG Q, FWA T F. Big AIS data based spatial-temporal analyses of ship traffic in Singapore port waters[J]. Transportation Research Part E: Logistics and Transportation Review, 2019, 129: 287-304.

[5] 李晓恩, 周亮, 肖杨, 等. 基于渔船AIS数据的南海北部海洋渔业捕捞强度空间特征挖掘[J]. 地球信息科学学报, 2021, 23(5): 850-859.

[6] LIU T K, TSAI T K. Vessel traffic patterns in the port of Kaohsiung and the management implications for preventing the introduction of non-indigenous aquatic species[J]. Marine Pollution Bulletin, 2011, 62(3): 602-608.

[7] FU P, WANG H, LIU K, et al. Finding abnormal vessel trajectories using feature learning[J]. IEEE Access, 2017, 5: 7898-7909.

[8] 高大为, 朱永生, 张金奋, 等. 基于AIS数据的船舶航迹多维预测方法[J]. 中国航海, 2021, 44(3): 56-63.

[9] 何正伟, 刘力荣, 杨帆, 等. 基于AIS实时数据的航道交通拥堵快速判定方法[J]. 中国航海, 2018, 41(2): 113-118, 129.

[10] 吴建华, 吴琛, 刘文, 等. 舶舶AIS轨迹异常的自动检测与修复算法[J]. 中国航海, 2017, 40(1): 8-12, 101.

[11] SHEN K Y, CHU Y J, CHANG S J, et al. A study of correlation between fishing activity and AIS data by deep learning[J]. TransNav: International Journal on Marine Navigation and Safety of Sea Transportation, 2020, 14:527-531.

[12] 苏斌, 王有军, 李星. 浅谈AIS海上电子围栏系统及在海上风电场的应用[J]. 航海技术, 2021(5): 38-41.

[13] 赵龙飞, 姜晓轶, 孙苗, 等. 面向海运统计的AIS大数据挖掘分析研究[J]. 海洋科学, 2021, 45(12): 55-64.

[14] 卫桂荣, 杨春. 船舶AIS数据错误检测方法[J]. 中国航海, 2016, 39(4): 11-14.

[15] ESTER M, KRIEGEL H P, SANDER J, et al. A density-based algorithm for discovering clusters in large spatial databases with noise[C]// Proceedings of the Second International Conference on Knowledge Discovery and Data Mining(KDD-96). [S.l.]: [s.n.], 1996: 226-231.

[16] 宋董飞, 徐华. DBSCAN算法研究及并行化实现[J]. 计算机工程与应用, 2018, 54(24): 52-56, 122.

[17] 李学东. 港外锚地相对安全距离研究[J]. 中国港湾建设, 2015, 35(1): 16-18, 24.

[18] 周江华, 胡云平. 基于层次分析法的宁波港锚地选择方案[J]. 浙江海洋学院学报(自然科学版), 2004, 23(4): 315-319.

[19] 董如梅, 王庆林, 陈锦娣. 一种两两比较判断矩阵的探讨[J]. 北京理工大学学报, 2000, 20(4): 407-411.

Siting of maritime electronic fence based on AIS data

CUI Zhiwei1,2, ZHANG Yulin1, ZHANG Feizhou1, GAO Shan3

(1. School of Earth and Space Sciences, Beijing University, Beijing 100091, China; 2. Troops 32011, Beijing 100094, China; 3.China Aero Geophysical Survey and Remote Sensing Center for Natural Resources, Beijing 100083, China)

Aiming at the problem of rough site selection in the application of electronic fences in marine traffic management, the paper proposed a site selection method of marine electronic fences by using the clustering analysis of automatic ship identification system (AIS) data: the original AIS data were screened by data cleaning and feature extraction to construct an attribute array with time-series characteristics; and an improved density-based spatial clustering of applications with noise (DBSCAN) algorithm was used to cluster the AIS data to mine and analyze the actual spatial distribution characteristics of ships; then a specific method and its process for siting the maritime electronic fence were given; finally, the boundary location of the electronic fence in the study area was obtained by the minimum enclosing rectangle method. Experimental result showed that the performance of the maritime electronic fence obtained by the proposed method would be greatly improved in terms of demand coverage rate, flow speed stability and distance close to the channel, which could have a relatively broad application prospect and provide technical support for the refined and scientific management of the port.

density-based spatial clustering of applications with noise (DBSCAN) algorithm; minimum enclosing rectangle; electronic fence; automatic identification system; validity analysis

崔志伟, 张宇琳, 张飞舟, 等. 基于AIS数据的海上电子围栏选址[J]. 导航定位学报, 2023, 11(4): 49-55.(CUI Zhiwei, ZHANG Yulin, ZHANG Feizhou, et al. Siting of maritime electronic fence based on AIS data[J]. Journal of Navigation and Positioning, 2023, 11(4): 49-55.)DOI:10.16547/j.cnki.10-1096.20230407.

P228

A

2095-4999(2023)04-0049-07

2022-11-18

崔志伟(1988—),男,河南商丘人,硕士研究生,研究方向为卫星导航应用、空间信息智能处理。

张飞舟(1966—),男,北京人,博士,教授,研究方向为智慧城市、物联网以及空间信息智能处理。

猜你喜欢
锚地围栏聚类
恐龙公园
长江江苏段港口锚地现状及发展建议
天津港船舶定线制与优化锚地规划的思考
TBS围栏灭鼠技术
连云港港30万吨级航道六、七、八号锚地启用
连云港港30万吨级航道六、七、八号锚地启用
动物园
基于DBSACN聚类算法的XML文档聚类
电子围栏系统在水厂中的应用
基于高斯混合聚类的阵列干涉SAR三维成像