基于非监督学习的海上目标行为分析技术研究

2020-07-13 02:11
探索科学(学术版) 2020年1期
关键词:航迹线段聚类

朱 刚 胥 刚

中国电子科技集团公司第二十八研究所 江苏 南京 210007

1 引言

随着船舶业的快速发展,水上安全监管形势越发严峻。准确及时地掌握对方规律,预判对手的行为特点,实现战场态势实时感知[1]、海上搜救和海上交通指挥是海事系统的关键内容。船舶实时航迹数据作为直观反映船舶与环境、船舶与船舶的相互作用、相互影响的时空证据,其中蕴含了船舶行为模式,通过有效的方式对船舶航迹数据的挖掘,能够为辨识船舶行为、进行有效的船舶行为监控和管理提供新的方式[2],因此,如何有效利用船舶的海量航迹数据,识别船舶运动模式,进一步辅助水上安全监管,已经成为当前海事领域的热点课题。

2 非监督学习聚类算法

由于海上船舶航迹数据无典型的相似性,难以正确选择样本进行标注,因此本论文采用无需标注数据的非监督学习聚类方法,对船舶历史轨迹进行聚类,并生成航行规则模型。针对船舶运动建模,通常有基于轨迹点和基于轨迹段两种。本课题采用基于轨迹段的方式。该方法首先依据轮廓将船舶航迹分成线段,获取航迹点数量不等的轨迹线段集合。在每个线段中,采用起始点、结束点的运动状态(位置、航向、航速)及变化描述船舶的运动特征。线段的集合作为密度空间聚类算法(DBSCAN)的输入。DBSCAN 将集合中的所有点分为核心点、边界点和噪声点,判断一个数据点是何种类型主要由算法中的两个参数ε、Min Pts。ε 确定对象的领域范围大小的半径,Min Pts是设定的阈值[3]。

基于线段的密度空间聚类算法原理如下:假定数据集Li、Lj、Lk为数据集D中的单条线段。

(1)ε-邻域集Nε:Nε(Li)为Li在数据集D 内所有与Li距离小于领域范围ε的数据集合。

(2)核心线段;给定数值参数ε、Min Pts,若Nε(Li)中的数据量大于等于Min Pts,则认为Li为核心线段。

(3)直接密度可达;给定数值参数ε、Min Pts,若Lj为核心线段,Li在它的ε-邻域集当中,则认为Li从Lj直接密度可达。

(4)密度可达:给定数值参数ε、Min Pts,若从Li到Lk直接密度可达,从Lk到Lj也直接密度可达,则认为Li到Lj密度可达。

(5)密度相连:给定数值参数ε、Min Pts 若存在Lk,Li与Lj同时从Lk密度可达,则认为Li与Lj互相密度相连。

(6)噪声:给定数值参数ε、Min Pts,若Li与数据集D内所有数据都不密度相连,则认为Li为噪声。

3 海上目标行为分析方法

训练数据是大量历史航迹点,其中包含了正常航迹点和部分的异常航迹。本项目使用非监督聚类的方法,将航迹聚类,挖掘航迹线段间的关联,剔除异常信息,针对聚类后数据进行网格训练,生成网格区域的航向和航速特征。

3.1 数据预处理 数据预处理主要是为了剔除数据中的无效数据,避免异常值产生的偏差。数据预处理首先将历史数据按照船舶类型进行分类,接着去除速度、位置、方向异常值;然后对航迹点位置进行坐标变换;最后对目标的航迹进行关键点进行提取,进行航迹抽稀处理。

3.2 航迹聚类 对预处理后的航迹数据进行聚类分析,目的是为了提取航迹中具有相似特性的航迹集,剔除离群的航迹。本文使用基于线段的密度空间聚类算法。根据数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是组内的对象相互之间相似,而不同组中的对象不相似。针对不同类型的目标航迹需要单独训练相关属性,并且从历史数据中剔除异常数据。

3.3 区域网格化 区域网格化将海上区域划分为指定区域大小的位置网格,分别训练每个网格中航迹点总数、方向、速度的规则模型。

3.4 航线规则训练生成 位置模型训练的是从历史数据中提取船舶位置规律,学习各类型舰船主要去的区域。具体方法是统计在网格化区域中的各个区域通过的船舶数量,因为船舶航路经过的网格会有大量历史航迹点,而非正常线路的历史航迹点很少或没有。位置模型可辅助支持对船舶航行异常区域行为的监测。

速度模型训练的是从历史数据中提取船舶速度规律,学习各艘船舶在不同区域的速度分布。具体方法是通过统计直方图和箱型图来统计区域网格内的最大和最小速度分布。速度模型可以为船舶速度异常、疑似漂航行为提供支持。

方向模型训练是从历史数据中提取船舶在各位置的航向规律,学习各航道各艘船舶在不同区域的正常航向范围,方向模型可以为船舶偏离航线行为提供支持。

4 试验结果分析

本文提出一种基于非监督学习的海上目标行为分析方法,利用目标航迹的模拟数据,进行航道聚类,挖掘航迹线段间的关联,剔除异常信息,针对聚类后数据进行网格训练,生成网格区域的航向和航速特征,针对实时航迹数据,进行对船舶行为进行监测。

通过试验,模拟2000批目标进行实时检测,对航行异常区域行为的发现率是90%,对船舶速度异常的发现率是92%,对船舶偏离航线行为的发现率是95%。

5 结束语

当前系统主要靠人工设定规则和指挥员经验来发现船舶的异常行为,过程比较复杂且与船舶实际航行规律存在偏差,误报警过多,且容易遗漏船舶异常行为。本论文将机器学习方法应用到海上目标行为分析中,可以改进系统自动对船舶异常行为监控能力,提升系统的自动化和智能化水平。

猜你喜欢
航迹线段聚类
画出线段图来比较
梦的航迹
怎样画线段图
数线段
自适应引导长度的无人机航迹跟踪方法
基于高斯混合聚类的阵列干涉SAR三维成像
视觉导航下基于H2/H∞的航迹跟踪
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
观察