大数据处理下的水面舰反潜鱼雷发现概率计算模型构设∗

2018-08-28 02:50
舰船电子工程 2018年8期
关键词:数据量反潜特征向量

刘 杰

(中国人民解放军91388部队91分队 湛江 524022)

1 引言

水面舰反潜鱼雷发现概率是水面舰反潜作战能力的一个重要指标,发现概率的高低直接决定了水面舰打击潜艇的效果。鱼雷出管后,能否发现目标,受到多方面因素的影响,主要包括发射时刻敌我态势、本舰和目标运动参数、鱼雷射击诸元和预设定参数、鱼雷性能、海洋环境、目标潜艇类型、目标是否采取对抗措施、系统解算误差、鱼雷航行误差等。在水面舰综合反潜火控设备显控台上能够看到鱼雷攻击潜艇的实时发现概率,对指挥员的指挥决策起到辅助作用,但是目前由于受到计算方法的限制,可参考性不强。

大数据分析算法就是对海量的各种各样的数据进行计算,找出数据之间的相关关系,与针对“小数据量”的传统算法相比,避免了在采样过程中信息的丢失以及算法本身的误差。利用水面舰在试验、训练、演习等过程中收集的有关使用鱼雷反潜的大量数据进行分析计算,能够更加准确地预测当前条件下水面舰反潜鱼雷的实时发现概率。

2 大数据

大数据的定义为无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。是信息网络技术发展的一个必然产物,其冲击对于任何领域和行业都无法避免,军事领域也是如此[1~4]。

2.1 大数据的特点

大数据的第一个特点就是“大”,即数据总量巨大。数据大小通常都在PetaBytes到ExaBytes,至少在GigaBytes;第二个特点是数据高速增长。随着信息技术的发展,任何事物都可以被数据化,数据量呈现爆炸式的增长,数据更新速度非常快,因此,对很多实时数据要进行快速处理,平衡数据量和处理速度之间的关系也是大数据分析的一个难点;第三个特点是数据种类繁多,关系复杂。随着数据收集能力的提高,收集到的数据类型也越来越多,质量参差不齐,各种数据之间都相互作用,简单地剔除较差的数据会导致数据的大量浪费;第四个特点是有价值数据占的比例较小,即价值密度较低。

上述四个典型特点可以用4V表示,分别为总量(volume)、速度(velocity)、多样性(variety)、价值(value)[5]。

2.2 数据挖掘

由于大数据的特点,传统的统计学方法无法对其进行处理,因此,出现了一系列的大数据处理技术,即系列使用非传统的工具来处理大量的结构化、半结构化和非结构化数据,从而获得分析和预测结果的一系列数据处理技术[6]。

数据挖掘也称为现代统计学,是对大数据进行分析处理的一门方法,是对传统统计方法的延伸和扩展,最早是由Fayyad在1995年[7]知识发现会议上所提出来的他认为数据挖掘是一个自动或半自动化地从大量数据中发现有效的、有意义的、潜在有用的、易于理解的数据模式的复杂过程。数据挖掘的核心任务是对数据特征和关系的探索、建立。根据要探索的数据关系是否有目标,可以将数据挖掘的功能分为两大类,一类称为有指导的学习,是对预设目标的概率学习和建模,主要由分类、估计和预测三方面的功能构成,其中分类是较为基础的,用于概念的识别,估计是对概念量的认识,预测则是对未知情况的判断;另一类是无指导的学习,旨在寻找和刻画数据的概念结构,主要由关联分组、聚类和可视化三方面的内容构成,主要任务是提炼数据中潜在的模式,探索数据之间的联系和内在结构[8~12]。本文的数据模型主要采用聚类的方法找出影响鱼雷发现概率的所有因素之间的联系。

3 发现概率计算模型的构设

3.1 水面舰反潜鱼雷发现概率

发现概率是对鱼雷出管后,按照预设定参数和设定的射击诸元进行动作,发现目标情况的定量描述。

影响水面舰反潜鱼雷发现概率的因素可分为本舰、目标、鱼雷、探测系统、环境等五个方面,每一方面都包含多种因素,具体如下所示:

本舰:类型、工作状态、运动参数、发射时刻与目标的相对态势、系统解算误差、系统工作方式等;

目标:类型、性能、运动参数、是否采取对抗等;

鱼雷:类型、性能、发射方式、预设定参数、射击诸元、航行(飞行)误差等;探测系统:类型、性能、使用方式、使用状态等;环境:水文、气象、海况、海区深度、海底底质等。

3.2 模型构设

鱼雷发射出去后能否发现目标主要由发射时鱼雷射击诸元是否正确、发射后鱼雷的执行能力、目标的性能及是否采取对抗等决定,因为对反潜武器系统来说,目标是否会采取对抗措施以及采取何种对抗措施,在实际作战中很难提前预料,所以,本文在模型构设时假定目标不采取对抗措施。

水面舰每发射一条鱼雷,就用一个特征向量P表示鱼雷攻击目标的过程数据,形式如式(1)所示。

式中a1,a2,…,a5分别表示上述影响鱼雷发现目标的五个方面,即本舰、目标、鱼雷、探测系统和环境,每个方面包含的因素都用一个变量表示,ϕ表示本次鱼雷发射后是否发现目标,0表示未发现,1表示发现。

设训练样本集为X,共包含n个特征向量,每个特征向量用 Pi=(ai1,ai2,…,ai5,ϕi) 表示,其 中(i=1,2,…,n),使用欧式距离来计算系统鱼雷发现概率。

对所有di<β(β是一个判断样本相似性的阈值,根据实际使用进行确定)的数据按式(3)统计鱼雷发现概率δ:

式中m表示di<β的特征向量总数,ϕk表示其对应的发现目标情况(是否发现)。

欧式距离判断方法需要对样本集中的每个样本进行计算,计算效率比较低,不适用于大规模数据集。当训练样本集中的样本量非常大时,可以采用聚类分析(二分k-均值算法或BIRCH算法等)的方法先将训练样本集划分成K类(K根据实际使用进行确定)[8],聚类的原则是使类内样本的相似度达到最大,而类间样本的相似度达到最小,然后计算与每个类的聚类中心的欧式距离,选择距离最小的类作为的类别,再按式(3)计算鱼雷发现概率δ,此时式中的m表示所属类别中特征向量的总数。计算流程详见图1所示。

图1 鱼雷发现概率计算流程图

3.3 可行性和存在困难

本文的计算模型是否可行,主要受数据和数据处理方法两个方面的影响。目前基于互联网的大数据分析技术已经在不同领域得到了应用,并取得了很好的效果,数据挖掘方法日趋完善,能够很好地对大规模数据进行组织、分析和存储。近年来,我海军舰船数量迅速增加,外出执行训练、演习、试验以及其他任务频繁,发射了大量的反潜鱼雷,期间产生的数据量急剧增加,多年来积累了大量与鱼雷发现目标相关的数据,因此,从理论上来说,本文计算模型可行。

但是想在水面舰反潜武器系统中实现该模型,还存在计算量和训练样本集实时更新的难题,要实现对大数据的实时处理,需要大量的存储设备和处理设备,目前互联网中解决该问题的方式主要是采用云计算,通过大众参与的方式来处理大规模数据。因此,海军舰船可以参考云计算的概念,通过某种方式将所有舰船上的计算和存储设备进行共享,充分利用各舰船闲置的存储和处理数据的能力,实时处理大规模数据,得到反潜鱼雷发现概率以及更新训练样本集的目的。同时随着计算机处理和存储数据能力的提升,将来大数据实时处理的难题应该能够得到更好的解决。

4 结语

数据就是信息,如何利用日益增加的数据来提升我军装备的战斗力,是一个需长期研究的过程。数据是客观的,当数据量足够大时,就一定能够从中找出我们需要的信息。本文提出的计算模型是基于大数据的预测能力,充分利用了舰船在执行各项任务期间所产生的有用数据,但是在实际作战中,鱼雷的发现概率还会受到人为的影响,尤其是声纳兵的能力,且本文的模型未考虑目标机动的情况,这些都是下一步需要研究的重点。

猜你喜欢
数据量反潜特征向量
反潜战:追击沉默的对手
克罗内克积的特征向量
高中数学特征值和特征向量解题策略
基于大数据量的初至层析成像算法优化
无人集群协同反潜应用研究
高刷新率不容易显示器需求与接口标准带宽
三个高阶微分方程的解法研究
有人机/无人机协同反潜作战探析
电力营销数据分析中的数据集成技术研究
固定资产管理系统对物流管理的促进和发展