基于决策树的空袭目标数据挖掘

2012-08-27 08:15:28杨根源
电光与控制 2012年11期
关键词:决策树威胁一致性

李 京, 杨根源

(1.海军航空工程学院,山东 烟台 264001; 2.海军信息化专家委员会,北京 100073)

0 前言

目标选择问题,是空袭作战的关键问题,直接关系到战役乃至战略企图的实现,而空袭作战任务的完成,则是通过摧毁被空袭方以重点目标为关节点所构建的目标体系才被最终反映出来。选择空袭目标的过程是一项复杂、动态、基于效果的系统控制工程。而现代战争中战场目标多、类型复杂、重要程度不一,准确地选择空袭目标,对指挥员进行敌情判断、兵力部署、定下决心具有重要意义[1]。

本文提出了基于决策树的空袭目标数据挖掘方法,即在建立空袭目标选择指标体系的基础上,利用决策树方法对具体的目标数据进行挖掘,进而提取空袭目标选择依据。

1 目标价值影响因素分析

参考美军目标选择程序和方法的研究[2],空袭目标可分为:1)夺取制空权目标系统,主要包括防空雷达系统、空军基地、地对空导弹阵地、防空指挥控制系统、高炮阵地、油料仓库等目标;2)夺取制信息权目标系统,主要包括通信枢纽、通信站、指挥自动化系统、计算机网络中心、电子干扰机及机场、雷达设备、航空航天侦察地面站等;3)战略攻击目标系统,由各级指挥机构、电信机构、情报收集机构、武器和燃料油生产基地、电力设施、港口、机场以及武器研究、生产、使用单位等目标组成;4)空中遮断目标系统,主要包括陆路、海上、空中交通枢纽和驿站等,如公路、铁路的桥梁、隧道,铁路枢纽站、军用和民用机场、运输工具和修理厂、港口码头等;5)空中近距离支援目标系统,主要的攻击目标是敌方的指挥机构和指挥系统、地面部队和武器装备、火炮阵地等。

在分析了目标的分类之后,准确评定各种不同类型目标的价值是进行目标选择的基础。通过参照目标选择的相关原则,经过详细分析,空袭目标价值的影响因素主要包括:目标固有价值、目标与作战意图及作战任务的一致性、目标的威胁程度、目标的社会影响,以及目标的易修复性,其具体含义如表1所示。

表1 目标价值影响因素Table 1 Indexes affecting target value

2 目标数据的建立

2.1 Netica 软件介绍[6]

Netica软件工具由Norsys Software公司开发,是目前应用比较成熟的分析软件,在医疗、故障诊断等民用领域有着广泛的应用,其核心算法是基于贝叶斯置信网络、决策网络以及影响诊断。除了自身功能完备外,其最主要的特点就是提供API接口,利用编程工具,可以将其嵌入相关的军事决策系统中,为军事辅助决策提供强有力的支持。本文将利用它产生符合目标选择原则的仿真数据。

2.2 数据的获取

Netica软件具有根据所建立的模型,随机产生案例这一功能,可以通过它获得需要的样本数据。

1)对数据进行概化处理,把数据概化到更高层次。针对数据本身的特点,将目标固有价值、威胁程度、社会影响概化为(高,中,低),任务一致性概化为(吻合,不吻合),目标易修复性概化为(容易,不容易,无法修复)。

2)通过对实际空袭案例进行分析,发现当某一目标被确定为打击目标时,其自身固有价值、社会影响程度为高的概率比较大,而其威胁程度和易修复性偏低的概率比较大;而且一般情况下都是与整体作战任务相一致。因此,利用Netica软件构造出反映这一原则的贝叶斯网络模型,如图1所示。

图1中攻击目标为父节点,其他5个指标为子节点。以固有价值为例(如表2所示),其条件概率表显示,当目标被选定时,其固有价值为“高”的概率为60.811%,为“中”的概率为 35.135%,为“低”的概率为 4.054%。

3)根据建立的贝叶斯网络模型随机产生60个案例样本。这些案例样本的特点是在总体上服从所构建的目标选择原则,并存在一定的随机性。60个案例样本如表3所示。

图1 基于Netica的目标选择模型Fig.1 Target selection model based on Netica

表2 固有价值节点条件概率表Table 2 CPT of inherent value dot

表3 目标选择训练样本集Table 3 Sample set for target selection training

续表

3 决策树构造

3.1 信息增益的计算方法

[7-8],本文采用ID3算法构造决策树。

ID3[9]是Quinlan提出的一个著名决策树生成方法,其流程如下:

1)决策树中每一个非叶节点对应着一个非类别属性,树枝代表这个属性的值,一个叶节点代表从树根到叶节点之间的路径对应的记录所属的类别属性值;

2)每一个非叶节点都将与属性中最大信息量的非类别属性相关联;

3)采用信息增益来选择能够最好地将样本分类的属性。

该算法使用信息增益来选择能够最好地将样本分类的属性,即选择具有最高信息增益的属性作为当前节点的测试属性(即最好的分裂属性)。信息增益的计算方法如下。

设S是s个数据样本的集合,假定类标号属性具有m个不同值,定义m个不同类Ci(i=1,2,…,m),设si是类Ci的样本数,对一个给定的样本分类所需的期望信息为

式中,pi为任意样本属于Ci的概率。

设属性 A 具有 v个不同值{a1,a2,…,av},则可用属性 A 将S 划分为v个子集{S1,S2,…,Sv},其中,Sj包含S中所有在A上具有值为aj的样本,若A选作测试属性,则这些子集对应于由包含集合S的节点生长出来的分支。设sij是子集Sj中类Ci的样本数,根据由A划分成子集的熵(entropy)为

由此,在A上分支将获得的信息增益为

3.2 决策树的构造

考虑到获得样本数量的有限性,一般把采集到的样本分成两份,一份进行训练,剩下的部分则用作测试。但是,在有些情况下用作训练的样本缺乏代表性。比如,某些特殊类的样本可能不在训练样本中,这样训练出来的分类器很难准确运行。因此,本文利用10折交叉确认法[10](10-fold cross-validation)将 60 个样本数据平均分成10个部分,每一份用作测试,剩余的进行样本训练,这个过程一共重复10次,最终每一部分样本都有机会进行测试。

根据式(1)~式(4)的信息增益方法,在weka平台上进行仿真,最终形成的决策树如图2所示。图中,叶节点值为null的情况,说明在训练样本集中这种情况未出现过。

仿真结果正确的分类个数为54,正确率为90%;错误的分类个数为6,错误率为10%。详细结果如混淆矩阵(Confusion Matrix)所示。

该矩阵说明当案例目标没有被选为攻击目标时,决策树模型判断正确的案例数为31个,错误的为3个;当目标被选为攻击目标时,决策树模型判断正确的案例数为23个,错误的为3个。仿真结果表明,由表1样本集训练出来的决策树模型的性能令人满意。

图2 对应样本集的决策树Fig.2 Decision tree corresponding to the sample set

3.3 规则的提取

生成决策树后,从决策树的根节点到任何一个叶节点之间所形成的一条路径就构成一条分类规则,该规则可用IF-THEN形式表示,最后可获得如下14条规则:

1)IF任务一致性=“吻合”AND固有价值=“低”THEN攻击目标=“否”;

2)IF任务一致性=“吻合”AND固有价值=“中”AND威胁度=“高”THEN攻击目标=“否”;

3)IF任务一致性=“吻合”AND固有价值=“中”AND威胁度=“中”THEN攻击目标=“是”;

4)IF任务一致性=“吻合”AND固有价值=“中”AND威胁度=“低”THEN攻击目标=“是”;

5)IF任务一致性=“吻合”AND固有价值=“高”AND威胁度=“低”THEN攻击目标=“是”;

6)IF任务一致性=“吻合”AND固有价值=“高”AND威胁度=“中”THEN攻击目标=“是”;

7)IF任务一致性=“吻合”AND固有价值=“高”AND威胁度=“高”AND社会影响=“高”THEN攻击目标=“是”;

8)IF任务一致性=“吻合”AND固有价值=“高”AND威胁度=“高”AND社会影响=“低”THEN攻击目标=“否”;

9)IF任务一致性=“不吻合”AND易修复性=“容易”THEN攻击目标=“否”;

10)IF任务一致性=“不吻合”AND易修复性=“不容易”THEN攻击目标=“否”;

11)IF任务一致性=“不吻合”AND易修复性=“无法”AND固有价值=“低”THEN攻击目标=“否”;

12)IF任务一致性=“不吻合”AND易修复性=“无法”AND固有价值=“高”THEN攻击目标=“是”;

13)IF任务一致性=“不吻合”AND易修复性=“无法”AND固有价值 =“中”AND威胁度 =“中”THEN攻击目标=“否”;

14)IF任务一致性=“不吻合”AND易修复性=“无法”AND固有价值 =“中”AND威胁度 =“低”THEN攻击目标=“是”。

3.4 结果分析

对14条规则做进一步分析,得到以下结论。

1)对潜在的打击目标最终能否成为空袭目标,首先要考虑该目标是否与当前我方的作战目的一致。在科索沃战争中,北约根据“五环”目标理论,选择能重创敌人战斗力或战争潜力的目标,对塞族战略目标进行打击,最终取得了在巴尔干的胜利。

2)目标的固有价值是其能否成为空袭目标的重要指标,因此,要详细地掌握空袭目标的结构和作用机理,准确判断其在敌作战体系中的地位。如海湾战争中,多国部队就将伊拉克化学工厂、化学武器库及核设施等对己方威胁最大,同时也是能力价值最大的目标作为首先突击的目标。

3)针对空中打击的特点,空袭目标的对空防御能力是航空兵及导弹部队能否顺利完成任务的一个重要制约因素。如果对方的防空能力过于强大,在某些情况下,尽管摧毁目标对作战进程有很大的推动作用,但是,考虑到所付出的代价,有可能用其他手段达到目的。海湾战争中,美军为避免战损,在突击防护严密的巴格达时,只允许F-117隐身战斗机进行突击,另外,所选目标从空中搜索识别的难度不能超过机载设备和人员的能力。

4)信息作战已成为现代战争的主角,而信息战所涉及的范围非常广泛,包含物理域、信息域、认知域和社会域。决策者在选择空袭目标时,要充分考虑打击所带来的更为广泛的影响。比如在第二次世界大战中同盟国与轴心国之间的战略轰炸,双方都力图通过大规模的轰炸摧毁对方抵抗的意志,缩短战争进程。但是,由于缺乏对双方民众的了解,轰炸虽然导致了大量的人员伤亡,但是双方民众的斗志并未瓦解,某种程度上反而更加坚定了战斗的决心。

5)目标的易修复性有时容易被人忽略,但如果目标容易被修复,则空袭的代价与获得的效果将不成比例。朝鲜战争美军发动的“绞杀战”中,1951年11月至12月对平壤以北三角铁路的轰炸最为严重,但是志愿军抢修铁路的能力连美国空军也无可奈何地表示叹服。

6)规则12)~14)可以这样解释,当目标与当前阶段作战任务并不一致时,仍将其列为打击目标,是因为从战争全局来看,打击该目标对于赢得胜利,达到作战目的有一定的帮助,尽管有可能目标并不符合局部某一阶段的作战目的。美军对于未进入打击目标清单的目标并不是立即将其删除,而是将这类目标分别归纳为暂不打击、限制打击和非打击目标清单等,保持对目标的持续监视,待到时机成熟将付诸行动[2]。

4 结论

利用决策树对空袭目标进行分析,有别于以往的目标选择方法。它将空袭目标选择看作是一种数据挖掘,并可以直接建立隐含的规则和知识。仿真结果显示,该决策树模型的分类合理、准确度高,可为我指挥人员提供一种辅助决策的新思路。

参考文献

[1] 李伟,晋华,谭斌.模糊综合评判的空袭目标选择[J].武器装备自动化,2008,27(9):25-28.

[2] 隋鑫,毛学良,赵春三.美军目标选择程序和方法的研究[J].科技创新导报,2009(18):239.

[3] 刘欣,罗小明.基于综合集成赋权法的导弹攻击目标价值分析[J].指挥控制与仿真,2008,30(2):35-38.

[4] 鲁华,周德云.贝叶斯网络的对地多目标攻击决策[J].火力与指挥控制,2008,33(7):54-58.

[5] 刘学军.典型目标的选择和突击武器的选用[J].飞航导弹,2000(12):32-37.

[6] 曹卫东,丁建立,刘玉洁.基于贝叶斯网络的航班离港延误预警分析[J].计算机应用研究,2008,25(11):3388-3390.

[7] 唐志武,薛青,刘朔.基于决策树的装甲兵登陆突击仿真试验数据挖掘[J].装甲兵工程学院学报,2008,22(1):6-9.

[8] 胡涛.文本分类在军事数据分发中的应用[D].重庆:重庆大学,2005:15.

[9] MITCHELL T M.Machine learning[M].NY:McGraw-Hill Science/Engineering/Math,1997:64-75.

[10] WITTEN I H,FRANK E.Data mining[M].San Francisco:Morgan Kaufman Publishers,2005:149-151.

猜你喜欢
决策树威胁一致性
关注减污降碳协同的一致性和整体性
公民与法治(2022年5期)2022-07-29 00:47:28
注重教、学、评一致性 提高一轮复习效率
IOl-master 700和Pentacam测量Kappa角一致性分析
人类的威胁
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
电子制作(2018年16期)2018-09-26 03:27:06
受到威胁的生命
面对孩子的“威胁”,我们要会说“不”
家教世界(2017年11期)2018-01-03 01:28:49
基于决策树的出租车乘客出行目的识别
Why Does Sleeping in Just Make Us More Tired?
英语学习(2015年2期)2016-01-30 00:23:16