吴天昊,王劲松,宋留勇,吴少强
(战略支援部队 信息工程大学,河南 郑州 450001)
网络空间安全防护体系中,重要网络目标的某些防护指标之间存在一定冲突,且其各参数具有不可共度性,无法进行简单的线性效益比较,如增设带宽、频谱等防护资源代价的同时,却降低了网络目标的隐蔽性。网络目标的防护方案设计科学、合理、精确是确保网络空间目标安全的关键一环,指挥者对方案优化模式的设计与选择对网络目标的防护效果发挥决定作用。
对目标方案优选评估的研究,目前主要采用的是概率、模糊理论或是MADM(多属性决策赋权)等方法[1-2],分析模型往往局限于寻找最优解或目标方案排序,且要求候选方案已给定,各指标参数为确定离散值[1]。网络空间下的精确指挥,其战场信息难以精准把控、目标势态瞬息万变,考虑设计网络目标防护方案过程中各指标参数不确定,属性值连续变化且没有统一度量标准,难以寻找最优解等诸多特点,本文针对网络目标防护的不确定多目标决策问题,提出一种并非寻求最优解,而寻求满意解集,依据指挥者偏好进行辅助决策的方式,以求解MODM(multi-objective decision making)的Pareto解集(非劣解集)作为研究方法[1],构建优选指标体系,并通过仿真实例,验证方法的有效性。
MODM,即多目标优化决策,其方案在条件范围内数目是无限多个,在优化决策前无法一一列举,此外,各方案指标的参数亦为连续变化值,因此,只可在决策过程中逐步寻找优化方案。
设定该MODM问题为
式中:f(x)为目标函数;g(x)为约束条件,且均连续可微。
定义:Pareto解,即有效非劣解,在多目标决策中,f(x)为多目标决策问题向量目标函数,其分量fj(x),j=1,2,…,n,n取越大越优。对x0∈X, 若在X中不存在x0使fj(x)≥fj(x0),j=1,2,…,n,则称x0为向量优化问题的非劣解[3-4]。
MODM在方案优化决策中应用的模式为,设有n维决策变量,在不同的方案集Z定义方案,多目标优化决策就是在Z构成的方案集中求解非劣解,通过缩小可行域的范围来寻找较优解,即满意解。
与对敌网络节点的摧毁进攻等其他网络作战行动不同,网络重要目标的防护指标更加复杂,防护方案不单是考虑单个或多个作战阶段的防护效果,而是长期地、持续不断地对网络目标进行综合性防御并对敌目标识别嗅探系统进行干扰。显然,防护效果越佳,防护资源代价越高。过度追求防护效果会造成军事资源的浪费,或是造成军事资源分配不均衡,这就要求指挥者对网络目标防护方案中多目标之间的矛盾冲突作以权衡。本文针对重要网络目标防护的实际需求,利用多目标优化决策模型处理不确定性问题的优势,以网络目标价值、目标受威胁程度、防护资源代价3个准则层为基本衡量标准,构建网络目标防护指标体系。
(1) 目标价值。目标价值是指该网络目标在作战中发挥的效能与影响。目标越重要,越要加大力度予以保护,因此,考虑目标的价值因素是设计制定防护方案的关键环节,是分配防护资源的重要依据。结合网络战场实际情况及上级意图,设定该网络目标具备网络战场控制能力、打击能力和支援能力,对网络作战体系实力和效能产生一定影响,具有对敌指挥中心、能源基地、要塞枢纽等重要目标的网络系统进行干扰与摧毁的效用。
(2) 受威胁程度。受威胁程度是网络目标防护方案设计的重点,与上述目标价值具有关联性。受威胁程度包含该网络目标的安全性与风险性,安全性包括服务抗毁性、IP地址伪装性、网关隐蔽性和网络恢复性4个三级指标,风险性包括被嗅探监视系数(可能性)、被木马入侵系数(可能性)、权限篡改难度和信息盗取难度4个三级指标。受威胁程度越高,网络目标越易被发现,越易被攻击和摧毁,越难以恢复效能,其防护力度就要相应加强。
(3) 防护代价。防护代价指防护方案中需要实施的人力物力资源,在网络目标防护过程中起到决定性作用,也是指挥者作出优化决策的核心内容。防护代价可划分为防护手段、工具资源和人员编配3个指标,每个指标的细化分类在下节图中有直观体现。在指标体系中的防护代价不仅要考虑其获取及实施的难度程度,还要考虑资源代价的投入量,可采用层次分析法AHP(analytic hierarchy process)方法确定其权重[5]。
参考美、俄网络作战的实战经验,结合网络设施建设的实际情况,分析对网络目标构成直接或潜在影响因素,经过征求专家意见,建立如图1所示的网络目标防护指标体系。本文采取的分类方式与建立的指标意在说明多目标决策非劣解及偏好设置在方案优化中的应用,对辅助指挥者决策并确定方案具有参考意义。
单目标优化模型目的是求得唯一最优解,告知指挥者“应该这样决策”。所谓的“最优方案”看似最优,但却存在2个问题:一是忽视了战场复杂性。能够取得最优解是理想情况,而在现实作战方案的设计中,往往难以把握各指标间的比重,直接获取最优解的情况较少。二是限制了指挥者的主观能动性。在不同的战场环境、局势、态势下,指挥者可依据自身的指挥艺术和经验对方案加以完善,而非按照模型给出的最优解进行决策。
网络目标防护方案的多目标优选决策模型能
够较好解决以上2个问题,通过多目标优化决策计算可获取指标的一组有效非劣解及相关信息,指挥者可以依据自身偏好进行选择判断[1-3]。该模型是通过2项程序分别缩小方案集的过程,如图2所示,第1步:以MODM模型计算得出非劣解集(可行方案);第2步:通过指挥者偏好赋权计算得出满意方案。
设定网络目标防护方案各指标模型中有n个决策变量,p个目标函数和m个约束条件[1]。那么,网络目标防护方案多目标优化的最大化标准型为[6]
(1)
在方案的应用模型中,若将各不可比较的指标变量视为不同维度的向量,则模型表达为
输入空间的向量为
x=(x1,x2,…,xn)T,x∈Rn,
(2)
式中:Rn为非劣解集。
输出空间的向量[7]:
f=(f1,f2,…,fm)T,x∈Rm.
(3)
在有偏好的多目标决策中,如果目标函数为凹函数且可行域为凸集,可设定加权向量w∈W,它反应了多目标决策问题的Pareto解与决策者选定的满意解之间的关系,即在求得的非劣解集中,只有符合指挥决策者主观偏好的有效解,可视为加权问题的满意解(最终方案)[4]。
在不考虑存在负偏好值的情况下,定义权值为
(4)
式中:Rn为加权向量集合,对w∈W偏好加权的问题可列为
(5)
式中:f(x)和g(x)分别为目标函数和约束条件[8]。
利用多目标优选决策建立的网络目标防护方案优化模型的基本步骤为:
Step 1:量化指标,设置参数。
Step 2:依据约束条件设定决策变量的可行域。
Step 3:计算得出Pareto解集。
Step 4:若得出最优解x0,则x0为最终方案,流程终止;若无法找到最优解,进行下步。
Step 5:则设定决策者偏好w=(w1,w2,…,wn)。
Step 6:依据偏好进行赋权,得出满意解,则该满意解为最终方案。
算法基本流程图如图3所示。
在某网络目标防护方案设计决策的过程中遇有如下问题:指标体系中,三级指标i10(网关隐蔽性)、i22(带宽及频谱)和i23(局域网配制)存在冲突,需要指挥者确定各指标参数值。3项指标的不可共度性表现为:增设i22权重会降低i10的参数值,i23的配制影响制约i10,i22的性能。
在无参考数据的情况下,若决策者根据传统方法进行决策,只能通过对比试验对约束条件内的值代入目标函数,并通过仿真来计算目标函数的最优解。这种方法不仅迟滞了决策者的决策效率,且错误率高。本文通过实验来验证MODM非劣解模型在指挥决策中的优势。
表1 决策变量的等级标准
根据专家给出的约束条件,设定并应用多目标优选决策函数为[9]
(6)
根据3.3节中式(5),转化为最大化标准型为
(7)
用Matlab进行求解,得出如图4所示。
图4中f1,f2,f3三维量纲代表目标函数与指标参数的映射关系。由于图5中所示的投影为凹的,因此中间部分为局部非劣解,应该舍弃[4]。
由图6,7可得该多目标优化函数的决策范围为[7,10]
(8)
式中:f为根据可行域得到的目标决策函数范围,即输出空间或决策范围[11-13]。
由此求得非劣解(指标参数可行域):
(9)
通过约束条件得出非劣解范围为
(10)
二者取交集求得最终非劣解的范围为
(11)
由以上步骤将满意解集缩小到最小范围内。
所谓的满意解,是依据指挥者的偏好缩小可行解的范围。偏好的设置要根据作战指挥中的实际情况,因势而定。目前,对偏好赋权的研究文献十分广泛,针对不同决策方式有着不同的偏好赋权方法。针对有多位专家或多个决策者时,对偏好的设置可参考文献[14],针对模糊决策时,对偏好的设置可参考文献[15]。由于本文研究方向为辅助决策,意在为指挥者提供可行有效的决策信息,因此,在不考虑有多个决策者的情况下,结合网络目标防护方案指标体系,给出几种较为简单实用的缩小可行域的方法:
(1) 依据指挥者的意图。比如,若指挥者意图实现网络目标的配制最优,那么可以图4中亮色区域选择指标参数,若指挥者意图强调网络目标隐蔽性强,那么可以在图4中暗色区域选择指标参数。同理,指挥者意图实现防护效果最佳或是强调军事资源的节约,则可分别在不同区域选择可行解。
(2) 依据指挥者的要求。比如,指挥者要求,网络目标防护设置中,局域网配置适中即可(50%),带宽投入不需要流畅,仅保证传输即可(70%),但是隐蔽性必须达到最优(100%)。那么其偏好可设定为w=(1,0.5,0.7),归一化后得w0=(0.454,0.227,0.318),通过3.3中式(4)的计算可得出指示参数范围为
(12)
决策范围为
(13)
(3) 依据指挥者的主观偏好。比如,指挥决策者对各指标的权重有主观设定,给出对此3项指标的主观正值偏好值为w=(3/25,5/25,1/25),归一化后得w0=(0.333,0.556,0.111),通过3.3节式(4)的计算可得出指示参数范围为
(14)
决策范围为
(15)
式(8),(13),(15)中:f均为根据可行域得到的目标决策函数范围。
由实验结果可以看出,通过多目标决策模型的构建并对目标函数和约束条件求解Pareto解,明显缩小了决策变量的范围,证明了本文提出的方法能够优化和确立网络目标防护方案指标参数,达到优化方案的目标。在网络空间下的指挥决策中,运用本文提出的方法,可避免指挥决策者在大量方案数据中寻找最优解,而是在求解后的解域中寻找满意解,对辅助指挥者科学、精确、合理设计优化网络目标防护方案具有较强的应用价值。
针对网络目标防护方案中部分指标存在冲突且不可线性比较的现实问题,本文构建了网络目标防护方案指标体系,通过建立多目标优化决策的数学模型,提出一种通过计算非劣解集,并依据指挥者偏好进行选择的应用方法。通过实例仿真证明了该方法能够达到缩小决策范围,优化方案质量的效果,对辅助指挥者决策并确定优化方案具有参考意义。未来相关研究要针对方案不确定性问题,在方案的有效性及减小误差值方面给出决策建议。