语义驱动的作战资源服务聚类方法

2020-09-07 00:30何宜超焦志强张杰勇
空军工程大学学报 2020年4期
关键词:模拟退火服务化种群

何宜超,孙 鹏,焦志强,张杰勇,王 衡

(1.空军工程大学信息与导航学院,西安,710077; 2.空装合肥第一军代室,合肥,230000)

近年来,随着云计算、虚拟化[1]、云制造[2]等各种新技术的不断发展,军事网络信息体系的开放性不断增加,新型指挥信息系统正朝着“智能与韧性”的方向发展[3]。在新型指挥信息系统建设过程中,作战资源的整合接入问题及新型指挥信息系统的服务模式问题亟待解决。

作战资源的部署使其地理位置具有特殊性,各层级资源结构各异,规模巨大,难以实现共享与集中管理。为了实现对作战资源的有效利用,使其动态接入网络化指挥信息系统,将面向服务[4]的思想应用于系统,需要对作战资源解耦合,将其能力映射至服务,从而实现对作战资源的统一管理。基于上述思路,需要对大量云服务进行聚类重组,减小作战资源服务组织管理对象的规模,提高服务组织效率,同时为系统敏捷演化提供依据。

针对军事组织中作战资源的整合管理问题,文献[5]引入了一种以接口匹配作为服务约束的思想,重点以输入输出的形式定义接口,提供了对云服务化作战资源的相关服务操作,虽然易于在云协同中管理云服务,但定义形成的云服务规模大,管理效率低。文献[6]提出一种面向应用的军事信息服务规划(Application-Oriented Military Information Service Planning, AOMISP),将军事应用抽象成服务,并通过PASW statistics软件对作战资源按功能属性聚类,但聚类方法较简易,聚类效果一般。文献[7]基于SOA架构提出了新型工业制造理念——云制造,将制造资源服务化,以网络平台和云服务架构为基础,完成资源的虚拟及整合,文献[8~9]对实现云制造的关键技术进行了研究,实现了制造资源云服务化。

就资源服务化而言,对其形成的云服务应进行描述以实现系统的机器互识。目前已有关于对服务进行语义描述的研究。文献[10]提出了一种新型服务描述模型,以动态描述的思路对传统方式进行改进,并对服务进行模型化处理,使其能作为动态资源接入计算系统。

对于资源进行服务建模可以认为是一种池化过程。对于大规模的服务池,文献[11]利用遗传K-means算法对服务池进行聚类处理,在结合遗传算法的基础上,有效地提高了K-means聚类算法的稳定性,但在寻优后期搜索能力较弱。

为更好解决云化资源的机器互识和拼接整合问题,本文采用服务本体描述语言(Ontology Web Language of Service, OWL-S)[12]作为语义描述规范,通过分析作战资源特征和属性,对虚拟化作战资源进行了服务化建模,然后设计了一种改进聚类算法对云化作战资源服务进行聚类,提高了聚类目标优化效果,改善了算法稳定性。

1 作战资源服务化

作战资源服务化是将同型异构的作战资源进行抽象聚合,形成弹性可扩展的资源池,使其能够实现动态分配,灵活调度与多域共享,从而使得作战资源的利用率得以提高,简化了对作战资源的管理,同时使战时作战方案得以优化。

1.1 作战资源概述

作战资源是指与作战直接相关的资源,它可以直接为作战行动提供支撑,包含武器装备、态势信息、后勤保障等相关资源。

战场中存在着数量庞大、形式不同的作战资源,为了对作战资源进行统一组织和运用,需要按照资源的物理属性及其功能作用,先对作战资源进行逻辑分类和建模,形成统一的语义描述,实现作战资源的机器互识。在复杂多变的战场环境下,武器装备等作战资源具有不同于普通计算资源的特征。若想更好地将武器资源应用于战场,需要对其属性进行分析研究[13]。

1.2 作战资源的属性模型

作战资源种类众多,形态各异,对其进行服务化封装需要属性建模,屏蔽其异构性。作战资源可以按照主从属性进行划分,其中主要属性包括元属性(Basic)、实时属性(Rtime)、地理属性(Location)、功能属性(Capability)[14]。

元属性是对作战资源固有特征的描述,包含了作战资源的名称、编号、类别、基本描述。实时属性是对该作战资源实时可用状态的描述,包含可用状态、队列状态、占用状态、失效状态。地理属性主要包含作战资源的经纬度坐标。功能属性下包含多个二级服务属性,每个服务属性都包含其唯一编码、描述、接口属性等。

1.2.1 Basic

Basic = {CR_Id, CR_Name, CR_Type, CR_Description}

其中:CR_Id为作战资源的唯一编码;CR_Name为作战资源名称;CR_Type为作战资源类型;CR_Description为作战资源描述。

1.2.2 Rtime

Rtime={Available, Occupied, Error, Scheduled}

其中:Available指该作战资源处于可调用状态,用户可以对该资源进行选择;Scheduled指该作战资源已处于队列状态,需完成前置任务需求;Occupied指该作战资源处于执行任务状态,其他用户无法调用;Error指该作战资源由于技术故障失效,无法被调用。

1.2.3 Location

Location = {Lo_x, Lo_y}表示作战资源的经纬度坐标。

1.2.4 Capability

Capability={Service1, Service2, Service3, …, Servicen}

Servicen作为该作战资源的二级属性,表示该作战资源可提供更小粒度的功能性原子级服务,用X元组表示为:

Servicen={S_basic, S_Access, S_interface}

1)S_basic表示该原子级服务的基本属性,有:

S_basic={S_Id, S_Name, S_Type, S_Description, S_Qos}

其中:S_Id表示该服务的唯一标识;S_Name表示该服务的名称;S_Type表示该服务的类型;S_Description表示该服务的具体描述;S_Qos表示该原子级服务的服务质量。

2)S_Access表示作战资源服务的访问属性,可形式化表示为以下四元组:

S_Access={Input, Output, Precondition, Effect}

其中:Input指服务的输入;Output指服务的输出;Precondition指服务的先决条件;Effect指服务执行后产生的结果。

3)S_interface表示服务的接口属性,可形式化表示为以下三元组:

S_interface={Protocol, Message format, Interface Type}

其中:Protocol指通信协议;Message format指消息格式;Interface Type指接口类型。

1.3 作战资源服务化建模

作战资源具备多种能力,将其服务化是在云环境下得以广泛共享应用的前提。将作战资源能力以原子级服务的形式表示,并结合本体语言进行描述,即一切作战资源提供的能力以服务的形式共享,见图1。OWL-S是一种在语义网中用于对服务进行规范化描述的本体语言[14]。根据该语言的语法约束,对原子级服务进行本体建模,其中原子级服务继承作战资源的元属性、实时属性、地理属性,同时拥有自己专有的访问属性。

2 作战资源服务聚类

对于统一建模的作战资源原子级服务,由于其数量规模庞大,根据任务需求对其进行快速组合与匹配难度较大。为缩小服务组合优选管理对象规模,并为后续服务组合优选等操作提供候选服务集合,需对作战资源中的原子级服务进行聚类分析。原子级服务相似度和服务聚类目标是作战资源服务聚类分析的基础。

2.1 作战资源原子级服务相似度

本文对于作战资源原子级服务间相似度定义主要体现在其概念相似度(SA)及服务质量相似度(SQ)的综合相似度。首先计算2个服务间的属性重合度作为共同概念相似度,由式(1)可知,当两服务间不具备属性重合时,两者间概念属性相似度为0,即两服务不相似。

(1)

式中:AX、AY分别表示样本X、Y的属性集合,服务质量相似度则采用欧氏距离作为QoS间的距离度量:

(2)

式中:xi,yi表示AX与AY属性集中的单一属性;n表示属性集元素个数,则其综合相似度定义为:

(3)

2.2 作战资源服务聚类目标

作战资源服务聚类的目标是将到某类中心距离之和最短的资源划分为同一类(相似度最大),即:

(4)

式中:m表示作战资源类别数;xi指样本为待求解的决策变量;S表示不同类的样本集合;Sj则为第j类的样本集合;zj为第j类的聚类中心。

3 基于遗传的模拟退火K-means聚类方法

到目前为止,K-means是最经典的聚类分析方法之一[15-18]。其原理是基于分区聚类的无监督聚类方法,该方法根据给定的度量距离,将具有相似特征的数据聚类为K个簇,最后通过投票情况决定对象的类型。算法时间复杂度为O(n2),局部搜索能力强,收敛快,但是在求最优解时需要选择合理聚类中心,并且进行全局搜索时,特征计算能力较弱,难以得到全局最优解。文献[19]提出结合遗传算法的K-means聚类方法,用于寻找初始聚类中心,增强局部搜索能力,虽然一定程度上提高了全局搜索能力,但遗传算法自身存在早熟现象,且最优解有可能会出现倒退,算法难以得出最优结果。

本文提出一种基于遗传的模拟退火K-means算法,通过结合模拟退火算法与K-means操作改善遗传算法本身的缺陷,使得聚类性能得以提高。

3.1 染色体编码

对于个体的基因编码是遗传算法中的首要操作。假设作战资源原子级服务的总体样本数量为N,聚类中心为m,则个体中每一基因点GX表示该作战资源服务所归属的类别号,由此得该个体样本见图2。

将作战资源属性样本随机分至m类中,并根据分类结果生成染色体编码GN。设定种群大小为Q,将该操作迭代Q次以形成初始种群P0。

3.2 选择操作

选择操作的主要目的是从当前种群中选取合适的个体为后续的操作提供父代个体。直观来看,优秀的父代个体可以产生更加优秀的后代,但强制选择适应度高的个体作为父代容易造成算法陷入局部最优,从而影响算法的寻优性。因此,在执行选择操作时,还需要兼顾到当前情况下处于劣势的个体,以保证算法的全局搜索能力。基于上述考虑,本文采用轮盘赌策略对个体进行选择,通过计算适应度确定其被选择的可能性,适应度越高,被选择的概率也就越大。由此可得种群P中每一个体被遗传至下一代的概率为:

(5)

3.3 基于K-means的交叉操作

对于选择操作后形成的新种群,使用K-means算法代替遗传算法中的交叉操作以实现加速聚类的目的。具体过程为:对新个体更新其聚类中心,重新计算所有样本到中心的距离,并重新分配至最近的类,从而获得新个体。对上一步操作中形成的新种群中的所有个体进行该操作从而获得新种群。聚类中心的更新体现如下:

(6)

3.4 模拟退火变异

在种群更替过程中,每一个体的编码情况都存在有一定的几率Ii发生变异。本文采用均匀变异操作,即每一染色体上不同位的基因,根据其与聚类中心的距离,以一小概率Ii发生变异。

(7)

3.5 整体流程

1)参数初始化:聚类样本总数N,聚类中心为m,种群大小Q,模拟退火初始温度T0,最终温度Te,常数K,模拟退火变异迭代次数iter;

2)将作战资源服务属性样本向量随机分至m类,并根据分类结果生成染色体编码GN,迭代Q次形成初始种群P0;

3)根据式(1)~(4)计算该种群中每个个体的目标函数值E(xi);

4)根据式(5)~(7)对初始种群进行选择变异及交叉操作,生成新种群;

5)将3)和4)重复执行iter次;

6)输出该种群中的最优个体作为最优解。

4 实验仿真

4.1 实验设计

根据前文设计的本体模型,采用模拟生成的3个数据集进行实验,验证算法的寻优性与稳定性。

数据集1:样本数据N=200,每组样本属性数n=11,聚类中心数m=15;

数据集2:样本数据N=400,每组样本属性数n=15,聚类中心数m=6;

数据集3:样本数据N=500,每组样本属性数n=20,聚类中心数m=12。

给出数据集1的一组样本数据实例,如表1所示。其中,每个聚类样本皆具有其11元属性组作为聚类参数,通过样本参数计算相似度并使用本文的改进算法对实验进行仿真。

表1 作战资源样本服务

4.2 算法寻优性实验

为验证本文改进算法的寻优性,本文对基于遗传的模拟退火算法(GS),基于遗传的K-means算法(GK)及本文提出的改进算法(GKS)进行比较,选取目标函数最优值及时间开销为对比数据,以对比3种算法的性能。结果见图3。

图3 3种数据集下实验结果

具体结果见表2,best_obj表示目标函数最优值,time_c表示算法每代的时间开销。

表2 3种算法结果对比

可以看出,由于在本问题中GS算法没有采用基于K-means的交叉操作,搜索能力较弱,目标函数值较低;本文提出的GKS算法的目标函数值均优于另外2种算法,由于改进算法中引入了模拟退火操作,所需的时间开销大于GK算法。整体来看,本文提出的算法可以得出更优的目标函数值、更优的聚类结果。

4.3 算法稳定性实验

为进一步验证本文提出改进算法的稳定性,本文选取第3组数据集进行6次实验,并记录3种算法的最优函数值,实验结果见图4。

图4 实验结果对比

图5为算法稳定测试测试结果,本文所提出的改进算法性能均优于GK与GS算法。为验证算法稳定性,选取标准差这一指标对目标函数值的结果进行分析,结果见表3,本文提出的GKS算法仿真结果的标准差值为0.033 641 777,小于GK与GS算法的标准差值,相比于GK算法和GS算法更为稳定。综上所述,本文提出的改进算法具有较好的寻优与稳定性。

图5 算法稳定性测试结果

表3 统计参数结果

5 结语

对服务化组织的作战资源进行聚类是减小服务管理对象规模、提高作战资源组织运用效率的重要手段。本文首先基于OWL-S构建原子级服务本体模型,为作战资源聚类提供资源描述的基础,然后根据服务本体模型描述特点改进服务间相似度定义,最后结合模拟退火算法改进变异操作,基于K-means算法的思想改进了交叉操作,提出了一种基于遗传的模拟退火K-means算法。通过实验验证,该方法相较于GS算法和GK算法具有更好的寻优性和稳定性。

猜你喜欢
模拟退火服务化种群
江苏省制造企业服务化对绩效的影响
制造企业服务化程度、服务化模式和服务化收益研究
山西省发现刺五加种群分布
基于遗传模拟退火算法的城市冷链物流末端配送路径方案——以西安市为例
基于遗传模拟退火法的大地电磁非线性反演研究
制造业服务化对企业竞争力的影响
“最大持续产量”原理分析
由种群增长率反向分析种群数量的变化
改进模拟退火算法在TSP中的应用
基于模拟退火剩余矩形算法的矩形件排样