杨进涛,沈寿林,黄 斌
(1.南京陆军指挥学院,南京 210045;2.南昌陆军学院,南昌 330103;3.解放军73123部队,福建 福清 350303;4.南昌职业学院,南昌 330000)
基于Multi-Agent的信息共享行为建模研究
杨进涛1,3,沈寿林1,黄 斌2,4
(1.南京陆军指挥学院,南京 210045;2.南昌陆军学院,南昌 330103;3.解放军73123部队,福建 福清 350303;4.南昌职业学院,南昌 330000)
针对信息共享行为的优化需求,构建了基于Multi-Agent的信息共享行为模型,该模型由Agent特性、A-gent信念、Agent连通性和Agent行为4个模块组成。在Agent信念模块,提出了关于信念的信任值量化更新方法,将其作为信息共享行为交互的优先级排序的依据。规范了Agent发送信息、接收信息和处理信息的实验流程。通过仿真实验,得出了较为理想的信息共享行为组织模式,实现了信任阈值下的信息过滤,通过实验结果分析验证了信息共享行为模型的有效性。
信息共享,Multi-Agent,行为建模
Abstract:In order to achieve optimal information sharing behavior,a multi-agent model is constructed,which includes four modules of agent characteristics,agent belief,agent connectivity and agent behavior.In the module of agent belief,a trust evolution algorithm of belief is put forward and is looked as a priority level standard of information sharing behavior.In the experiment flow,the agent send message flow,receive message flow and handle message flow are put forward.The simulation results show the perfect organization mode of the information sharing behavior and achieve the information filter,which are based on the proposed model,and the feasibility of the model is validated consequently.
Key words:information sharing,Multi-Agent,behavior modeling
在当今信息时代的趋势下,信息普遍被大多数组织或团体认为是最有价值的资源,信息共享行为的优化已经成为组织取得与维持竞争优势的关键。本文提出了基于Multi-Agent的信息共享行为模型,将由各成员组成的系统作为一个整体进行分析,克服了上述研究只注重静态数据分析的缺点,注重信息共享行为全过程中各成员的意愿、相互信任的变化,并通过成员网络结构的变化,从而对信息共享行为的相关因素进行定量分析[1-3]。
本文提出了一种基于Agent信任度的信息共享模型,包括Agent特性、Agent信念、Agent行为和A-gent连通性4个模块,其中前面3个模块是在Agent内部,而Agent连通性主要是进行Agent外部的连接。如下页图1所示,Agent特性模块通过意愿在Agent信念模块的作用下,决定是否接收来自Agent连通性模块传送的信息。若接收,则通过Agent行为模块接收信息至SX(i),然后由Agent特性模块通过能力分辨信息价值,并在K个仿真步长后,由Agent信念模块计算发送消息的Agent的信任值,并对各个Agent信任值排序进行更新。Agent特性模块通过能力从FX(i)中选择有价值信息,最后,Agent特性模块通过意愿在Agent信念模块对FX(i)的接收对象进行信任值排序条件下,决定是否发送相关消息。若发送,则通过Agent行为模块发送消息至Agent连通性模块,相关接收对象可通过它进行信息的接收。
图1 基于Multi-Agent的信息共享行为模型总体结构图
Agent在本文中是指拥有一组信任值集合,可实现其自身特性的自治的实体。每个Agent都能实现特性的变化,其特性主要包括能力和意愿两种。能力一般指Agent拥有完成特定任务的素质,如感知能力、通信能力、攻击能力等。噪声是指无价值信息。在本文中能力是指从含有噪声的所有信息中分辨有价值信息的素质。Agent能力用参数Pc表示,Pc(i)∈[0,1],如果 Pc(i)=1,则 Agent将总能分辨出有价值的信息。意愿是描述Agent希望参与团队活动的状态,本文是指Agent有选择性地参与信息分享或信息接收行为。意愿也包括两个参数。一个是表示参与团队活动意愿的参数 Pw(i)∈[0,1],如果Pw(i)=1则Agent在全部仿真步长中参与团队活动。另一个是表示选择邻居的参数 Ps(i)∈[0,1],如果Pw(i)=0则Agent i不选择邻居,发送信息给所有邻居。Pw(i)和 Ps(i)是相互补充的,Pw(i)决定在指定的时间内是否发送信息,而Ps(i)则决定发送信息给谁。
本文认为,信念在人对信息分析和环境交互中起到关键作用。在本文的模型中,Agent的环境感知由一个信念网络代表,节点代表Agent的信念,边代表信念之间的相互关系。本文的信念网络模型和神经网络模型有一定的相似性,因为信念相互间激发,从而可能导致积极或消极的作用。信息的激发是通过网络进行增值的。本文的模型以Rashaad E.T.Jones[4]的三级模型框架为基础。第1级包括通过相关信息的获取。第2级是将第1级获取的信息针对相关的目标和任务进行融合、理解。第3级是以自身当前状态为基础,预测系统和要素未来的状态。通过Agent i收到Agent j的信息的价值情况(例如有用信息或噪声)来确定Agent i对Agent j的信念,用t(i,j)表示。有用的证据p表示从Agent j收到的有价值信息的总数量;无用的证据n表示从A-gent j收到的噪声的总数量。Agent i决定一个信息是否有价值是基于自己的能力而不是信息本身。本文设定Agent i关于Agent j有个先验信念值,以p0和n0表示。本文在t(i,j)接收到证据p和n后选用Beta-Binomial[5]分布对信任的信任度进行描述。Beta-Binomial分布是取式(1)和式(2)的平均值。
tc的平均值表示Agent i对于Agent j信念的信任值的期望值,方差σc2的平均值表示该信念的不确定性。不论何时,只要 p0>>p 或 n0>>n,则新的证据对改变Agent以前的信念影响很小。总体而言,证据在仿真中对Agent信念的影响可用上述模型分析。
在仿真中,通过构建一个群体的信息共享网络场景,连接在同一网络内固定数量的Agent群体,尝试通过信息共享行为,以达成完成任务的最优化。在本文中,构建的是静态网络,以便链路拓扑在仿真实验过程中保持一致,一条边代表Agent i能与其通信范围内的另一个节点Agent j联系。
本文对层级网络进行了优化,区别就是中队长能得到更多的权力以自身的能力去过滤信息。这样,中队成员的能力将是一个网络效能的重要部分。
协作网络是层级网络的一个变化形式,是在层级网络的基础上由不同小队成员间建立链接而形成,这些链接代表允许成员之间交换信息的备份通道。在协作网络中,所有的信息通过这些通道交换而没有过滤。这个网络有较多的连通性,但是不允许以能力为基础而过滤信息。本文对协作网络进行了优化,以比较实验效果,区别就是中队长能利用自身的能力进行信息过滤。
边网络是完全松散的,任何Agent都能与其他Agent进行交流。但Agent的连通性受一些外在因素的制约,比如通信网络或Agent相互的信任度。所有Agent以自身的能力为基础,分享它们认为有价值的信息。本文中边网络是以图论为基础的空间随机无向网络,各个Agent初始随机分布在距离不等的某个区域内。
每个Agent都有发送信息、接收信息和处理信息的行为。SX(i)是 Agent i收到信息的集合,FX(i)是准备发出去的信息集合。在每个仿真步长内,A-gent i在能力参数 Pc(i)和意愿参数 Pw(i)作用下,决定是否基于自己的意愿和能力而采取行动。如果采取行动,它可以从 FX(i)发送信息,如 FX(i)是空的,则接收信息至SX(i)。在每K个仿真步长后触发处理信息行为,Agent i利用仿真过程中从SX(i)所获得的证据,就是信息的价值情况(有价值信息、重复信息和噪声),更新对它邻居的信任值,并按信任值高低对邻居进行排序。
构建了基于Multi-Agent的信息共享行为模型,并通过Java语言设计了原型实验系统。通过仿真实验,可分析Agent的多样化特征和相关参数对网络性能的影响,从而探索以网络结构、噪声和成员相互信任关系为基础的信息共享行为的优化方法。
仿真实验以某武警大队反恐作战任务为背景,担负任务的武警大队由4个武警中队编成,遂行城区反恐任务。针对恐怖分子善于伪装欺骗和发布虚假信息的特点,武警队员需要具备较强的侦察识别能力和相互信任、协同作战的意识。在模型中,共设置21个Agent,由武警大队长Agent带领4个中队执行任务,每个中队长Agent指挥4个Agent成员。Agent的能力是不一样的,因此,对不同领域信息的分辨能力也不一样。本文允许Agent相互共享信息,有一定数量的信息在网络中,其中有些是有价值的,有些无价值。
设置有价值信息为40个,噪声为400个。在Agent网络随机设置这些Agent。每个Agent知道一个信息集合。实验开始时,一个信息只被一个Agent知道。如果Agent不发送此信息,信息就丢失。这些Agent的工作就是彼此分享信息直到每个Agent知道所有有价值的信息,具体参数设置如表1所示:
表1 仿真中使用到的缺省参数值
本文用信噪比解释附加噪声在网络中的影响,系统的主要性能指标由网络中Agent知道的真实信息的平均数赋值,由TN表示。信噪比和TN计算方法如下:
通信负载在本文是指在网络达到系统性能TN最大值时发送信息的总数量,由Com表示;仿真步长数量是指网络达到系统性能TN最大值时需要的仿真步长的数量,由Step表示。这两个值越低,则表示系统性能越好。
收益在本文是表示在网络中使用信任值对系统性能的影响。在每个仿真步长,如果使用信任值提高系统性能TN,则收益值大于1。但对通信负载和仿真总步长来说,则收益更小也更为合理。系统性能收益(TN)=采用信任的系统性能/没用信任的系统性能,如果信任值提高了系统性能,则收益(TN)>1。为了便于3种收益数据的比较分析,本文设定通信负载收益(Com)=没用信任的通信负载/采用信任的通信负载;仿真总步长收益(Step)=没用信任的总步长/采用信任的总步长。如果信任值改善了通信负载和仿真总步长,则收益(Com)>1,收益(Step)>1。
在实验开始后,各个Agent按照“发送信息-接收信息-处理信息”的3个流程重复进行。具体流程如下:
Agent发送信息前,基于它的能力参数Pc(i)来判断信息是否有价值。如果它认为信息是有价值的(若 Pc(i)<1 则有可能误判),在意愿参数 Pw(i)作用下,决定是否发送。在意愿参数Ps(i)作用下,具有选择性,它将从FX(i)的接收者列表中移除部分邻居。如果没有信任值,它可能随机选择移除者,反之,如有信任值,它将选择最信任者优先发送。
接收处理信息负责当前证据收集和处理,发送重复信息被认定为不良证据,但是没有发送噪声信息性质恶劣。如果从某个Agent接收的噪声信息越多,则其信任值越低。信任模型有个阈值,低于它,Agent将不被考虑信任。这个信息过滤能被打开或关闭。通过SX(i)接收信息时,可以选择按信任值排序,优先接收较信任的Agent的信息。
Agent在每经过K个仿真步长后,进入处理信息流程。所有邻居累积的证据都保存在SX(i),通过SX(i)计算每个邻居的信任值。a表示从邻居j接收的重复信息数量,b表示从邻居j接收的有价值的信息数量,C表示从邻居j接收的无价值信息数量,用C(j)=(b,c+a*s(i))表示邻居 j的能力证据。参数s(i)代表Agenti的重复信息敏感度。将能力证据代入式(1)和式(2)中即可算出t(i,j)的值,也就是Agent i对邻居Agent j的信任值,并对照全部邻居的信任值进行离散化处理,用优(1)、良(0.75)、中(0.5)和差(0.25)表示,然后更新每个邻居的信任值。
本文对比了层级、协作和边3种网络,通过网络结构及噪声的变化来分析对系统性能TN的影响。实验结果如图1所示。在层级和协作网络,大队长Agent在处理每个单一信息时,是瓶颈。当中队长能过滤时,减轻了大队长的通信负载Com。当所有节点都能过滤噪声时,通信负载Com将减轻更多。这里假定Agent能力值均为1。在图2(a)中是将1个信息发送给1个Agent,在图2(b)中是将1个信息随机发送给3个Agent。随着信噪比的减少,边网络的性能表现高于其他两种网络,受到噪声的影响非常少。通过噪声过滤,可以明显看出层级和协作的通信负载Com明显降低。但是随着每个信息发送给Agent的数量的增多,可以看出层级网络在不过滤噪声的情况下通信负载Com增大明显。总体来看,层级结构在低噪声环境中非常有效,但是应对团队成员的失误是非常脆弱的,在高噪声环境下,容易使得团队成员效率低下,形成瓶颈;而边网络则在高噪声环境下非常有效,能有效应对团队成员的失误,但是在低噪声环境下不适用,因其通信负载相对较高。
图2 信噪比条件下不同网络结构的通信性能比较图
图3 信任阈值条件下是否信任过滤的性能比较图
信任阈值对通信负载Com、仿真总步长Step和系统性能TN的影响如图3所示。仿真结果显示出Agent在信息共享中利用信任值对邻居进行优先级排序,从而对网络各方面性能产生影响。所有的Agent利用信任值去决定是否发送信息给特定的Agent。不被信任的Agent将不发送任何信息。信任的作用减少了所有级别的通信负载Com和仿真总步长数Step以达到最终结果,即TN达到最大值。在使用信任阈值决定一个Agent是否值得信任时,对网络性能将产生一定的影响,达不到最低阈值(0.4)的都将被过滤。当阈值低于0.5时,利用信任过滤对3个性能指标没有明显影响,当阈值大于0.5时,更高的阈值导致通信负载增大和仿真所用步长的增加,但是系统性能没有增加,原因在于少数不被信任的Agent没有收到有价值的信息。在图3(b)中启用了SX(i)的信任度排序功能,使得不被信任的Agent发送的信息不被接收,这样通信负载收益和仿真总步长收益在阈值小于0.6时获得了较好的性能提升。结果说明Agent信任模型能有效减少不良信息的传播机会,可以不发送信息给信任度低的成员,从而降低通信负载,减少仿真总步长,使得信息共享行为更高效。
本文构建了一个基于Multi-Agent的信息共享行为模型,从网络结构、噪声及网络成员相互信任关系等方面对信息共享行为进行了仿真实验,从实验结果来看,能较好地体现相关因素对信息共享行为的影响,从而验证了模型的正确性。下一步将针对不同信息的信念进行权重设置和对证据进行融合,针对Agent的个性特征进行适量扩展,例如增加领导力、士气、风险偏好等相关特征,以贴近真实人的信息共享行为。
[1]张艳伟.微信平台中信息共享行为的影响因素研究[D].北京:北京邮电大学,2015:16-35.
[2]张岌秋.虚拟社区信息获取与信息共享意愿和行为的实证研究[J].情报科学,2015,33(8):59-64.
[3]冯秀珍,岳文磊.虚拟团队信息共享行为的实证研究[J].科技管理研究,2009,29(10):249-251.
[4]JONES R E T,CONNORS E S,ENDSLEY M R.A framework for representing Agent and human situation awareness[C]//IEEE International Multi-Disciplinary Conference on Cognitive Methods in Situation Awareness and Decision Support(CogSIMA),Miami Beach,2011:226-232.
[5]赵为华,李泽安,陆志峰.Beta-Binomial模型基于EM算法的应用研究[J].大学数学,2010,26(3):147-150.
[6]赵青松,王晓攀,熊伟涛.面向演化的装备体系方案选择的不确定性决策方法[J].四川兵工学报,2015,36(11):65-69.
Research on Information Sharing Behavior Modeling Based on Multi-Agent
YANG jin-tao1,3,SHEN shou-lin1,HUANG bin2
(1.Nanjing Army Command College,Nanjing 210045,China;2.Nanchang Military Academy,Nanchang 330103,China;3.Unit 73123 of PLA,Fuqing 350303,China;4.Nanchang Career Academy,Nanchang 330000,China)
TP393
A
10.3969/j.issn.1002-0640.2017.09.026
1002-0640(2017)09-0121-04
2016-07-15
2016-08-17
杨进涛(1979- ),男,湖北天门人,博士研究生。研究方向:军事运筹。