杨昆
摘要:随着网络用户数量的不断壮大,为网络的日常管理与维护带来巨大的挑战。为了维护日益庞大的网络系统的正常工作,保证所有网络资源处于良好的运行状态,必须有相应的网络管理系统进行支撑。网络管理系统中技术革新就显得尤为重要,只有新技术不断推陈出新,才能使网络管理系统不断向前发展。
关键词:计算机网络;智能化;故障管理
一、智能化网络管理的概述
为了能够更有效地对各种大型复杂的网络进行管理,许多研究人员将人工智能技术应用到网络管理领域。虽然全面的智能化的网络管理距离实际应用还有相当长的一段路要走,但是在网络管理的特定领域实施智能化,尤其是基于专家系统技术的网络管理是可行的。用于故障管理的专家系统由知识库、推理机、知识获取模块和解释接口四大主要部分组成。专家系统以其实时性、协作管理、层次性等特点,特别适合用在网络的故障管理领域。但同时专家系统也面临一些难题。
1.动态的网络变化可能需要经常更新知识库。
2.由于网络故障可能会相关到其它许多事件,很难确定与某一症状相关的时间的开始和结束,解释和综合消息复杂。
3.可能需要大量的指令用以标识实际的网络状态,并且专家系统需要和它们接口。
4.专家系统的知识获取一直以来是瓶颈所在,要想成功地获取网络故障知识,需要经验丰富的网络专家。在实现智能化网络管理系统时,还必须把握系统复杂性与系统性能的关系。不仅要利用将较为成熟的人工智能技术,而且要考虑实现上的复杂度和引入人工智能技术对系统性能和稳定性的影响。
二、基于免疫的网络故障管理
在前面介绍理论的基础上,我们提出了一个基于免疫agent的网络故障管理模型。下面对这个模型进行详细分析。
1.免疫故障管理模型
免疫网络模型的工作原理是,当网络发生故障的时候,搜集故障信息,然后经过一定的处理后,以抗原的形式提交到本地免疫,本地免疫首先在本地知识库进行搜索,看是否存在与抗原相匹配的故障类型,如果存在,那么输出故障信息,同时发送匹配成功的激励信号;否則发送协助信号,请求其他免疫协助解决,其他免疫接收到帮助信号以后,到自己免疫中的知识库就行搜索,看是否存在相匹配的信息,如果存在,则将匹配到的故障类型发送给本地免疫,否则将故障信息交由人工解决。
模型的运行是不断进行迭代的协同进化过程。每进行一次故障数据信息的诊断,模型就完成一次迭代过程。每一次迭代中,免疫之间会进行信息的交互,在迭代过程中每一个免疫的知识库(也就是抗体集)会不断的进行更新,因而故障诊断能力会不断的增强,整个过程是始终是处于动态变化。
2.免疫各功能模块介绍
移动免疫由六种不同功能的免疫组成。下面对每种免疫功能进行详细介绍。
(1)信息采集免疫。信息采集是进行故障诊断的前提。信息采集免疫主要是对网络主机及所属子网络上的原始数据进行收集,然后将收集到的原始数据保存,然后进行一些预处理(如分析数据传输采用的协议、丢包率等),为故障断准备好数据信息。
(2)故障诊断免疫。故障诊断免疫是整个系统的核心。一个故障诊断免疫通常只包含相对有限、独立的故障检测方法,提供对某一具体类型的数据分析服务,因此它的检测能力是非常有限的。故障诊断免疫根据本身的责任,它会主动发送请求给相关的信息采集免疫,然后对返回的信息进行分析,得出诊断结论。如果存在无法识别的异常,故障诊断免疫会将数据源信息、实际诊断方法、故障参数等信息作为本地存储,发送给决策免疫做下一步处理。
(3)通信免疫。所谓的通信免疫就是负责网络免疫之间的相互通信。每个局域网都有一个通信免疫而且是唯一,局域网内的免疫之间必须通过通信免疫才能进行交互,否则不能直接通信。通信免疫本身并不具备执行诊断任务的能力,是为其他免疫服务的。
(4)决策免疫。系统在故障诊断过程中可能遇到各种问题,如数据采集不完整、领域知识不完备等,这些因素增加了检测结果的不确定性。对于比较简单的任务而言,决策免疫也许不是必需的,但是如果任务比较复杂,根据单一故障特征并不能确定问题的所在,此时决策免疫就发挥作用了。如果无法得出明确的诊断结论,这个时候决策免疫会将诊断信息发送给系统管理免疫,请求人工处理,处理完成后,将处理信息添加到知识库中,以备将来使用,这也就是学习过程。
(5)知识管理免疫。知识管理免疫主要功能是存储相关领域的基本原理、专家的经验知识以及一些实际案例等,信息数据也是专家知识库的重要部分。知识库的内容为各种故障的诊断提供了必需的知识。知识管理免疫主要是维护、搜索、转换知识库中的知识,包括协调全局、本地知识库的管理的同步和关联,负责知识库中知识的更新与学习。
(6)系统管理免疫。系统管理免疫是整个系统正常运行的保障,主要职责是负责agent的创建、挂起、注销等,并为各个免疫提供信息搜索功能。系统管理免疫中还为诊断任务联盟提供信息存储功能。
(7)故障诊断中抗体库算法设计。在整个系统中,故障诊断是系统中的最重要部分,而故障诊断的核心是抗体库。本文基于免疫原理的设计了一种高效的算法,具体描述如下。
①初始种群,根据待解决问题的具体要求,随机产生数量为N的个体。
②根据专家知识和经验建立本地知识库,本地知识库包含的一系列的抗体集。③本地知识库接收其它免疫的疫苗,然后进行知识库的更新,形成新的抗体集。④抗原传感器采集一定范围内的信息数据。⑤如果判断采集到的信息数据可能会存在异常,则发送协助解决信息给当前免疫免疫,处于等待状态并保持免疫耐受,转步骤⑧。信息数据与本地知识库抗体进行匹配,如果匹配成功,那么表明本地知识库内有对应的解决方案(即存在抗体),然后进行免疫应答。⑥将此抗体模式作为疫苗,发送刺激信号给其它相关免疫免疫,然后可以作为经验给其它免疫Agent解决类似问题。⑦进入下一阶段,转到步骤③。⑧若免疫免疫返回的信息是继续等待,那么继续保持免疫耐受,并转到步骤⑦;若其它免疫免疫返回经验知识作为参考,那么转到步骤⑤,并且学习参考经验知识并保存,然后对本地知识库进行更新,提供给下次免疫答复。
实际的操作过程中,我们首先需要定义网络状态和实体,网络故障具体表现在网络实体的某些的属性值的超出了允许的范围,然后系统就可以获取网络运行时的信息,对这些信息进行预处理,将其转换成具体问题的求解,最后将此问题求解方案通过一定的形式转化成免疫算子,用于生成种群中的个体。
三、结束语
本文提出的基于免疫免疫的网络故障管理智能化系统,相对于传统的网络故障管理,具有更好的灵活性和主动性,具有更高的效率和决策能力。我们将免疫算法和免疫结合运用到网络故障管理中,可以对一些不完整的信息进行处理,提高了网络管理智能化水平,特别适合于分布式的大型复杂网络,能更好地、更快的发现解决了网络中存在各种问题。
参考文献:
[1]彭玉娟.分布式计算机网络故障管理系统分析[J].科技资讯,2007,(13).
[2]温润芝,张玲,张冬英.计算机网络故障管理智能化探究[J].广播电视信息,2009,(11).
[3]辛浩,李玲玲.常见网络故障的诊断与排除[J].淮北职业技术学院学报,2010,(06).