杨厚云,回广福,付兴建,王巧玲,孔德娟
(1.北京信息科技大学 信息网络中心,北京 100192;2.北京信息科技大学 自动化学院,北京 100192)
通讯与网络
基于智能决策CBR技术的高校网络故障管理系统的设计
杨厚云1,回广福1,付兴建2,王巧玲2,孔德娟2
(1.北京信息科技大学 信息网络中心,北京 100192;2.北京信息科技大学 自动化学院,北京 100192)
设计了一种智能决策CBR技术的高校网络故障管理系统。通过应用CBR技术模拟人工网络故障解决过程。此外,本研究还设计了网络故障管理智能决策支持系统及其开发流程,并融合智能决策支持系统优化人员调配流程。
网络故障;智能决策;CBR
互联网技术的快速发展和广泛应用,使得校园网已经成为高校必备的信息化基础设施,为学校的教学、科研、管理与服务提供运行平台。随着校园网不断延伸,其故障报修频率越来越高,任何一处网络故障都会给用户学习生活带来不便。目前校园网故障处理过程中主要存在两方面问题:1)人员调度问题,故障多层转交和多次重新分析以及责任互相推诿等问题降低了故障管理效率;2)故障分析过程问题,由于故障分析过程复杂,需要工作人员具有全面综合的技术水平,才能及时的处理故障问题,因此人员的技术水平直接影响故障处理效率。基于以上网络故障处理存在的现实问题,高校校园网亟需一个有效的智能系统,实现对网络故障节点快速判断,并在第一时间指定故障处理人员。
目前智能决策支持系统已经被广泛应用于教育[1]、医疗[2]、航运[3]、公益服务[4]、供水系统[5]等多个方面,智能决策正在被越来越多的运用。
运用CBR技术将北京信息科技大学网络故障分析过程通过人工智能进行模拟,完成网络故障描述、检索、重用、调整、学习等部分工作,实现电脑代替人工分析网络故障的工作。
1.1基于CBR技术的智能决策
案例推理又称CBR(CASE-BASED REASONING),是一种基于案例的类比推理法,基本原理是模仿人类思维方式,通过搜索已有案例库,找到相似案例后,根据当前案例对原案例进行改编和学习,从而寻找到解决当前案例的办法。
1.2案例推理核心技术
案例推理技术是人工智能的一个重要技术。目前基于案例推理技术(CBR)的核心技术分为五个部分:表示、检索、重用、调整、学习。CBR在北京信息科技大学网络故障管理智能决策中的详细步骤如下:
1)校园网络故障管理案例表示方法
案例表示过程就是把案例以某种约定形式描述成为知识,然后编码成某种数据结构过程,本文采用petri网表示方法完成描述。
图1 网络故障描述框架
将校园网络故障管理智能决策方案用三元组表示:故障问题描述;故障解决方案描述;故障解决方案效果描述。网络故障案例库由故障描述和解决措施两个部分组成,针对校园网络故障管理的故障方案描述由故障类型、故障范围、时间间隔组成。以petri网表示方法[6]建立网络故障描述框架如图1所示。
在案例库中一务案例的内容如表1所示。
表1 校园网络故障管理案例内容
2)校园网络故障案例检索方法
假设待解决案例为Ax,案例库中的案例集表示A={A1,A2,…,An},根据索引选出相似案例集B={Atp},其中tp为索引号,B∈A。案例检索匹配就是从B中检索出与Ax相似度满足所设阈值的一个或者多个案例的过程。
通过字段匹配技术[7]实现检索过程,字段匹配公式如下:
匹配度=匹配字数/[(M的字数+N的字数)/2],其中M、N分别代表当前案例中某索引下字数与案例库中所检索案例的相同索引下字数。
根据表1所示内容,案例库中一务完整的案例应包含序号、标题、故障类型、故障范围、检测情况、故障原因、解决措施、指导故障处理人员8项,而与当前待解决案例匹配时只需匹配故障类型、故障范围、检测情况这三个字段。假设当前案例与表1具有相同索引情况,如表2所示。
表2 当前案例内容
计算当前案例与表1中案例匹配度:
故障类型匹配度计算:“输入网址无法打开网页”与“输入网址打开缓慢”匹配字数=6,M=10,N=8,所以匹配度=6/[(10+8)/2]=0.67。按照此方法计算故障范围匹配度为0.83,检测情况匹配度为1,三者平均匹配度为(0.83+0.67+1)/3=0.83。若设定阈值为0.6,则0.83>0.6,表示表2中案例与当前案例匹配。
3)校园网络故障案例重用
案例重用是指在匹配到案例库中的旧案例后,通过旧案例故障解决措施来解决当前案例问题的过程。但是通常情况下旧案例与新案例不会完全匹配,这就需要通过案例编辑和修改来调整出与当前案例更加匹配的案例。CBR中案例库设计为可视化界面,用户通过人机界面可直接对匹配到的旧案例进行修改。
4)校园网络故障案例调整
校园网络故障管理智能决策系统中,首先要通过案例检索来匹配出与当前案例最匹配的旧案例,然后根据知识库中的专家知识进行修改,使检索出的旧案例能够解决当前的案例问题。
基于规则推理又称RBR(Rule-Based Reasoning)技术是专家系统的一种推理形式,其过程是录入事故信息后在规则库中检索出适合当前案例的专家规则,对每务专家规则进行修正判断,如果需要修正,则把专家规则添加到故障处理预案中。如果不需要修正,则判断下一务规则,直到判断完所有规则,RBR案例调整流程如图2所示。
图2 RBR案例调整流程示意图
5)校园网络故障案例学习
在每次进行CBR运算出当前案例故障处理的措施并成功解决问题后,是否考虑将此次案例添加到案例库中,是案例学习的目的。若所有新案例在计算后都添加到案例库,会造成案例库检索时效率降低。通过案例学习更加科学地将有价值案例添加到案例库中,使案例库在完善的同时且不降低检索效率。
设案例集A={A1,A2,…,An},Ax表示当前案例,将Ax与案例集中的源案例进行匹配,同样采用案例检索中字段匹配技术,计算出Ax与A中案例匹配度,并设定一个阈值w,当Ax与A中所有原案例匹配度小于w时,将新案例添加到案例库中;当Ax与A中任意案例匹配度大于w时,删除当前案例。
在运用CBR技术的智能决策算法分析完成后,需要对智能决策支持系统进行系统总体设计和开发流程规划,进而实现智能分析网络故障功能。
2.1系统总设计
校园网络故障管理智能决策系统涉及到数据的修改和补充、管理员管理、操作员数据录入、网络设备监控、数据包监控、认证监控、智能决策系统等方面内容。在校园局域网环境下,系统采用B/S结构,管理员对决策系统后台进行维护;用户提交故障后,操作员根据受理故障情况,通过打开智能决策支持系统网页进行故障录入;监控系统对设备、数据包、认证系统进行实时监控;决策支持系统首先获取当前网络监控系统的数据,通过推理和计算显示出故障解决措施。图3为校园网络故障管理智能决策支持系统网络结构图。
图3 校园网络故障管理智能决策支持系统网络结构图
2.2系统功能模块设计
校园网络故障管理智能决策系统功能体系如图4所示。
校园网络故障管理智能决策系统功能包括数据管理:专家规则管理、案例库管理、新故障案例库管理、方法库管理、监控数据管理;系统管理:系统用户管理、系统角色管理、系统日志管理;人员调用管理;信息处理系统管理。
这些功能共同协作形成决策系统平台,使校园网络故障管理智能决策系统有效运行。数据管理是为决策出解决故障技术措施而设置,解决方案提出后根据人员调用管理功能指定某个岗位员工进行故障处理。系统管理为系统管理员建立管理账户、管理登录用户名密码及日志整理提供便利。信息处理系统则提供自然语言与机器语言之间转换功能,从而实现人机交互。
2.3求解过程
决策系统平台核心任务即为智能决策,为当前故障找出适当处理方案,智能决策求解过程如图5所示。
图4 校园网络故障管理智能决策系统功能体系
图5 决策任务求解流程示意图
1)录入故障后,经过人机接口翻译为机器语言;
2)从方法库中找到描述方法;
3)在数据库中分析出当前设备运转情况及数据转发、认证等方面数据;
4)当前故障与当前监控数据描述;
5)通过在案例库中检索、重用、以专家库中专家知识规则进行调整等步骤,完成问题求解,从而提出解决方案。
执行人员对当前方案进行评估,若感觉方案无法解决当前故障,需要调整,则进行故障重新录入继续上述步骤,若方案可解决当前问题,系统判断当前案例是否为经典案例。若是,则添加到案例库中;若不是,则删除当前案例后结束此次决策。
2.4开发流程设计
系统平台分为两个部分,一部分为将CBR实现过程分解对应四个数据库进行设计,建立管理系统并录入数据,集成各自功能部件。另一部为问题控制设计,对人员调用、编程控制、人机对话等功能进行开发。最终建立各部件之间接口,使之集成为一个综合智能决策支持系统。
采用C语言实现字段匹配检索实现过程。例如,当前案例关键语句“输入网址无法打开网页”,案例库中案例关键语句为“输入网址打开缓慢”,通过C语言实现判断相似度过程如下:
通过程序运行计算出结果如图6所示,通过运行结果可看出字符相似度为0.67,通过设置阈值判断是否将此案例检索出作为备选方案。
图6 字段匹配技术代码实现结果
通过对信息网络中心应用智能决策前后业务流程及故障分析过程加以研究,以列举实例、测速故障处理时间,分析出应用智能决策支持系统后对人员调配影响和故障分析过程的影响。
4.1智能决策应用对人员调配影响
智能决策支持系统应用后对故障管理流程,在岗位的数量、技术水平的要求、人员调配等方面都有很大的变化。
1)岗位变化
故障管理方式改变使得不同岗位要求技术等级有所改变。综合服务部内的智能决策系统操作员,作为核心人员,要求技术等级提高,原来工作是负责咨询、查询、故障分类并转交等业务,应用智能决策系统后操作员的工作在原工作基础上增加以下三务:
(1)故障分析能力。受理到网络故障后有一个总体判断,对故障分类要求较高,做到在一开始对故障有个大概定性,可以为输入智能决策系统语言做好准备。
(2)故障输入表达能力。当接受到故障后,可以将故障时间节点、故障影响范围、故障类型等情况用专业术语表达出来,并迅速输入系统。
(3)故障解决措施判断能力。当智能决策支持系统输出故障解决方案时,操作员可以对解决措施作出初步判断,判定是否可以解决问题。若可以,则联系解决措施方案中指定技术人员解决问题,若不可以,则增加或者转换输入务件,重新录入故障描述,再次进行分析,并得到新解决方案。
原网络部和系统部技术人员原工作为项目建设、故障分析、故障修复,应用智能决策系统后可以省去故障分析这一重要工作,故而对技术等级要求相对降低。
2)人员调配变化
应用智能决策支持系统后,即解决了技术人员之间工作相互干扰、业务互相推诿现象。当操作员判定系统决策出来的解决方案可行时,则会直接指定技术人员处理故障,快速、便捷。
4.2智能决策对设备故障管理影响
智能决策支持系统模拟人的思维,决策过程中有两处正是人类思维模拟的体现:
1)将实时监测数据作为案例表示中的一部分。这一行为即为模拟技术人员通过网络设备监测数据判定故障节点的过程。
2)通过案例推理库推理方式,找到相似案例,经过修正后决策出当前案例解决方案。这一行为正是模拟人类利用工作经验根据当前故障现象找出故障节点。
因此判断故障时不再需要高水平的专业技能、不再需要丰富的网络故障处理经验,对设备故障的管理更加精准和高效。
本系统是根据高校信息网络中心对网络故障管理相关流程、故障分析过程特征等信息多年积累后,根据实际经验设计决策系统模拟人工处理网络故障过程,实现快速分析诊断决策出故障解决方案并指导人员调配,从而使网络故障管理逐渐由经验型向智能型发展,最终达到提高网络故障管理效率,提升网络质量的目的。
[1] Elenasusnea.Improving Decision Making Process in Universities:AConceptual Model of Intelligent Decision Support System[J]. Procedia - Social and Behavioral Sciences,2013,(76):795-800
[2] PariDelirHaghighi.Development and evaluation of ontology for intelligent decision support in medicalemergency management for mass gatherings[J].Decision Support Systems,2013,(54):1192-1204.
[3] SantosoWibowo ,HepuDeng.Intelligent decision support for effectively evaluating and selecting shipsunder uncertainty in marine transportation[J].Expert Systems with Applications,2012,(39):6911-6920.
[4] 彭佳红.湖南省生态公益林服务功能价值评价智能决策支持系统研究[D].长沙:湖南农业大学,2013:35-109.
[5] IzabelaRojek.Models for Better Environmental Intelligent Managementwithin WaterSupply Systems[J].Springer ScienceBusiness Media Dordrecht,2014,(28):3875-3890.
[6] 李小平.铁路突发事件应急救援智能决策关键技术研究[D].兰州:兰州交通大学,2013:53-108.
[7] 李洪宇.基于CBR与FTA的飞机故障诊断专家系统的研究与设计[D].青岛:青岛科技大学,2012:8-22.
The design of university network failure management system based on intelligent decision-making CBR technology
YANG Hou-yun1, HUI Guang-fu1, FU Xing-jian2, WANG Qiao-ling2, KONG De-juan2
TP391
A
1009-0134(2016)10-0056-05
2016-07-27
杨厚云(1978 -),女,黑龙江佳木斯人,工程师,硕士研究生,研究方向为计算机应用技术。