IPv6环境下的网络故障管理研究

2012-06-07 04:03任凤双李慈海
吉林大学学报(信息科学版) 2012年1期
关键词:网络故障网络管理路由器

任凤双,任 萍,李慈海

(吉林大学a.长春电信工程设计院股份有限公司;b.管理学院;c.通信工程学院,长春 130012)

IPv6环境下的网络故障管理研究

任凤双a,任 萍b,李慈海c

(吉林大学a.长春电信工程设计院股份有限公司;b.管理学院;c.通信工程学院,长春 130012)

针对在IP(Internet Protocol)v6环境下可能发生的网络故障,通过分析IPv6MIB(Management Information Base),利用Java实现了一个IPv6环境下网络故障管理的模型,开发出针对IPv6环境下的网络故障管理软件。研究结果表明,该故障管理系统在现代网络中具有可行性和高效率,在现有网络环境下具有实用价值。

IPv6;简单网络管理协议;管理信息库;故障管理

0 引 言

当前,对网络设备故障管理的研究已经非常成熟,但由于IP(Internet Protocol)v6的高速发展,如何处理IPv6环境下的设备故障,如何在IPv6的环境下传送故障事件已成为不可忽视的问题。同时,目前网络设备商们对SNMP(Simple Network Management Protocol)、流量统计和ICMP(Internet Control Message Protocol)等协议都有自己支持的接口,而且并不统一,这就使网络管理平台不得不针对不同的设备建立不同的故障管理系统。在目前的IPv4协议向IPv6协议过渡阶段,有两种IPv6网络接入方式:双栈网络(Dual stack IPv6&IPv4networks)和纯IPv6网络(IPv6only networks)。在国际和国内大的IPv6试验网络中有部分区域是纯IPv6网络[1],第二代中国教育和科研计算机网CERNET2是目前世界上规模最大的采用纯IPv6技术的下一代互联网主干网[2],但由于其投资较大,并没有在厂商中得到广泛支持。而许多设备厂商都支持双栈网络,所以其应用较广,已成为主要的接入方式[3]。

笔者主要研究IPv6环境下的网络故障管理,开发出针对IPv6环境下的网络故障管理功能软件,并完成该软件对IPv6网络拓扑的测试。借鉴 UNIX API(Application Program Interface)[4,5]的编程思路,在FreeBSD(Berkeley Software Distribution)平台上完成了该软件,并在测试中取得了较好的效果[6]。由于网络故障管理功能是NGN(Next Generation Network)大型网络管理系统软件的一个子功能,应该充分考虑到对大规模网络的支持,因此在故障管理功能设计上充分考虑到了应用于大规模网络时的效率情况,争取做到发现故障的效率随被服务的网络规模的增大呈缓慢的线性下降。

1 网络故障管理功能分析

1.1 IPv6环境下网络故障管理功能的特点

在IPv6环境下,网络管理的功能和目的与IPv4环境下的基本相同,但在实现上有所不同,网络管理软件必须作出相应的调整。IPv6使用邻居发现代替了ARP(Address Resolution Protocol)功能,并且使用扩展的ICMP协议运载邻居发现报文,用Multicast[7]代替Broadcast,彻底取消了ARP表。在IPv4环境下,一些网络管理软件通过读取ARP表发现同一个网段中活动的主机,对于路由器来说,通过查看路由器某个端口的ARP表,可以获得与该端口相连的同一子网的活动主机。在IPv6环境下,仍然可以通过查看路由器端口的IPv6NetToMediaTable表实现该功能[8,9]。

IPv6增加了很多可管理项目,包括TCP(Transmission Control Protocol)v6MIB、UDPv6MIB和ICMP(User Datagram Protocol)v6MIB,分别在 RFC(Request For Comments)2452,RFC 2454和 RFC 2466中定义。作为支持IPv6的Manager,需要提供两方面的支持:能对IPv6设备、主机进行管理,实现IPv4环境中的一切管理功能,即配置管理、故障管理、计费管理、性能管理和安全管理;一切SNMP PDU(Protocol Data Unit)均通过IPv6网络进行传输,可以利用IPv6的安全特性,也可以使用SNMPv3的安全特性。

1)影响故障管理功能的IPv6新增MIB及其具体实现作用。故障管理功能数据相关的管理对象如表1所示。

表1 与故障管理相关的MIB对象Tab.1 Fault-management-related MIB objects

在发现接口故障过程中,由管理器定期向各设备(路由器、交换机、服务器、工作站、网关、个人计算机)发送包含GetRequest-PDU的SNMP报文,获取各设备MIB信息库IPv6MIBObjects组中的两个对象:IPv6IfAdminStatus和IPv6IfOperStatus。将这两个对象联合起来使用,就可以确定接口的当前状态。

2)获取与IPv6故障功能数据相关的MIB对象处理流程。管理站通过查询能从管理代理中访问到与故障管理有关的管理对象,并能对某些对象进行修改,从而维护网络的正常运行。

1.2 故障管理系统模块设计

故障管理是检测和确定网络环境中异常操作需要的一组设施,负责完成网络系统中故障的发现、定位和修复的功能。故障的日志记录则提供了诊断和分析的依据。系统通过收集与故障检测目标相关的数据,再将收集到的数据与所设置的阈值比较,从而检测出网络瓶颈、拥塞、网络病毒等网络故障。

将故障管理系统分为4个模块(见图1):故障的告警模块;网络连通性故障发现模块;接口故障发现模块;故障的分析和隔离模块。故障的告警模块提出了IPv6环境下的网络故障管理中告警信息的处理需求,报告网络管理员网络故障所在位置;网络连通性模块对网络的连通状态进行管理,如果网络某处连通失败,向报警模块发送消息,以便报警模块向管理员发出报警信息;接口故障发现模块对与其相关的IPv6MIB节点的关联进行研究,监测管理路由器端口的开关状态,如连通端口出现故障(端口处在down状态),向报警模块发送消息。故障的分析和隔离模块对可能发生的网络故障进行分析,其目的是迅速找到网络故障的确切原因,对可能发生的网络故障进行分析,为排除故障指明方向。

图1 故障管理系统Fig.1 Fault management system

2 故障管理系统的测试

目前的故障管理只是建立在低层次水平上,对失效事件的自动推理过程不够完善,从而不能迅速定位故障点。在IPv6这种超大规模的网络管理上,事件“风暴”问题将会更加突出。事件关联技术可以对数量巨大的网络事件进行过滤,并建立其中的关联,帮助网络管理员有效地过滤信息、智能化地进行网络故障诊断、快速确定问题发生的根源。

为了完善IPv6环境下故障管理系统的功能,需要建立一个适当的IPv6网络,并选择合适的操作系统平台和开发环境。通过对现有支持IPv6的操作系统和开发环境的考察,设计出网络实验环境,并在该实验环境基础上对已实现的故障管理系统进行测试。

2.1 测试环境

NGN话务主干网络环境如图2所示。

图2 NGN话务主干网络环境Fig.2 NGN network main frame

该IPv6网络测试环境主要由一台PSTN交换机,一台7515中继网关和两台路由器构成。以上设备均采用IPv6协议栈,其中两台IPv6路由器是PC通过IPv6模拟器虚拟的路由器,分别装载FreeBSD和Linux操作系统[10],运行Zebra-0.93b路由软件。具体配置仅以7515中继网关为例,各端口配置如下:

2.2 SNMPv1通信建立实例

由于故障管理系统与中继网关绑定,为了能与其通信,需使用指令行接口CLI(Command Line Interface)进行通信建立,执行以下SNMPv1配置步骤:

1)定义SNMPv1公共体;

2)定义SNMPv1陷阱主机。

下面通过实例说明通信建立的方法,以及关于SNMP通信建立指令的详情。

实例1 键入如下指令,定义SNMPv1公共体:

define snmp community〈community-name〉{r|rw}〈ipaddress〉

2.3 SNMPv3通信建立实例

同样,基于SNMPv3的通信机制,为了达到能与中继网关通信,需使用指令行接口进行通信建立,执行如下SNMPv3配置步骤:

1)创建SNMPv3用户;

2)创建SNMPv3查看;

3)创建SNMPv3入口;

4)创建SNMPv3用户和接入连接。

以下实例说明通信建立的方法。

实例1 键入如下指令以创建SNMPv3用户:

create snmp usm user snmpuser md5des snmpauth snmppriv

实例2 键入如下指令以创建SNMPv3View:

create snmp vacm view all 1 0x80included

实例3 键入如下指令以创建SNMPv3认证:

create snmp vacm access public 3authpriv all all all

实例4 键入如下指令以创建SNMPv3用户和SNMPv3接入连接:

create snmp vacm group 3snmpuser public

2.4 故障管理测试方法

故障管理过程中需要对影响网络性能的每个节点设置阈值,对一台网络设备或主机来说可能设置的阈值包括处理器使用率、警告持续时间等。对一个连接则可以选择对出错率、平均利用率和总吞吐量等项设置阈值,也可以针对不同的时间段和性能指标进行阈值设置。通过设置阈值和阈值检查可以在网络出现性能问题前及时向管理人员告警。一旦阈值被设定,当网络性能达到一个特定的出错率或使用率时,网元就会被触发向故障管理系统发送告警。例如:当一个端口的丢弃包数很多,达到一定数量时,或输出队列中的包数超过一定数量时,则被认为网络已经发生故障,因此,设置适当的阈值,然后通过IPv6模拟器将一个网元设备不同接口上相关的值设置为超出的阈值,以此触发告警信息,根据故障管理系统报出的告警定位信息,测试告警是否有效及故障定位是否准确,基于测试模拟的告警给出本故障管理系统的测试结果。

2.5 故障管理的测试结果显示

当故障管理代理监测到某一节点或一网段发生故障时,网络管理系统采用颜色区分告警严重性状态(见表2)。

表2 严重性告警彩色编码Tab.2 Serious warning color coding

不同的网络故障,在告警表中的内容不同。当服务器程序发现某种故障情况时,将该故障对应的代码及其检测到的故障节点生成的故障事件显示在用户界面上。

由于所管理的是大型网络,每天产生的故障信息量过大,所以每天将告警数据写入数据库的做法无论是效率,还是硬件方面都不太现实。因此,该系统将每天的告警信息以文件的形式存入指定的文件夹,每周把文件中的告警信息批量存入SQL数据库,这样既解决了每天存储数据库的频繁操作,又为用户对告警信息的查阅和比较提供了保障,客户端主界面如图3所示。

图3 故障管理系统主界面Fig.3 Layout of fault management system

故障事件在数据内容的显示上具有层次性,这主要表现在:如果某台路由交换设备内的某个接口发生故障,用户可以首先在客户端主界面上看到该路由交换设备图标的故障显示信息,然后可以再选择该记录,在右键属性中选择“DETAIL”,即能看到具体发生故障的接口等相关信息(见图4,图5)。如果某一子网内的设备发生了故障,用户同样可以首先在客户端上看到该子网图标的故障显示,然后可以再进一步通过选择记录,查看具体发生故障的节点信息,发布告警网关的网络名,告警类型,告警严重等级,接收到告警的日期和时间,发布告警的硬件,事件类型,其中事件类型分为如下5种:

1)通信告警类型:此类告警与端对端传送信息程序或过程有关;

2)服务质量告警类型:此类告警表示服务质量的下降;

3)处理错误告警类型:此类告警表示软件或处理错误;

4)设备告警类型:此类告警表示设备故障;

5)环境告警类型:此类告警与设备所在密闭环境有关。

图4 以太网口状态改变事件详细信息Fig.4 Detail change of the ethernet interfaces

图5 时钟状态改变事件详细信息Fig.5 Detail change of clock state

以上告警信息均由IPv6模拟器模拟出,并适时给出清除告警。除了以上信息外,告警详细信息窗口还会通过故障分析方法,对获取的告警信息记录、分析、判断,给出告警发生可能的原因(Content),对于已知的故障原因使用此参数,则系统会告知一个或多个解决方案,让用户更加直观地理解所发生的故障,并采取系统提供的相关解决方法处理出现的故障,这对简化网络故障的管理有着非常积极的作用。

下面对以上几种告警类型包含的典型告警事件分别作简要介绍(见表3~表8)。

表3 时钟状态改变告警Tab.3 Clock state change alarm

表5 主用板状态改变Tab.5 Main board state change alarm

表7 软件升级失败告警Tab.7 Software upgrade failure alarm

表4 E1/T1状态改变告警Tab.4 E1/T1state change alarm

表6 风扇状态改变告警Tab.6 Fan state change alarm

表8 系统配置改变告警Tab.8 Configuration change alarm

3 结 语

笔者将IPv4网络下的故障管理系统的架构和设计应用到了IPv6环境下,对于复杂的网络环境,通过对新增MIB的分析,很好地做到了对IPv6网络设备数据的选择性读取,并对设备发送的trap、采集的轮询数据进行分析,有效地对网络故障进行管理。此外,针对网管系统软件开发环境的欠缺,设计了IPv6网络设备的模拟,不仅可以模拟各种网络设备,并可以模拟大型的IPv6网络,为网络故障管理软件的开发提供了坚实的基础,也为以后的研究工作提供了便利之处。

[1]赵俊杰,武文忠,周庆国,等.基于IPv6的SIP网络管理系统的设计与实现[J].微计算机信息,2008(27):103-105.

ZHAO Jun-jie,WU Wen-zhong,ZHOU Qing-guo,et al.Design and Implementation of SIP Network Management System Based on IPv6[J].Microcomputer Information,2008(27):103-105.

[2]王恒,高玉琢.校园网IPv4/v6环境下网络管理问题研究[J].网络安全与技术应用,2009(2):18-19.

WANG Heng,GAO Yu-zhuo.Research of the Network Management Problem in the Campus IPv4/v6Network[J].Network Security Technology & Application,2009(2):18-19.

[3]魏楚一.IPv6环境下基于规则的网络故障管理[D].长春:吉林大学计算机科学与技术学院,2010.

WEI Chu-yi.The Network Fault Management Based on the Rule in the IPv6Network[D].Changchun:College of Computer Science and Technology,Jilin University,2010.

[4]RICHARD W STEVENS.UNIX网络编程[M].北京:人民邮电出版社,2009.RICHARD W STEVENS.UNIX Network Programming[M].Beijing:Peple's Posts & Telecom Press,2009.

[5]WARREN W GAY.实战Linux Socket编程[M].西安:西安电力出版社,2001.WARREN W GAY.Linux Socket Programming[M].Xi'an:Xi'an Power Press,2001.

[6]周保余,孔德刚,赵宏伟,等.嵌入式Linux实时性研究[J].吉林大学学报:信息科学版,2011,29(4):338-342.

ZHOU Bao-yu,KONG De-gang,ZHAO Hong-wei,et al.Research on Enhancing Embedded Linux's Real-Time Performance[J].Journal of Jilin University:Information Science Edition,2011,29(4):338-342.

[7]STEFAN EGGER,TORSTEN BRAUN.Multicast for Small Conferences:A Scalable Multicast Mechanism Based on IPv6[J].IEEE Communications Magazine,2004,42(1):121-126.

[8]SILVIA HAGEN.IPv6精髓[M].北京:清华大学出版社,2004.SILVIA HAGEN.The Essence of IPv6[M].Beijing:Tsinghua University Press,2004.

[9]JOSEPH DAVIES.理解IPv6[M].北京:清华大学出版社,2004.JOSEPH DAVIES.The Understanding of IPv6[M].Beijing:Tsinghua University Press,2004.

[10]毛德操,胡希明.LINUX内核源代码情景分析[M].杭州:浙江大学出版社,2001.

MAO De-cao,HU Xi-ming.The Analysis of the LINUX Kernel Sources[M].Hangzhou:Zhejiang University Press,2001.

Research of Network Fault Management in IPv6Network

REN Feng-shuanga,REN Pingb,LI Ci-haic
(a.Changchun Telecom Engineering Design Institute Company Limited;b.College of Management;c.College of Communication Engineering,Jilin University,Changchun 130012,China)

Based on the fault which may be occurred in the IP(Internet Protocol)v6network,a module of the architecture with Java through analyzing the IPv6MIB(Management Information Base)is accomplished,and the network management system which can be used in the IPv6network is developed.The architecture is effective and workable through comparing the accomplished module with current fault management on the cost of network communication.

internet protocol v6(IPv6);simple network management protocol(SNMP);management information base(MIB);fault management

TP393.07

A

2011-11-14

任凤双(1955—),男,长春人,吉林大学长春电信设计院高级工程师,主要从事电信工程设计研究,(Tel)86-13843169000(E-mail)jlrfs@sohu.com;通讯作者:任萍(1983—),女,长春人,吉林大学博士研究生,主要从事通信工程与设计研究,(Tel)86-13511003352(E-mail)rpdxx@163.com。

1671-5896(2012)01-0088-07

(责任编辑:何桂华)

猜你喜欢
网络故障网络管理路由器
买千兆路由器看接口参数
维持生命
路由器每天都要关
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
电动汽车充电服务网络管理初探
无线路由器的保养方法
基于EOC通道的SHDSL网络管理技术
通讯网络故障类型研究
校园网络管理及安全防护