交换机频繁故障诊断与处理

2017-05-10 08:20刘成军
山东冶金 2017年2期
关键词:库底网络故障环网

刘成军

(江苏沙钢集团淮钢特钢股份有限公司设备处,江苏淮安 223002)

交换机频繁故障诊断与处理

刘成军

(江苏沙钢集团淮钢特钢股份有限公司设备处,江苏淮安 223002)

通过对整个工厂网络各节点进行远程诊断和监控网络流量,找到核心关键节点,并对全厂网络重新统一规划,完成全厂网络组态及网络拓扑结构的完善,减轻核心交换机的负担,使整个网络的各交换机数据通讯量均衡分布,消除交换机故障概率,保证生产顺利运行。

网络拓扑;SCALANCE;环网冗余;网络故障诊断

1 前言

某钢铁厂矿渣粉2#水泥库底交换机采用西门子SCALANCE X204产品,自2009年投运以来,经常出现故障而导致网络通讯中断(故障频率大约1个月),且该交换机又是主干网络交换机,其故障直接导致其他部分产线因网络通讯故障而停机,严重影响了生产。网络的通信中断,使中控集中监控人员短时间内难以掌握现场设备运行情况,特别是关键调节参数得不到监控,甚至可能导致设备安全事故。分厂经过多次排查和整改替换,都没有达到很好的效果,故障一直得不到解决。鉴于此,非常有必要对该故障进行彻底查找和消除,保障系统的稳定运行。

2 钢铁厂网络存在的主要问题

该钢铁厂自2008年投产第一条矿渣粉生产线以来,现已有多条矿渣粉生产线、水泥生产线、转体炉生产线及熔分炉生产线。由于各产线于不同时段建设和投产,自动化控制系统又由不同厂家配套,再加上生产控制系统网络自始至终都没有统一规划,各新上产线的网络规划、设备选型和拓扑结构均由自动化系统成套厂家实现,并就近网点接入整个工厂网络。没有考虑网络负担、级联网络设备状况及通信速率等因素,使整个工厂网络结构比较混乱,且各线所选择的交换机品牌型号也存在差异,从而形成现在相互交织的混乱网络结构,主要体现在以下几个方面。

1)整个厂区的网络没有专门的规划,导致现网络拓扑结构不清且混乱。2)网络以总线型为主体,在总线主干网络上的交换机既有管理型,也存在非管理型;传输介质有的是光纤,有的是电气介质。绝大部分管理型交换机都没有重新配置,保留出厂的默认设置,其管理功能存在不正确配置的现象。3)各产线随意接入主网,导致各交换机在网络数据交换中负担不均衡,也造成某些交换机成为某段网络的数据交换中心。4)各产线的主干网络交换机都是管理型带双光口交换机,型号为西门子SCALANCE204、308及400系列交换机,默认设置为光口环网冗余设置。5)由于主干网络接口数量限制、各生产线间的连接及后期改造增加设备等原因,分厂对网络进行了增容及改造,级联了下级网络,级联的下级网络交换机品牌及型号非常混杂。

3 故障排除及解决方案

3.1 故障排查过程

3.1.1 梳理最终拓扑结构图

由于整个厂区网络拓扑结构非常混乱,各产线又不能同时停产,造成整个工厂的网络拓扑结构没有整理,这对故障的排查增加了难度。要排除故障,首先必须对整个网络拓扑结构进行梳理。完整准确的网络拓扑是网络管理的基础,也是故障排查与改进的基础。

梳理网络结构工作量较大,特别是光纤介质接口,需要测光验证,必然导致中断网络,影响生产,所以梳理工作安排在各生产线检修和停产期间进行。经过几个月的梳理和校验,最终得到原完整网络拓扑结构图。图1为最终主干网络拓扑结构。

3.1.2 网络拓扑结构图分析

图1 厂区主干网络拓扑结构

从图1中可以看出,整个厂区由多条不同生产线构成一个大的总线型+树型结构网络。整个网络可沿中间虚线分为两大部分:1期矿粉及钢粉磨系统(简称I段),2期矿粉磨及水泥系统(简称II段)。II段网络以总线型网络结构,该段的总线主干网络设备主要为从水泥包装X202交换机到3#粉磨X204交换机。I段网络以西门子X400交换机为中心的星型网络结构。两段网络通过2#水泥库底X204交换机作为连接中心,实现了两段网络的互联。北门发货楼5#~8#粉库操作监控电脑安装在I段网络,而监控的数据却来自II段网络的5#~8#粉库系统,经过2#水泥库底X204交换机、3台民用级H3C交换机、2#钢粉库底X204交换机、信息中心网络及民用级交换机DLink的多级级联后,完成数据交换。这4台民用级交换机长期不间断的大量数据交换运行,经常会发生因发热严重而导致网络通信不畅的现象。

图1中2#水泥库底X204交换机是经常发生故障的交换机,该交换机是连接两段网络的中心交换机,且是北门发货楼水泥系统监控中心的节点交换机,承担了大量的数据交换任务。

3.1.3 网络监测

2#水泥库底SCALANCE X204交换机为网管型交换机,带有4个10/100 Mbit/s RJ45接口,2个100 Mbit/s多模BFOC接口,LED诊断功能,故障信号显示,连接设置按钮,冗余电源输入,PROFINET IO设计,网络管理。

II段网络主干网交换机均属网管型交换机,且默认情况下均设置为主冗余环网管理交换机。项目从安装送电后一直没有重新设置,且没有形成网络环形结构,所以一直有报警指示,但不影响使用,该报警指示为环网故障。

根据现网络情况,需对整个主干网的管理型交换机设置进行排查和纠正,满足现网络拓扑结构现状,并去除冗余环网功能,同时对于经常出现故障的交换机,需要在线查看通信工作状态,实现对其实时监控,以便分析故障原因。

在对交换机进行管理设置前,必须设置IP地址,而默认状态下没有IP地址,故不能通过计算机对其进行设置和监控。设置交换机IP地址需要安装西门子Primary Setup Tool软件工具(简称PST)。通过PST工具,设置完IP地址后,可通过IE浏览器实现对交换机管理和数据监控。

通过对2#水泥库底交换机进行在线监控,发现其数据通信量较大,比较其他主干网上的交换机通信量,增加220%,而且数据丢包的概率非常大,表明其通信不畅,网络频繁进行数据连接和数据重发。

3.2 故障确认

通过对网络拓扑结构的分析及在线数据监控,可以得出以下结论:1)2#水泥库底交换机是北门发货集中监控和两段网络连接的核心交换机,承担了较大的数据通信任务,网络负担较大;2)5#~8#粉库系统的监控通过两段网络间的数据交换来实现,且经过4台民用级交换机,民用级交换机数据通信不是很稳定,随长时间运行,容易发生丢包现象;3)I段网络数据通信主要发生在监控电脑与控制器之间,其间经过3台民用交换机(2台H3C,1台Dlink)串接,数据通信不稳定,特别是3#矿粉库的H3C交换机,是整个工厂网络数据交换的核心交换机,让普通民用级交换机承担如此重要任务,不可避免的存在安全隐患;4)民用级交换机无管理功能,当数据通信阻塞时,交换机虽不发生故障,但使数据频繁丢包,导致2#水泥库底交换机接收了大量的废包数据,并承担了大量数据处理任务,使发生故障的概率增大。

可以得出,2#水泥库底交换机频繁出现故障原因是由于整个网络规划不合理导致的,造成了民用级交换机承担了主干网络节点、局部交换机承担了沉重的数据管理和交换任务。操作员站线路规划不合理增加了两段网络间数据交换量。

3.3 解决方案

3.3.1 处理措施

根据上述分析的结果,对整个网络需要重新进行规划,消除局部网络数据阻塞,主要措施如下:1)对整个网络的主干网络管理交换机全部重新进行了配置,满足现行网络拓扑结构的设置要求。2)减少两段网络间的数据交换量。两段网络间最大的数据交换量来自5#~8#粉库监控站,对该台计算机网络路径重新规划,使其连接到北门发货楼的1#Dlink交换机上。3)对两段网络间的连接点重新进行了规划。解除了3#水泥库和3#矿粉库间的网络连接,两段网络间通过主干网交换机间进行连接,即增加了中控室X212与X400交换机间的电气口连接。4)对I段网络主干网重新规划。增加了3#粉库X308到2#钢粉库底X204光纤连接,解除3#粉库X308与H3C交换机的连接。5)解除中控室的X204 与Dlink交换机的连接,增加中控室X204与X308交换机间的连接。

3.3.2 处理后的结果

经过上述的处理措施后,对2#水泥库底交换机进行实时监测,发现其网络负担大大减少,与本段其他总线交换机的网络通信量是一致的,表明网络负担均衡;民用级不再承担主干网络的作用,在半小时的监测时间内,没有发现数据丢包现象;经过半年的运行,没有出现交换机死机的现象。由此可以看出达到了改造后的理想效果。

3.3.3 形成新的环形网络

经查,工厂使用的西门子SCALANCE交换机都支持冗余环网功能,默认的环网端口为光纤接口,搭建新的连续网络环将每台设备连接在一起,即保证1台设备上发送的信号可以被环上其他所有的设备都看到。当网络出现线缆连接中断的情况出现时,交换机接收到此信息,激活其后备端口,使网络通信恢复正常运行。整个网络重新组态将在0.3 s内完成,待故障问题解决或消除后,将立即恢复原始拓扑,大大提高了网络通信的可靠性。

4 结语

完整准确的网络拓扑结构是网络的基础。由于网络中设备的多样性、透明性、动态性,因此要靠严格的管理来加以完善,保证网络拓扑的准确性。设置专人对网络进行管理,严禁私自搭连网络,以避免网络故障的发生。网络故障管理是网络管理的基础工作,主要包括故障检测、定位、隔离、恢复等关键技术。快速有效采集该钢铁厂网络故障监视数据,得出优化故障管理策略,快速定位网络故障等则是解决此次网络故障的关键工作。为了提高该钢铁厂工业以太网的可靠性,减少因网络故障造成的损失,必须定期对网络数据交换进行统一监控和详细分析,便于掌控整个的网络动态,保障整个厂区网络的正常运行。

TP277

B

1004-4620(2017)02-0079-02

2017-01-27

刘成军,男,1981年生,2004年毕业于中国矿业大学电气自动化专业。现为江苏沙钢集团淮钢特钢股份有限公司工程师,从事设备管理工作。

猜你喜欢
库底网络故障环网
基于声固耦合法的拱坝-库水-地基相互作用分析
基于ODUk Spring方式实现基础网络环网保护的研究
基于河长制的水库库底清理工作新思路
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
高速公路万兆环网建设探析
卫生填埋场水平防渗系统工程量优化计算探讨
Wireshark协议解析在网络故障排查中的应用
基于CAN的冗余控制及其在轨道交通门禁环网中的应用
水库库底清理规划设计的探索与难点分析