李文轩
(佛山供电局,广东佛山,528000)
本文分析变电站内常见的数据网网络故障类型,并探讨电力通信人员对于网络故障处理的一般方法,并提出相关建议及措施。
电力专用数据网络结构与一般以太网类似,由交换机、路由器、线路及终端设备构成。电力数据通信网通过站内交换机及架设于电力线路上的电力通信光缆构成网络。在变电站内,通常包括终端设备、连接线路及相关设备、网络交换机三种类型设备。因此,对于变电站内的网络故障,其现场处理方式主要针对终端、线路、交换机三个部分进行。
对于数据网络网络的故障,主要有以下几种类型。
网络故障中,常见的线路故障包括线缆损坏、受严重电磁干扰等。
测试方法:(1)线路RJ45接头是排查线路故障时首先要检查的位置,通过接头外观的检查可发现接头压线、线序的质量优劣,由此可判断接头是否良好。不正常的接头常表现为线序错误、锈蚀、接触不良、损坏等情况。(2)确定线缆接头正常后,需对线路本体进行测试,可使用线路测试工具,如网络测试仪、精明鼠等,的对线功能对线路进行测试。若对线信号灯正常则线路正常,若部分对线信号灯不亮或顺序错误则此部分线路故障。对于直连网线,其亮灯方式为按顺序由1至8亮灯;对于交叉网线,其对线侧模块亮灯顺序为1-4-3-6-5-2-7-8。
除上述使用对线仪器外,也可将网线一端接入一台能正常连接局域网的电脑的RJ45接口内,另一端接入正常的HUB接口内,使用电脑的Ping命令测试,通过ping命令反馈的信息判断线路是否正常。(1)对于租用的长线路,可与线路供应商联系,通过供应商检查线路的好坏。(2)对于电磁干扰的情况,可使用屏蔽线对线路进行更换测试,若屏蔽线可正常使用,则说明存在电磁干扰情况。
端口故障指终端设备或交换机上RJ45接口故障,一般包括接头松动、端口的物理故障等。
测试方法:(1)对于插头松动,主要通过外观信号灯及接触检查接头是否扣紧端口,若发现不能扣紧,则检查接头或端口是否故障。常见的情况为端口卡口损坏或接头卡口损坏。(2)对于端口故障,若发现接口及线路外观及物理接触正常,接头接入端口后端口指示灯不亮,可尝试更换端口测试。更换端口测试需向网管提出开通以封锁端口的申请,否则空闲端口为封锁状态。
2.3.1 集线器或路由器物理故障
设备物理故障通常为设备损坏,若出现则连接的所有终端均不能工作。
测试方法:使用替换法测试设备是否故障。
2.3.2 路由器逻辑故障
路由器逻辑故障一般包括路由区端口参数设定错误、路由器配置错误、路由器CPU利用率过高、路由器内存余量太小等。
测试方法:(1)路由器端口参数设定问题可通过ping命令或traceroute命令查看远端地址中出现故障的节点。此项测试需要网管配合。(2)路由器配置错误,通常会导致出现IP地址循环,可通过traceroute命令查看,此项测试需要网管配合。(3)路由器CPU利用率过高或内存不足,会导致网络服务质量下降甚至导致路由器死机,情况可与网管沟通后确认。
2.4.1 终端物理故障
终端物理故障主要指终端电源损坏、网卡故障等,在现场可通过主机的控制面板查看。
2.4.2 终端逻辑故障
终端逻辑故障包括,端口关闭、网卡驱动或程序冲突、IP地址设备错误。
测试方法:(1)端口关闭可通过ping命令查看端口是否在down状态;(2)对于网卡驱动冲突,可在设备管理器中查看网卡驱动是否正常;(3)对于IP地址设置错误,可通过系统中网络与共享中心查看IP设置是否正确。
对于上一节所提的常见问题,在现场处理过程中应按有效查出问题、确定问题归属、解决问题的方式处理。
对于硬件类的问题,处理方法是工作人员至现场对硬件进行更换或维修。
(1)对于RJ45接头故障,需重新压制接头解决。维护人员剪去原线路的故障接头后,按应有的线序排列线芯,将排列好的线芯按合适长度套入水晶头内,使用压线钳压制。压制时,制作者应多压1至2次,保证线头与铜针可靠接触。
(2)对于线路损坏故障,若无备用线路则需要对故障线路进行更换。租用线路可联系租用供应商解决,自有线路则需要申请工作计划对线路进行重新敷设。
(3)对于端口故障,找出对应接口后,看是否能够修复,若不能修复则需更换接入的路由器或集线器端口,通过与网管沟通开通并测试网络功能是否恢复。若为终端上唯一接口则需更换终端设备,更换后需重新联系网管开通网络接口。
(4)对于网络设备故障,若为CPU过载或内存不足则可尝试重启设备,查看故障是否恢复,否则需更换路由器或集线器等硬件设备,需提起检修申请。
(5)对于软件的故障,对于IP地址或网络配置可以通过现场进行配置,若为网络端口等现场难以处理的问题则需通过联系网管或信息中心进行处理,如交换机更改绑定的IP或MAC地址、重新配置路由器或终端网络等。
(6)对于终端部件物理故障,需要联系终端维护部门更换终端。
对于变电站内网络故障处理问题中,工作人员可能里故障点距离较远,处理流程中事前部分进行有效安排可以减少故障处理难度,其中最重要的是与报障用户沟通。与报障用户有效沟通能有效缩小故障类型范围,因此作为故障处理人员需通过有效手段与用户沟通。
与用户沟通主要针对以下几个方面:用户此前是否更改终端的配置;用户此前是否更换终端设备;是否只有用户单机出现问题;终端系统是否正常。
通过上述问题可以将问题缩小至以下范围:更改配置后可能是新配置存在问题;更换终端后,可能是终端问题、交换机端口配置问题;单机网络故障,可能是服务器配置问题、线路或线路端口问题;终端系统不正常,可能为终端系统问题。
图1 故障处理关键步骤
在服务器进行新的安全配置情况下,对于服务器端口出现问题的可能性较大,因此,在询问用户时,应着重对网络故障出现的时间及是否有更换设备、网络配置进行询问。通过询问报障用户的具体情况,针对可能的问题进行工器具的准备,并将可能出现的情况及早做好预案,能够提高故障处理效率。
由图1可知,变电站内终端与交换机之间存在IDF集线器,而此集线器由于进线侧存在大量的线路缠绕,容易导致对线、巡线不准确,因此是网络故障处理的一大难点。
对于中间有IDF的网络线路,首先可以通过标签查找相应的线路,若不能通过标签找出对应线路则需要在IDF两端分别进行对线或巡线以找出相应线路。由于集线器进线侧通常有大量线路缠绕,因此使用巡线的方式往往难以确定线路。在此情况下,需要逐根线路进行插拔进行对线。对线过程需注意不能中断在用的监测、数据采集等实时业务。
图2 变电站网络故障处理一般流程图
通过对故障的分析及故障处理关键部分的探讨,本文总结变电站网络故障处理一般流程图如图2所示。
在网络现场维护中要注意以下几个方面:(1)变电站内设备、线路施工及验收时,工作人员应对线路及设备进行清晰明确的标识,并做好文档整理,易于现场查找线路及线路相关设备,降低定位故障线路及故障接口的难度;(2)收到故障单后,应首先与用户进行有效沟通,缩小问题范围,判断故障是否属于通信维护范围进而判断是否需赴现场处理。通过沟通可有效减少问题排查的难度;(3)对于在安全措施加强的情况下,某一原因导致网络故障出现频率大幅上升,在询问用户时应着重针对此原因的导致故障的相关现象进行询问;若沟通不明确,在现场对故障处理时也应重点针对此原因进行处理。