文/胡 磊 张敬睿
园区网络故障分析与处理
文/胡 磊 张敬睿
解决网络故障一般按照由易到难、由线路到设备、由硬件到软件的原则进行。
园区网一方面连接学校内部子网和分散于校园各处的计算机,另一方面作为沟通学校校园内部网络的桥梁,是为学校的教学、管理、办公、消息交流和通讯等服务的网络。这里所说的园区网是针对学校内部的计算机网络,不是一般的企业网,有其自己的特点和规律。
园区网的结构与学校的组织机构、园区网的规模和主干网的结构选择关系密切。根据防火墙和外网接入方式的不同,一般将整个园区网以防火墙为中心分为三个部分:内网区、外网区和服务区。内网区主要是园区网内部用户的集合,具体为学校办公用户、移动用户、内网学生等;外网区主要是指整个园区网的对外出口;服务区提供各类网络服务区功能,它是整个园区网的中心。划分园区网络的大小主要依据以下三个方面的内容,一是园区网络站点的多少;二是园区网的数据流量大小;三是园区网的分散程度。
园区网一般由通信线路、交换机、路由器和防火墙等网络通讯设备组成。解决网络故障一般按照由易到难、由线路到设备、由硬件到软件的原则进行,园区网故障诊断以网络配置、网络原理和网络运行知识为基础,从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题根源,排除故障,从而恢复园区网正常运行。
计算机网络硬件故障诊断与排除
园区网硬件故障根据故障的不同对象可划分为:通信线路故障、服务器故障、配置故障、路由器故障、网络通讯设备故障等。下面对园区网常见故障的诊断与排除分别作介绍。
1.通信线路故障诊断与排除
线路故障常见的现象就是线路不通,常会出现线路损坏、接口松动、线路受到严重电磁干扰等。例如,网络管理员发现网络某条线路突然中断,首先用ping命令检查与网络中心的服务器或网络设备是否连通,如果连续ping都出现信息“Request time out”,则说明网络线路不通。此时,要检查RJ45端口插头是否松动或损坏,或者网线接法是否正确。现在的网线大多使用的是双绞线,双绞线是由4对线严格且合理地紧密绞合在一起的,以减少串扰和背景噪音的影响。目前,使用了双绞线的1、2、3、6四条线,其中1、2用于发送,3、6用于接受,而1、2线必须绕对捆绑在一起,只有这样,才能最大限度地避免串扰。如果RJ45接口损坏,需要制作新的RJ45接头。有时候线路不通,也要检查线路连接是否正确,比如两个路由器Router的普通端口直接连接会导致DHCP分配混乱,这时应该让一台路由器的出口连接另一台路由器的入口,而这台路由器的入口连接另一路由器的出口才行。当然,集线器Hub、交换机Switch、多路复用器等网络设备也必须连接正确,否则也会导致网络故障。
2.服务器故障诊断与排除
园区网通常由若干个服务器(Data服务器、Web服务器、DNS服务器等)运行来支持多功能的网络服务,服务器存在一些典型的问题。例如,账号和口令过短,网络服务配置不当,没有配置Finger、RPC、Rlogin服务等。这些问题会导致网络中数据的丢失,服务器权限被非法取得,甚至整个网络被黑客攻击。因此,必须将服务器上含有机密数据的区域全部转移成NTFS格式,限定使用登录网络的权限,做好数据备份、恢复工作等。RAS服务器对于黑客来说,进入主机很方便,但可限定远端用户只能存取单一服务器。Windows NT系列的服务器可使用支持服务器远端存取(RAS)的回拨功能。Windows NT虽然存在很多安全漏洞,但是微软会定期出台修补程序(补丁),有时收集成ServicePack(服务包)发布,网络管理人员需立即进行修补。园区网服务器,建议大家使用Unix系统平台,Unix的漏洞非常少,它的代码在网上是免费公布的,遭黑客攻击出现的问题不大。
3.配置故障诊断与排除
配置故障往往是由于网络设备的配置原因导致园区网故障或异常。造成配置错误的原因有可能是路由器端口参数设定不正确,或路由器的路由策略配置错误以至于路由循环或找不到远端地址,或者是路由掩码设置错误等。例如,以园区网中的线路故障为例,故障线路没有流量,但可以ping通线路的两端端口,这种情况就是有可能是路由配置错误。此时,我们通常用“路由跟踪程序”就是Tracert,Tracert用于确定IP数据报访问目标所采取的路径,它把端到端的线路按线路所经过的路由器分成多段,然后以每段返回响应与延迟。如果发现在Tracert的结果中某一段后,两个IP地址循环出现,这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上来回反复传递。Tracert也能检测到哪个路由器之前都能响应,到哪个路由器就不能响应了。这时只需要更改远端路由器端口配置,就能恢复线路正常了。配置故障也可能是园区网内的单机配置错误。学校的网络对外IP地址通常只有几个,因此园区网就需要划分成局域网,IP地址划分为B类还是C类要视学校大小来定。有的教员并不注意上网需要填写IP地址、DNS、子网掩码等配置信息,此时需要咨询网络中心人员以填写正确的配置信息。
以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题根源,排除故障,从而恢复园区网正常运行。
4.路由器故障诊断与排除
实际上,线路故障很多情况都涉及到路由器。因此,有些线路故障可以归结为路由器故障。通常,我们利用SNMP变量浏览器MIB Browser来检测路由器故障,用它收集路由器的路由表、计费数据、端口流量数据、路由器CPU的温度、负载以及路由器的内存余量等数据。一般情况下,园区网管理系统有专门的管理进程不断地检测路由器的关键数据,并及时给出报警。路由器的硬件故障有可能是路由器CPU温度或路由器内存导致的。路由器CPU温度过高十分危险,有可能导致路由器的烧毁;而路由器CPU利用率过高和路由器内存余量太小都将直接影响到网络服务的质量。解决这种故障只有对路由器升级、扩大内存等,或者重新规划园区网拓扑结构。路由器的软件故障通常是本地或远程的路由器配置丢失,或端口配置CLOCKRATE丢失,将CSU或DSU设置为“LoopBACK”状态,用“Show int s*”命令确认line Protocol是否up,如果up,证明路由器已经ShutDown。
计算机网络软件设备故障原因及解决方法
1.广播风暴
网络广播技术在园区网中的重要性是不言而喻的。然而,随着园区网中连接主机数量的增多,广播包的数量亦会急剧增加。当广播包的数量达到通信总量的30%时,网络传输效率将会明显下降,即广播风暴。一般情况下,产生网络广播风暴的原因主要有几种:(1)当网卡或网络设备损坏后,会不停地发送广播包,从而导致广播风暴;(2)若网络中存在环路,也很容易出现这种现象。例如,若在交换机与交换机,交换机与集线器,集线器与集线器之间,同时插人2根级联线,就会造成园区网中存在环路,如此一来网络中的每一帧数据信息都会重复广播,致使整个园区网瘫痪;(3)网络病毒的传播,一些联网主机的用户有时由于好奇试用如网络执法官、网络剪刀手等黑客软件,也会损耗大量的网络带宽,引起网络堵塞。所以网络维护人员要通过逐步排查的方法,找到引起广播风暴的罪魁祸首。例如,最好有备用的交换机和集线器,然后用它来替换正在使用的交换机或集线器,如果替用之后网络反应“迟钝”现象消除,就表明“祸首”已经找到。要是网络反应仍然很“迟钝”,就表明交换机或集线器没有损坏;接着可选1台主机,在命令提示符状态下,通过“ping”命令来测试园区网中每一台工作站的连通性,一旦发现无法ping通,可以用更换新网卡的方法重新进行测试,直到网络传输速度正常为止。当然为了有效避免网络回路现象发生,一定要在组建网络时养成良好习惯,如记得给每根网线贴上明显标签、对备用网线做好记载等。
2.病毒
病毒的智能化,变种、繁殖的快速化,加上其洪水般的泛滥趋势,以及黑客工具的“傻瓜”化,使得网络变得脆弱不堪,随时面临瘫痪甚至永久损坏的危险。而园区网最大的特点就是网内计算机的数据快速、便易的传递,这也给病毒传播提供了有效的通道。如果有1台计算机感染病毒,任何与该计算机进行数据传递的计算机都必然会感染病毒。比如,被感染了像“冲击波”、“震荡波”等网络病毒的主机只要一连上网就不停的占用网络资源,整个网络中充斥着病毒文件,堵塞了网路,增加了服务器或客户机的负荷,造成园区网明显拥塞,甚至瘫痪。因此,网络维护人员应时常注意各种新病毒通告,了解各种病毒特征,定时查毒杀毒,及时升级杀毒软件,设置网络防火墙。
3.端口瓶颈
园区网中某些重要端口的带宽太小,可能会影响整个网络的传输速度。例如,路由器端口、交换机端口、集线器端口和服务器网卡等都有可能成为网络瓶颈。特别是在网络访问高峰期间,这些重要端口很容易成为园区网反应“迟钝”的“罪魁祸首”。可在网络使用高峰时段,利用网管软件查看路由器、交换机、服务器端口的数据流量(如用Netstat命令统计各个端口的数据流量),并记录访问高峰期的具体时间,从而确认网络数据流通瓶颈的位置。这样就可以有针对性地采取相应措施,如增加其带宽,从而消除网络瓶颈,最大限度地提高数据传输速度。
(作者单位为空军预警学院)