数字化时代高校网络与系统常见故障与处理
——以温州医科大学为例

2021-05-18 01:17
科技创新与生产力 2021年4期
关键词:网络故障表象交换机

刘 巧

(温州医科大学,浙江 温州 325035)

网络卡顿,系统、网站打不开是校园网的常见问题,这类问题的排查和解决并不容易,会花费运维人员大量的时间和精力。为了提高相关从业人员的工作效率,根据工作中的实际经验对发生这些问题的原因和处理办法进行整理,以期为相关人员提供参考。

1 网络与系统故障原因

1)链路太长。从前端页面到后台服务器,从Web 应用服务器到后台数据库,任何一个环节的问题都有可能导致请求整体卡顿,到底是前端资源加载过慢,还是数据库出了问题,还是新发布的服务端代码有性能问题?出现问题的原因五花八门。

2)业务发展、迭代速度快,会导致业务系统频繁修改接口、增加依赖、代码质量恶化。

不同应用由不同的团队、人员分别维护,加剧了问题排查的难度。

2 高校网络常见故障

一般问题都来源于设备。按照与用户的距离由近到远划分,网络设备故障产生的影响大小可以从4 个方面描述[1]。一是底层的用户端设备,包括PC、网卡、水晶头、网线、网络模块、无线路由器、无线接入点 (Access Point,AP)、电源等;二是中间层设备,一般设置在弱电间,包括网线、接入层交换机、Poe 交换机、光纤、汇聚层交换机、电源等;三是核心层设备,这些设备一般设置在核心机,主要有防火墙、光纤、尾纤、光模块、电源等,见图1。

图1 网络设备的组成

网络拓扑图可以比较直观立体地呈现各个网络设备的布局,它也是排查网络故障的重要手段,出于安全考虑,本文不对外公开温州医科大学的网络拓扑图。

围绕这些网络设备,根据实际工作经验,常见的网络故障及其解决办法有以下8 个方面。

2.1 用户电脑系统故障

表象:单人故障。

原因:浏览器损坏、网卡驱动丢失、中病毒。

排查方法:ping 127.0.0.1,或者通过仪器设备排除网络故障。

解决方法:重装系统。

2.2 网络模块故障

表象:单人或多人网络故障。

原因:模块内针脚损坏,模块老化损坏,模块内网线没卡牢,模块线路没按顺序打等。

排查方法:拆开模块检查。

解决方法:修复或者更换模块。

2.3 预埋线故障

表象:单人或多人网络故障。

原因:墙体内线路老化或被老鼠咬断。

排查方法:用网络测线仪检测。

解决方法:重新布线。

2.4 路由器故障

表象:单人或多人网络故障。

原因:路由器故障、路由器至电脑或者模块跳线故障。

排查方法:查看主干口,即广域网 (Wide Area Network,WAN)口的灯是否亮、是否恢复出厂设置、登录路由器查看是否获取网际互连协议(Internet Protocol,IP)地址、测线仪检测。

解决方法:更换路由器或者更换跳线。

2.5 交换机故障

表象:单人或多人网络故障。

原因:交换机老化、交换机损坏、交换机配置问题、交换机至配线架的跳线故障、机柜内的插板没电。

排查方法:ping、查看灯是否亮或是否狂闪(线路环路)。

解决方法:更换交换机或者更换跳线。

2.6 光纤线路故障

表象:多人网络故障。

原因:光缆断线、光缆信号衰减、光缆线路接错等。

排查方法:红光笔、测光衰仪器。

解决方法:光纤重新熔接、光纤重拉。

2.7 打印机不能共享

表象:单人网络故障。

原因:不在同一网段打印机不能共享。

排查方法:ipconfig。

解决方法:调整网段。

2.8 校内网页打不开

表象:单人网络故障。

原因:未能自动获取域名服务器、软件自动获取了中国电信的域名系统 (Domain Name System,DNS)服务器。

排查方法:ipconfig/all。

解决方法:给电脑固定域名服务器。

3 网站与系统常见问题

系统、网站访问出现问题,除了网络故障和自身的代码故障外,其他问题可能与以下的设备和软件有关:防火墙、玄武盾 (云防护) 、代理服务器 (nginx) 、Web 应用防火墙 (Web Application Firewall,WAF) 、前置机 (nginx)、服务器 (硬件、云主机、操作系统、系统自带防火墙)、360 安全卫士、统一监管平台 (360)、360 安全狗、DNS。

超文本传输协议 (HyperText Transfer Protocol,HTTP)状态码:当用户试图通过HTTP 访问一台运行主机的内容时,Web 服务器返回一个表示该请求状态的数字代码,该状态记录在服务器日志中,或可能在Web 浏览器显示,即打开页面发生错误时浏览器显示的错误信息码。状态码可以指明具体请求是否成功,还可以揭示请求失败的确切原因。这也是排查系统、网站访问故障的有效手段。常见的协议状态码如下。

1** 保留

2** 表示请求成功地接收

3** 为完成请求客户需进一步细化请求

4** 客户错误

5** 服务器错误

围绕这些设备、软件并根据实际工作经验,系统、网站可能发生的访问故障主要有以下9 个。

1)您访问的网站并未申请接入云防护,如需防护请网站建设方联系当地销售 (云防护)。原因:玄武盾未配置443 端口。

2)您的访问可能对网站造成危险,已被云防护安全拦截。原因:玄武盾拦截。

3)“502 Bad Gateway nginx”。原因:一是 (内网访问正常)外网通过代理转发,服务器上的安全狗判断为攻击,从而拦截该正常访问;二是 (内外网访问不正常) 服务器 Web 服务 (Tomcat,Apache,IIS 等)出现故障。

4)无法访问此网站,172.18.6.20 的响应时间过长。原因:服务器开启了防火墙,80 端口被禁止访问。

5)一是请求失败原因 “Http failure respond http://*** 400 Bad Request!”;二是 Bad Request;三是请不要使用非法的统一资源定位系统 (Uniform Resource Locator,URL)地址访问。原因:Waf 拦截。

6)一是校内ping authserver.wmu.edu.cn,返回外网地址;二是校内telnet authserver.wmu.edu.cn 80,返回外网地址。原因:电脑DNS 配置错误。

7)一是 “504 Gateway Time-out nginx/1.15.3”;二是 “504 Gateway Time-out”。原因:服务器 (硬件、云主机、操作系统、自带防火墙)故障。

8)“500 Internal Server Error nginx”。原因:代理后台打开了GZIP 压缩功能,关闭该功能后恢复正常。

9)“出错啦!该网站无法访问;可能的原因为:您正在访问的目的地址为:idp.***,是否输错了地址,如果地址正确的话,表明该目的资源还没有发布,请联系管理员修改配置并发布此资源。您正在使用IPv4 地址*** 进行访问,目的资源没有对IPv4 进行发布,请联系管理员修改配置并发布此资源。(错误代码502) ”原因:该资源仅使用443 端口,代理服务器未开通443 端口。

4 结束语

作为前端的打开工具浏览器,其实也很重要。目前主流浏览器主要是四大内核,而随着浏览器的发展现在也出现了双内核,像360 浏览器、QQ 浏览器都是采用双内核。综合上述问题与解决办法得出以下5 点:一是400 和Bad Request 报错,WAF拦截可能性较大;二是5**报错,服务器 (硬件、云主机、操作系统、自带防火墙)、代理都有可能;三是非80 端口,例如443 端口,注意玄武盾和代理的配置问题;四是网络、系统、服务器、机房、电脑、程序等的变动,例如电脑被安装了不良软件、增加了新设备等引起新故障;五是不同的浏览器打开网页的显示格式不同。

通过以上介绍,相信大家对于解决类似问题的逻辑思路有了比较清晰的了解。当然,不同的高校采购的设备不尽相同,即使使用了相同的设备,也会因为里面细微的配置不同而产生不同的故障。对于用户来说,需要加强网络与计算机基础知识的普及,应具备最基本的主机故障诊断和处理能力。对于校园网的管理人员来说,需要对整个学校的网络拓扑了如指掌,应具备扎实的计算机网络理论知识,熟悉各种网络设备的连接与配置,加强对网络技术的学习,还要勤动手、多总结,积累经验,加强交流,以更好地为广大师生服务。

猜你喜欢
网络故障表象交换机
面向未来网络的白盒交换机体系综述
局域网交换机管理IP的规划与配置方案的探讨
表与里
表与里
更换汇聚交换机遇到的问题
绘画往事:表象的折射
基于地铁交换机电源设计思考
透过表象看公式
计算机网络几种典型故障的处理及维护方法