■ 南开大学信息化建设与管理办公室 梁尔民 焦宝臣 张四海
编者按:笔者通过分析高校校园对网络运维的要求,以及网络运维面临的问题,针对校园网络提出了制定科学的运维管理规章、合理的文档管理制度和构建性能良好的跨平台网络监控系统三个方面的改进建议,从而有效提升了运维水平。
校园网络是保障师生在校学习、科研和生活必不可少的重要基础平台。网络规模更是随着学校的发展和信息化建设的不断推进变得日益复杂和庞大。网络维护和运维团队建设是网络管理工作的重中之重。为此,本文从分析高校校园网络运维面临的问题入手,从规章制度、文档管理和网络监控系统三方面提出当前高校网络运维的策略,为高校网络建设提供可借鉴的经验。
1.高校校园网络运维要求:响应及时、运行稳定以及安全可靠
2.高校校园网络运维面临的问题
(1)人员困境
当前各高校校园网络运维的具体维护工作基本上都采取服务外包的方式,但仍需学校的专职人员对网络运维服务公司及其派驻学校的工作人员进行管理。因此,校方的专职人员不但需要有较高的管理水平,而且也需要有较高的网络技术水平,同时还要有了解学校网络状况的丰富经验。这对于合格的校方专职人员要求非常高。在大多数高校的体制下,很难留下这种高水平的技术管理人员。
(2)管理上的重视程度
虽然良好的网络运维能够保证校园网络的稳定运行,但因其工作大多是故障维修性质的,因此并不能引起重视,而往往忽略了对其科学合理的管理,以及对其专业人员在职业规划上的重视,导致经常出现网络故障维修不及时,网络运行不稳定等等。
(3)技术上的问题
网络监控系统是技术人员运维校园网络的重要工具。它能监控网络设备运行状态,网络节点是否正常,能提供预警信息,让技术人员及时发现问题。监控系统应具有完整的校园网络拓扑结构,能让技术人员及时发现网络中存在的不合理问题。
但目前的网络监控系统均是网络厂商针对自家产品而构建的,例如锐捷的RGSNC 智能网络指挥官系统用于监控其网络服务器和交换机等有线网络设备,锐捷的AC 管理系统用于监控无线AP 设备,H3C 智能管理中心以及华为eSight 网络管理系统。很明显这些网络监控系统能够实现自家品牌产品的监控,但是并不能监控其他厂商的网络设备。因此,需要构建一套能够跨平台的网络监控系统,实现对所有网络设备的监控。
图1 高效校园网络运维策略示意图
面对人员、管理和技术的困境,采用怎样的方案才能满足高校校园网络运维的响应及时、运行稳定和安全可靠的要求?应从网络管理的规章制度,良好的文档管理和强大的网络监控系统,三个方面来入手,使运维团队能够保证校园网络的正常运行。
图1 给出了高校校园网络运维策略示意图。
1.网络管理规章制度
网络管理规章制度是需要学校从顶层设计的高度来规范学校网络运维工作,可从以下两个方面来制定。
(1)权责明确
因与网络相关的工作有很多,一定要明确哪些是网络运维的工作范畴,这样才能保证运维工作不会被一些不相干的事情所拖累,更重要的是如果采用服务外包的形式,一定要弄清楚哪些是运维公司职责范围内的事情,哪些是校方的职责,等等。通常情况下,涉及到安全防范、用户资料、收费等敏感信息时应由校方来负责,而运维公司通常负责处理一些信息不敏感的工作。例如,故障维修、重大活动和会议的网络保障,网络IP 分配和拓扑结构运维,等等,需要学校依据自身情况而定。这一条是要解决谁去干什么的问题。
(2)规范管理
第一,规范网络运维流程。要规范好网络运维所包含的每一项内容的处理步骤。例如,用户遇见故障该如何报修,运维人员应在多长时间内响应并处理,如何增加IP 点位以及如何落实网络安全工作等等。通过规范的运维流程,将人的影响因素降到最低。这一条是要解决该如何干的问题。
第二,运维团队的稳定。因网络运维需要的工作人员不但要具有较高的网络维护技能,而且要熟知网络的具体情况(包括网络的设计建设结构和经常出现的故障点,等等),因此运维经验是非常重要的因素。如果运维团队中的成员大量且频繁变换,那么运维团队中的成员很难积累对具体学校网络情况的运维经验。这非常不利于实现网络运维的及时响应。
通常情况是一个运维团队中必须要有经验丰富且技术能力强的技术人员,能够在学校网络运维中长期工作。即使长期提供运维服务的工作人员要更换,也应做好交接工作,使新接替的人能够胜任工作。
简易言之,运维团队的稳定从根本上说就是保证网络运维能力的稳定。而其关键点就是保证组成运维团队的人员稳定。
这需要从两方面入手,一方面是要求为学校提供网络运维服务的公司要保证其运维团队中的具体工作人员的稳定,避免大面积人员的频繁变换。
另一方面学校应重视校方专职人员的职业规划,能够留住技术能力强且经验丰富的人才。这样才能保证由校方和服务公司组成的网络运维团队的稳定。
第三,重视网络运维工作。例如通过设置网络运维奖的形式,对学校各部门参与相关工作的人进行奖励,来提升师生对网络运维工作的认可和重视。这样达到对校园网络运维人员进行激励的目的。
2.文档管理
高校校园网络运维的文档管理具体内容如下:
第一,要对网络的故障及其处理方式全过程进行记录。要对经常出现的故障进行总结,形成常见故障的处理方式汇总,方便运维人员查阅并及时处理网络故障,保证网络运维的及时性。
第二,要对学校重要活动的网络保障、特殊情况的处理等进行记录,形成过程文档,以方便学校再遇到类似事情时进行参考。
第三,还应对网络建设之初的设计和施工建设文档进行汇总和管理,以便在出现复杂网络故障情况时提供重要的参考。
良好的文档管理能为运维人员提供重要的参考和依据,能够降低对运维人员在运维经验上的要求,能在出现运维团队中有经验的技术人员的突然变换的情况下保障新的运维人员能够顺畅运维网络。
3.网络监控系统
网络监控系统是运维校园网络的重要工具。鉴于当前网络监控系统多是网络厂商针对自家产品而构建的情况,需要构建一套功能强大的跨平台网络监控系统,具体如下:
第一,良好的兼容性,能够将所有网络设备纳入到网络监控系统中,实现一套系统对所有网络设备的统一管理。
第二,功能丰富的设备状态监控,能够监控网络设备CPU 使用率、内存情况、端口情况、网络流量情况,等等,全面地监控网络设备。
第三,要有及时的预警机制。能够根据设定的阈值,在网络设备发生故障时,通过微信、短信等形式将报警信息推送至网络运维人员。
第四,功能强大的网络结构管理,能够将完整的网络拓扑结构在系统中呈现,也方便运维人员管理网络拓扑结构。即不仅仅对网络设备进行管理,也能对网络本身的状态进行管理。
第五,完善的安全防控能力。对于非法入侵,病毒等的防御,以及黑客攻击等的防御或报警,已成为当前人们关注的重点领域。因此系统应具备对非法入侵,病毒等报警及一定的防御功能。
综上,通过科学合理的网络运维管理规章制度和良好的文档管理,采用性能优异的网络监控系统的工具辅助,能充分发挥运维团队的能力,提供稳定的网络服务。
高校校园网络是保障师生在校学习、科研和生活的重要基础。良好的网络运维是提供稳定校园网络环境的重要保障。当前高校校园网络运维在响应及时、稳定运行和安全可靠上均有很高的要求,但是目前存在着人员困境,管理不够重视和技术上的问题。为此,本文提出从制定科学合理的网络运维管理规章制度,良好的文档管理和构建功能强大的跨平台网络监控系统三方面,来提升运维团队的能力,从而保障高校校园网络的稳定运行,为高校开展校园网络运维工作提供重要的思路。