王俊杰
摘要:信息网点巡检工作是很多企业的信息部门必不可少的一项日常工作。文章从工作准备、台账资料、巡视要点、记录字段、交流沟通、信息系统、远程监控这几个方面提出了一些建议,有助于规范网点巡检工作。
关键词:网点台账:巡视记录:巡视照片;系统
在企业的信息运维工作中,信息网点的巡视工作是不可缺少的一部分。如何规范信息网点巡检工作,最大限度地发挥巡检工作的作用,是信息运维运行和管理人员需要思考的问题。以下是笔者巡检工作中的思考和经验的总结,希望能起到抛砖引玉的作用。
1信息网点管理的现状及巡检的意义
笔者所在的单位是一个大型国有企业,有员工2000余人,主要的信息网点100个,散布于全市各处,各类交换机近200台。除了信息中心机房具备机房监控系统外,其余99个网点均无监控设施。设备的运行状态靠网管软件通过SNMP协议监控。设备的现场运行状态、现场运行环境、网点安全隐患等只能靠人员定期巡检确定。由于巡视工作是运维工作不可或缺的一部分,提升巡检质量和记录信息的完整性、科学性也就提升了运维工作的质量。
2巡检工作的规范化要点
2.1信息网点台账
完整的信息网点台账是故障发生时准确定位的基础,是巡检工作必不可少的基础资料,是优化运维工作、消除安全隐患的基础。所在企业有100个信息网点,单纯靠记忆或是简单的记录是不可靠的。对于一个信息网点,笔者认为需要记录以下信息(见图1)。
下面本文将说明每一个字段的意义。
网点名称:给网点起一个名字,可以是企业中约定俗成的名字。运维人员在互相交流某一个信息网点的情况时用到的都是这个名称。地址:需要记录完整的路名和门牌号码,以便任何人接手工作后都能准确地找到位置。所属区域:根据所在地点设置,笔者所在城市分为4个区。今后可以根据区域筛选,方便查找。钥匙保管人:记录钥匙的保管位置、保管人及联系方式。适用于信息运维人员没有保管所有网点钥匙的情况。当某个网点信息机房不是专用机房时,钥匙可能由所在地部门专人保管。空调:记录空调的品牌、出厂日期、制冷量。掌握机房空调台账有助于管理人员统筹考虑老化空调更换计划。交换机信息:记录该信息网点内的设备信息。该信息可以使运维人员对该网点的设备情况有一个整体的认识。这个信息将来还可以和其他系统联动。其他还包括房间号、面积等字段,这些字段需要记录的内容一目了然,无需赘言。将所有网点的台账信息记录完整,至少有几个好处:(1)当有故障发生时,可以立即了解网点的基本信息,对故障的影响范围和可能原因有个大致的评估。(2)任何运维人员,无论他是否有做过巡视工作,当需要时,都可以迅速找到信息网点的准确位置。(3)根据记录的网点基础信息,可以开展其他的工作。比如,评估空调的使用情况以确定更换计划。
2.2巡检记录
巡检记录记录了某个时间点下某个网点当时的状态。通过巡检记录,运维人员最直观地了解到信息网点存在的问题、问题解决的情况、历史状况等。每一次巡检都要记录相关的巡检信息。笔者认为,以下内容是巡检记录的重点。
巡查人员:完成此次巡查的人员姓名。时间:巡查开始与结束的时间,格式为yyyy-mm-ddhh:mm。信息网点:巡查的网点名称。门关闭情况:可以按“开”“关”“无锁”3种情况记录。窗户关闭情况:可以按“开”“关”“无窗”3种情况记录。空调运行情况:可以按“无空调”“正常”“关闭”“异常”4种情况记录。如果是异常情况,还需记录具体的异常信息。空气质量:可以按“好”“中”“差”3种情况记录。好、中、差的定义如下。好:不用带口罩,中:建议带口罩,差:必须带口罩。这是为了保护巡检人员,提醒巡检人员在空气质量差的环境中注意先通风后工作,防止出现密闭空间缺氧。卫生情况:可以按“好”“中”“差”3种情况记录。理论上,如果此网点由信息科管理,信息科巡检人员应对信息网点的卫生情况负责。如卫生状况较差,巡检人员无法完成清扫工作的,应记录在巡检记录中。如果此网点由所在地部门管理,应将检查情况通知相关部门领导,由该部门安排清扫工作。杂物堆放情况:可以按“有”“无”2种情况记录。如果有堆放杂物,应通知相关部门将杂物清理干净。设备运行情况:可以按“正常”“异常”2种情况记录。如果异常,应记录具体的异常现象。设备标签:网络设备端口处、跳线端头处应有标签。可以按“有”“无”2种情况记录。如果无标签,巡检人员应补齐标签。废旧设备拆除情况:可以按“有”“无”2种情况记录。如有废旧设备未拆除,应记录具体的型号数量。巡检照片:应对以上提到的巡检要点拍照取证。
2.3巡检的准备工作
在开展巡检工作前,首先应制定巡检计划,确定每月、每周的进度及具体巡检地点。其次,对巡检装备实行定置管理。巡检装备包括笔记本电脑1台、网线3根、SC,FC,LC接头的尾纤各2根、SC,FC,LC之间的转接头各2个、标签机、相机、手套、口罩、安全帽、急救箱、黑色水笔2支等。这些装备的状态和数量都要定期检查。每次巡检后都要归位,专人保管。最后,在每一次巡检出发之前,要先打印信息网点信息表和巡检记录表,做到对巡检的目标心中有数。
2.4交流与沟通
信息网点的物理位置不一定都在信息部门的管辖范围之内。巡检时发现问题可能有很多种类,有的是信息设备本身的故障,有的是信息通道的故障,有些是机房基础设施的问题。不管是否是巡检人员能够单独解决的,都应在巡检结束后,与信息网点所在地部门的负责人和钥匙管理人员交流巡检时发现的问题。通过和相关人员交流巡检时发现的问题,互相交流掌握的情况,往往能够找到最合适的解决方案。同时,将一些工作情况互相通气,有助于工作的顺利开展。
3巡检系统的设计
通过建立一套巡检信息系统,可以将上文所说的信息网点台账、巡检记录、交换机信息等信息电子化,方便查询、统计、分析。由于篇幅所限,不再展开说明巡检系统的设计细节。巡检系统可独立使用,也可作为网络综合管理系统的一个模块使用。
4用远程监控代替巡检
近年来,网络监控摄像头日益普及。我们可以在各个网点安装网络监控摄像头。将各网点摄像头信息接入机房监控系统,可在监控系统中统一查看。安装摄像头后,可大幅降低巡检频率。比如,原先3个月巡检一次的,可以更改为半年巡检一次。这样,运维人员可以花费更少的时间在巡检上。
5结语
巡检工作看似简单,实际要真正做到位还有很多提升的空间。究其原因,首先是巡检人员对巡检工作的轻视,认为无非是到现场走走看看,缺乏认真负责的态度和深入的思考。其次,没有一个标准制度或标准作业卡来规范巡检工作的开展。三是未能有效利用计算机技术辅助工作。通过上文提出的一些规范化的做法,可以使工作开展更顺畅有序,信息利用更充分有效。