“老王,下周公司组织体检,你招呼下信息中心的同事,今年公司为了方便大家选择,提供了好几种定制化套餐,提前一定要选好啊!”
提起老王所在的公司,福利还真是不错,每年都会组织员工进行集体体检,但这也是个麻烦事!由于去年人事部门好心,调整了多年一贯的体检项目,造成许多员工的不满,这不,今年为满足大家的个性化需求,改成定制套餐模式了,除了分男女外,有适合查三高的、有适合查肿瘤的、有适合查心脑血管的……,也算是越来越人性化了!
对呀,说到这,老王脑子里一闪念:公司数据中心和各分支机构的IT设备和系统的定期巡检工作是不是也该变一变了?那一套固定模式和检查项目,都执行快十年了,现在每次出来的报告,自己不看都知道是什么结果,越来越感觉像是走过场了!
看官们可别奇怪,做为IT部门日常工作的一部分,定期巡检可是共性最强的,甚至可以说是千篇一律,有多少人像老王一样,反思过这项工作要怎样做才更有价值呢?
就让我们先来回顾下“定期巡检”工作的来世今生吧:
由于过去缺少实时化的各类监控工具,还有一些外部供应商为了体现自己的增值服务能力,于是就在运维服务,尤其是维保类服务中加入了定期巡检服务项目,而且大多是免费的,一般每年四次,即每季度一次,具体要求的巡检内容涉及两个方面:一方面是用肉眼观察硬件设备的外观好坏;一方面是通过设备内部命令检查设备当时的运行状态是否正常。虽最后形成的巡检报告格式不一,但内容大同小异。
近些年,由于实时的监控工具层出不穷,而且越来越完善,许多巡检指标已不需要再通过定期巡检获取了,而设备外观的观察,通过远程摄像头也可以看个大概,于是此项工作就渐渐成了“鸡肋”,大多数情况下只是体现下工作内容丰富些而已。
那么,此项工作未来是不是就此边缘化,最终走向消失呢?
答案是否定的。因为我们忘了定期巡检的目的了,那就是主动预防,即像我们人体一样,需要通过定期体检,识别亚健康状态,进而由专家通过分析各类检查指标,发现潜在病因,制定预防方案,减少生病的机率。
那么,新形势下,应该怎么样提高定期巡检的有效性呢?
首先,要确定巡检的具体目标,是为了续保获取最新设备信息?还是为了重大节日保障事先进行健康检查?抑或是为了检查前期发现的问题整改得效果如何?甚或是考察机房环境、运维管理规范、人员能力素质成熟度怎样等,可以说,只要是对运维体系各环节及现网设备及系统想要了解的真实情况,都可以通过“定期巡检”这个“巡视组”有针对性地进行。
其次,要确定巡检的具体项目,可以从环境、设备、工具、流程、人员等多个维度进行设计和选择,重点关注状态,这里需要提醒的是,一定要事先确定个衡量标准,尽可能的量化,即在什么范围内是正常的,高或低分别代表什么异常情况要有统一的解释,避免产生歧义。
最后,要确定巡检的具体方式和频率,主要的巡检方式有现场、远程、混合等几种,频率主要是指按季、月、周、天进行,可以根据具体的巡检项目进行针对性安排,这样既考虑到了不同巡检项目的特殊性,也兼故了巡检成本的可控性,尤其是对涉及多分支、涉及设备和系统种类多的单位更是如此。
当然,在上述准备工作做完之后,就是严格的执行了,这时一定要保证巡检过程的规范化,以及巡检结果的准确,只有用真实的数据进行分析和决策,才能体现巡检的价值和意义。
——治未病之病,才是真的高医!
下期预告:另起炉灶的艺术!