王 娟,孙 婧,张 鑫
(山东省水文局,山东 济南 250002)
近年来,山东省水文局积极推进水文信息化建设工作,水文信息化装备和技术有了较大的发展,取得了显著的成效,水文信息系统已成为水文日常工作不可或缺的重要组成部分。随着信息化建设的深入,机房环境及辅助设备、网络设施、通信设施、各类服务器、存储设备等硬件平台,业务系统、数据库管理系统、地理信息系统、中间件等软件系统越来复杂,如何维护好日益增多的硬件设备和软件系统,成为保障水文信息系统正常运行的关键,也对水文信息化技术工作者提出了更新更高的要求。
自2012年6月山东省水文局(以下简称省局)新办公楼启用以来,省局信息化系统建设内容有了很大的变化,省局机关已拥有较为完善的中心机房、大屏幕会商室、多媒体会场、计算机网络等基础环境,相继建设了门户网站、视频会议系统、视频监控管理平台、电子政务系统以及各类业务系统等多个软件系统,工作人员配备的计算机、打印机、扫描仪、一体机等终端设备数量也日益增多,各部门对信息、网络系统的依赖程度也越来越紧密,对信息系统稳定性和可靠性的要求越来越高。
目前省局设有专人从事上述各类信息化系统的运行维护工作。维护内容主要为对机房、计算机网络等基础设施以及各类办公用的信息化设备等进行例行维护、故障处置,分工负责为各业务应用系统提供基础性的保障和例行维护。另外还根据各类会议及活动的要求提供大屏幕会商室、多媒体会场音视频系统的调试、操作,视频会议系统的全省联调、操作等技术服务。鉴于现代信息化系统种类繁多、集成度高、专业性强、涉及学科多且有一定的深度,又加之各系统投入使用的年代不一、质量和性能差异大,维护技术手段和方法又有很大差别,这对运维人员的多学科及专业性要求越来越高,运维工作压力日益增大。
在维护方式上,目前只能实现较为单一的响应式维护,根据使用者的故障报告在一定的时间内消除故障,或者根据业务的需要进行配置变更、系统优化等,没有制订具体而规范的工作流程,只能被动的随需求应变。在运维的深度上,仅能实现对部分系统进行定期的检查、更新等例行维护,停留在基础服务层面,未能实现对各类硬件平台、软件系统及各项业务应用进行性能、效能的评估、优化、整合等深层次的服务。
目前在运维人员数量和技术能力方面都存在欠缺,且缺少相关的管理流程和工具,更多的是依靠运维人员的个人能力维系各系统的运维管理,由此导致日常的运维工作存在很多不规范之处:在运维内容上尚无法实现对所有系统的定期监控巡检,存在故障遗漏、处理不及时的可能;没有针对不同的维护类别制订相应的维护流程,导致实际工作中随意性大,尤其缺少应急响应流程、整体应急预案、定期的应急演习等,应对突发事件的能力不足;尚未进行运维档案建设工作,缺少对运维工作过程的记录以及系统技术文档的收集整理等工作,不利于运维人员相互学习借鉴,不利于同类故障的快速排除。
在现状条件下大量常见问题及重复性的工作占用了维护人员大部分时间和精力,如果能够借助自动化的手段,配备运行维护支撑系统,将日常运维工作电子化,实现诸如自动监控、风险预警、分析评估等功能,将极大提高运维工作的水平和效率。
制订信息系统运维管理制度,目的是实现系统运维管理的系统化、规范化、科学化。目前省局已出台了《山东水文信息化建设管理暂行办法》,在计算机设备使用、软件使用、网络网站、数据安全、机房及水文视频会议系统等方面从管理的层面作出了框架性的规范要求。下一步需要依照《水利信息系统运行维护规范》(SL715-2015)的要求对信息系统划分运行维护服务级别,然后在此基础上对运行维护工作进行全面梳理,对各类运行维护对象(机房环境设施等物理环境,计算机网络,服务器及用户终端等主机设备,存储备份设备及软件,数据库、中间件等基础软件,安全设施、视频会议系统等)在监控巡检、例行维护、响应式维护、故障处置、应急响应、安全管理、分析总结等各方面列出具体的工作内容、细化服务指标,对各类维护活动制订详细的工作流程,对运维工作提出具体的规范要求,使信息系统运行维护在工作流程、技术标准上有据可依,建立健全运行维护服务体系。
信息技术发展日新月异,对从事信息系统运维工作人员的要求越来越高,而目前运维人员的技术多依靠自学和平时的实践经验积累,人员技术能力不足是导致运维水平难以提高的关键因素。因此必须重视信息系统运维人员队伍建设,建立健全人员培养制度,定期组织各类培训,给运维人员提供多渠道的学习和交流机会,在信息技术基础知识、运维岗位专业知识以及水文业务知识等方面,全方位提高信息系统运维管理人员的知识技能,才能实现一专多能、一人多岗,切实满足岗位需要。
同时还需要建立合理的运维工作绩效考核、评价机制,能够在工作量、维护完成度及质量、维护工作效率等方面对工作人员的日常工作内容进行统计和评价,并采取合理的激励措施,提高工作人员的积极性。
目前省局采用的是自行维护方式,即完全依靠自身的人员力量承担全部信息系统的运维工作,但在实际的工作运转中越来越感觉这种维护方式不能满足实际需要,比如机房内配置的精密空调、UPS等硬件设备,由于专业性太强,无法自行进行日常维护,出现故障更不具备自行维修的技术能力,需要外包服务以保证此类设备安全稳定的运转;视频会议系统、多媒体会场的音视频设备随着运行时间的增长也时有故障出现,对此也存在应对能力不足的问题,同样有引入外包服务的必要。因此,为了实现对各信息化系统进行更专业化、规范化的管理,增强系统的安全性、可靠性,延长系统设备的使用寿命,建议对省局目前的信息系统进行全面的梳理和划分,根据实际情况,以自行维护为主,将不具备自行维护能力的部分引入外包服务,采取混合维护的方式全面展开运维工作是较为理想的方式。
不论采用哪种维护模式,运维经费都不可缺少,且随着运行系统的增加以及设备运行年限的增长,需要投入的运营经费也相应增多,因此需要摒弃传统的“重建设、轻维护”的观念,确保足额资金以保障信息化运维工作的顺利运转。目前申请运维经费依据的是《水利信息系统运行维护定额标准》,该标准颁布于2009年,建议尽快修订完善,适应新形势发展需要,使运维经费的概算、核定更加有据可依。