仝晖
摘要:三维运管平台是一个完整的、网络化、可视化的三维虚拟环境设计及展示平台,通过整合机房实时信息及资产信息,真正使IT管理者的管理步入虚拟现实领域,提供给IT管理者最为直观的一项网络可视化管理工具。本文将从我院机房管理实际情况出发,通过对比我院机房管理系统与管理方式的具体情况,分析三维运管平台所解决的实际问题。
关键词:三维运管平台 数据机房 管理
中图分类号:TP393.07 文献标识码:A 文章编号:1007-9416(2016)08-0222-01
近年来数据机房网络规模及设备的增加,对于机房设备监管已经上升到一个新的高度。大多医疗行业对机房环境监控仍然停留在传统的人肉查看方式,管理者对机房管理采用值班制度,每天排班不定时巡查巡视机房及UPS电源运行情况,这样的机房管理方式不仅不容易持续坚持下去,而且加重了管理者的负担,面对突发情况不能及时的发现及响应,对于事故发生缺乏提前预知的应变能力和科学有效的数据分析。因此,如何将数据机房的基础设施能够统一地集中化有效管理运行,成为了信息化行业领导重视的问题。
1 管理存在问题分析
1.1 日常巡检问题
对于数据机房不定期或每日的巡检大家一定不会陌生,尤其对于信息中心管理数据机房的管理员更是担负起机房日常巡检的重任。以我院为例,由于我院每栋病房楼都有一台汇聚机房,加上生产机房总共有6个机房,6个机房分布范围较广,每日的巡检机房确实给管理者带来了很多的麻烦,为了解决这一实际问题,我们使用了三维运管平台。
1.2 报警问题
现有机房设备报警问题是领导最为头痛的事情,我院自2009年至今就出现过两起因空调停机,室内温度达到40多度,没有及时发现,造成HIS小型机过热宕机,影响到门诊及住院患者无法完成正常进行业务流程。所以日常的巡检只是发现设备异常的一个方法,消除设备隐患,避免事故发生,其中设备报警是提供给管理者最重要的、最快捷、最有效的设备信息。
1.3 网络监管的问题
现有医院楼宇众多,每栋楼宇弱电井几乎都会有楼层接入设备(交换机),由于弱电井数量多、分布广、环境差、温度高等原因,交换机长时间运行会出现各种千奇百怪的故障问题,归总原因有很多,要花费更多的时间去查看核心交换机配置或下层交换机配置来去摸索故障交换机的配置,这样既花时间又有可能解决不了问题。从上述的情况来说,网络监管是一项非常重要且非常繁琐的工作。由于我院大部分交换机使用的同品牌产品,通过运管系统实现了将1469台接入交换设备、5台汇聚交换设备、1台核心交换设备接入网络管理系统,通过界面化来管理每台设备的IP管理地址,端口配置、端口流量控制、VLAN划分等,解决了网络监管带来的繁琐问题。
1.4 服务器管理的问题
目前的机房环境管理软件虽然采用的是B/S架构,但所开发的管理软件大多数界面平面化,机房所放置服务器和设备位置无法定位,只有进入机房查看服务器等设备状态。通过三维运管系统可实现院区内多个机房联动一体化管理,管理者只需一个IP地址就能在院区随时访问并监控各个机房机柜的服务器、小型机的工作状态及位置。
2 管理数据对比
我院在2011至2013年期间共有1个核心机房,3个汇聚机房。除核心机房为国家A级机房建设标准,采用的是知名品牌机房专用精密空调设备、UPS机柜外,其余3个汇聚机房因机房环境与面积受到局限性,采用的是家用的柜机式空调,UPS为国内品牌。汇总2011-2013年期间我院机房巡检记录(如表一),不难发现在未使用运管平台的时间段之间,在日常巡检的过程中未发现机房设备出现故障的概率及次数。
2014年初我院两栋新病房楼投入使用,信息机房由之前的4个机房增加到了现在的6个机房,为解决数据机房管理存在的问题,更好、更有效的管理机房设备,我们引用了三维运管平台系统,通过远程登录机房平台监管机房设备运行状态及数值指标,减少了人为现场巡视的次数,提高了工作效率。汇总2014年-2015年至今的巡检记录(如表二),数据显示在引用了运管平台系统后,实际巡检过程中发现设备异常状态,预知判断设备故障率显著提高。巡检记录数据证明了运管平台系统在我院今后数据机房管理中的重要性。
3 结语
通过三维运管系统,我院已实现对各个机房进行了实施动态监控,解决了之前机房管理中的巡视多、报警晚、设备多、管理难等问题。除了使用三维运管系统管理机房外,健全的机房管理规章制度也是机房管理的关键,机房管理是相当繁琐的工作,在工作中也应做好管理日志及管理标签、标识,采取科学的管理措施,保证数据机房的正常运行。