信息化助力机房运维便捷自动化

2020-01-02 20:27陶明邬丹华潘志安陶波
网络安全和信息化 2020年11期
关键词:机房运维故障

■ 陶明 邬丹华 潘志安 陶波

我国目前正处于信息化建设高速发展的阶段,在信息技术不断发展和普及的今天,企业在信息化技术方面的应用也越来越广泛。对于信息系统运行维护单位而言,机房是重要的资产。机房作为信息系统的物理环境支撑基础,也是信息化服务的载体。机房是否能够安全和稳定的运行决定着现代化信息系统项目能否正常运作。同时,机房也影响着运维单位对信息系统项目的保障能力和用户的自身利益。因此,如何及时有效地对机房内部信息设备的运行状态进行监测直接影响着信息系统的运行情况。

大数据时代的到来,使得信息数据有了一个质的飞跃。与此同时,如此庞大数量的数据合理有效的管理使用成了各个企业面临的难题。先进技术的发展会推动企业的管理方式进行转变。在这一“颠覆性”技术出现后,传统意义上的机房运维管理已经不能适用于现代化企业管理。信息化技术作为新时代下的标志性技术在企业管理中的优势越来越明显。现代化的机房管理很好地利用了信息化技术来助力,使得机房的运维管理变得更自动化。这一技术在机房中的应用不仅能有效地保障机房稳定安全的运行,还能在一定程度上提高运维管理的效率,降低机房的运维管理成本。

一、机房运维现状

我们知道,作为信息服务的支撑基础,数据机房是由很多的子系统组成的。各个子系统稳定运行依赖于众多的IT 基础设备,包括中间件、服务器、防火墙、数据库、安全设备、网络设备、网络基础线路等。随着近几年数据网络机房规模和机房内设备数量的不断增加,运维单位对机房中的设备的监测管理已经是一件不容忽视的事情。但是,当前很多运维单位对机房的运维还是依靠传统的方式,通过人工方式进行查看。机房运维管理人员通过制定值班制度,每天进行排班管理,安排专人值班,不定时地对机房进行巡查巡视,监测UPS 电源情况。机房运维人员从机房的基础设备、服务器业务系统层和机房环境等不同的类别进行维护,但是工作量巨大且管理复杂和应用环境复杂。在日常的巡检中很难提前发现故障,只有当故障爆发时才能发现并进行故障排查和定位。虽然也能够解决问题,但是传统人工方式的被动的运维会在一定程度上影响系统的运行。

传统的模式进行机房的运维管理,一是会进一步加重管理者的负担,并且很难及时地掌握机房内设备情况,缺乏对事件发生的提前预知能力及风险的应变能力,缺少对机房内设备数据的有效分析和利用。二是传统的“救火式”的运维方式已经无法满足现代信息化机房的需要,不仅使得运维人员终日忙于查找问题,无法提高运维的质量,也使得运维单位对运维服务的满意度降低。三是在机房运维成本中,近八成的成本支出是用于运维人员的管理成本和培训成本,只有两成是硬件设备和技术成本,使得运维费用过高。四是运维的自动化程度较低,导致信息管理部门在获得大量的杂乱的信息警报时无法明确快速地寻找到问题根源,只能用手工方式进行一一的比对检查,大大地降低了运维速度和质量,也占用了很多资源,增加了运维成本。五是运维的集中程度较低。我国的IT 部门的机房硬件设备是由多家公司以大集中的形式采购集成的,每一家都有其对应的运维管理人员和开发人员,并对应形成了运维管理中心。在机房现场运维中,出现故障问题,运维单位不能进行统一的指挥调度,只能由对应公司的工程师进行现场处理。这将导致在工程师的水平和事故处理问题的时间上很难进行把控。六是机房管理中缺乏明确的运维管理机制,出现故障时很难找到负责人,这就使得无法及时对问题进行处理。因此,在机房运维中利用信息化技术、大数据技术等对机房内的设备设施进行集中的管理调控是现代机房运维管理的一个重要的问题,就是我们所说的IT 运维。

二、IT 运维自动化

信息化技术应用于机房运维就是我们说的自动化运维。自动化机房运维管理就是指通过信息化技术,把日常机房运维管理中的大量的重复冗余的工作,包括整个系统组织流程的变更、日常的机房设备检查工作、机房环境监控等,实现机房的主动式运维、平台的智能调度、机房信息数据的感知,实现机房运维的信息数据协调发展。有效地提高机房的供冷供热系统的保障能力。IT 运维自动化可以把以前日常工作任务中基于手工操作的部分和组织流程等方面的变更转变为基于信息化技术的自动化操作。通过建立知识库的方式,主动对机房设备及环境进行监测,提前对事故预判、预测、预警和进行事故信息处理。在突发事件发生时,相关的监控系统将会激发关联系统并启动数据备份机制和故障响应机制,将事故损失降到最小。IT 运维可以定期地对机房内设备、软硬件和相关的依托网络进行日常的检查,通过大数据技术对数据进行挖掘、收集、分析、处理,并与知识库中的数据进行比对后形成分析报告,供管理员查阅。

三、IT 运维的应用

1.IDC 技术应用于机房运维

IDC 不仅具有主机运行可靠和数据集中等传统的数据中心具有的特点,还有反应迅速、能够进行7×24 小时的不间断服务且访问方式多样的优势。IDC 的出现为信息化行业的建设开辟出了一条可持续发展的高效的道路。现在的IDC 机房可以给机房运维服务提供良好的机房环境、庞大的数据存储空间、安全的环境保证和优秀的服务性能等等。简单地说,IDC 作为提供机房运行和维护环境的基础,可以有效地提高机房运维的自动化水平。

2.机房运维中虚拟现实技术的应用

在机房的运行维护和管理中存在着诸多分散的系统,如网络设备、管理系统、服务器、安全设备等等。这些设备相互独立但又相互影响,单个的设备很难对所有设备进行统一的监控管理,这使得机房在运维中容易形成监控监测的数据孤岛。

机房运维可视化利用虚拟现实技术,在信息化技术的基础上,生成一个有着感知能力的、逼真的机房环境。机房运维管理人员和机房中的各种设备,管理系统等实现交互式操作,产生一种声临其境的交互式的、具有沉浸感的仿真场景。通过大数据技术,及时准确地收集汇总整理机房内业务系统的运行情况、各硬件设备的信息和对机房的实时环境监测,并且展现在虚拟环境中,使得机房的运维工作从人工的被动运维模式转向信息自动化控制。

3.传感器技术在机房运维中的应用

传感器是一种通过电子芯片技术对机房内部环境的温度、甲醛、湿度等一些环境数据进行采集,利用网络技术进行数据汇总的一种精密的仪器。通过传感器技术汇总后的数据信息传输到监控室后呈现给管理员。机房运维管理员通过得到的数据结果来利用干燥器、空调、加湿器等设备进行机房温度湿度等方面的调控,从而保证机房环境对机房设备和系统运行环境的适宜。

传感器网络的构建可以基于ZigBee 技术。ZigBee技术可以将传感器采集到的机房数据信息以无介质的形式传输到汇聚节点。汇聚节点收集信息,进行汇总后利用光纤网络传输至服务器端,服务器利用大数据分析技术对机房的环境状况进行分析。除此以外,服务器可以对所有数据信息进行保存记录,运维管理人员可以随时对数据信息进行查看。通过传感器技术的应用,可以实现机房运维控制的自动化。

四、总结

IT 运维要实现高效自动化的第一步就是要利用信息化技术建立自动的管理和监控平台。利用监控工具对机房硬件设备、软件系统、机房环境等进行实时的监测来实现机房的集中管理和故障的实时处理。现代化信息技术大量应用于机房的运维中,使得机房的运维管理越来越自动化。自动化的运维可以实现机房故障的定点定位。如果机房出现故障问题,系统会及时准确地通知相关的负责人,并显示故障位置,缩短故障排查时间。所以说,将信息化技术更多地应用于机房运维中,可以大大降低机房运维成本和人工,在一定程度上提高运维服务水平和用户的满意度。

猜你喜欢
机房运维故障
平疫结合的CT机房建设实践
高速公路智能运维平台
浅谈广播电视播出机房技术操作与维护
故障一点通
基于VPN的机房局域网远程控制系统
传输机房安全操作和日常维护要点
配电线路的运维管理探讨
奔驰R320车ABS、ESP故障灯异常点亮
基于一体化的变电标准运维模式
故障一点通