梁后健 宗学 王迎生
(淮北供电公司,安徽淮北 235000)
地市公司信息主机在线监测应用实践
梁后健 宗学 王迎生
(淮北供电公司,安徽淮北 235000)
信息主机是电力公司业务系统的主要基础设施,是地市电力公司信息运维重要组成部分,传统人工巡检和监测方式费时费力,难以适应现有运维模式,为此淮南公司开发应用了一套专用主机监测系统工具,实现了主机主要性能参数的自动化采集与预警,大幅提升了主机监控效率和准确性。
公司信息 在线监测 应用实践
随着供电公司信息化建设的不断推进,电力信息网络规模迅速扩大,各类业务应用进一步普及,主机的运行状态监测、性能监测和网络运行维护也愈发重要[1,2]。供电公司目前主机服务器主要是Windows服务器,对主机的服务、进程、事件日志、性能、存储、网络流量、应用系统、基本配置等对象的运行监控基本上采用人工巡检和手工监测的方式,既耗费大量人力时间,又很难及时准确有效地发现主机的潜在隐患和故障,难以适应对信息网络运行维护一体化、自动化、精细化管理的需要,因此开发应用了一套专用主机监测系统工具,已成为公司实现主机运维一体化管理和自动化管理的必然手段。
图1 主机监控技术架构
图2 主机监控展示界面
主机监控工具主要功能包括主机服务检测[3]、主机状态监测、关键进程监测、CPU利用率监测、CPU峰值监测、CPU阶段利用率监测、内存使用监测、内存阶段利用率监测、磁盘数量扫描、磁盘空间监测、主机网络流量监测、主机网络丢包率监测、主机网络延迟率监测、IIS状态监测、IIS应用监测、数据库连接监测、服务程序名采集等多项实用化监测指标采集以及各类采集策略配置、采集数据告警配置,并需要与地市公司信息专业统一监控工具的集成应用。
工具技术架构见图1。
主机监控工具是主要包括主机网络监控、主机监控、应用监控,通过监控网络的流量、延迟率、丢包率、主机服务、进程、事件日志、性能变化、硬盘可用空间、指定文件使用概况、WEB服务器、数据库服务器、数据库空间使用等来实时掌握主机的运行情况,确保主机和网络的正常运行。
工具完全由软件来实现,部署简单,集中部署,无需更改网络配置,不影响网络的正常运行。其中管理平台采用WEB架构,部署在应用服务器中。采集服务程序通过主动和被动的方式来获取主机和网络信息。 工具基础数据库采用MYSQL数据库,存储主机基础台帐信息、初始化配置信息、网络采集信息、主机采集信息等。
主机监测的参数采集及计算方式如下:
(1)通过Snmp协议对Windows服务器监测,检测Windows进程、Windows主机磁盘剩余容量和接口信息。
(2)编写WMI脚本实现自动任务管理,通过C++程序接口、.Net类等方法获取Windows操作系统的对象信息。
(3)通过WMI获取远程主机的Windows机基本信息。
(4)采用平均值算法计算网络流量、网络的延迟率和网络的丢包率。
图2为主机运行状态监测展示界面,运维人员可快速掌握主机在线状态、CPU及内存使用情况等基本主机信息。
通过主机在线监测工具的开发和应用解决了地市供电公司日常运维过程中对主机的服务、进程、事件日志、性能、存储、网络流量、应用系统、基本配置等对象的运行监控采用落后的人工巡检和手工监测的方式,既避免了耗费大量人力时间,又达到及时准确有效地发现主机的潜在隐患和故障的目的。
[1]兰建容.基于Windows 2000主机监控系统的设计与实现.江西理工大学学报,2006, 27(3):38-42.
[2]熊中根,齐德昱.分布式主机监控系统的设计与实现.重庆工学院学报:自然科学版,2009, 23(12):77-81.
[3]袁萌.内网主机监控与审计系统解决方案.《计算机安全》,2008 (7):44-45.