Zabbix性能监控软件在高性能集群上的应用

2017-03-17 14:12肖海琴
中国管理信息化 2017年3期
关键词:集群应用

肖海琴

[摘 要] 随着集群引进节点数量和存储容量的增加,运维难度逐渐增加,需要人数也会增加,如果运维人员想构建一套自己的监控系统环境,Zabbix将会是最佳的选择。如果是开发,想基于开源软件开发一套属于自己的监控系统,Zabbix也是比较好的选择。通过Zabbix连续监控软件在大庆高性能集群应用上的介绍,可自动地监控集群系统节点的性能和故障,达到快速处理和解决问题,减少运维成本。

[关键词] Zabbix;集群;应用

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 03. 077

[中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2017)03- 0139- 01

1 引 言

地震处理并行集群系统,主要是由高性能IO节点、管理节点、计算节点、高速网络及光纤存储、集群存储等集成起来的并行机系统。随着地震生产任务的逐年增加,服务器节点数量也随之增多,而整个处理系统长期以来缺乏一个实时监控工具,因没有故障监控和故障定位功能,给故障诊断造成困难。

其实作为集群系统运维工程师所关心的是日常工作的主要内容,通过哪些手段可以保证服务器的正常运行。比如:检查服务器性能、连接数量、DB的相关情况等等。因此通过研究开发集群监控软件,对系统管理人员,能做到发现问题、预知问题、及时处理问题,对于提高系统管理和维护效率,有着非常重要的意义。

2 Zabbix集群监控软件的主要功能及特点

Zabbix是一个企业级的开源分布式监控解决方案,具备常见的商业监控软件所具备的功能。可监控系统运行性能的技术指标,包括CPU利用率、内存的使用、磁盘的使用、网络的状况、端口的监视、日志的监视等,支持自动发现网络设备和服务器,支持分布式,能集中展示、管理分布式的监控点,扩展性强,Server提供通用接口,可以自己开发完善各类监控,依照监控系统长期收集的各项综合信息,及用户实际应用的反馈信息,弄清系统瓶颈真正所在,为系统运行环境的优化提供宝贵的资料。其意义在于让系统步入一个良性的循環轨道,实现集群的负载平衡,提高整体运行效率,所以集群监控软件在生产中具有非常重要的作用。

3 Zabbix集群监控软件的优劣势

3.1 优点

(1)开源,无软件成本投入;(2)Server对设备性能要求低;(3)支持设备多;(4)支持分布式集中管理;(5)开放式接口,扩展性强。

3.2 缺点

(1)全英文,界面不友好;(2)无厂家支持,出现问题解决比较麻烦。

4 Zabbix配置使用及安装部署

4.1 配置使用过程

通过本地浏览器访问http://ServerIP/zabbix来开始配置和使用Zabbix。

使用Zabbix进行监控之前,要理解Zabbix监控的流程。

4.2 一次完整的监控流程简单描述

Host Groups(设备组)->Hosts(设备)->Applications(监控项组)->Items(监控项)->Triggers(触发器)->Actions(告警动作)->Medias(告警方式)->User Groups(用户组)->Users(用户)

4.3 安装部署

Server:mgt2

客户端:node001-node240

Zabbix监控实例如图1所示。

5 结 语

开发的Zabbix监控系统已经部署到HP、IBM集群的偏移节点,并实现对偏移作业实时连续监控,通过直观的监控信息,可及时发现问题,并为系统性能优化提供有效帮助,提高了系统管理和维护水平。

主要参考文献

[1]吴兆松.Zabbix 企业级分布式监控系统[M].北京:机械工业出版社,2014.

[2]高俊峰.高性能Linux服务器构建实战:运维监控、性能调优与集群应用[M].北京:机械工业出版社,2012.

猜你喜欢
集群应用
海上小型无人机集群的反制装备需求与应对之策研究
一种无人机集群发射回收装置的控制系统设计
Python与Spark集群在收费数据分析中的应用
多媒体技术在小学语文教学中的应用研究
分析膜技术及其在电厂水处理中的应用
GM(1,1)白化微分优化方程预测模型建模过程应用分析
煤矿井下坑道钻机人机工程学应用分析
气体分离提纯应用变压吸附技术的分析
会计与统计的比较研究
对构建智慧产业集群的几点思考