姚成玉
摘 要
随着各行各业业务的拓展和多样化,对信息系统功能的强大依赖性越来越高,因此各种大中小型企业的IT构架规模也不断在发展,运维水平质量也各不相同,这其中有大集群的复杂运维环境,也有质量相对差的运维环境,在现代不同企业中,自动化生产线的规模、运行方式以及需求方式也各不相同,因此在技术控制方面,通用的方法实现难度较大,但是,运维工具的使用与发展思路是有共通之处的。
【关键词】运维工具 大数据 自动化生产线
1 运维工具介绍
1.1 运维工具应用阶段
运维工具一般分为三个使用阶段:
1.1.1 手工阶段
利用人为的将软件部署和运维进行重复的操作,完全没有使用运维工具,充分利用个人的经验来进行操作。
1.1.2 脚本阶段
这个阶段主要是通过脚本的编写,对软件的部署和运维,这阶段的操作很方便,个人经验非常重要,同时也很难对系统传承,运维成本非常高。
1.1.3 工具阶段
这个阶段主要是利用第三方工具进行软件的部署和运维,而且高效、运行方便。在半自动化阶段主要是对系统进行检测控制,对数据进行自动化采集,而这个过程主要依赖于人工进行处理;全自动化阶段主要是对系统进行全生命周期的自动化部署和运维,不需要人工参与进来,完全的对运维知识库的拓展与修正。
1.2 运维工具研究现状
国外对运维工具研究的比较早,对IT服务管理规范和标准比较深入,并且非常完善,对世界起到了标准规范的作用。很多大企业的IT部门主要以ITIL为最佳时间参考,以ISO20000作为标准和规范,大部分是以自己的IT服务管理为主。大多数是以服务、价值运维为中心的发展阶段,这样就使运维实现了高度集中状态,自动化程度非常高。
目前国内较少部分企业实现了运维自动化,而且运行的也非常好,例如百度公司实现了作业和管理两个大领域的自动化。搜狐公司提出的“Smart IDC”概念,就非常新颖、创新,该目标实现了数据中心运维的自动化。
2 运维工具的分类
运维工具主要包括:运维工具管理工具、运维监控告警工具和运维发布变更工具,下面分别介绍各种工具的用途和特点。
2.1 运维流程管理工具
运维流程管理工具主要是结合在实际工作过程中流程管理需要,主要通过申请单、操作票等管理方式进行运维实际操作,对运维人员、运维事件等进行管控。
主要包括:
(1)流程管理工具对业务操作不予执行,主要是进行系统跟踪和确保闭环,体现事件汇总工作关系,控制审批风险。
(2)告警和突发管理工具,通过这种工具可以确保故障中提炼总结经验教训,为业务的可控性提供指导,通过人工手段管理风险并且丰富知识库。
2.2 运维监控告警工具
运维监控告警工具是对系统运行监控指标进行多种采集,比如网络设备、数据库、安全设备、主机、应用系统软件等,并以图像、短信、邮件等多种方式告知运维人员进行告警,这部分是目前自动化程度最高、工具类型最多、应用最为广泛的运维工具。这种工具主要是zabbix,是一个基于WEB界面的提供分布式监视系统的企业级开源工具。它主要用于监控网络上的服务器以及其他网络状态,能与多种数据库搭配一起使用。随时提供报警,采集的速度特别快。
现在所面临的技术难点是各项工具采集目标满足不了个性化需求,对校本化、接口化等第三方监控数据不理想,同时还存在大数据的读取出现重存轻读或者重读轻存等现象,这样就对设计数据采集和转移读取机制提出更高的要求。
2.3 运维发布变更工具
运维发布变更工具主要是对资源发布、资源调控进行统一的管理,根据实际的需要进行大批量下发的工具,即有主动发现发布变更,又有被动获取下载的功能。
以上介绍了运维工具的类型和相应的特点,目前存在的技术难点在于相关工具使用方便程度较差,人工学习周期较长,对自动化配置更新方面还不够成熟。
3 运维工具的发展方向
运维工具在系统自动化方向越来越受人们关注,越来越得到重视,因此运维工具未来发展方向是研究和开发人员研究热点。它的价值不仅仅是保障系统运行以及处置故障,而应该从以下几个方面开发和研究运维工具的价值:
3.1 事前干预运维工具
实施运维工具干预,对系统的源代码、运行数据进行管理和分析,系统所需要的资源与其他系统进行横向对比,同时也和自身运维变化的数据进行纵向对比,通过这两种对比,实现对系统运行自动控制,对资源配置能充分预防式管理。这其中主要包括两方面:
3.1.1 自动系统预先检测工具
通过监控运行指标数据和分析代码智能化,检测和排除项目在运行过程中可能出现的隐患,就目前的情况来看,代码的性能和安全问题是最主要的侧重点。
3.1.2 系统资源分配策略制定
系统资源合理分配依据为系统运行知识库,资源占用情况同比数据,这样可以最大程度的避免浪费资源和资源不够。
3.2 事中知识库智能运维工具
事中知识库智能运维工具是指系统在运行过程中出现的故障并能进行及时的诊断和分析,而这些诊断和分析是通过知识库进行的智能选择。这种工具与平时所应用的程序区别在于:知识库的智能运维可以将相应领域的求解过程表达出来,而不是利用程序段中隐藏的代码来解决问题。
因此,自动化系统通过知识库方式的智能运维,可以非常好的解決某一领域的所对应的问题,因为运维知识库相对比较简单,同时将知识和信息进行有效的融合,这样寻找和利用所需要的时间大大减少,从而极大程度的提高系统的有效性。
3.3 事后大数据挖掘运维工具
事后大数据挖掘运维工具主要特点就是对运维工具所产生的数据进行专业化处理,比如告警信息、日志信息等有意义的数据,对它们进行加工,实现运维数据的再次利用,这样分析出监控资源的运行情况,分析所得到的结果给运维人员一些合适合理的建议,从而使运维人员更好的监控系统,掌握所需要的专业知识。
4 结论
随着科技不断发展,各行各业业务不断扩大,运维方式也不断在创新,从手工运维、到脚本运维,再到工具化运维,运维方式不断在进化和改进,适应现代自动化系统的要求。通过运维工具把复杂的自动化系统进行简单化,将运维人员从繁重的运维体系中解脱出来,是运维工作未来不断发展的方向,同时也相信,运维工具将来也会越来越先进。
参考文献
[1]王永.大数据抵御APT攻击的可行性研究[J].电子制作,2015(10).
[2]李春鸣,肖军,潘丹.大数据影响下网络承载问题研究[J].科技创新与应用,2015(26).
[3]马敏燕.大数据时代网络信息安全策略研究[J].网络安全技术与应用,2016(07).