基于云计算的大数据智能运维系统设计方法初探

2021-04-04 10:28陈中元
信息记录材料 2021年8期
关键词:运维智能化监控

陈中元

(广西民族大学相思湖学院 广西 南宁 530008)

1 引言

在信息化时代,信息系统作用的大小将决定社会生产环节的快慢。而智能化运维系统其实就是将大数据与云计算技术两者进行结合,并以此为基础,这样能够有效地解决这种传统模式下IT运维服务的表现方式,在实际操作中就可以发挥大数据智能运维系统对网络实时监控的有效性,同时其还具有对大数据进行分析的能力。这就使其能够从根源上发现问题并发出警报,随后进行自我调整,同时将各种危机状况化险为夷。

2 大数据智能运维系统的技术操作原理

和传统的运维系统相比,这种将大数据和智能技术应用在运维系统中,就可以使其拥有对数据大规模进行搜索、快速进行处理以及大量开展业务等功能,使其起着非常关键性的作用。这种新型的大数据智能运维系统,在传统的自动化基础上实现了智能化,使其在应用过程中既减少了运维资金,又能够提高对客户的服务质量以及服务体验。由于其将智能混合技术合理地应用,从而使其拥有了对各种工作进行动态化的管理及对内存的合理计算调节和全方位的调控等,用通俗的话来说,就是其可以将资源的利用达到最大化,从而节省对初期资金的预算[1]。

在大数据运维系统中,只需要我们对大数据技术进行简单的基础操作,就可以使各项运维工作达到各方面的基本指标,从而实现对每个服务器运行的数据进行实时动态管控。并且,其可以对运行日志统一进行收集,凭借着对不同非关系类型数据库的有效借助,从而实现对各类数据进行多样化存储的功能。基于这项基础,在Hadoop数据的集群当中,同一时间输入每项所收集到的数据情况,就能够使大数据技术对这些收集到的数据情况进行全方位的离线分析,并且同时生成相应数据的曲线图。另外,可以将其和预先设定的相关数据做对比,在与监控报警系统进行合理关联后,就能够实现对目标数据进行实时监控,除此之外,还需要根据时代的发展趋势进行有效分析。可以根据之前收集到的有关数据和算法,就能够使预算模型获取相应的应用基础。此外,还需要观察其运行状况,从而合理地对未来服务器进行预测,运维人员可以针对这些所获得的数据信息,从而提前对系统及硬件进行调整以及迁移。

3 现阶段信息系统运维存在的问题

就现如今的信息系统运维来看,将面临着一个新的巨大挑战——云计算技术。云计算技术在应用过程中,通常会以能量分散、管理集中的方式进行,从而就会对信息系统的整体架构以及运营模式产生巨大的影响。然而,对于传统运维系统来说,想要把虚拟技术作为核心是一个巨大的挑战,这主要是因为若想让运维系统能够正常地运转,只运用传统的监控以及数据分析是远远不足的[2]。从根本上来讲,其主要存在着以下两方面的问题。

3.1 监控防护处于被动趋势

在传统的监控防护中,大多数监控都是按照发生问题-发现问题的位置-通告运维人员-运维人员处理问题的流程进行的。换句话来说,就是当出现了预警的声音,就代表监控的相关工作人员已经发现了问题所在,这时候就需要将这个信息进行传递,合理展开控制和管理等相关工作。当然,能够在这种环境工作的相关运维人员,其自身的专业素质也都是非常高的。因为,若其自身专业素质过低,发生问题的时候,就不能在第一时间找到问题根源,那么带来的后果是不可估量的。

3.2 传统运维手段与大数据环境有一定冲突

在大数据的环境中,指数式增长就是其数据特征之一。在海量的数据面前,频繁地运用相对传统的运维手段,这样就易发生在工作当中出现死角的现象,既降低工作效率又没能确保运维工作是否能够正常完成。与此同时,在传统的运维模式当中,没有对管理人员以及业务人员进行多维度分析相关数据的工具配备,从而使这些运维人员无法针对这些大量的运维数据,合理开展运维方面的相关工作,从而导致问题没能在第一时间得到有效处理,造成巨大的损失。

4 大数据智能运维系统功能设计具体分析

4.1 智能预警

大数据智能运维系统其智能预警功能就是把监控对象的历史数据以及此对象的走势作为基础,对统计学原理基础充分利用,对被监控对象使用大数据技术进行详细的了解并分析,从而可以有效地对被监控对象的平稳性做出准确的判断。同时,其还可以对业务形态和时间范围进行查看并分析,从而知道被监控对象之间存在的差异性。最终形成一个动态阈值,在不同的时间对业务进行实时勘测,通过利用这种动态阈值,就可以使性能监测机制得到进一步的提升,对传统的预警监测进行改良,从而使其在动态上以及实时勘测上有着明显的优势。这样一来,无效预警的出现概率就会大幅度降低,从而就可以使用户更精确地感知系统中的性能是否存在异常状况。

4.2 分析预测智能化

分析预测智能化,用通俗的话来说,就是在服务器当中对SAMATR信息和sysolg信息等一些不相同的信息进行基础应用。与此同时,还应当做好相关的监督工作和对各种例子的模拟等。在进行一些特殊的场景时,若能够将GBDT模型合理地引入或者借助LR,这样就能够有效地对服务器内部反复使用多次的部件出现故障的概率预测以及出现该故障的具体时间进行准确的,同时会采用相对应的措施,有效地对故障做出预防,从整体上来看,增强了IT架构的时效性以及可用性。另外,就产品和定制而言,利用智能技术对产品标准的准确预测及对方式的开发,能够对动态阈值、瓶颈点获取进行预测及分析,这些都是需要以IT系统能够准确对容量进行预测为基础。除此,通过智能预测对方式的定制开发的使用,就可以通过针对数据中心以及其余链路设计出一种全新的预测技术,从而对网络流量实现针对性地预测,将其快速地作为决策依据,进而为流量数据的调度工作提供有效帮助。

4.3 根因定位智能化

根因定位智能化其实就是根据故障发生的原因,从而对发生故障的地方进行精确定位,该功能的工作原理就是将专家知识库作为基础,该功能通常会应用在相对困难的IT故障场景之中。与此同时,该功能也还可以对故障发生的位置做一些基础的运算,可以有效算出该故障地方所影响的范围以及对故障进行自动化修理的功能。

4.4 能耗智能化管控

在能耗的智能化管控过程中,就需要对服务器数据以及运行的能耗进行全方位的采集,将集群和业务作为基础,通过历史数据的比对分析服务器的能耗状况,同时与云平台的业务调度机制相结合,通过使用powercapping、powersaving等相关的技术,从而使业务系统能耗得到明显的优化,进而使其能耗最大化减少的同时又保障了其系统正常的运转。

5 大数据智能运维系统的技术架构分析

5.1 采集器模块

从大数据智能运维系统的整体来看,其主要包含着四大逻辑性各不相同的模块,分别是采集器、存储数据、对数据进行分析以及展示数据的模块。这4个模块表示着从开始直至展示的过程,其中所谓的采集器模块就非常高效地运用分布式来实现数据动态化进行采集目标的,这种采集目标的方法在保障对数据资源高效采集的同时,又可以切实保障相关任务的完成效率。比如,主机、虚拟机、存储和网络等相关的数据都可以利用此技术进行采集。当然,在采集器当中,所有的节点的地位也都是平级的,只是在执行相关采集任务的时候会有所不同。当其中的某一项功能出现故障,导致停止运转,那么控制中心就会像我们人身体中的白细胞受到指挥时的情形一样,第一时间去查看发生事故的根本原因,随后,控制中心就会将出现故障地方的相关采集任务分配给其他节点,从而减少数据采集过程中受到的干扰,以保证其完整性[3]。

5.2 数据存储模块

大部分的系统当中都会有两大数据模块,他们就是拥有结构化的MYSQL数据库和没有结构化的MongoDB数据库。其中,拥有结构化的MYSQL数据库拥有相对较强的稳定性以及数据总量并不是非常庞大的特点。而没有拥有结构化的MobgoDB数据库主要拥有较好的更新频率以及实时性,并且它的数据结构相对来说较为简单。将这两种数据库合理地应用,那么若想存储系统内全部的数据类型也不再是特别困难的事。

5.3 数据分析模块

在大数据智能运维系统的运行中,数据分析模块在其中起到的作用是非常重要的,其主要的功能就是对收集到的数据快速匹配相对应的任务进行分析,检测此项数据完成的是否合格,将检测合格的数据用最快的速度存储在数据库内部,从而降低计算机重复计算相同数据任务的概率。

5.4 展示模块

展示模块其实就是在我们运用图表工具的基础上,根据所收集到的相关信息做出图形化处理的方式,将那些抽象的运维数据用直观的数据图进行展示,随后将这些直观的数据图给相关操作人员进行查看,操作人员根据数据图很快就能够看出其运行状况以及对应的相关结果,进而就可以提高工作效率。

6 结语

综上所述,在当今这个时代,随着大数据、人工智能、云计算等技术的迅速发展,许多企业也开始跟随时代的步伐,把智能运维系统的建立作为企业的发展方向,这源于智能化运维系统的便捷以及对各项业务的效率有着促进作用的缘故。与此同时,智能运维系统拥有着强大的技术基础,当我们在处理运维系统中一些较为困难的问题时,可以为我们提供一条全新的解决思路。

猜你喜欢
运维智能化监控
智能化战争多维透视
The Great Barrier Reef shows coral comeback
印刷智能化,下一站……
运维技术研发决策中ITSS运维成熟度模型应用初探
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
基于“物联网+”的智能化站所初探
基于ITIL的运维管理创新实践浅析