毕进元
摘要:探究大数据自动化运维在企业中的应用价值和方法,从大数据自动化运维的应用架构和技术架构出发,阐述大数据自动化在企业发展中的具体应用及实践,对推广大数据自动化运维技术有重要意义。
关键词:大数据自动化运维;企业;应用
在计算机技术的应用中,通过软件等一系列非人为方式完成操作与控制即自动化运维。自动化运维技术的应用,在提高运维工作效率的同时,也减少了因人为失误所造成的损失。当前数据中心规模不断扩大,传统的人工運维模式难以支撑数据中心海量大数据的应用。研究适用于数据中心的大数据自动化运维平台,让数据分析工作更加安全、智能和自动化非常有必要。
1 大数据自动化运维平台设计原则
1.1 指导性
为避免人为因素导致的各种风险,数据中心自动化运维平台的设计应当具有一定的指导性,利用计算机软件技术在数据处理方面的优势,通过科学的分析,对风险进行评估,为运维管理工作提供依据,从而提高自动化运维平台的安全性,降低平台运营风险。
1.2 实时性
自动化运维平台的相关工作均以数据流的形式进行展现,因此,为保证自动化运维平台的工作效率,数据的实时传输就是必要条件之一。数据传输的实时性,能够使运维人员在第一时间掌握自动化运维平台的工作状态,并根据数据分析的结合,对可能存在的风险进行防范。
1.3 可靠性
数据中心自动化运维管理平台建设的目的是实现以数据为参考的自动化运营和维护,因此,数据的可靠性就显得至关重要。因此,在自动化运维中心的设计过程中,需要增加数据监控、对比、分析的功能,保证数据的真实、有效。
2 大数据自动化运维平台建设目标
2.1统—数据存取
大数据平台数据存取服务实现了异构、分布式数据存取,建设了统一的用户管理和授权,满足数据统一存取基础的应用需求。但在访问服务的负载均衡模式、数据存取安全控制及资源保护方面的需求也要求更精细化,需要在数据存取服务提供统一分配下多节点独立服务的模式,更好地提高处理并发服务请求能力,同时也要加强数据跨库访问、异构数据库关联查询的服务能力,以及存取访问会话、流量等方面的管控能力。
2.2 资源隔离按需分配
随着企业业务量接入的增加,对业务系统的用户资源管理提出了更高的要求,一方面需要实现对用户级的科学隔离,另一方面还需要充分利用技术环境如软硬件资源池来加强对硬件级别资源的科学管理。因此通过对大数据自动化运维技术的应用可以实现多租户管理,便于企业更好地落实管理制度。
2.3运行故障自动告警
运维工作是一项极为复杂的工作,对运维人员有着极高的要求,在运维管理工作中,自动化运维平台需要对任务类型进行分类,并严格按照流程执行相关任务。但是,在实际应用中,自动化运维平台出现故障的几率较高,一旦出现故障,自动化运维平台将向运维工作人员发出告警信息,并为工作人员解决故障提供指导。
3 大数据自动化运维平台应用实践
自动化运维技术的应用,降低了传统人工运维模式下工作超时发生概率,将人们从重复性的工作中解放出来,大大提高了工作效率。不仅如此,基于计算软件技术的自动化运维系统还可以实现自我状态监控,对运维管理中的各种风险进行预估,并根据软件中阈值设置的大小发布预警信息,从而降低自动化运维过程中存在的风险,减少因自动化运维风险导致的成本支出。为更好地支持企业数据中心大数据应用,开展大数据自动化运维技术研究和应用很有必要。
3.1 构建自动化运维管理平台
自动化运维管理平台是数据中心自动化运维平台的核心,通过自动化运维管理平台,能够实现对数据中心自动化运维平台所存在的风险提出预警,并对其中出现的故障进行快速恢复。在自动化运维管理平台的构建中,需要借助服务端、数据库、互联网、计算机等技术,实现对数据中心海量数据的监控,通过科学的数据分析,对自动化运维风险进行评估,同时给出降低自动化运维风险的建议。
3.2 构建故障监控流程
故障监控流程,是指在自动化运维平台出现故障之后,系统将自动对故障信息进行汇总,并启动上报流程,将汇总后的故障信息发送至相关人员,并对这一故障将产生的风险进行预估,为运维人员后期故障的排查、处理提供依据,提高自动化运维平台的故障处理效率。
3.3 完善事件跟踪流程
自动化运维平台的实现,是基于软件对参数分析后的自我判断,在软件判断行为做出之前,需要对数据库中的信息进行比对,从而确保自动化操作的正确性。为实现的对自动化运维平台工作情况的监督,自动化运维平台的建设过程中,应当设计完善的事件跟踪流,从而明确自动化运维平台所发出的每一项指令,减少运维工作人员对系统的随意操作,避免不必要的风险与故障出现。
3.4 增加关键流程管控
在自动化运维平台的建设过程中,基于关键流程对整个平台的影响,需要单独进行管控。在触发关键流程之后,运维人员需要对关键流程进行分析,详细介绍该流程的含义、处理机制,以及对平台的影响,从而为流程审批人员提供参考。除此之外,针对关键流程所产生的影响,运维人员应当进行特别监视,避免关键流程所引起的自动化运维平台连锁反应造成的影响。
结束语:
大数据时代的到来,促使政府、企业、高校工作的信息化程度不断提高,以数据中心为代表的新技术为政府、企业、高校等各项工作的开展带来了极大便利。加快数据中心自动化运维管理建设,降低数据中心管理过程中人为因素导致的故障,节约运维管理成本,提高管理效率,是数据中心运营管理的必然选择。
参考文献
[1]叶枝平, 苏立伟, 杨秋勇,等. 基于大数据平台的营销监控自动化运维探索研究[J]. 电子世界, 2019, No.580(22):32-34.
[2]胡人卓, 费晓亮, 赵路宁, et al. 基于大数据的计算装置自动化运维管理模式研究与应用[J]. 信息周刊, 2019, 000(032):1-2.