基于AIoT+AIOps的数据中心智能化运维实现探讨

2020-01-01 01:10:36覃进学
数字通信世界 2020年2期
关键词:多维度数据源数据中心

覃进学

(成都四方伟业软件股份有限公司,成都 610000)

经调查显示目前全球已经有三千多名CIO将数字化业务列为工作重点,且预计2020年AIOps全球部署率会由2017年的10%增加至50%[1],覆盖了电力、金融、航天、HPC及通信多领域,目前对于所要处理的数据量正面临严峻挑战,不仅表现在海量数据上,更表现在运维成本的不断增加。所以实现数据中心智能化运维已经成为必然所趋,本文对此展开研究。

1 AIoT+AIOps概述

由于数据中心基础设施无法达到较好的监控效果,且未能给客户带来立竿见影回报,因此用户整体体验较差需求定制已经难以交付[2]。但是AIoT+AIOps则正是能够对这些问题有效解决的技术关键。经过运用AIoT可以对满足运维数据的采集、上报,并实现数据融合所需。AIOps即Artif icial Intelligence for IT Operations,不过Gartner对它的解释是AlgorithmicIT Operations,也就是基于AI算法去解决IT运维流程中的问题,例如性能监控、可用性分析、关联事件、自动化,以及日志、应用状态等运维数据信息。AIOps则可以智能化处理人工处理问题,经过专家经验结合数据分析模型,共同实现的智能化运维可以对运维效率充分提升。

2 智能运维实现解决主要问题

2.1 海量数据存储分析处理

运维人员应当对服务器的主要运行状况实时监督掌握,包括常规服务器配置、资源占用多种信息情况,运行业务时会产生一定异常、日志、状态警告等“事件”,通常情况下每一台服务器无论所处任何时刻都会出现大量事件。那么在数据中心服务器规模愈来愈大背景下,如何对这些“事件需求”统一自动化处理[3]。通过基于AIoT+AIOps能够实现对实时、非实时、格式化、非格式化、需要引擎以及只需运算、全量、抽样和可视化、告警等数据进行分类处理。由脚本运维至工具运维、智能运维,主要表现在以下几方面:大数据分析和搜集数据源,识别规则模式以及AI算法、域算法和自动化算法。但是在这个过程中需要注意AIOps并没有对AI应用本身加以转变,而是更加强调实现规则、流程AI智能化。譬如AIOps能够由无至有的逐一击破单点,之后可以形成局部方案逐渐由类推面的解决,这样一来多单点模块组合形成了完整AIOps流程,能够达到可知悉、可重用、可升级的优势。

2.2 多维度多数据源

处于复杂的业务场景下对于事件处理,除了需要包括常用时间、地点及内容,多维数据还需要包括地区、服务池、业务线和机房、接口等服务数据。那么很多情况下数据分析人员需要充分运用多种维度指标生成的数据报告,警告规则和Dashboard,因此是否可以支持多维度数据查询存储,作为衡量智能化运维是否具备灵活性的关键指标。那么通过AIoT+AIOps技术能够实现多维度数据处理,很多时候作为协议/模型类似设计问题,甚至不会对具体分析处理框架有所牵扯,通过设计较好的存储协议模型,可以确保整体具备多维度和简洁性。设计理念的不同,需要对应不同的智能运维处理模型,因此彼此之间并未存在优劣之分。多维数据源目前已经作为一种比较普遍存在的情况,AIoT+AIOps能够具备多类数据格式/API适配能力的同时,还可以达到数据展现分离,解决展现、数据契合度较高极有可能更改前端界面的工作问题。

2.3 信息过载

在智能化运维中最为典型的事件就是信息过载“告警”应用,几乎所有运维管理员都为所需地方加上告警,以为这样可以高枕无忧。但是需要认识到各类型告警信息会毫无疑问的占满空间,那么基于AIoT+AIOp能够对抖动性、重复性相关信息加以过滤,并且由中可以寻求问题的存在根源,在Dashboard达到数千上万下,AIoT+AIOp能够自动过滤满足智能运维灵活性。当然身为运维AI工程师自身也应当积极学习AIoT+AIOp技术,从而对运维产生数据完成整理分析,真正发挥数据本身的价值。

3 结束语

总而言之,基于AIoT与AIOps技术的智能运维,能够实现告警异常检测、告警故障分析、智能能耗等方面的不断提升改进。经过将物联网、人工智能和知识图谱等技术引入,能够对IDC机房和园区管理工作的整体效率有效提升,还可以提高综合服务能力与控制处理突发事件能力,从而达到机房的最优化决策控制,最终实现数据中心的智能化运维。

猜你喜欢
多维度数据源数据中心
酒泉云计算大数据中心
“多维度评改”方法初探
民航绿色云数据中心PUE控制
电子测试(2018年11期)2018-06-26 05:56:24
Web 大数据系统数据源选择*
多维度市南
商周刊(2017年7期)2017-08-22 03:36:22
基于不同网络数据源的期刊评价研究
基于云计算的交通运输数据中心实现与应用
基于真值发现的冲突数据源质量评价算法
Overlay Network技术在云计算数据中心中的应用
河南科技(2014年11期)2014-02-27 14:16:49
分布式异构数据源标准化查询设计与实现