运维管理体系架构发展研究

2021-09-13 22:17云超赵智伟周辉安娜
计算机与网络 2021年14期

云超 赵智伟 周辉 安娜

摘要:新的网络特点、新的网络架构的出现对运维管理提出新需求,NFV和人工智能等新技术驱动运维管理向智能化方向发展。运维管理体系架构经历了集中式、分布式、基于策略的网络管理架构和智能自主运维管理架构。集中式网络管理结构简单,管理职能集中,适用于小型网络管理;分布式网络管理适用于多业务、大信息量、需要灵活扩充容量的异构网络。基于策略的网管在很大程度上提高了管理的灵活性和自动化程度,智能自主运维管理适用于高动态的弹性通信网络,实现主动、协同、智能管理。

关键词:集中式结构;分布式结构;基于策略的网络管理;智能自主运维管理

中图分类号:TP393 文献标志码:A 文章编号:1008-1739(2021)14-66-4

0引言

随着通信网络的发展,新的通信网络呈现出如下特点:环境可感知、容量可伸缩、属性可变化、能力可调整、万物可互联。这些特点对运维管理提出了新的管理需求,要求运维管理系统能够感知网络变化,动态调控物理和虚拟资源、进行网络功能虚拟化编排,以及进行多维信息感知和融合呈现。

弹性网络架构打破了以往垂直分割、封闭网元的静态架构,对传统的管理架构管理模式提出了新的挑战。SDN/NFV、云计算、大数据、人工智能等新技术的发展也对运维管理提出了新的需求和挑战。总之,新的网络特点、新的网络架构的出现,新技术驱动,都对传统运维管理提出了挑战。

1管理模式

随着网络管理对象规模增大、复杂性增加,同时大数据和人工智能等新技术的驱动,网络管理模式也随之发生了变化,集中式、分级式以及分布式等管理模式都是伴随管理对象和技术的变化而升级变化的。可以概括为集中式和非集中式两大类,其中分级式和分布式2种模式归为非集中式管理模式。随着网络和新技术的发展,又出现了基于策略的智能网管体系和智能自主运维管理模式。

1.1集中式网络管理模式

集中式网络管理模式是最早出现的,也是最常用最普通的一种管理模式。在集中式管理模式下,所有的网管代理统一由一个管理站管理,协同工作实现集中管理。在集中式网络管理模式下,在全网设置一个统一网络管理节点,称之为管理站。所有的管理软件和管理功能均部署在管理站上,管理站负责对全网进行统一集中管理:统一规划和调控全网资源,实时监视全网节点运行状态并在拓扑视图上实时呈现,监视全网端到端的路由和流量信息;对全网进行实时告警信息采集和呈现,故障定位、故障诊断和清除;对全网性能进行统计分析,设定性能阈值进行越限告警。

集中式网络管理模式的优点是网管结构简单、管理职能集中,有利于从整体和全局对网络进行有效集中管理。然而任何事物都有两面性,集中式管理的缺点在于:①所有的管理信息均需上报至管理站,极易导致网络管理信息拥塞,管理站汇总存储着全网的管理信息,一旦管理站发生故障则第一所有管理信息极有可能丢失。②全网管理工作无法进行,因此集中式管理模式具有明显的可靠性、抗毁性差的问题。随着网络规模扩大和复杂异构度的日益增加,集中式管理模式很容易成为网络运行瓶颈,致使网络负荷不均衡。同时全网所有的管理数据在同一时刻涌向管理站,不仅占据大量带宽,同时也极易导致管理站超负荷运行至崩溃,各种请求响应操作超时,管理性能大大降低。

1.2分级分布式网络管理模式

随着网络规模增大和复杂性的提高,集中式管理模式日益暴露缺点,难以适应大规模高复杂网络的全网管理功能。分级式网络管理体系结构和分布式网络管理体系结构应运而生。分级式网络管理体系结构将网络管理中心功能进行分级,可以根据管理需要分为一级、二级和三级网络管理中心,一级网络管理中心负责全网级的管理工作,根据管理规模,可以设置多个二级网络管理中心;二级网络管理中心实现本区域的管理工作;三级网络管理中心实现本节点的管理。一级网络管理中心对多个二级网络管理中心进行管理,二级对三级网络管理中心进行管理,在一级网络管理中心故障时,二级可以升级为一级,进行全网管理,且可以根据管理规模和需要,横向扩展二级或三级管理中心,或纵向延伸为四级管理代理。相对于集中式管理模式而言,分级管理模式具有可靠性高和管理灵活的优点。

分布式网络管理模式是一种对等式管理模式。多个管理者可以按需部署在一个网络系统中同时运行,每个管理者管理网络中的一个特定管理域,协同管控整个网络。任何一个管理者失效,其令居管理者均可以接管;而且在数据存储和共享方面,每个管理者都可以存储使用全网管理数据,共享其他管理域的管理信息。管理者之间可以对等通信,也可以通过上级管理者统一协同工作。

分布式网络管理模式将管理者分布在网络中,使得网络负载均衡,相对于集中式网络管理模式而言,大大提升了管理的可靠性和健壮}生,非常适应目前的大规模高复杂网络管理。

随着网络发展和新技术的出现,新的管理模式应运而生,主动网络管理、智能移动代理、基于Web的网络管理、智能网络管理、基于策略的网络管理PBNM等新型管理模式如雨后春笋般涌现。分级、分布、智能管理体系已经成为目前网络管理模式的主流,分布式和智能网络管理适应目前大规模高动态高复杂的网络形态和特点,有效提升了管理的自动性和智能性,已经成为目前流行的重要管理模式和研究方向。

1.3基于策略的网络管理模式

基于策略的网络管理(PBNM)的原理是基于策略将管理行为的控制和具体执行分离,初步实现了网络管理的自动化。基于策略的网络管理的重要组成部分就是移动代理。移动代理(Mobile Agent,MA)技术结合了分布式计算技术和代理技术的优点,MA具有自主}生、移动}生、智能性和平臺独立}生等特征,将MA技术应用到网络管理中可以提升管理的自主性。PBNM和MA这2种技术具有很好的互补性:智能代理技术能够弥补PBNM中存在的技术复杂、广泛分布、缺乏智能性、环境适应性差等缺点;将智能策略植入自动代理中可以按需设定MA携带代码的容量,根据需要灵活设定MA的迁移路径,提升MA与所运行环境的自适应通信能力,使用基于策略的访问控制还可进行MA和运行执行环境的安全认证。综上所述,PBNM和MA的结合对于提升网络管理的自主性和智能性具有显著的优势。

基于策略的网络管理能自主采集网络和环境信息,不依赖于具体环境和网络拓扑结构,能够基于策略理解和执行各种管理指令,自适应调控资源,实现业务管理的自适应协商和配置,具有管理流程简化、资源配置优化、强兼容性、易扩展性等特点,但是PBNM严重依赖于管理策略,不能根据网络拓扑动态变化进行实时管理,被管对象无法自主管理,这些缺点不适合于弹性通信网络的管理。将策略管理和移动代理与分布式管理相结合,能更好地实现智能自动管理。

综上所述,集中式网络管理模式在网络拓扑、管理模式上都比较简单,适用于小型網络、业务单一网络的管理。分级分布式网络管理模式在网络拓扑、管理模式和实现技术上相对复杂,更适合大规模高复杂性、多样化业务的网络管理。基于策略的网管在很大程度上提高了管理的灵活性和自动化程度,但是对被管对象的自主功能无法得到充分体现。不同的管理模式各有其优缺点,不存在一种“最好”的管理模式。每种管理模式都有适合的网络和工作场景,可以根据被管网络的特点和不同的应用环境选择一种适合的网络管理模式。

综合分析对比集中式网络管理模式和分级分布式管理模式的优缺点,同时结合弹性通信网络的拓扑动态变化和用户需求动态变化的特点,弹性网络架构的出现打破了以往僵化的管理架构,以及SDN、NFV、人工智能等新技术驱动,需要具备管理规模自适应的智能自主的运维管理体系。

1.4智能自主运维管理架构

采用运维管理中心-域管理中心-管理代理的智能自主运维管理架构,同时结合策略管理技术,基于感知-分析-决策-执行实现智能自主自动管理,适应弹性网络和应用的双重动态变化,具备管理规模自适应能力。运维管理中心是弹性通信网络管理的最高层,具有最高管理权限,进行弹性网络全网级的运行状态监视、端到端流量监控、跨网跨域资源调控、跨网跨域故障监视和处理。能够基于任务进行资源规划和调度,是运维管理的核心。负责进行动态分域,管理和委任各个域管理中心,向域管理中心发送命令以达到监控和优化网络,负责网络规划,向域管理中心发送管理命令进行通信网络配置和任务分配,同时接收域管理中心上报的网络状态数据进行全局监控和优化。

运维管理中心采用固定位置或由域管理中心选举产生,固定模式实现机制简单,但是其抗毁性较差,选举算法采用多因子加权算法,综合考虑弹性网络节点的位置、移动性、性能、管理能力等多种属性,当原有运维管理中心故障时,域管理中心可以升级为运维管理中心,接替运维管理中心进行弹性网络全网管控。

管理域是按照行政划分或地理位置划分的按照策略和规则确定的集合,域管理中心负责实施单个管理域的管理工作。域管理中心是运维管理中心的下级,域管理中心负责将本域的管理信息上报运行管理中心,同时接受上级运维管理中心的查询和配置操作,上报本域重要信息和实时状态,域管理中心与运维管理中心只进行必要的或者涉及全局或跨域的管理信息交互,减少了所有信息交互所带来的带宽占用和超负荷运行,管理域内的事情原则上由域管理中心自主管理和处理,大幅提高管理性能和效率。

各个域管理中心可以通过协作完成单一域管理中心不能独立完成的管理任务。域管理中心负责本管理域内地面网络和空中网络的管理,整个弹性通信网络的管理需要由不同的域管理中心共同完成,即域管理中心通过协作的方式完成单—域管理中心无法实现的任务。

网管代理是策略和命令的执行者,受所在域中域管理中心的管理。网管代理属于唯一的域,受其所在域管理中心的管理。网管代理是各种策略的具体执行者。

每个网管代理管理所在的节点,多个代理形成一个域并由域管理中心管理,域管理中心由运维管理中心管理。各个域管理中心接收运维管理中心分发的管理任务,整理和处理收集本管理域的数据,管理本域内的多个代理节点,同时把影响整个通信网络管理的数据上报给运维管理中心,本管理域的拓扑、故障、性能和配置等信息由域管理中心自主完成管理,具有高度自主性和自治性,大幅提高了网络管理效率。

管理域划分既可以依靠网络规划时的域分配情况,也可以通过弹性通信网络拓扑结构动态变化来触发管理域的动态更新和划分。通过管理域的划分,具备管理规模自适应能力,根据网络的动态变化随时增加或减少管理域;通过运维管理中心之间的协作运行,实现资源自适应配置、对系统运行情况的监视、诊断和智能处理、安全问题的及时监测和自我保护以及系统状态发生偏移时进行有效调整和优化,最终达到弹性通信网络的自主化、智能化运维的目标。

域管理中心具有自主管理能力,当运维管理中心发出简单的管理指令后,域管理中心能够独立完成某些管理功能。例如,域管理中心可以将运维管理中心下发的管理任务进行管理域内分解,根据各个MA的当前网络状态进行合理分配,并根据任务需求选择合适的派发方式,如采用基于移动代理技术的任务委派方式。另外,域管理中心还负责管理域配置、密钥的分发和更新、故障诊断或排除等,既可提高网络管理的自主}生和实时性,又可降低管理开销。

基于策略的管理代理负责接收域管理中心分配的任务和配置信息,并及时将自己的状态信息上报给域管理中心。另外,基于策略的代理具有一定的自主性,同处于一个管理域内的策略管理代理之间可以相互协商,进行任务的委托和迁移。

与传统的网络管理相比较,智能自主管理具有如下优势:

①自主管理实现了主动管理,网络的变化触发感知,进行动态分域和自动处理,实现了自主管理,提高了管理效率。

②自主管理增加本域故障诊断和故障处理,减少了故障处理时延,增加了管理自主性。

③自主管理可以满足高动态弹性通信网络高抗毁性的要求,一个域管理中心乃至运维管理中心的失效可以由其他域管理中心代替管理,并不影响整个运维管理系统的运行。

④自主管理可以保证实时运维管理,且能根据网络节点的增加和减少相应地增加或减少管理域,具备管理规模自适应能力。

⑤基于策略和移动代理的智能管理与域管理中心之间的自主协作相结合,实现智能自主管理。

⑥管理域具有扩展性,可以根据网络规模的大小和管理层级的伸缩按需灵活扩展。2网络管理架构总结

网络管理系统成体系发展,体系逐步完善。由单一设备的管理、对网络的管理、对业务和应用的综合运维管理;管理模式由集中式到分布式到智能自主运维管理模式;形成了由网元管理系统、专业网络管理系统、综合网络管理系统、综合运维管理系统的管理体系。

实现了集中控制下的分布式专业网络管理和综合网络管理,网络管理体制适应通信网络组织管理机构的编成,各级各类管理机构都具备了自动化集中管理所属专业网络及其综合网络的基本手段。

专业网络管理系统具备掌控全程全网的拓扑、性能、故障、配置和资源等运行情况的能力。综合网络管理系统以专业网络管理系统为基础,实现了综合网络拓扑、性能、故障、配置和资源的综合管理。宏观监视和掌握各专业网在性能、故障、配置等方面的总体运行情况,网系间的关联故障进行关联分析和准确定位,综合统计分析各网系运行情况的主要特征指标,按规范化工作流程进行网系问性能、故障、配置等方面的管理作业,处理各类通信业务,而向保障任务进行综合的业务管理。

3结束语

运维管理系统以及体系架构的发展经历了从集中式、到分布式到自动运维到智能运维的阶段,运维管理系统的发展趋势如下:

(1)进一步提升网络管理的弹性和自主性

基于SDN/NFV技术的弹性网络架构,成为下一代网络的重要发展方向。弹性网络架构突破了传统的垂直分割、刚性网络体系和复杂繁多的封闭网元架构。改变了现有网络的部署、操作和管理方法,因此弹性通信网络的管理、资源调度和监视也会对现有的网络管理系统带来极大的挑战。需要构建纵向贯通、横向协作的弹性化自主化网络运维管理机制,实现通信网络无配置、零规划开通运行。

(2)SDN/NFV、云计算、云存储、大数据技术在运维管理中的应用

将SDN/NFV、云计算、云存储、大数据技术思想应用于运维管理,使得运维管理在管理架构、信息感知和存储、多维态势认知、大规模业务流量和用户行为分析等方面与先进的技术结合,提高管理的智能性和先进性。