网络管理自动化中闭环形成的概念

2020-10-14 14:26
中兴通讯技术 2020年4期
关键词:网络管理调用闭环

(北京邮电大学,中国 北京100876)

降低成本、改善性能和保障运行是网络管理系统建设始终追求的目标。从21世纪初开始,人们逐渐认识到进一步降低成本,改善性能,需要提高网络管理的自动化程度。此后,经历了20余年的发展,相关技术的不断出现持续推动着网络管理自动化技术的进步。

1 网络管理自动化的发展过程

1)基于策略的网络管理

早期的网络管理自动化是基于策略的网络管理[1]。该管理方式是指,在不对网络管理系统重新编码且在其在线运行的情况下,动态改变网络管理系统,从而提高网络管理的自动化程度。

2)基于智能的网络管理

随着研究的不断进展,人们发现在大规模的网络环境下,基于策略的网络管理会产生策略冲突,尤其是在复杂的环境中。网络环境越复杂,策略冲突就越严重。在这种情况下,需要提高网络管理自动化的程度。因此,从21世纪初起,基于智能的网络管理逐渐成为研究热点[2]。

基于智能的网络管理是指,通过将网络管理领域专家的经验总结为知识,形成知识库,然后基于该知识库进行网络管理。采用这样的方法,同样可以在不对网络管理系统重新编码且在其在线运行的情况下,动态改变网络管理系统,从而提高网络管理的自动化程度。

3)自主管理的网络管理

随着研究的深入,人们遇到了和基于策略的网络管理类似的问题:将网络管理领域不同的专家经验总结为统一的知识表示是一件相当困难的事情。同时,由于网络管理系统建设具有周期性的特点,在一个新网络对应的网络管理系统建设的初期,专家的经验还不能及时被总结出来。

在基于智能的网络管理研究时期,在欧盟FP7和H2020的支持下,研究人员开展了基于自主管理的网络管理的研究[3]。自主管理的基本思想是让网络本身具有管理能力,其目标是实现5S(自感知、自配置、自保护、自优化、自修复),并在异构无线接入网、软件定义网络(SDN)、网络功能虚拟化(NFV)等网络上开展具有2S或3S的初步验证性实验,同时在5G等新型网络上探索具有自主管理能力的体系结构[4]。有关实验显示:自主管理能够在自感知方面有较好的效果,但网络管理自动化程度总体上并无明显提高。

4)基于深度学习的网络管理

在图像、语音、自然语言处理方面取得重要进展的深度学习方法也逐渐被业界关注。初步的实验表明:深度学习在故障管理和性能管理预期有比较好的效果,但总体上网络管理自动化程度并无明显提高,特别是需要海量的训练数据也是一件比较困难的事情。

以上几种方法的共同特征是:

1)提出了一种基于X1的网络管理自动化方法,可以很快地将网络管理自动化程度从零提高到一定程度;但到达一定程度后,想再进一步提高就显得困难。

2)又提出了一种基于X2的网络管理方法,又可以很快地将网络管理自动化程度从零提高到一定程度;但到达一定程度后,想再进一步提高还是显得非常困难。

以上过程一遍一遍地重复,似乎存在一个天花板,只要碰到这个天花板,自动化程度就很难再提高了。

这个现象引起我们对网络管理自动化的思考:如果有一个天花板的话,那么这个天花板是什么?

2 网络管理自动化中闭环形成的概念

在早期,网络管理面对的是单一网络的简单环境,执行的是一些简单重复的操作;而现在,网络管理面对的是叠加/混合/综合/融合/异构的复杂环境,执行的是一些复杂精细的操作。虽然发生了如此大的变化,但网络管理过程并没有发生变化,仍旧是3个基本操作:监视、分析和控制。

实现网络管理过程的一般方法是先对规划的网络管理功能确定管理参数,再确定管理参数的管理指标,然后对管理指标进行监视、分析和控制。例如,在故障管理中,监视就是故障监视,采用主动或被动的方式,实时或周期地收集告警事件;分析就是故障定位,根据告警事件进行故障定位;控制就是故障恢复。如果能够进行故障管理的自动化,这3个操作应当形成闭环,即故障管理闭环。故障管理闭环的示意如图1所示。

▲图1 故障管理闭环

▲图2 配置管理闭环

目前的各种网络管理方法主要是为了提高这3个管理操作中某个操作的质量或效率,并没有解决管理操作形成闭环这个技术难题。例如,故障管理的故障监视中采用的各种方法,就是从海量事件中过滤出告警事件,然后将大量重复的告警事件收敛为可供分析的有效告警事件。目前使用的各种方法就是提高过滤和收敛的质量或效率。

因此,提高网络管理自动化程度就是要提高形成闭环的程度,其中有两项关键技术问题:一是实现网络控制自动化(网络管理过程中控制操作的自动化),二是闭环调用技术。

网络控制自动化的难点是网络控制结果存在不确定性。网络在运行的情况下,特别是在不正常的情况下,如果改变网络配置,结果则存在不确定性。目前在自配置、自保护、自修复等方面主要有两种办法:一种是启动备用(保护)部件,另一种是部件升级。

启动备用(保护)部件实质上没有对网络配置进行改变,只是在线更换了相同配置的部件。

部件升级实际上是网络扩容的常用方法。在网络扩容时进行部件升级,一般选择在网络稳定、低载时有计划地进行。在实施网络控制进行部件升级时,实现网络稳定和低载,常用的方法就是部分降级和闭塞部分用户,但这都有可能产生部件升级原因的正反馈,从而增加网络控制结果的不确定性。

闭环调用是一个闭环调用另一个闭环。例如,在故障管理闭环的故障恢复操作中,故障管理的资源中不足以保证故障恢复的质量,需要通过配置管理改变配置,以提高故障管理中资源的数量。在这种情况下,就需要故障管理闭环中的故障恢复调用配置管理闭环中的配置控制。

配置管理闭环的示意如图2所示,闭环调用的过程如图3所示。

▲图3 闭环调用过程示意图

图3显示的是最大管理功能粒度,但实际闭环的管理功能粒度要小得多,因此实际闭环调用也就复杂得多。

通常用闭环调用图来表示闭环调用的关系。在闭环调用图中,结点表示一个闭环,如果一个闭环调用另一个闭环,那么这两个闭环对应的两个结点是邻接结点。

在使用闭环调用图时,闭环调用中的一些判定问题,如闭环调用循环、闭环调用死锁、闭环调用嵌套等,就可以转化为对图或子图的处理。

3 结束语

网络管理自动化研究面临着巨大的技术挑战,迫切需要研究人员开展网络管理自动化方面系统性、长期性的研究,其中基础性的工作是闭环形成技术。系统解决闭环形成问题还有较长的路要走。

猜你喜欢
网络管理调用闭环
大型军工企业集团重大风险全流程闭环管控方法探析
时尚与数字共舞,打造印花供应链生态闭环
公平关切下闭环供应链差别定价决策
数控机床DNC网络管理平台在智能制造中的应用
战略管理型模式下的产业闭环管理体系建设
系统虚拟化环境下客户机系统调用信息捕获与分析①
网络管理技术的应用分析
利用RFC技术实现SAP系统接口通信
C++语言中函数参数传递方式剖析