不仅只是AI与网络切片 5G网络运营维护智能化秘密

2020-06-23 09:25
新潮电子 2020年3期
关键词:切片运维运营商

之前我们聊过关于AI与网络切片对于5G网络运维的影响。而对于智能化运维更深层次的内容。我们的展开还不够。而诸见报端的各种口号。如“4G改变生活。5G改变社会”。如何去真正实现它。话题就多了。毕竟。2020年我们的消费者关注的是移动终端。而要发挥终端魅力。业内关心的更多是运维的执行力。既然5G网络需要支持超大带宽、超低延时及海量连接场景(可服务于自动驾驶、工业控制、智能电网、大视频、AR/VR等丰富的垂直行业应用)。那么如何更具象地展开运维工作。就变成一件“粮草先行”的必然。

毕竟。在运营商传统网络运维中。巡检、告警分析、故障处理等工作长期积累了丰富的经验。其价值并未被充分挖掘。同时。目前的人工运维存在系统复杂耦合度高、数据来源多种多样、人工维护风险度高。修复间隔时间过长、人员培养难度大等现状。导致了性能相关告警不明确、无效告警筛查规则缺失、故障维护只能被动解决。优化维护工单重复派发等问题。影响网络运维的效率和成本。

网络切片是基准要素

5G时代使用的无线频率高,相比4G时代单个基站的覆盖减小,为了满足覆盖需求。基站将会非常密集。网元数几倍乃至几十倍的增一为运营商的运维工作带来了巨大的挑战。“5G相比4G时代网络复杂性提升了一个数量级”这句话已经是老生常谈了。更重要的是。5G时代带来的不仅仅是网络架构的变化,更是业务形态的变化。5G通过灵活的网络切片渗透到网络社会的各个角落。使能各种差异化的新业务包括高清视频、车联网工业物联网等,成为垂直行业数字化转型的利器和未来万物互联数字社会的基石。

在切片管理系统中引人人工智能。根据AI训练平台输出决策依据。自动化执行管理策略,赋予网络智能感知、建模、开通、分析判断、预测等方面的能力,实现切片灵活性和管理复杂度之间的完美平衡。

毫无疑问。网络切片是5G网络的一个重要特性,通过对网络资源灵活分配。能力灵活组合,基于一张物理网络虚拟出网络特性不同的逻辑子网,以满足不同场景的定制化需求。网络切片运维实质上就是提供切片实例的全生命周期管理,包含设计、开通、SLA保障、终结等阶段。网络切片带来极大灵活性的同时,也增大了运维管理复杂度。基于人工智能来增强切片自动化管理能力是必然趋势。

为高效地管理网络切片。降低运维复杂度和成本。切片管理系统必须具备网络自感知、自调整等智能化闭环保障能力。目前网络策略仍是基于人工静态配置,忽略了网络的实际情况。引入AI后可基于时勵位置和移动特性,结合网络中的流量、拥塞级别、负载状态等进行智能分析和判断,通过AI训练平台输出切片管理动态策略。实现智能化调度。

另外。实时/历史智能分析还提供健康评分、异常检测预测、故障根因分析等参考数据,据此执行容量优化、配置优化、资源弹缩、问题定位等操作。实现切片闭环优化。5G智慧切片网络将会经历领域内探索、跨领域融合、高度自治三个阶段、首先,5G网络各子领域将分别与AI初步结合和应用。依托大数据与机器学习的支撑。在网络资源分配等领域探索实现初级智能化;其次随着技术发展。AI将可以学习跨领域的5G网络大数据,部分子领域将出现融合智能,实现中级智能化:最后。5G和人工智能技术高度发展,将实现全网联动和高度自治,大幅提升网络全生命周期管理效率,基于人类控制网络的意图实现高级智能化。

之前我们在多篇文章里提到,运营商在5G全面运营的情况下,为了优化网络运维的工作模式,提升网络运维准确性及效率性,提出了多种“集中维护支撑服务”的项目,都是基于AI啲运维解决方案旨在强调实现以维护为中心,并依托大数据挖掘技术与深度学习算法,实现问题早发现。一句话:由被动处理问题改为积极预防问题,从而提高整体资源的利用率和维护效率。

找到核心推动因素

在当前云时代。基础设施集中化且中心DC物理设备规模庞大,网络功能分布式打散分布在不同的物理节点上,一旦出现故障,原有的软硬件一体化主备倒换方式不再有效,需要更有效性自动化识别能力,识别故障根源是硬件原卧云平台原卧还是上层VNF的原因。快速区别出故障的根本原因,才能快速对故障进行有效隔离和恢复。

实际上,当前伴随着NFV和SDN技术的发展和成熟。通信行业逐步向ICT融合的All Cloud时代过渡。5G标准的确定以及云化核心网的商用。使网络运维面临更加复杂的运维环境:节点数;增加、跨层运维、多厂家管理、缺乏统一的运维工具等。换句话说。实现自动化和智能化的网络运维,是5G成熟关键技术、智能监控、故障分析等是自动化运维中关键技术。

而且,面对网络全云化。控制面、用户面分离的分布式网络架构演进,网络运维在5G时代会面临较大的挑战,电信运营商需要通过运维转型来提升网络运维效率。降低网络运维成本。这其中,NFV网络NFV网络的3层架构包括上层的VNF层。功能与传统的CT网元功能一样:中间层的CloudOS,实现向上提供基础资源,向下管理通用硬件:下层的通用硬件层。包括物理的計算、存储和网络资源。

用比较生涩的专业术语来说。NFV的各层之间是解耦的。其中“完全解耦”是NFV发展的方向和业界趋势,运营商可以摆脱对个别厂家的依赖。降低网络建设成本。“完全解耦”部署和维护较复杂,但资源可以做到统一管理和调度。其最根本特征是各层间使用标准接口。但当前协议和标准进展缓慢。

实际上。我们所熟知的网络,经历了从各设备厂家物理机无统一标准的传统设备演进到物理设备基本统一的X86服务器士层应用虚拟化。继续演进到云、云原生。短短十年间,4G演进到5G,5G在2020年走向成熟、我们之前多次提到。4G走向5G,电信设备从传统设备演进到虚拟化、云化、时代,软硬件架构都发生了翻天覆地的变化、众所周知,过去的运维工作都是在进行大量的事后处理工作,现在,通过运维专家梳理,选取动力环境、历史工单、网络性能、天气停电、故常告警、综合资管等多个维度特征,构建训练数据集。同时。我们选取了多种AI模型进行对比测试,最终确定选用多层LSTM循环神经网络实现小区退服告警预测,以达到故障预警分析的目的。实现了变被动处理为主动预防的运维思路转变,摆脱“拆东墙补西墙”的运维状态。达成对故障的事先预判。

所以。自动化运维的关键技术,除了故障监控和故障根源分层关联分析,故障自愈能力、全局透视、跨域全方位数据采集能力、全网网络拓扑管理、一键自动化测协一键自动化业务部署等,都是智能运维应具备的成熟商用能力。中兴通讯智能运维方案。化繁为简。降低5G云原生及服务化软件架构带来的系统维护复杂性,致力于聚焦5G业务本身,才能为我们的用户创造真正的便利。

后记

从目前的情况看。我们的三大运营商(其实国际上的其他成熟运营商也都差不多)通过运营商网络部、网管、分公司、县公司一线维护人员目标使用者,基于AI的运维解决方案,可提高维护效率和能力。预防性主动运维能力、快速响应的报告能力、快速应急处理能力、自动化减少人为工作量、经验移植减低人员要求、支持市场前线的分级保障能力。使平台融入运维生产中,实现商业目标。电信业引入了很多IT的软件架构、思维、方法等:开源、APP和基础设施解耦等给电信应用带来了很多好处、便利,同时也带来了新的问题,其中对电信运维方式产生了较大的影响,这其中的意义不仅只是AI与网络切片能够阐述的。

猜你喜欢
切片运维运营商
运维技术研发决策中ITSS运维成熟度模型应用初探
基于SDN与NFV的网络切片架构
基于ITIL的运维管理创新实践浅析
取消“漫游费”只能等运营商“良心发现”?
肾穿刺组织冷冻切片技术的改进方法
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合
三大运营商换帅
冰冻切片、快速石蜡切片在中枢神经系统肿瘤诊断中的应用价值比较
墨汁染色在组织切片中的应用