方琰崴
南京 210012
面向云化的电信运营转型方案、关键技术和发展策略
方琰崴
南京 210012
在我国,基于NFV/SDN/云计算的虚拟化运营渐行渐近,电信运营转型过程中挑战和机遇并存。文章介绍MICT-OS云化运营转型智能解决方案和关键组件,分析自我规划和设计、优化网络模型和策略设计、自动运维托管等几个关键技术问题的解决方案,提出云化运营转型的“三步走”发展策略,为运营商转型提供参考。
电信运营;云化;转型;关键技术;发展策略
随着移动互联网时代的到来,电信运营商在如何降低成本、提高网络资源利用率、加强网络运维的灵活性,乃至加快业务上线、实现差异化服务等方面承担着越来越大的压力和挑战。而随着在IT行业的成功,虚拟化技术开始进入运营商的视野,得到越来越多的关注。其中,NFV/SDN(Network Functions Virtualization,网络功能虚拟化;Software Defined Network,软件定义网络)和云计算正在成为电信行业未来发展的重要趋势,将是未来影响电信产业格局的一大关键因素。与此同时,ETSI、TMF、5G NORMA等标准组织聚焦于虚拟网络规范化以及运维运营的标准化、模型设计[1]。各种针对虚拟化技术的开源社区也不断涌现,运营商和设备商加大投入力度,逐渐在社区中起到主导作用。
中国移动推出下一代革新网络—NovoNet,并发布NovoNet 2020战略愿景。中国联通发布新一代网络架构CUBE-Net 2.0白皮书,将网络即服务作为发展目标。中国电信发布CTNet 2025网络架构白皮书,全面启动网络智能化重构。国外运营商诸如Verizon、AT&T、Orange、Vodafone、NTT docomo、Bharti也纷纷发布构想,加快向数字化运营的转型步伐。
电信运营转型是大势所趋,而如何转型则成为迫在眉睫的关键课题。对于电信运营商来说,基于NFV/SDN/云计算的虚拟化运营与传统电信运营有着很大差异,运营转型过程中挑战和机遇并存。运营商需清楚认识到传统运营方式在虚拟化时代所面临的问题,以及转型过程中将会面临的各种挑战,才能更好的制定转型目标,确保从当前组织架构、流程、系统以及平台实现平稳转型,满足未来发展要求。
在云化网络中,运营商的角色从传统对网络支撑,转型为对网络真正的主导控制,从而具备自我规划、自我设计的能力。由SDN/NFV带来的网络软件化和虚拟化,事实上将软件变成至关重要的建网和组网技术要素。软件及软件系统的技能和实力,也将成为运营商真正的硬实力。
数字化转型的不断深入,驱动着运营商传统运营系统的变革。传统的BSS/OSS系统(Business Support System,业务支撑系统;Operation Support System,运营支撑系统)必须向大平台演进,实现扁平化、云化,对内满足运营商高效运营需求,对外满足合作伙伴灵活创新需求和消费者个性化需求。
传统OSS领域面临诸多挑战:烟囱式垂直运维模式根深蒂固,而且统一管理困难;传统OSS很难实现如业务开通这样的端到端方案,尚不支持根据可用性、负载和需求自动灵活的重组服务和组件;手工部署、升级流程和许多特定的硬件管理及规划过程,将产生更高的成本;当新技术和服务应用时,由于同时关注软、硬件运维为业务创新带来梗阻限制,导致业务上线时间太长,创新困难;现有OSS设计也没有考虑自动处理大量数据的情况,难以满足未来发展要求;此外,系统封闭难以对外提供能力开放,无法为运营商创造更大价值。
在运营转型构建新一代运营系统的过程中,会面临诸多问题。
1)如何实现灵活、易用的自动化编排,打造灵活智能的弹性网络。2)网络层次多,供应商更多,多厂家配合以及问题定位困难。3)各层接口尚未完全标准化,多厂家对接困难,初期集成周期长。4)如何满足云网协同管理、保障以及安全的要求。5)如何实现实时、自动以及自助的业务开通。6)如何满足能力开放,提供按需定制的网络服务和应用,进一步构建创新生态系统,为运营商创造更大的价值。7)相对应的电信运营流程、组织架构以及人员能力如何满足未来运维要求。
下一代运营系统不再是简单运维、运营的后端系统,也不是简单的Service Online,而是面向客户的前端业务系统和价值创造系统,实现按需DIY的“Service On-Demand”,是整合了运营商网络资源、IT资源、用户资源、第三方内容和应用,从而形成的面向客户的产品和解决方案开发平台、经营平台和生态链构建平台,逐渐成为运营商开展经营的操作系统。面对这些挑战,需要建立虚拟化、自动化、简化/抽象、可优化以及智能的下一代运营支撑OSS系统。
电信运营转型势在必行,如图1所示的MICT-OS(Mobile Information and Communication Telecom-Operation System,移动信息和通信的运营系统)智能运营系统解决方案能帮助运营商构建开放、敏捷、自动、智能的下一代运营系统,加快面向云化的运营转型步伐[2-3]。
MICT-OS智能运营系统解决方案引入设计域,以DevOps(Development &Operation)为手段推动创新业务敏捷开发部署,缩短新业务的上市时间,提升运营商市场竞争力,降低运营商CAPEX和OPEX。能够快捷自动化编排部署,基于策略闭环控制实现自动化运维托管,并以智能分析为核心优化网络模型和策略设计,构建智能化运维体系。提供能力开放,对外提供可编程接口,吸引合作伙伴入驻,开发创新的应用,挖掘潜在业务价值,壮大产业链,构建合作共赢的数字生态链[4]。
图1 MICT-OS运营融合整体解决方案
在I C T云化智能运维管理范畴,编排(Orchestration)指的是以用户需求为目的,将各种网络服务资源等元素进行有序的安排和组织,使网络各个组成部分平衡协调运行。编排后得到的是能满足自动化部署要求的网络服务,具有快速部署、动态调整、重复使用的能力。编排器是整个云化智能运维系统的核心引擎[5-6]。
端到端全局编排(Global Orchestrator)作为云化运营转型方案中的核心组件,遵循业界标准、接口开放、助力运营商实现高效的业务和资源编排、自动化完成网络部署和开通。端到端全局编排器(Global Orchestrator),包含端到端业务编排器GSO(Global Service Orchestrator)和端到端资源编排器GRO(Global Resource Orchestrator),二者相互协作和配合。
GSO负责实现来自BSS/自助Portal的用户订单服务请求到实现的全流程管理,需要支持订单服务到网络资源的转换(传统网络资源,SDN资源,虚拟网元资源等),支持统一的信息模型(产品->服务->资源)。GSO实现面向用户的业务编排,屏蔽业务实现底层细节,为用户提供简单易用的自助编排Portal门户,用户可以自由的随选业务及网络。
GSO包括模型设计器、业务编排器、业务生命周期管理、业务激活等功能模块。GSO在进行业务编排时,对外提供统一的能力开放接口,接收业务服务订单请求,内部将业务服务订单转化为需要的网络服务/切片需求,通过NFVO(NFV Orchestrator,NFV编排器)提供的NFV编排能力,进一步与SDNO(SDN Orchestrator,SDN编排器)协同,最终实现端到端业务的编排、开通和激活。
GRO提供丰富的资源编排能力,实现编排过程可视化,编排输出标准化,部署过程自动化,业务开通智能化。通过网络业务资源统一编排,部署周期从原来的数月缩减到数天,极大提升网络开通效率。
GRO提供强大的智能可视化编排能力,可进行多域、多租户、多VIM/DC/vDC(Virtualized Infrastructure Manager,虚拟化设置管理;Data Center,数据中心 ;Virtualized Data Center,虚拟化数据中心)、多厂商、混合网络的端到端资源编排,满足vCS、vIMS、vUDS、vEPC、VoLTE、vVAS、vIPRAN、vCPE、5G切片等编排需求, 还支持VNF(Virtualized Network Function,虚拟网络功能)和PNF(Physical Network Function,物理网络功能)的联合编排及与EMS(Element Management System,网元管理系统)的协同[7]。GRO采用业界标准的模型描述语言包括TOSCA、HOT、YANG等,具备开放、标准、通用以及多厂商全解耦的优势。
GRO包括NFVO和SDNO两大核心模块。1)NFVO负责端到端的NFV领域资源统一编排,提供强大的NFV计算、存储、网络资源的编排能力,支持基于策略的全网统一编排和生命周期管理[8-10]。本地策略管理包括资源分配策略、弹性伸缩策略等。生命周期管理包括网络服务的注册、实例化、弹性、升级、终止等。2)SDNO负责端到端的SDN领域网络资源编排,支持跨厂商、跨域的SDN控制器连接管理,实现Access 、WAN、DC/vDC间的网络连接编排,支持IP光网协同。
GRO在进行资源编排时,对外提供统一开放的接口,接收GSO的NSD(Network Service Descriptor,网络服务描述)编排请求,NFVO将NSD编排请求转化为网络服务需要网络资源需求,当发现所需网络资源是跨DC/vDC的网络连接需求时,则进一步与SDNO协同,最终实现端到端的网络服务编排、开通和激活。
GRO提供一键快捷自动化部署开通能力,涵盖硬件资源层、虚拟资源层到上层NS、VNF、SDN等的端到端一体自动化部署。基于编排输出的NSD和VNFD(VNF Descriptor,VNF描述文件)自动进行实例化,形成NS(Network Service,网络服务)和VNF,自动部署SDN网络连接。GRO支持自动测试套件,进行网络和业务的自动拨测和验证。部署完成后,系统自动执行预先编排好的业务配置脚本,进行业务一键式开通和业务激活。
如图2所示的GA(Global Assurance)全局保障组件作为云化运营转型方案的重要部分,负责运营商集中的SLA(Service Level Agreement,服务登记)管理,通过全局多层次的实时数据采集、分析,实现集中的告警、性能、事件实时监控,支持告警根分析和告警自愈等功能。可基于预设用户业务质量、网络质量以及综合智能分析来实时跟踪和优化策略,达到策略自优化的目的,从而实现智能化运维托管,提升全方位服务保障能力。
图2 GA全局保障组件架构
GA为云化电信运营提供端到端维护、监控及诊断,包括以下方面。
1)集中告警及性能监控。①提供整个云网的告警监控分析功能,包括告警显示、操作和统计功能;②提供整个云网的关键性能指标进行实时监控,并对预定义事件触发上报管理网元。
2)多层告警的自动关联定位。①全方位采集:全面采集硬件、虚拟层、 VNF、EMS、NS相关告警②智能定位:基于模型自动关联多层告警,提供根告警跟踪关联,以便于问题快速定位③闭环告警自愈:通过监控,自愈策略匹配,调整优化,快速自动解决问题,使网络健康稳定
3)服务保障以及工程调度。①服务保障包括问题、变更、SLA管理以及预防性维护,提供网络级服务保障。②工程调度涵盖工单管理,备件管理,工具管理以及智能调度等。
4)全面“体检”及智能诊断,及时发现问题,防患于未然。①全面检查各组件状态、告警和资源使用率,VNF的状态、告警和KPI指标以及SDN管理组件的状态、告警和连通性。②自动部署模拟VNF,进行专项诊断,如诊断网络互通性、探测虚拟网络性能和诊断VNF部署状况等③巡检任务按需灵活定制,定时自动执行,无需人工干预。诊断完提供可视化体检报告,异常条目自动以醒目颜色提示。巡检记录实时保存,可供历史查询跟踪。
5)提升网络可靠性保障。①各管理实体支持高可用性冗余,支持异地容灾及分布式部署,保证服务连续性;支持多级备份,故障时可快速恢复或重生。②提供网络、系统、应用安全等全方位保障。
资源和网络集中的全流程管理调度组件Global Manager包括GI(Global Information,全局信息)和GP(Global Provision,全局受理)两个模块。
GI负责运营商集中的资源信息管理,通过与云、网络相关的资源管理模块/数据库交互,获取相关信息,给运营商展示全局范围的SDN/NFV实时资源和实时拓扑视图,提供API(Application Programming Interface,应用程序接口)供其他模块获取全局的资源信息,提供包括物理资源、虚拟资源、业务资源的跨网、跨域、跨厂家的资源管理和拓扑管理;提供业务建模和拓扑关系的可视化功能支持对第三方网络的数据采集的管理;提供全局的资源分析和资源列表;为端到端业务开通提供可用资源支撑,为端到端服务保障,特别是跨域的告警、性能分析、策略提供数据支撑。
GP负责运营商集中的网络管理,包括全局范围内的网络统一的权限管理、配置管理、测试管理、多厂商EMS接入适配、网络激活、统一的北向接口等。
云化运营转型方案的关键技术是部署规划及设计模块,通过微服务UI集成和统一权限管理,实现集中的规划及产品设计、网络及业务设计、模型设计、策略设计、指标及流程设计、模型验证、测试验证等,设计环境和验证环境分离,并提供集中的目录、软件仓库和版本管理,以及设计到生产环境的分发管理。
通过引入设计域,可以在线完成不同层面的模型蓝图设计,经过测试和验证,通过发布器进入执行域。以“设计域+运维域+运营域”三域结合为基础,以设计域为主导,优势体现在以下方面。
1)在线蓝图设计:采用模板化设计思路,提供丰富、成熟的应用场景模板。蓝图设计器基于开源设计工具,融合主流设计理念,满足业界发展趋势。蓝图设计器能够同时支持 TOSCA、YANG、HOT等模型规范;蓝图描述文件格式支持YAML、XML;业务模型设计支持模型规范与Openstack平台无关性。
2)设计过程图形化,架构呈现清晰,一目了然。设计者可从组件库中拖拽完成设计,无需专业指导,实现分钟级设计。
3)软件仓库集成丰富的能力组件包,支持用户本地上载或从互联网开发资源库中获取,实现按需DIY。
4)集成自动化测试工具,支持对模型设计以及网络进行全方位验证测试。
“设计+验证+发布”三域结合的闭环流程贯穿整个网络的生命周期,即不仅在部署前完成网络规划设计,快速地进行网络自动部署,还可在网络执行过程中,完成持续设计、优化和发布,极大提升了网络运营的敏捷性。
随着电信虚拟化的深入,网络复杂性也会随之不断上升,传统故障和性能管理方式难以适应云化网络运营要求。如何对实时以及历史数据进行分析,评估潜在问题对业务、客户以及服务的影响,如何完善、预测和改进运营以及客户体验,有效提升效率成为关键。为此,有必要部署如图3所示的智能分析模块,智能分析部署在GA中,是云化转型的关键模块,采用大数据分析技术,提供运营分析保障,包括以下方面。
图3 智能分析模块架构
1)业务运维:通过对业务的深入分析和预测,实现业务资源占用以及业务质量可视可评。对端到端业务问题进行智能定界定位,快速主动处理。
2)体验运维:建立多维度模型,对用户体验进行实时监控、快速分析、有效保障和主动关怀,实现价值区域以及VIP客户的差异化体验管理。
3)价值运维:以商业价值为导向进行价值分析,为客户体验部门提供体验和营销数据,为网络部门提供精准的网络优化及扩容数据支撑。
通过各种分析手段可了解系统状况和历史运行趋势,实现问题自动定界定位,验证各种策略设置的合理性,提供的分析预测能力可有效完善模型和策略设计,转被动为主动,为网络优化和用户体验提升提供有力支撑。
智能分析组件部署非常灵活,可根据实际需求选择轻量化以及增强型两种部署方式。智能分析结果应用广泛,极大提升运营效率,有助于自动化运维,构建以客户体验为中心的电信运营体系。
全局策略中心(Policy Center)模块,能够建立统一的策略管控中心,包含策略模板和任务管理,提供策略查询、调度、执行等服务。支持策略在线定义,策略冲突检测防止非法策略进入系统。具备策略自优化能力,引入知识库和专家库管理弹性伸缩、网络自愈、自动控制等策略。
如图4所示,部署在GA中基于策略的闭环控制方案,使网络具备了自优化以及自愈能力,加速了运维自动化进程。通过“设计-部署-运行-分析-再设计”这种自我进化的能力不断优化客户体验和网络。
图4 基于策略的闭环控制方案
提供两种模式:1)运维层面:轻量化智能分析模块和本地策略/全局策略对接,直接驱动编排/网管/云管动作,实现小闭环基础运维。2)运营层面:规划设计组件,全局编排组件和大数据分析系统通过全局策略中心对接,大数据分析提供策略优化支撑。设计域、执行域结合大数据,构建整体闭环系统,从而实现智能运营。
未来还可以引入机器学习方法,包括人工神经网络、向量机等技术,实现智能策略预测,进一步加强运营运维的智能化体系构建。
运营商与第三方合作的传统方式是通过API调用,第三方自行开发、部署、运营应用,收费单一,业务上线慢,灵活性以及合作性差,难以构建持续盈利的生态链。
在基于MICT-OS基础上,有必要转变思路,构建灵活敏捷开放的生态链,构建如图5所示的基于组件化服务能力开放架构,面向能力开放和运营,支持 API管理,提供开发运营门户,基于GUI/模板灵活组合和第三方在线发布新业务,充分利用自有和第三方服务,支撑互联网合作开发模式。
图5 云化运营能力开放架构
其中,能力开放门户提供开发域和运营域服务功能,支持快速开发和运营管理;能力开放管控提供安全、策略控制、能力管理等功能,实现与上游应用系统标准化对接;能力开放服务提供服务接入、能力封装、能力总线等功能,实现与下游业务系统的标准化对接。
运营商通过能力开放吸引合作伙伴入驻,开发创新应用,以丰富应用吸引最终消费者,不断增加的合作伙伴和消费者形成正反馈,持续挖掘潜在业务价值,壮大产业链,形成开放共赢的生态链。
云化运营系统转型,建议按如图6所示的“三步走”方式实现。
图6 云化运营转型“三步走”方案
第一阶段是转型初步阶段,采用新网络传统方式管理。传统BSS/OSS不关注设备是否虚拟化,按传统新增网元管理。MANO(NFV Management and Orchestration,NFV管理和编排)负责虚拟化设备的管理,独立部署,与现网接口少,可快速上线。但这种方式的问题是新网络优势无法得到充分利用,运营运维模式跟传统模式相同。第一阶段引入编排系统,实现资源,网络以及切片编排,主要目标是支持SDN/NFV弹性网络管理以及按需网络切片服务。
第二阶段是转型深入阶段,采用新老网络分域协同管理方式。新增自服务门户与编排协同管理SDN/NFV网络,传统网络由现网BSS/OSS体系管理,现网BSS/OSS微改造支撑新增管理网元的接口需求,实现真正端到端网络管理。分域协同管理能够实现集中化实时资源管理和在线DevOps的自动化设计、部署,并统一策略管理,优化网络设计和策略,构建弹性、开放的微服务架构,实时开通自助式业务,将网络能力服务化,推动建立创新生态链。
第二阶段主要目标是构建ICT服务一体化平台,支撑云网一体化业务自动开通,业务编排以及开放云网能力等。
第三阶段是转型完成阶段,采用新老网络融合管理方式。传统BSS增强产品编排,集成DevOps能力开放平台等客户体验功能,OSS与Orchestration融合。第三阶段主要目标为支撑全网能力服务化,网络智能运维,业务SLA按需实时提供及自动保障,用户定义业务,构建端到端智能化运营系统。
在运营系统向云化加速转型的同时,相应的运营流程,组织架构以及人员技能也需配合转变。
首先,落实流程转型。作为规范业务运作的规则和机制,运营流程需要从传统的“以网络性能为中心”转变为“以用户体验为中心”,同时引入DevOps敏捷流程加速新业务上线,结合大数据分析预测能力进行流程优化和决策,促进流程“自编排”能力,使之更加灵活、高效、简单以满足未来构建业务生态链的需求。
其次,组织架构也要逐步适应云化运营变革,可逐步平稳实现传统运营团队向融合MICT运营团队的转型。组织架构扁平化为第一要素,取代传统的“烟囱式”管理模式,打造敏捷的研发团队,提升创新业务编排和上线效率,进一步融合资源管理和运营平台,加强建设数字业务管理规划团队,适应未来网络能力开放和生态系统合作的需要。
同时,运营维护团队的技能培养,也要适应云化运营趋势。可通过持续培训提升人员数字化技能,促进ICT融合,引进互联网和软件人才,加强大数据分析预测能力,培养数字化营销和客户体验管理专业人才,营造敏捷、协作、创新的企业竞争氛围。
运营转型方式并非一成不变,可根据实际运营和转型的发展不断调整策略。
面向云化的电信运营转型,以全局编排作为核心引擎,引入DevOps敏捷模式加速业务创新,智能化、自动化运营运维降低OPEX,在开通、保障以及服务能力三大方面加速运营转型,构建未来全域融合管理的运营系统蓝图。
云化是5G发展的基础,在5G阶段将引入Cloud Native(云原生),电信网络将会面临前所未有的发展契机,而目前中国正处于5G发展的启动期。面对这个巨大的存量市场和较大移动用户增长空间,电信运营商需要抓紧时间窗,积极转型,加大力度构建云化运营能力,为即将来临的5G市场快速发展期打下良好基础。
[1] ETSI GS NFV 001.Network Functions Virtualisation(NFV).Use Cases
[2] ETSI GS NFV 002.Network Functions Virtualisation(NFV).Architectural Framework
[3] ETSI GS NFV 003.Network Functions Virtualisation(NFV).Terminology for Main Concepts in NFV
[4] ETSI GS NFV 004.Network Functions Virtualisation(NFV),Virtualisation Requirements
[5] ETSI GS NFV-INF 001.Network Functions Virtualisation,Infrastructure Overview
[6] ETSI GS NFV-MAN 001.Network Functions Virtualisation(NFV),Management and Orchestration
[7] ETSI GS NFV-SWA 001.Network Functions Virtualisation(NFV),Virtual Network Function Architecture
[8] ETSI GS NFV-INF 003.Network Functions Virtualisation(NFV);Infrastructure,Compute Domain
[9] ETSI GS NFV-INF 004.Network Functions Virtualisation(NFV);Infrastructure,Hypervisor Domain
[10] ETSI GS NFV-INF 005.Network Functions Virtualisation(NFV);Infrastructure,Network Domain
方琰崴
硕士,高级工程师,发表论文二十余篇,获多项专利,专业方向为核心网的组网和关键技术。
Research on Solutions, Key Technologies and Development Strategies of Cloud-oriented Telecom Operation Trasnformation
Fang Yanwei
Nanjing 210012, China
Telecom operation based on NFV/SDN/Cloud Computing is approaching in China, both with challenges and opportunities in transformation. This paper introduces smart solution on MICT-OS cloud telecom operation transformation and main components, and analyzes some key technical issues, including self-planning & designing, optimizing network model &designing strategy, and self-maintenance services. Furthermore, it presents ‘Three steps’ development strategy for telecom operation transformation confronting cloud. Hope it to provide references for the transformation of telecom operators.
Telecom Operation; Cloud; Transformation; Key Technologies; Development Strategies