张 维 肖 鹤
网络通信与安全紫金山实验室
5G+工业互联网催生了一批全新的、前所未有的电信业务模式,也深刻影响着电信网的网络架构和技术路径。5G园区专网正待破茧而出,企业内网改造已写入国家信息行业“十四五”规划,高质量企业外网不断得到验证,云网融合业务即将进入深水区。新变革对网络运营系统提出了更全面、更敏捷、更智慧的要求。
运营商传统BOSS系统严格来讲不能称之为“系统”,称为“系统集群”更为恰当。该系统集群由多个割裂的系统组成,开通一个业务需要手工分段开通若干网段,资源管理数据也不同步,因此面对5G+工业互联网的新挑战显得臃肿而乏力。正因如此,三大运营商都提出了新架构云网融合BOSS系统的规划。但由于现网系统庞大复杂,历史包袱沉重,而网络运营不能有丝毫干扰,规划落地之路必然面临巨大困难,需要较长的过渡期。
紫金山实验室综合实验平台利用自建的国内规模最大、一站式科研试验基础设施——长三角新型网络、南京城域网、新型无损数据中心、自研司络网络控制器——开展创新技术研究和工业互联网示范应用。一方面内在需要开发运营系统实现平台资源管理,支撑示范应用落地,另一方面也希望利用轻装上阵的优势为业界重构运营系统提供试验场,由此兼收并蓄,充分吸收业界经验,初步建成了面向5G+工业互联网的新型运营系统,可为业界发展提供借鉴。
传统系统大多各自独立拥有一整套采集控制、数据存储、业务应用的功能模块,各系统垂直纵向一体,系统内数据与逻辑、逻辑与界面紧耦合,这就造成系统可配置性差,对新业务、新网络的需求快速支撑能力不足。尤其在5G+工业互联网领域,未来由于新业务的发展,5G园区专网将成为新的网络形态,企业内网和外网深度交织,企业上云快速普及,势必要求运营系统具备灵活敏捷的配置能力。企业更加重视内网和外网的自主可控和数据安全,也将促使用户侧小型运营系统的普及,或由运营商提供系统服务。而传统的烟囱式系统集群显然无法满足这一需求。
新型运营系统目标架构为纵向解耦、横向融合、B&O一体。系统由前台、中台、后台和能力开放平台四个部分组成,前台、中台、后台纵向解耦、横向融合,后台提供统一的基础平台、前台提供若干能力中心+应用场景;中台即统一数据中台,提供数据存储、处理、分析、订阅等能力;能力开放平台提供系统的管理、API控制等能力。如图1所示。
图1 新型运营系统总体架构
新型的系统架构打破专业界限,实现了相近功能以原子化统一开发,系统统一登录,应用需求配置化实现。
资源管理提供存量管理、基础管理、资源应用,实现资源的纳管和动态扩展、资源的可视化管理,提供丰富的查询、统计分析支撑运营管理,是网络运营的核心能力之一。在传统系统集群中,由于各系统是纵向垂直一体的,造成各系统重复采集资源信息,又因采集周期不同步导致数据不同步,无法实时准确地开展资源管理。当收到业务请求时,需要人工复核各系统数据是否一致,确认业务资源是否就绪。
5G+工业互联网业务向互联网模式趋近,提出了业务一键快速开通的要求。这就必然要求资源实时精确管理,且可端到端查询、配置。在新型运营系统架构中实现这一能力的核心是两个“统一”,其一是“统一采控”,其二是“统一数据中台”。新架构纵向解耦,统一采集平台成为系统中资源信息的唯一来源;数据和逻辑解耦,所有数据都存入统一数据中台,在数据中台完成整理、分发、AI分析,供所有前台应用中心订阅。
应用中心订阅数据时,将首先检查该资源数据是否为实时数据,再决定后续执行流程。如该数据不需要按实时数据使用则直接从数据中台订阅,如需按实时数据使用则通过能开平台调用后台统一采集平台能力,发起一次数据采集。统一采集平台采得数据后北向写入统一数据中台完成数据更新,数据中台完成数据处理。应用中心调用相关AI分析服务完成数据分析并订阅该数据。具体如图2所示。
图2 资源管理流程
如上所述,新型运营系统实现了所有资源数据均为一个采集周期内的实时数据,为业务一键开通、开通过程可视化奠定了基础,提升了使用者实时掌握资源全貌的能力。
网络自动驾驶是网络运维的最终目标,因质量保障在网络运维中的优先级最高,所以当前网络自动驾驶的探索基本集中在故障管理领域。运营商有庞大、高效、强力的运维队伍,但垂直行业企业用户的运维能力相较而言比较薄弱,因此用户对故障智能处理的需求更为强烈,是5G+工业互联网业务发展中尤其需要重视的方向。
新型运营系统以非硬件故障“自发现、自定位、自处理、自恢复”(以下称“4自”)为目标,探索示范应用运维保障中的故障智能处理。其流程如图3所示,当故障发生时系统采集到故障告警,完成告警压缩和根因分析,匹配根因特征,如满足“4自”特征则调用统一控制平台按流程自动排障,如不匹配则转人工工单。
图3 “4自”智慧排障流程
因此故障特征库是“4自”处理的核心,特征库的建立经验上依赖专家知识库,技术上可依托知识图谱、大数据分析、AI算力、机器学习等,其中专家知识库是基础。
故障智能处理的下一阶段目标是故障自预测,有待进一步研究。
工业互联网业务与传统业务存在显著差异,其一业务产品不再是生产的辅助工具而是直接工具,其二业务对网络性能,如带宽、时延、确定性、可靠性、安全性极度敏感,两者共同作用下,用户的关注焦点自然地从产品延伸到网络。因此5G+工业互联网业务前所未有地将业务产品和网络紧密连接在一起提供给用户,用户也前所未有地关注业务产品后面的网络资源。用户从订购产品的一刻起就迫切希望获知产品包含了后台哪些网络资源,哪些网元为自己提供服务,承载业务的链路拓扑,网络性能是否满足业务要求,业务开通过程中哪些资源已经被激活、哪些等待激活等等,可以称为“电信产品可视化”。
在传统BOSS系统中,由于前述原因,用户无法实时获取上述信息,即使在专门服务大客户的“大客户网管”中也难以做到过程可视化、链路可视化。在新型运营系统中,由于解决了资源数据实时性和唯一性问题,打通了业务侧和网管侧,具备了向用户可视化呈现开通过程的条件。
新型运营系统是运营系统在5G+工业互联网时代发展的有益探索,验证了纵向解耦、横向融合、B&O一体新型架构的可行性,能够满足综合性、一站式、大规模科研设施的运营需要,为工业互联网示范应用提供强大支撑,实现了综合试验平台全生命周期服务。