多云环境下的集约化运营平台建设方案探讨

2021-02-26 08:29
邮电设计技术 2021年1期
关键词:云网多云租户

1 概述

为响应中国联通集团公司网络线运营组织体系改革精神,推进资源统筹布局共享,实现云资源统一规划布局、统一投资建设、统一资源调动和统一维护,针对江苏联通IT 云、CT 云、业务云,尤其是行业云如地(市)政务云、私有云,当前缺乏统一运营管理手段、云技术架构分散、集中维护管理难度大、IT 专业人员缺失的现状,本文探讨了一种多云环境下的集约化运营平台的功能建设方案,希望能解决痛点问题,满足业务需求,面向政企云客户提供电信级的保障手段,有效推动全省云运营集约化体系的改革落地,提升客户感知和服务质量。

2 多云网络现状与问题

2.1 现状

江苏联通目前建设有IT云、CT云、各类业务云,包括行业云、私有云等多种云资源池,这些云资源池的维护统一由省市两级云资源池维护团队负责,业务运营由产互公司负责。全省共有DC 数据中心15 个,云资源池23 个,资源池类型包括Xen、OpenStack+KVM、裸金属等,云厂商有中兴、华为、爱立信、沃云、华三、阿里、腾讯等,硬件设备厂商繁杂。上云的业务系统有410 个,物理设备1 457 台,云主机2 776 台。DC 组网方式有传统三层架构、硬件SDN 和软件SDN 架构。各云资源池均有独立的操作平台,有的云平台运营面和运维面无法分离,存在审计风险。

2.2 痛点分析

目前多云资源池的运营主要存在以下问题。

a)资源交付效率低下:主要以线下方式为主,通过电话、邮件、纸质单据等完成资源审批,周期长。

b)网络资源管理混乱:不同资源池的网络架构不一致,VLAN/VXLAN/IP等用户配置只能用Excel管理。

c)自助服务能力不足:云资源通过4A 堡垒机登录较多,但系统级故障处理仍依赖运维团队。

d)资源效率无法评估:硬件资产、虚拟化资产的使用情况无法得到有效评估。

e)运维工作量大且故障无法快速感知:硬件设备数量庞大,类型众多,多种虚拟化技术与云平台分开使用,维护人员需要在各种管理工具之间来回切换。传统的网管监控系统无法覆盖云资源池内的虚拟资源,无法及时感知云自身的运行状态。

3 需求分析

云网业务应以高质量发展为目标,通过数字化转型,提升业务的运营管理水平。集约化的多云管控平台的建设需求应运而生。该平台应具备以下基本功能。

a)缩短资源交付时间:将本系统与企业OA 或CBSS 流程结合,实现线上流程和资源发放全自动,显著提升资源交付效率,资源全流程开通平均时长由之前的数天缩短到小时或分钟级。

b)异构网络自动开通:将云内多种网络架构有机整合,通过统一的运维平面消除底层技术差异、简化配置步骤,网络开通方式由原来的手动和专业人员操作转变为业务部门自助按需开通,并且开放自助配置能力。

c)资源管理统一视图:将整体纳管本地行业云、私有云等多个异构云网资源池,提供全局资源评估和调度机制,有效平衡和提高云资源使用效率,方便从业务运营视角客观评价当前网络资源使用效能和收益情况。

d)简化运维工作:通过建立数据中心资产台账,增强设备带外管理、补全云内监控机制,建立应用和设备的端到端拓扑;通过自动化工具和智能算法进行异常检测和容量预测,以此简化运维工作,降低故障风险。

4 核心场景设计

针对不同业务场景对多云集约化运营平台的要求,站在不同使用者的视角,集约化平台应同时具备资源管理、运营、自服务和运维管理能力,满足以下用户场景需求。

a)外部客户可感知多样化的云产品和云服务,自助订购使用云网资源,及时掌握资源使用量和成本;内部用户通过合规流程获得云能力,自主维护云网资源,通过运维工单得到快速支撑。

b)外部系统调用API 进行数据集约共享、能力注册和开放,具备第三方快速适配和接入能力,可集成和扩展系统规模。

c)运营决策者可设计云产品和云网融合套餐,快速发布上线,灵活配置计费规则,感知云能力容量变化并做好预测、规划。

d)运维管理员整合云平台,统一视图,监控云资源运行状况,并根据负载进行调度,及时发现和处理故障。

5 平台架构设计

多云集约化运营平台通过屏蔽云之间的差异、抽象功能、统一概念,以标准化视图来简化全省业务云/产业云的业务运营、网络运维工作。平台主要功能模块包括资源管理、运营管理、自服务、运维管理和南北向API总线。异构云环境的统一视图主要是通过南向API 实现各云的对接纳管。北向API 用于对接第三方应用或集团平台,提供平台能力输出(见图1)。

运营管理模块主要实现产品配置和上线、客户和租户管理、订单管理和流程设计、计量计费、运营统计和分析。运维能力模块主要实现云资产管理、拓扑发现和可视化、自动化作业、异常检测、故障定位、故障预测。自助能力模块主要实现自服务、云资源自助开通/变更/注销、资源管理控制、订单/账单/清单管理。资管能力模块主要实现异构云平台统一视图、全生命周期管理、资源调度和编排、容量监控和预测、资源适配扩展API。

如图2 所示,各地的行业云、私有云可以通过DCI或城域网进行互联,在省中心部署多云集约化运营平台,各级用户分权分域在统一的平台上进行操作。

5.1 常用角色和流程

图1 集约化平台架构设计图

平台应具有以下5 种常用角色和标准工作流程,同时支持根据客户需求进行定制。常用角色分为系统管理员、运维管理员、运营管理员、租户管理员和普通用户。系统管理员负责维护人员组织架构和用户权限、设置系统基本参数。运维管理员负责云资源生命周期管理、性能监控、操作维护、资产管理、自动化运维、告警监控、报表管理、云资源工单处理。运营管理员负责维护租户及成员、发布服务、管理订单账单和订单审批。普通用户负责资源申请、监控、操作和查看申请单和流程。租户管理员负责管理普通用户所有功能、维护租户内项目和成员、审批租户内订单、查看租户账单。

图3 为5 种用户角色之间的标准工作流程图,体现了各角色的不同功能职责和工作流程。

5.2 云网融合功能

集约化平台不仅支持云资源的全自动开通,同时也支持下发物理/虚拟网元参数,完成租户VPC、出口网关和防火墙的全链路自动配置,实现从“开资源”到“开业务”的转变,一体化交付应用系统所需的计算、存储、网络资源和服务。

云网融合借助于资源管理模块,通过资源适配总线完成各类设备的纳管(见图4),在此基础上实现云资源和网络资源的一站式开通。

5.3 服务目录

服务目录是运营管理中的重要功能。服务目录可以将云能力封装成标准服务发布上线,自定义服务费率和生命周期策略,自定义服务模型,满足各类云业务场景,如图5所示。

a)支持合规化发放。服务目录可配置多场景不同流程,确保资源使用合规,支持根据IT 规范定制开发流程。

b)自动化配置。在资源交付之前可根据企业内控和基线要求,对资源进行初始配置、安全加固。

c)标准化封装。服务目录将公有云标准服务和私有/第三方非标准服务,采用统一标准封装对齐,统一面向业务部门提供能力。

6 结束语

图5 服务目录运行结构

集约化运营平台应为企业租户提供多种异构云的统一管理界面,一站式满足企业上云、用云、管云需求,为企业上云消除最后一公里障碍。由于现网的复杂性和多样性,可以分阶段规划实施多云环境下集约化运营平台方案。初期主要指云网协同,以各类云专线为代表,为企业提供云网套餐,帮助企业实现安全可靠的上云和组网。中后期运营商以云网融合为目标,实现关键能力垂直和水平扩展。垂直维度向上与企业应用深度融合,实现“云+网+X”,向下实现企业组网及IT 集成服务延伸,以云服务方式提供ICT 服务。水平维度向云网融合体验和产品创新方面持续扩展,优化用户体验,做强云计算产品。

猜你喜欢
云网多云租户
日本租房歧视跟种族有关
多租户SaaS应用系统关键技术分析
助力新基建,赋能企业高质量发展
向日葵·成长·礼物
多租户管理技术在运营管理系统的应用研究
航天云网科技发展有限责任公司
中国电信:云网通
一种基于安全标记的多租户访问控制方法
何氏“十全大补粥”