叶卫华 江西省邮电规划设计院有限公司 南昌市 330002
随着用户规模和业务的不断发展,运营商内部的IT系统规模不断增大,各类数据业务数量日益增多,如果沿用传统的从硬件到应用相互独立的烟囱式部署方式,IT设备采购和部署将面临越来越大的压力,各类IT设备的资源将无法得到有效利用,资源复用率低,成本投入浪费严重。
在新的全业务竞争形式及运营商转型要求下,IT系统仍然面临极大挑战,在IT支撑建设转型过程中,首当其冲就是要推动IT基础资源建设层面的集中化、标准化和简化工作。因此网管支撑系统基础资源池的建设是非常必要的。
本文就以分析某运营商网管支撑系统现状中存在的问题为契机,试着就网管支撑系统基础资源池工程建设思路及关键技术进行探讨,希望本文能起到一个抛砖引玉的作用,能有效指导类似网管支撑系统基础资源池工程项目的高效建设。
运营商的IT支撑网主要分为BSSOSSMSS三个支撑系统,即业务支撑系统、网络支撑系统、管理支撑系统。业务支撑系统包括CRM、 BOSS、经营分析、BOMC、呼叫中心平台、电子渠道、ESOP、VGOP等;网络支撑系统包括话务、传输、数据、拨测等专业网管、资源、监控、信令监测、开通激活、运维等;管理支撑系统包括统一信息平台、ERP等。
IT支撑系统涉及了七大类IT基础资源(小型机、存储、带库、SAN交换机、网络设备、x86服务器、系统软件) 和 应用软件以及配套。
(1)跨项目、跨系统间基础资源共享调度难,资源利用率有待进一步提升。
跨项目、跨系统目间资源共享、资源调配在具体流程规范中操作难度大;基础资源灵活调度能力不足,资源动态管理与利用率需进一步提升;烟囱式部署方式也带来运维系统困难,另包机包系统使维护人员不断增加。
(2)涉及项目数量多、流程重复工作量大、跨部门工作效率低。
单系统、单项目推进,项目数量众多;每一个项目,无论大小,基础资源均要经历立项、采购、工程设计、工程验收及转资等内部流程;流程各环节重复工作量大,工作效率低,亟待整合。
(3)设备供货、建设周期长,在业务转型阶段,投产交付慢,支撑不及时。
基础资源系统集采化比例高,集团一年一次集采,受集采启动时间晚、采购周期长,到货时间晚,机房条件紧张等因素,影响对业务发展支撑的及时性。
网管支撑系统作为IT支撑网三大支撑系统之一的OSS,主要实现对综合性网管(资源、监控、开通、分析,电子运维、网络投诉、信令检测等)、专业网管(包括话务、传输、数据、WLAN、动环、拨测、智能巡检、业务质量检测等)和各厂家自带的OMC性网管系统相关的基础资源类需求支撑。
根据支撑网各系统数据库、应用、备份部署等扩容需求,采购各类硬件及第三方软件,构建网管支撑系统基础资源池,结合支撑网机房节点部署、现网系统硬件资源确定组网架构。
在统一架构下重点打造“业务支撑”、“管理支撑”、“网络支撑”三个子池,每个池包括主机、存储、网络、备份、x86五个逻辑部分,IT支撑网整体采用集中、统一的资源池管理平台。
网管支撑系统基础资源池按“集中池构建、动态灵活能力提升、标准服务能力输出”三阶段规划演进。
2.3.1 主机虚拟化技术
服务器虚拟化(又称为计算系统虚拟化)是指在一台物理主机上虚拟出多个虚拟机(Virtual Machine,VM),各个虚拟机之间相互隔离,并能同时运行相互独立的操作系统,这些客户操作系统(Guest OS)通过虚拟机管理器(Virtual Machine Monitor,VMM)访问实际的物理资源,并进行管理。
服务器虚拟化需要满足一致性、高效性、可控性。一致性是指程序在虚拟机上运行的效果必须与物理主机上运行的效果一致;高效性是指程序在虚拟机上运行造成的性能代价较低,亦即要求虚拟机的大部分指令能够直接在物理主机上运行;可控性是指虚拟机管理器能够完全控制物理主机的资源,保证虚拟机之间的独立性隔离性,同时虚拟机管理器能够收回已分配给虚拟机的资源。
服务器虚拟化的核心是虚拟化平台(Hypervisor),分为商业软件(VMWare ESXi和Citrix XenServer等)和开源软件(Xen和KVM等)两大阵营。商业软件成熟、稳定、功能丰富、技术支持能力强,但成本较高;开源软件则以免费取胜,产品免费,虽然仍需支付技术支持费用,总拥有成本仍远小于商业软件。
2.3.2 存储虚拟化技术
云存储主要有两大应用需求。一是新建存储资源池,二是整合利旧已有存储设备。
新建存储资源池时,主要采购商用存储产品,总体上可以分为集中式存储和分布式存储。集中式存储按照技术架构可分为SAN和NAS,其中SAN又可细分为FC SAN、IP SAN、FCoE SAN。目前FC SAN和IP SAN技术都已比较成熟,FCoE SAN目前还处于发展初期,分布式存储也已有不少商用产品和成熟案例,各种存储产品有其各自的特点和优劣势,适合不同的应用场景,应结合具体应用需求,综合考虑性能、价格等因素进行选择。对于虚拟机的镜像文件,建议采用SAN存储方式建设存储池;对于虚拟机的数据存储,可综合考虑性能、成本等因素,选择SAN存储或分布式存储方式建设存储资源池。
考虑整合利旧原有存储资源时,可采用的方式有三种。一是基于主机的存储虚拟化,二是基于存储设备的存储虚拟化,三是基于网络的存储整合,即依赖于在存储网络中添加相应的虚拟化设备而实现对存储网络中存储设备的虚拟化。存储整合时,需综合考虑不同方式对原有存储数据的影响性、存储池化的成本、以及现有存储设备的特点等方面进行综合评估。
对为充分利旧原有存储设备而整合存储资源池,目前主要的方式有两种:
方式一:采用纯软件的方式
方式二:采用在主机和存储设备中增加中间层的方式
对于不同的方式,需考虑从整合存储设备本身的特点、存储池化的成本、实施的可操作性等方面进行评估。
2.4.1 实施部署原则
(1)构建池化实施:物理层面,与现网各类物理资源融合组池,资源池物理层面涵盖所有支撑系统;
(2)应用系统分级部署:逻辑层面,根据业务特性对应用系统进行分类分级,依据“先边缘,再核心”原则,逐步提升资源池动态、弹性逻辑部署能力;
(3)子池部署场景:小型机子池重点部署核心数据库节点、高计算需求节点,逐步降低规模;x86子池重点部署web应用,分布式数据库、接口、边缘系统等,逐步扩大应用范围。
2.4.2 容量管理原则
(1)容量变更:资源池设备新增、扩容、替换需求,根据“控制总量、优化增量、提高质量、盘活存量”的基本原则进行评估;
(2)容量管理模型:从业务处理能力(用户数、话单数、业务种类、网络中各类网元数量等)、系统处理能力(TPMC、存储容量等)、服务水平(稳定性、响应速度等)三大维度构建设备容量管理指标模型,作为相关容量管理的计算依据。
(3)跨部门职责分工与协同:需求、规划、生产维护、工程建设、采购等共同参与协作。
某市网管机房由1#、2#、3#、4#机房等四个节点构成,设备网络拓扑如下图所示:
通过前期的网管系统集中备份建设,网管系统目前完成网管集中备份能力建设;建立了网管系统重要性备份恢复保护等级机制,提升关键系统备份能力;建立了网管集中备份恢复测试验证环境。
从以上网络拓扑图及运营商提供的其它资料可以看出网管系统存在的主要问题包括机房分散建设、单机房容量过小、系统设备分散,基础设施整体架构设计与管理难度比较大;网管支撑系统备份能力不足,备份后未建立规范的备份恢复演练流程和工作制度,缺乏恢复测试验证环境,存在备份介质无法恢复的风险;各应用软件升级上线前测试不足。
工程应用中该网管支撑系统基础资源池的建设共纳入综合性网管、专业网管和厂商自带设备网管OMC的基础资源类需求,根据“控制总量、优化增量、提高质量、盘活存量”的基本原则进行建设。
根据业务测算综合性网管资源最终确定增加主机处理能力共2000万TPMC,增加存储裸容量120TB;专业网管系统资源增加主机处理能力共500万TPMC,增加存储裸容量40TB;网管OMC系统资源增加主机处理能力共300万TPMC;增加存储裸容量10TB。合计增加主机处理能力共2800万TPMC,增加存储裸容量170TB。
根据上述测算结果,该网管支撑系统基础资源池新增10台小型机设备,共新增处理能力2800万TPMC,新增96台X86服务器以满足X86资源池(包含路测服务器、网络优化、专业网管采集机、WLAN采集机、信令监测、联机指令网络激活、测试服务器、家庭网关及集客IMS管理平台、网络投诉平台、智能巡检、业务开通)需求。新增1套磁盘阵列,裸容量为140TB;同时对现网一套磁盘阵列进行扩容,新增30TB裸容量。
该期网管支撑系统基础资源池的改造建设最少能满足今后5-10年的发展,依据上述的基础资源池部署和管理思路进行集约化建设可使人力、硬件等相关成本节约30%以上,社会效益和经济效益明显。
一方面,网管支撑系统基础资源池的建设涉及到众多厂家的服务器、磁盘阵列、带库等硬件设备,在项目建设过程中设备的选型、软硬件兼容性、系统的升级维护等问题都有可能对整个项目建设产生影响,因此,要做好基础资源池项目建设的风险因素分析,尽量避免项目建设中各种潜在问题的发生,将项目建设的风险最小化。另一方面,建立运营商的网管支撑系统基础资源池系统,通过大规模集中采购、建设和维护IT基础设施,并借助虚拟化和云计算等新技术带来的优势,可逐步实现进一步降低整体IT系统的建设和运营成本,加快应用部署快速目标的实现。
在新的全业务竞争形式和运营商转型要求下,IT系统建设仍然面临极大挑战,在IT支撑系统建设转型过程中,最关键就是要推动IT基础资源建设层面的集中化、标准化和简单化工作。因此引入主机虚拟化技术、存储虚拟化技术等关键技术及“集中池构建、动态灵活能力提升、标准服务能力输出”的建设思路对今后网管支撑系统基础资源池的集约化建设是非常必要的。