在线计费系统云计算应用研究

2013-08-10 03:41张金娟徐歆壹
电信科学 2013年10期
关键词:云化计费刀片

胡 虹 ,陈 娜 ,张金娟 ,徐歆壹

(1.中国电信股份有限公司广东分公司 广州 510081;2.中国电信股份有限公司广东研究院 广州510630)

1 引言

电信行业的计费系统是电信支撑系统BSS/OSS的核心模块之一,其灵活性、响应速度、支撑能力直接决定了电信运营商的服务水平和客户体验的满意程度。计费系统主要根据电信运营商签约用户的客户资料、消费行为、享受的服务等信息,计算用户消费所产生的清、账单费用,并以此完成费用优惠、缴费抵扣、信用控制等一系列动作。根据计费信息是否实时影响业务提供、账户余额更新的情况,计费系统可分为离线计费系统(offline charging system,OFCS)和在线计费系统(online charging system,OCS)。离线计费系统以联机方式得到用户使用记录后进行计费,计费信息不会实时影响业务提供;在线计费系统在用户使用业务的过程中直接与会话/服务控制交互,计费信息实时影响业务提供。

随着移动互联网时代发展高峰期的到来,电信行业的业务种类更加丰富,业务需求多种多样,系统实时响应的要求越来越高,在线计费系统的重要性更加凸显。近年来,在线计费系统的用户数不断增加,承载业务不断发展,现有系统架构大规模部署的成本随之剧增,在线计费系统部署的灵活性和可扩展性、计费应用的稳定性和可靠性受到空前的关注。

云计算相关技术的快速发展,为电信运营商带来了一次重要的变革机遇,在提高在线计费系统响应速度、提升系统稳定性、提高资源利用率、降低系统成本等方面提供了一个很好的突破口。

2 系统分析

2.1 系统特性

在线计费系统通过与核心网网元设备的不断交互,精确控制用户使用的业务,即用户使用业务的全过程中,OCS对外不断与核心网设备进行通信;对内在保留当前用户状态和费用信息的情况下,以一定的粒度不断重复批价、扣费的过程,直至用户使用完对应业务。在日常运营中,在线计费系统承载电信运营商大量的业务处理,具备以下几点特性。

(1)不间断性

在线计费系统每天都需要24h不间断地处理各种数据。一旦出现故障,在线计费服务中断,会导致用户欠费风险大、部分在线类控制业务无法开展等诸多问题。

(2)实时性

根据在线计费系统的工作原理,用户是否使用业务,需要在线计费系统进行实时控制,这对系统的计算、存储速度提出了很高的要求。

(3)可靠性

在线计费系统中的资源繁多,系统的数据量极大,数据处理涉及计费、批价等操作,因此数据的处理对系统的可靠性要求很高。尤其在移动互联网时代,数据业务的大量使用会导致大量的系统吞吐量。在高负载情况下,系统仍需很好地保持成功率,以保证高可靠性。

(4)稳定性

在线计费系统每天都需要24h不间断地处理各种数据,即使长时间处在一定压力下,其处理效率仍需要保持稳定水平,以确保客户良好的业务使用体验。

2.2 面临的挑战

随着业务的发展、OCS用户数的不断增加,现有系统架构大规模部署的成本越来越高,系统部署的局限性带来的负面影响越来越突出,主要有如下一些问题。

·设备要求有高端化趋势,IT预算压力大,设备成本、能耗成本居高不下。

·主机资源利用率不高,主备模式闲置了50%计算能力,无法共享计算资源,造成资源浪费。随着集约化运营的进一步深入,资源利用率低的问题将进一步凸显。

·扩容周期长,前期主机资源空闲,造成浪费,无法快速响应新业务的要求;后期主机资源紧张,造成运营风险,且升级、扩容出现故障时,系统响应中断时间较长,承担风险较高。

·横向扩展能力差,面对业务高峰存在性能瓶颈。

·多RG业务模式使得业务激增,数据业务的迅猛发展使得系统负荷大大增加,稳定性、可靠性受到全面挑战。

·缺乏有效的手段应对突发事件造成的短时间业务量激增的情况。

上述问题范围较广,从系统成本控制方面到在线计费系统的不间断、高效、稳定运营方面均有涉及。实际上,对于在线计费系统建设、运营过程中遇到的问题,云计算解决方案的某些特性恰好可以很好地解决。

3 云化分析与方案

3.1 云化分析

到底什么是云计算,目前还没有公认的定义。参考文献[1]认为云计算是一种商业计算模型,将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存储空间和信息服务。

对性能要求较高的在线计费系统,可通过网络把多个成本相对较低的刀片机整合成一个具有强大计算能力的系统,通过统一管理调度模块,根据各台刀片机的运行情况对核心网网元的业务请求进行分发,确保各请求可以及时得到响应,达到和小型机同样的效果,并且能很好地控制设备成本和能耗成本。

在系统处理性能方面,刀片服务器单CPU处理能力高于小型机,但每个刀片处理板只能配置2/4路CPU,而高端小型机可配置64路CPU;刀片服务器的可靠性、容错性、I/O性能亦低于小型机;从价格和耗电方面,刀片服务器具备一定的优势,如刀片服务器每TPCC单价远低于小型机,每瓦特/立方米的计算能力高于小型机。随着刀片服务器虚拟化技术的日臻完善,刀片机可以通过集群技术、高可靠的云管理平台替代私有的、费用昂贵的小型机,并提供同等性能的服务。同时,计费应用可共享硬件资源、集中管理软件、自动安装、自动更新,从而大大降低软硬件维护难度,为应用虚拟化提供很好的平台。

因此,从成本控制、系统维护以及整体趋势上,对可靠性、实时性要求较高的在线计费系统亦可以引入刀片服务器架构,通过虚拟化多机集群资源池、完善的冗余备份、故障恢复机制保证系统的可靠性,利用虚拟化技术保证系统在升级、扩容时的零停机,全面提高系统部署效率,保障系统运营的稳定和可靠。

但由于在线计费系统处理数据的客户敏感性,需要在高可靠性保证的基础上稳妥推进,尤其是在线计费系统实时性要求较高,需要制定周密的实施步骤,采用应用与数据分离的模式,通过应用集群部署,提高整体可靠性,以软件架构的高可靠性逐步替代硬件高可靠性,分阶段逐步从现有环境迁移到刀片服务器上,以达到降低成本、降低能耗、提高系统部署效率,同时又保证系统处理可靠性的目的。

3.2 云化方案

传统的计费系统只能使用指定的物理资源,经过物理平台的云化演进,可以通过云计算管理平台对系统的需求进行按需分配,保障系统的运行性能,提高物理资源利用率,系统可以自动、自发地进行伸缩性部署,物理资源的扩展也更加方便、快捷。

在线计费系统可采用如图1所示的架构进行设计,主机池中所有主机上的应用相同,任何一台主机出现故障后,都不会影响系统运行。升级时可以分批升级,不升级的主机进行正常业务的处理。数据资源共享可保证其中任何一个节点主机出现异常都不影响系统的正常业务处理。

图 1 在线计费系统总体架构

系统功能架构设计如图2所示,增加了路由管理、计费控制等功能模块。具体介绍如下。

图2 在线计费系统功能架构

接入域:实现外部网元设备稳定、安全的数据接入,实现可配置的数据路由分发。

功能域:实现OCS的计费和信控等业务功能。功能域将状态数据剥离数据域管理,所有功能均具备无状态特征。功能域以计费控制为核心,将协议适配器、计费引擎、计费网关等节点通过扩展协议动态调度。

数据域:负责保留会话状态、订购关系、账户账本等数据,根据数据聚合度分为共享数据存储和非共享数据存储。非共享数据由多内存数据库实例分区存储,并在主备机间实时同步;共享数据集中存储在一个数据实例上。数据域由小型机做双机热备份,数据在主备机间实时复制。

管理域:实现功能域内刀片应用的注册、激活、去激活、注销等功能,实现数据域集群管理的功能,提供路由参考数据的路由优化能力。

4 在线计费系统云化应用

4.1 应用实例

在线计费系统的架构按照图3部署。应用与业务、数据分离,统一由计费控制按负载均衡算法调度应用节点,实现横向扩展、负载均衡,并通过池化技术,实现主机的可扩展。计费控制、数据库为双机热备份,采用浮动IP地址;计费应用为集群方式,都是active;计费应用不保存会话信息,会话信息保存在内存库中。

如图3所示,多个计费节点可以部署在多台刀片服务器上,每台服务器上的计费节点具备的功能相同,同一个会话中的不同请求,通过这种无状态的架构模式分发到不同的计费节点上,达到应用无状态的目的,方便进行任务切割并进行分布式计算。通过计费调度平台,平衡各节点的运行效率,同时该平台作为整体架构的管理平台,通过心跳信号网络保持与各节点的心跳连接,一旦系统出现故障或者繁忙,马上启用资源池中的备份机,保障系统运行的可靠性和稳定性。

图3 在线计费系统云化架构

根据OCP,在线计费系统的业务相关性可通过会话标识进行关联,同一个会话的不同请求处理之间具有强相关性,后续更新的业务请求的业务信息只能从与之相关的初始业务请求中获得。此类相关性,可以考虑通过业务请求解耦,以保证业务请求的无关性和业务处理的正确性。业务处理流程如图4所示,网元发送请求消息给计费系统后,首先由计费控制根据各计费节点运行情况进行智能调度,将计费请求转发给对应的节点,计费应用节点接收到计费请求后,从内存库中获取与此条消息相关的会话信息进行批价,会话管理内容由内存库保存,计费节点不再保存会话信息。

图4 业务处理流程

4.2 实施效果

通过本云化实施方案,可以达到以下几方面效果。

·降低成本:引入x86刀片服务器架构,大幅降低设备采购成本和能耗成本,节能减排。

·以软件架构高可靠性代替硬件高可靠性:应用无状态、多机集群。

·降低软硬件维护难度:采用云平台统一管理方案,提高系统管理自动化程度。

·近线性横向扩展能力:扩容过程简单灵活,即插即用。短时间内迅速提升支撑能力。

·保证系统稳定性、可靠性:应用与数据分离,应用集群部署。

4.3 部署要点

在实际部署中,考虑到数据的重要性,采用双机备份的方式,随着后期云化方案的逐步完善再分批进行数据云化。应用和内存库部署需遵循一定的原则,主要有如下3方面:

·应用和内存库数据在逻辑设计上要分离;

·支持物理上的灵活部署,各系统的内存库可以部署在一起也可以分开;

·为了提高应用的效率并减少网络占用,某些应用可以和内存库物理部署在一起。

在线计费系统应用和内存库合并部署和分别部署的比较见表1。

表1 部署对比

图5 部署示例

数据部署架构如图5所示,不同的本地网使用不同的内存库,对于多个本地网用户容量不足内存库半配的,可合并到一个内存库,以提高资源利用率。一个物理库实例对应一个内存库,物理库采用小型机,内存库可以采用刀片服务器。

此外,大本地网按客户维度分布实现分布式部署,为了保证应用的顺利实施,一个客户下的账户、用户信息必须处于同一数据库中。若关系实体中关联的两个客户、两个用户、两个账户、用户与账户等,其归属的客户不是同一客户,且两个客户被分布于两个数据库时,账务关系存在统一数据库,“一点维护”复制到每个相关数据库使用。

根据实际实施情况,用户数增长,对应的机器增加,相应添加路由,在采用刀片服务器的情况下宁可预留部分资源,达到减少数据迁移的目的。

5 演进步骤与目标

系统的云化演进工作是一个非常具有挑战性的复杂的系统工程,如果要成功实现云化,需要进行大量的研究与实践,通过充分的前期准备工作,对云化架构进行深入的研究与验证,经验得到大量储备后,才能根据演进策略进行分步实施;在具有一定的实际建设运维经验之后,才能对核心业务进行分布式迁移,保障系统支撑能力的平稳运行;最后对云计算创新、创收阶段进行研究实施,为电信运营商寻求新的盈利点。云计算演进步骤如图6所示。

6 结束语

对在线计费系统的特点及面临的问题进行了分析和论述,并针对在线计费系统的特点设计实施方案,最后对系统云化的演进步骤和目标进行了总结,对其他系统的云化有一定的借鉴作用。在线计费系统的云化需要进一步研究的内容还有很多,如支撑的业务量大、相关数据种类多、很难验证实现所有数据节点云化的可行性;某些特殊的数据耦合度较高,处理上很难做到完全独立;有些业务导致的数据必须串行化处理等。

图6 云计算演进步骤

1 刘鹏.云计算.北京:电子工业出版社,2012

2 3GPP TS 32.296.Online Charging System(OCS):Application and Interfaces,2009

3 中国电信在线计费系统(OCS)技术规范,2012

4 TMF.The business process framework for the information and communications services industry release 6.0(DK).http://www.tmforum.org,2011

5 陶彩霞,陈康,郝颖.云计算在电信支撑系统领域的应用分析.电信科学,2010,26(10)

6 朱近之.智慧的云计算.北京:电子工业出版社,2010

7 Nielsen D.关键云计算平台及框架.第4届中国云计算大会,北京,中国,2012

8 Ruest N,Ruest D.虚拟化技术指南.陈奋译.北京:机械工业出版社,2011

9 Krissi D.Distinguishing cloud computing from utility computing.http://www.Ebizq.net,2011

猜你喜欢
云化计费刀片
5G网络独立组网中融合计费方案的研究
基于云计算和微服务架构的高速公路计费系统
圆盘剪高速剪切时的刀片温度分析
生活中的分段计费
5G/云化下的VR产业未来
圆刀片切削力计算方法
IBM中国企业云化实践中心成立
核心网云化技术的分析
圆刀片淬火裂纹分析及防止措施
基于AM3354的电动汽车充电监控计费系统电表通信的实现