赵晶
(中国移动通信集团设计院有限公司北京分公司,北京 100038)
经过近几年的建设,中国移动已经成功建立起了若干增值业务运营业务平台、完善的计费账务支撑保障的BOSS以及面向决策支持的经营分析系统。这些系统积累了中国移动业务发展的海量信息,并初步建立了面向企业运营的统一数据信息平台,为经营决策、市场营销、业务实施、客户服务等工作提供了有效支撑。
但是,随着智能手机的普及,手机上网量和数据业务爆炸性增长,如何在现有平台的基础上合理有效的建立起一套关于流量的分析和支撑体系,为中国移动流量收入提升提供有效保障,满足未来市场的发展需要,是业务运营支撑急需解决的问题。
目前,数据流量收入已超过点对点短信,成为拉动数据业务收入增长的主要驱动力。但数据流量经营中仍存在诸多问题。
(1)用户行为感知能力弱:无法及时感知用户的浏览内容、位置、网络、终端等重要用户行为信息,从而无法为客户提供相应服务和精确营销。
(2)网络协同能力弱:2G网络、3G网络、WLAN网络业务承载率差距大,各网络资源利用率严重不均,2G网络流量业务接近饱和,无法及时对2G网络用户进行分流。
(3)缺乏精细化营销手段:无法及时洞悉客户行为,缺少用户行为轨迹信息,故无法对客户进行精确营销,业务部门缺乏自有产品应用和资费套餐的主动有效营销手段。
(4)用户个性化服务保障待提升:无法针对不同级别的客户提供不同的流量控制策略和服务。用户无法查询流量使用的内容详单。
针对以上问题,需要借助平台支撑能力,协同用户、应用、终端、网络、渠道等多个环节,共同推进,融合发展。
(1)通过流量分析经营管理支撑手段,使管理人员能够及时准确地了解市场竞争、业务发展和资源使用情况,以便及时发现问题和解决问题,这也是电信经营分析系统的价值所在。
(2)真实掌握客户流量业务中的行为,掌握客户画像,为用户提供更加有价值的应用,提升客户满意度,促进收入提升。
(3)针对终端、互联网应用、用户关联分析的营销。
基于用户终端信息、位置信息、流量内容分析等多维度关联数据分析是流量经营的基础支撑能力,是流量经营发展中重要的数据输入,以及衍生价值来源。
探索潜在的市场机会,智能地从数据中提取与营销相关的信息和知识,为市场营销和决策人员制定业务发展和市场竞争策略提供科学、准确、及时的依据。基于终端、互联网应用、用户等多维度关联分析的营销支撑数据,对促进移动数据业务的发展发挥重大的关键性作用。
流量型业务面对电信联通等电信运营商的端到端的竞争优势,内容型功能性业务面对着互联网各种应用的直接竞争,面对多元化的选择,用户的需求已经从传统功能实现到个性化、及时的信息服务转变。构建基于客户行为的运营能力,支持自有产品、门户网站等产品能力提升、支持业务营销等运营工作开展,构建以客户为中心的运营能力是未来数据业务发展的关键。
系统总体分为3个部分:数据分光,数据采集,后台分析系统。
数据分光就是在光传输通路上采用分光的方式,获取与原链路相同的数据。根据业务需求的不同,可以从网络的不同节点进行分光,主要包括如下方案。
(1) 对CMNET出口链路 “旁路分光”,采集和分析总的CMNET流量数据,如图1所示。
图1 CMNET出口链路分光方案
(2) 对IDC业务出口链路“旁路分光”,采集和分析IDC业务数据,如图2所示。
图2 IDC出口链路分光方案
(3) 对Gn接口链路“旁路分光”,采集和分析GPRS上网数据,如图3所示。
(1)旁路专业设备采集:旁路专业设备采用硬件板卡处理,性能可满足基础分析、识别功能。但扩展性有限,例如要实现基于内容的精细分析审计,及全量数据采集,通信质量监测,用户差异化服务等需要突破硬件性能瓶颈。
图3 Gn口链路分光方案
(2)旁路通用PC集群采集:采用旁路通用PC集群分析的能力、稳定性、准确性较高,通过合理配置分析服务板卡数,实现各类应用所需分析,无性能瓶颈,可为互联网精细化运营运维进行各类型任意规模的数据流分析。
根据数据流量经营支撑系统的检测原理,主要有深度报文检测(DPI)和深度流检测(DFI)两种方式。
深度报文检测通过深度分析报文净荷中的特征指纹进行业务识别和分类,通过对每个数据分组进行内容分析,得到数据流的特性,是目前识别协议和应用最重要的技术手段。
深度流检测能够动态根据每个流(IP五元组)的流量统计规律和连接规律,例如连接速率、流持续时间、报文长度分布等进行分析,对流进行分类。
深度报文检测适用于标准协议和非加密应用的识别,可以细分到具体的应用软件,深度流检测适用于私有或加密应用的识别,分类较粗。
后台分析系统主要实现系统管理,数据分析处理,各种XDR数据及报表数据生成及存储等功能。后台分析系统主要管理服务器,业务分析服务器,数据库服务器和接口服务器,以及存储设备等。
2.4.1 业务分析服务器配置方法
根据TpmC值进行服务器设备的配置,如表1所示,业务分析服务器的TpmC计算方法如下。
表1 业务分析服务器的配置参数表
处理Gn数据所需TpmC=忙时PDP激活次数×10 000/60 min×平均每次PDP活动产生的记录数/一次事务处理记录数×事务中XDR数据与统计数据占比(1+6%)。
处理WLAN数据所需TpmC =AP总数×单AP支持用户数×用户并发系数×每用户session数×60 s/在网时长(min)。
2.4.2 存储配置方法
2.4.2.1 GPRS数据所需存储容量计算方法
每次PDP激活所需XDR存储空间(MB)=平均每次PDP活动产生的记录数100×XDR每条记录平均字节数300/1024/1024。
XDR数据存储裸容量(TB)=忙时PDP激活次数×每次PDP激活所需XDR存储空间×每天忙时×XDR存储压缩60%×XDR保存天数90。
统计数据存储裸容量(TB)=忙时PDP激活次数×每次PDP激活所需XDR存储空间×每天忙时×统计文件占XDR数据文件比例×统计数据保存天数365。
Gn数据共需存储空间=(XDR数据存储裸容量+统计数据存储裸容量)/存储利用率/ RAID利用率。
2.4.2.2 WLAN数据所需容量计算方法
XDR数据存储裸容量(TB)=每天事件数×每事件记录字节×数据压缩率×保存天数/1 024/1 024/1 024/1 024。
图4 系统功能架构
统计数据存储裸容量(TB)=每天事件数×每事件记录字节×统计文件占XDR数据文件比例×统计数据保存天数365。
WLAN数据共需存储空间=(XDR数据存储裸容量+统计数据存储裸容量)/存储利用率/RAID利用率。
采集层:采集层主要实现各类数据采集,采取实时或准实时方式以文件或数据流形式从各个接口系统采集数据。
数据处理层:主要完成流量数据采集信息的预处理和数据匹配,对流量内容语义的解析,对标签信息的特征识别等,同时对内容信息、用户信息、应用信息、终端信息、用户偏好信息等进行信息管理。
应用功能层:应用功能层主要实现用户、套餐、终端、应用、内容、网络流量的监控和分析,在监控和分析用户的行为特征偏好,在分析的基础上建立相应的营销支撑能力。
运营支撑层:运营支撑层主要实现业务应用和业务运营的相关支撑。
本文结合当前数据业务发展形势,分析了运营商在流量经营过程中存在的问题,并针对性的提出了建设流量经营支撑系统的技术方案分析和建设思路,为运营商的相关系统建设提供了参考方案。
[1] 杜娟. 移动互联网流量经营策略研究[J]. 邮电设计技术,2011,(5).
[2] 宋俊德, 马琳. 谈谈智能管道和智能运营支撑平台[J]. 电信科学, 2011,(2).