黄莎,魏宗静,徐秋连,冉小刚
(中国移动通信集团四川有限公司,成都 610041)
基于多数据源关联的市网分析产品终端战略地图*
黄莎,魏宗静,徐秋连,冉小刚
(中国移动通信集团四川有限公司,成都 610041)
终端战略地图是四川公司立足LTE、流量、终端等公司关注的焦点,依托网优中心整体技术优势,以终端客户行为研究为核心开发的市网分析产品,旨在提升市网匹配协同度的成功案例。系统首次聚合网络侧2G/3G/4G信令监测数据、市场侧经分数据等11个数据源并进行关联挖掘,提供了4G驻留比优化、终端在网分布、用户位置研究、业务喜好画像等特色应用功能。系统在支撑网络面向运营的转型的同时,提升市场精细营销成功率和市场网络协同度,助力4G超常规发展。
数据关联;客户行为分析;市网协同;4G超常规发展
步入互联网时代,通信行业逐渐从传统路线演进到以多样化、精细化服务为核心的市场竞争态,传统经营分析类系统的分析功能已不能满足客户日益增长的个性化需求。终端战略地图产品立足LTE、流量、终端等公司关注的焦点,关联网络、市场多维数据,深入挖掘聚合数据隐藏的终端客户行为信息,依托原创的终端锁网原因分析、用户轨迹分析等算法,打造多项特色应用。一方面将用户位置等网络数据营销给市场,提升试点区域的市场精细化营销成功率;另一方面将客户价值等市场数据输送给网络,使网规网优更加贴近于实际客户需求,提升LTE网络的利用率和网络价值;通过以上手段,促进市场、网络协同发展的步调一致,提升客户感知。
(1)移动通信市场空间有限,如何在保有存量客户的同时,有力挖掘发展新客户,持续挖掘已有客户的业务潜力、消费潜力,提升客户流量、客户价值,不断提升客户的业务使用感知,是公司一直关注的关键问题。
(2)随着客户消费能力和需求水平的不断提升,客户更加期望运营商为其提供更为智能化、个性化的业务服务,对运营商的服务能力提出了新要求。如何提供更主动、更高效、更准确的一体化体验式服务重要性凸现。如何加强移动内部资源的整合,完善服务支撑体系建设已迫在眉睫。
(3)运营商对客户本身缺乏深入了解,传统的话单数据缺乏客户的业务行为信息,无法真正准确掌握各类客户的业务喜好和业务需求。客户分级方式线条还较为粗放,仅从客户的当前消费能力等来定义客户所属级别,未考虑客户在未来的潜在可开发价值及其他可分级属性。客户属性信息的不完备会给各类业务的拓展带来障碍,精细化营销活动效果受限。
(4)由于精细营销所需数据众多,数据来自多个独立部门,部门间缺乏快速的数据提取机制与跨部门数据聚合分析平台,造成整个数据提取流程繁杂、过程漫长,不利于注重时效性的精细营销活动的及时开展,影响营销效率。
(5)部分区域市场、网络发展不均衡,业务量高、客户价值高的区域并未完全对应网络建设、维护、优化的高优先级别,LTE网络的整体价值提升受限,需要特色应用支撑“网规向高投资收益比区域倾斜,网优优先确保高价值用户、高价值业务的感知,市场聚焦网络质量良好但利用率较低且4G客户分布少的区域拓展业务”的思路提供数据与方案支撑。
3.1产品概述
通过关联2G/3G/4G信令、BOSS、网管、资管等多维数据,深入挖掘客户的终端使用时长、平均换机周期、品牌偏好、业务偏好、锁网行为、开关机习惯、实时位置、住宅小区等信息,提升市网聚合数据价值。通过自创算法,进行客户的使用行为分析,科学量化客户的终端、宽带等项目可营销指数,为市场2G/3G高流量客户迁移、4G终端投放、宽带驻点营销等营销活动提供数据与工具支撑;通过分析4G驻留比等指标,对网络倒流流量成因进行溯源分析,区分网络原因导致的倒流流量、市场原因导致的倒流流量,并对可用于提升不同区域4G驻留比的市场手段/网络手段进行细分,助力网络、市场发展步调一致,部门协同发挥最大能效。
3.2产品数据源
产品使用了CS域信令(MC口信令、SGs接口信令、C/D口信令数据)、PS域(GB口信令、Iu-Ps口信令、S1-MME接口信令、S1-U接口信令、S6A接口信令、4G MR数据、BOSS数据、业支数据、资管数据、网管数据、互联网数据、地图数据、终端库数据共计16类数据源,并计划引入客户的终端投诉数据,完善客户行为分析。
信令数据采集提取范围:所有试点地市;
信令数据采集提取频次:实时采集,每分钟生成采集文件,实时解析上传。
3.3产品架构
系统整体功能架构严格遵从中国移动集团公司三层架构的规范,将应用和数据进行解耦,层次之间设计逻辑清晰,层与层之间采用服务方式进行数据生产和供给,每个层内部有严格的层次数据处理规则和逻辑,层内部算法相互独立,数据源扩充简单方便。
系统接入层实现对多源数据的采集和接入,根据前期项目建设的经验和四川公司的实际情况。海量用户信令日志包括G/T/L多种网络制式数据和MR数据,还包括了地市自建信令数据平台、省公司信令平台、集团上网日志平台等多个厂家和多个数据源的情况;数据源还包括互联网数据、网络基础数据(如工参、资管、网管等)、用户信息数据、终端库数据等多种数据源。
数据共享层从数据接入层获取的标准化数据中抽取要素信息,构建一次汇聚和二次汇聚数据、指标数据、网络性能数据等,向上层应用提供数据集市,在处理过程中,软件技术上包含了大数据处理和流式数据处理等多个方面的处理技术。
数据应用层根据本期项目的应用特性,并参考前期已经建设的项目情况,进行数据宽表和应用数据的计算,构建业务分析、终端分析、网络分析等多个数据应用功能域,并向外部系统提供功能调用和接口服务。
3.4产品主要创新算法
3.4.1基于行为聚类的用户位置识别算法
本项目充分利用基于CS/PS信令监测、MR、GPS、资管、百度地图等7个数据源41个字段,相对于单纯的Mc口、LTE等信令监测得出的位置精准度有大幅度的提高,采用模糊C均值(FCM)聚类算法,按照用户的XDR记录数据,并按照时间维度和周期性校验方式,并分别得出用户住家小区、工作地等位置衍生信息。
模糊C均值(FCM)聚类算法是基于目标函数的模糊聚类算法的典型代表。FCM算法的主要目的在于,将向量空间的样本点按照某种距离度量划分成多个子空间,不需要训练样本,可以直接通过机器学习达到自动分类的目的。是一种快速、高效的位置聚类算法。
算法的主要过程:
(1)抽取多个数据源获取的用户位置信息,形成用户位置向量矩阵。
X={X1, X2, ……, XN}
其中Xi=(xi, yi)为记录的用户所在位置坐标
(2)目标函数。
其中c为聚类数量,ui,j为随机产生初始化c×N维隶属度矩阵,di,k为样本Xk与第i个聚类中心向量Vi的欧式(Euclid)距离。
(4)第r+1次和第r次迭代的隶属度矩阵的||J(r+1)-J(r)||<ε,即欧式距离小于门限时,迭代终止。得到的聚类中心向量Vi即为第i个分组的用户位置。
3.4.2基于遗传算法的用户业务行为轨迹提取算法
采用CS/PS域信令监测、资管、MR等5个数据源37个字段,提取特定用户使用2G/3G/4G,CS/PS业务时的地理路径。其中2G/3G流量分布路径,是判断用户主动关闭4G功能的重要依据。
地理路径提取采用遗传算法(Genetic Algorithm)。根据用户使用业务过程的小区变换过程,形成转移矩阵。计算转移矩阵最多可覆盖的栅格的最优解。从而形成用户行进轨迹。
具体的操作步骤:
3.4.2.1数据预处理
(1) 用户数据地理覆盖区域的栅格化:即将特定用户所有的地理测量点所在区域栅格化,后续计算,均以栅格为最小的地理计算单元。
(2) 栅格点概率及转移概率矩阵建立。
栅格点概率:pi,j=sumi,j/sun_Total,其中sumi,j为用户数据落入(i,j)对应的栅格的数量,sun_Total为用户数据点总数。
转移概率矩阵:P(i,j)→(k,r)=pi,j×pk,r×μ(i,j,k,r),其中,μ(i,j,k,r)为从栅格(i,j)到(k,r)的置信度函数。
μ(i,j,k,r)主要用于判断栅格(i,j)到(k,r)的可能性,可以使用栅格(i,j)到(k,r)的欧氏距离的倒数来进行计算:
μ(i,j,k,r)=ω×{1/[d(i,j,k,r)]},其中d(i,j,k,r)为栅格(i,j)到(k,r)的欧氏距离, ω为判决函数,比较简单的方法是:
即2个栅格点距离小于门限D时,转移才有效,否则ω为0,表示2栅格距离太远,之间不可能转移。
3.4.2.2初始遗传种群建立
(1) 基因集合生成:扫描所有栅格,当该栅格内有用户数据时,该栅格进入基因集合,从而形成基因集合G={g1, g2, ……, gM}
(2) 染色体集合生成:设栅格化电子地图栅格列数为N,从上述基因集合中,选择N个基因,生成染色体C={c1, c2, ……, cN}。其中,c1, c2, ……, cN按照从第一列开始,逐列选择。
(3) 初始种群生成:设种群的规模为M,随机生成初始化种群生成的染色体集合Ci={c1, c2, ……, cN},下图所示为其中一个基因。
3.4.2.3迭代搜索
(1) 对于选定规模为M的遗传种群,按照栅格间的转移矩阵P(i,j)→(k,r)=pi,j×pk,r×μ(i,j,k,r),计算本次遗传的最优解,即遗传种群所对应的目标路径的总体转移概率的最大值,即评价函数最大值。
(2) 种群交叉变异,生成下一次迭代的路径。
设种群规模为M,第一次选取(C1,C2)作为双亲,第二次选取(C2,C3)双亲……第j次选取(Cj,Cj+1)双亲,交叉操作完成后产生多个新的子个体。
其中α,β为(0,1)区间的随机数。生成的新的基于集合C'j={c1, c2,…… cN}即为下次迭代的初始值。
3.4.2.4最优路径确定
2次迭代的评价函数误差小于门限时,即|fn-fn-1|<ε,停止迭代,输出最优路径。
4.1面向市场,助力精细化营销成功率的提升
4.1.1宽带支撑
目标:解决“不知道这个小区的移动宽带将向谁推销”的问题,提升宽带营销成功率。
优势:
将住宅小区宽带资源和潜在用户关联;
通过潜在用户的业务喜好、消费水平、资费套餐、快速上网需求等确定营销优先级。
难点/创新点:用户住宅小区无法直接提取,项目通过自创算法关联多数据获得。
4.1.2渠道支撑
目标:为增加渠道管理力度提供数据支撑,同时也为渠道销售终端(配件)类型、推荐业务类型等提供支撑。
优势:提供渠道周边消费水平、人流量、平均MOU/ DOU、业务喜好、新增/存量市场的终端分布等信息。
难点/创新点:用户归属渠道的获取。
4.1.3换机/换卡/流量促销模块
目标:提高营销成功率,让有限营销成本发挥更大的能效。
优势:综合网络覆盖、业务喜好、终端类型、是否有快速上网需求、消费能力等因素经综合运算后确定营销优先级。
营销优先级支持用户自定义算法,满足差异化需求;
用户明细提供常驻位置、归属渠道、开关机信息等特有信息,支撑就近渠道在用户开机时刻进行外呼营销/在用户常驻小区做针对性驻点营销,增加用户信任度,提升营销成功率。利用明细中提供的用户常用业务、套餐订购等业务行为信息,可进行业务套餐的促销,一举多得,提高营销效率。
4.1.4锁网分析模块
目标:减少锁网用户,提升用户DOU/MOU,提升移动收入;
优势:能区分用户锁网原因(主动锁网、无网络覆盖、未换USIM卡),达到对不同原因锁网采用不同手段消除的目的;
难点/创新点:对主动锁网用户的精确判定。
4.2助力网规网优面向价值导向转型
目标:以一线需求为工作出发点,实现网规网优面向客户需求的转型。
优势:4G投资收益比提升:分析4G驻留比与4G利用率,对可用于提升不同区域4G利用率的市场/网络手段进行细分、确认目标用户、目标区域和预计提升空间。
呈现区域/基站收入、倒流情况、用户业务喜好、终端类型等数据,为"网规向高投资收益比区域倾斜,网优优先确保高价值用户/业务感知”提供数据支撑。
4.3面向终端业务体验提升
目标:解决终端网络交互类问题定位处理工具手段缺失的问题,提升投诉处理效率。
优势:提供终端价值健康度、质量健康度、业务喜好的画像,提供终端网络交互类质差指标的自动化分析模型;
难点/创新点:自动化的质差分析模型(专利支撑)。
图1 终端画像功能
图1为终端画像功能。
该项目主要来源与信令和资管、网管、BOSS数据,不受地域差别、设备类型、标准制式等其它因素的影响,可在中国移动内部(甚至更广)区域推广,项目在四川第二大城市绵阳试点,试点期间成效显著。
5.1面向市场营销网络数据
利用终端战略地图,市网协同开展精细化营销。试点区域2G/3G高流量换机成功率提升1.2倍,4G终端转换为4G用户率提升16.7%,目标用户数据套餐升舱率提升19.8%;宽带办理成功率提升9.89%;首次对系统判别的“主动锁网”用户进行外呼激活,激活成功率高达94%,人均DOU提升38.7%,人均ARPU值提升2.3元。
此外系统提供自定义算法,支持将多数据源关联后得出的显性化字段进行自定义计算,高效低成本的满足一线差异化的需求。
5.2面向网规网优
倒流和价值模块进入网规网优流程,试点区域倒流比降幅40.35%;倒流流量减少15.22 GB,日均4G流量增长107.23 GB,增幅达到61.14%。
5.3面向终端业务体验提升
利用终端战略地图工具,极大提升终端类投诉的处理效率,提升终端业务体验。目前共向市场、客服中心、终端公司、地市分公司发布终端预警14期,共计190个LTE终端网络交互类问题与解决方案。 预估终端类投诉处理效率提升了50%。
产品从以下3个方面,助力中国移动客户满意度和企业品牌形象的提升。
项目中提升4G换机、换卡等营销成功率,将更多的用户迁移到了速度更快、时延更小的4G网络,有助于提升用户的满意度。
项目助力网规网优面向用户需求和价值提升的转变,其中价值区域数据已进入网规网优流程,有助于提升价值用户的客户满意度。
项目能提高终端类投诉处理的效率,提升终端业务体验,从而提升客户满意度。
项目具有市网聚合数据,并将诸如用户住宅小区等有价值但无法直接提取的数据显性化/结构化,在数据通过聚类脱敏后,能为救灾、应急、交通、市政规划等输出分析数据。
[1] Hung C C, Peng W C. A regression-based approach for mining user movement patterns from random sample data[J]. Data & Knowledge Engineering, 2011, 70(1):1-20.
[2] Zhu Y, Zhang Y, Shang W, et al. Trajectory enabled service support platform for mobile users' behavior pattern mining[C]. Mobile and Ubiquitous Systems: Networking & Services, MobiQuitous, 2009. MobiQuitous' 09. 6th Annual International. IEEE, 2009: 1-10.
[3] Akoush S, Sameh A. Mobile user movement prediction using bayesian learning for neural networks[C]. Proceedings of the 2007 international conference on Wireless communications and mobile computing. ACM,2007: 191-196.
[4] 谭钧元, 宋国杰, 谢昆青, 等. 一种有效的基于生活熵的移动用户分类算法[J]. 计算机研究与发展, 2009,46(46):433-438.
[5] Shad S A. 移动用户轨迹与行为模式挖掘方法研究[D]. 合肥:中国科学技术大学, 2013.
[6] 梁鹏, 李兵, 郭文君. 移动数据业务用户行为模型研究[J].中兴通讯技术, 2005,11(4):70-74.
[7] 吕洋. 基于用户行为数据分析的移动互联业务推荐模型[D]. g武汉: 华中科技大学, 2011.
[8] Liu Y, Yuan P. A study of user downloading behavior in mobile Internet using clickstream data[C]. Intelligent Information Technology and Security Informatics (IITSI), 2010 Third International Symposium on. IEEE, 2010:255-257.
[9] Zhao G, Lai W, Xu C, et al. Analysis of User Behavior in Mobile Internet Using Bipartite Network[C]. Mobile Ad-hoc and Sensor Networks (MSN), 2012 Eighth International Conference on. IEEE,2012:38-44.
[10] 赖志伟, 梁勇华. 移动互联网用户行为分析[J]. 科技风,2014, 27(4):249-249.
[11] 李勇, 徐振宁. Internet 个性化信息服务研究综述[J]. 计算机工程与应用, 2002,38(19):183-188.
[12] 王国霞, 刘贺平. 个性化推荐系统综述[J]. 计算机工程与应用, 2012,48(7):66-76.
A market and network analysis system based on multidimensional data association
HUANG Sha, WEI Zong-jing, XU Qiu-lian, RAN Xiao-gang
(China Mobile Group Sichuan Co., Ltd., Chengdu 610041, China)
Terminal Strategic Map is a system based on LTE, data traffi c, terminal, etc., aiming to improve the matching degree between market and network. Terminal Strategic Map aggregates signaling data, business analysis data, etc.,to provide users with 4G index optimization, terminal distribution, customer location, individual p
and so on. This system can increase the success rates of marketing campaigns as well as the matching degree between market and network, will strongly promote super-conventional development of 4G.
data association; customer behavior analysis; coordinated development of market and network; superconventional development of 4G
TN929.5
A
1008-5599(2016)09-0008-06
2016-08-19
* 中国移动集团级一类科技创新成果,原成果名称为《盘活网络数据,加速智能营销》。