数字轨迹分析系统研究

2017-08-08 01:20朱奕健顾剑峰陈一夏
无线互联科技 2017年14期
关键词:运营商轨迹无线

朱奕健,顾剑峰,陈一夏

(中国联通上海分公司,上海 200050)

数字轨迹分析系统研究

朱奕健,顾剑峰,陈一夏

(中国联通上海分公司,上海 200050)

为了突破中国联通上海分公司现有的模式,文章基于MR数据建立数字轨迹分析系统,通过研究定位算法、数据采集、系统架构、大数据建模、数据隐私安全等技术研究和创新,打造全新的应用场景,最终形成数据变现的创新商业模式,达到百万级的收入。

MR消息;数字轨迹;大数据;商业模式;定位

当前电信运营商被逐渐管道化,并没有利用好运营商自有的数据资源进行通信外价值的变现,特别在针对用户位置信息系统的研究和对外变现的商业模式上,3家运营商都没有成功的案例和突出的成果。中国联通上海分公司根据现状,重点研究数字轨迹分析系统,开拓思路,从技术和业务模式上进行创新。基于无线网络的用户轨迹信息是运营商网络资源优势,使移动通信网络成为获取区域性用户移动轨迹的最佳载体,系统实现用户分时段、分区域、分频次的轨迹刻画,并依据群体匿名用户的移动模型刻画群体特征,提供垂直商业应用建模和Web呈现系统。最终,上海联通实现多个垂直领域的应用场景,形成数据变现的创新商业模式,达到百万级收入规模。

1 研究背景

当前运营商无线侧MR数据只用于运营商进行网络质量分析及网络优化。如小区话务分布分析,无线覆盖的实时评估、切换分析、恶意使用网络排查等,并没有利用运营商这些数据的价值进行非通信价值的变现。大数据时代的到来,让传统电信运营商面临不小机遇。由于电信运营商长期进行网络运营,拥有海量的用户以及丰富的行业应用,这些资源能够为电信运营商提供海量的数据源;电信运营商拥有的基础网络资源优势明显,能够为大数据快速发展提供基础保障;而且电信运营商还有平台资源的优势,电信运营商提供的智能管道和综合信息服务,能够为庞大的有价值的数据处理提供平台。

2 数字轨迹分析系统

2.1 定位算法研究

MR数据是指在专用模式下,手机向系统发送对无线环境进行测量的报告和系统对上行链路进行测量的报告。MR数据包含上、下行无线链路测量数据,包括手机的接收质量、接收电平、发射功率,基站的接收质量、接收电平,上下行链路损耗等无线环境信息。作为网络优化的重要分析评估手段之一,相对于话务统计数据分析、DT/CQT分析而言,通过MR进行网络评估和优化具有真实、详尽、方便、直观等多种优势。

平台采用混合的定位算法,基于快速定位算法,根据MR信息先对覆盖手机的基站求加权质心,得出一个初步的估计结果;根据信号衰落或者信号时延对上一步的位置校正,以提高定位精度。通过路测、AGPS等方式获取精确位置同手机信号质量的对应关系,建立特征度,用户MR匹配定位,来实现用户定位精度提升。定位算法如图1所示。

2.2 无线侧MR数据采集

通过RNC无线网元收集MR数据上报到数字轨迹分析系统,按照业务需求,进行加工、预处理和丰富增强等,平台按照位置模型对数据进行存储,以便为后续的能力开放提供支撑工作。期间,克服多个技术难题和系统瓶颈,实现5个核心机房内的所有32个RNC的MR数据在线采集,并通过专网方式与中心节点打通,形成5个采集节点与一个中心节点的架构(见图2)。

图1 定位算法

图2 数据采集网络拓扑

2.3 系统架构研究

解决方案的总体架构如图3所示,涉及的网元/逻辑功能包括管道网元(如BSC/RNC,eNB,MME/SGSN,GGSN/P-GW)、数据采集和预处理、大数据分析建模、Enabler开发组件、API管理平台、业务系统(运营商自营业务、OTT/行业应用)。系统架构如图3所示。

2.4 数据对外开放API设计

系统基于人群分布规律的分析场景,根据交通规划对移动管道数据的需求,通过数据采集、经纬度计算、存储建模,然后通过批处理任务构建OD图等,设计对外API接口如图4所示。

2.5 数据隐私安全

系统对用户足迹文件其中的终端用户标识(IMSI,IMEI等)进行加密,也就是匿名化处理;IMSI作为HMACSHA256算法的输入,输出结果为32字节,然后将每字节拆解为两个16进制数字[0—F],由此得到长度为64字节的数字串。这64字节由[0—F]组成的数字串,即为保存在给用户呈现的CSV文件中的输入的IMSI对应的匿名ID。加密算法HMAC是密钥相关的哈希运算消息认证码,HMAC运算利用哈希算法,以一个密钥和一个消息为输入,生成一个消息摘要作为输出。数据匿名化算法如图5所示。

图3 系统架构

图4 数据对外开放API

图5 数据匿名化算法

2.6 应用场景

上海联通与第三方公司合作讨论用户行为轨迹的应用场景,包括GFK户外广告屏候车厅价值评估、AC尼尔森对烟草店面选址、浦东统计局流动人口统计等应用场景。

2.6.1 场景一—户外广告评估

该应用场景采用统一受众测量方法,缔造行业标准;促进广告分时定价,提升传媒商屏幕效率;使能户外媒体组合,提升广告主投资回报。

浦东金茂大厦工作日和周末的人数和人次的统计如图6所示,其中再细分为本地人、外地人和外国人。根据人数、人次以及年龄、收入等信息,再进行户外媒体LED屏的价值评估。

图6 浦东金茂大厦户外LED屏统计

2.6.2 场景二—零售店面经营

该应用场景通过获得详实的店面人流数据,改进经营活动;为选址、比对、集客区等关键动作提供手段。 零售店面选址场景如图7所示。

图7 零售店面选址场景

2.6.3 场景三—流动人口分析

该应用场景通过群体人员行为轨迹分析,了解特定区域流动人口的来源和去向、社会层次、人员类型等;解决人口普查中无法统计的问题。

2016年7~10月浦东区域居住人口的变化、以及从上海本地各行政区(如黄浦、长宁等)迁入区域的人数分布统计如表1所示。

2016年7~10月浦东区域36个街道/镇人口统计如表2所示,包括各街道/镇的出现人口数、年龄段、性别、户籍、ARPU值等。

2016年7~10月浦东新区内,居住的所有人口工作地(上海其他地区)分布如表3所示。

3 结语

上海联通利用运营商无线侧MR数据,突破现有的应用场景,从技术和业务模式上进行创新,搭建数字轨迹分析系统,结合大数据分析,实现用户分时段、分区域、分频次的轨迹刻画,提供垂直商业应用建模和Web呈现系统。最终,上海联通实现多个垂直领域的应用场景,并形成数据变现的创新的商业模式,达到百万级收入规模。上海联通利用数据轨迹分析系统实现各个行业领域的应用拓展,并且能够帮助政府和企业解决城市交通、规划、人口统计等方面的问题,使联通公司能与这些行业企业、政府保持良好的关系,产生更好的黏性,这不仅为公司带来的经济收入,而且提高公司的核心竞争力和整体形象,带动公司向前发展。

表1 浦东区域居住人口迁入统计

表2 浦东区域36个街道/镇人口统计

表3 浦东区域居住人口工作地的分布统计

[1]华为技术公司.GSM无线网络规划与优化[M].北京:人民邮电出版社:2004.

[2]韩斌杰.GSM原理及其网络优化[M].北京:机械工业出版社:2009.

[3]陈康.基于位置信息的用户行为轨迹分析与应用综述[J].电信科学,2013(4):118-124.

[4]ShAFQAT A.移动用户轨迹与行为模式挖掘方法研究[D].合肥:中国科学技术大学:2013

[5]王晓明.基于移动数据的轨迹模式挖掘算法的研究与应用[D].沈阳:东北大学,2013.

[6]MINAKAKIS L.Evolution of mobile location-based services[J].Communications of the ACM,2003(12):61-65.

[7]HU JM,JY S,LI W.A Method of Traf fi c Information Collection Based on Wireless Location Technology[J].Journal of Highway & Transportation Research & Development,2010(4):7-10.

[8]燕斌.基于网络的无线定位技术的研究[D].南京:东南大学,2009.

[9]陈京民.数据仓库与数据挖掘技术[M].北京:电子工业出版社:2007.

[10]邓平.蜂窝系统无线定位原理及应用[J].移动通信,2000(5):19-22.

[11]威廉.移动通信工程理论与应用[M].宋维模,译.北京:人民邮电出版社,2002.

[12]胡捍英,杨峰义.第三代移动通信系统[M].北京:人民邮电出版社,2001.

Study on digital track analysis system

Zhu Yijian, Gu Jianfeng, Chen Yixia
(China Unicom Shanghai Branch, Shanghai 200050, China)

In order to break the existing model of China Unicom Shanghai Branch, this paper builds a digital track analysis system based on MR data. Through the study of positioning algorithm, data acquisition, system architecture, large data modeling, data privacy and other technical study and innovation, we created a new application scenarios, and ultimately the formation of data innovation business model to millions of revenue.

measurement report message; digital track; big data; business model; positioning

朱奕健(1975— ),男,上海,硕士,中级工程师。

猜你喜欢
运营商轨迹无线
轨迹
轨迹
基于ARM的无线WiFi插排的设计
轨迹
进化的轨迹(一)——进化,无尽的适应
ADF7021-N在无线寻呼发射系统中的应用
取消“漫游费”只能等运营商“良心发现”?
第一章 在腐败火上烤的三大运营商
三大运营商换帅不是一个简单的巧合
三大运营商换帅