中国联通研究院 北京 100032
以手机为代表的移动终端能力越来越强,不仅体现在计算能力和存储能力的提升,还体现在对越来越多通信方式的支持,比如GPS、GSM、CDMA、LTE、Wi-Fi、Bluetooth等,此外,加速度传感器、数字指南针、陀螺仪、磁力计、光照传感器等也逐渐成为移动终端的基本配置,这为更加精准地获取移动终端位置提供更加丰富的数据支持。
与此同时,ICT资源越来越如水电一样容易获取,软件工具也越来越趋向于开源与开放,这大大促进了移动互联网应用的创新发展,不断推陈出新的移动互联网应用真可谓百花齐放、百家争鸣。在用户使用移动互联网应用的过程中,移动互联网应用平台通常会以文本、图片、语音、视频等多媒体形式记录用户的使用行为,这些行为记录成为商家实现精准化营销的大数据基础。与此同时,海量的数据、越来越快的数据形成速度、移动用户位置的实时变动等也对应用平台提出更大的挑战,要求应用平台既要保证服务提供的实时性,还要处理好隐私保护、信息安全、电量消耗、成本效益等问题。
基于位置的服务(Location Based Service,LBS)分为位置获取和服务提供两个阶段。对于面向特定用户的精准化营销而言,需要实时、准确地掌握用户在某个时点或者时间段所处的场景,包括时间、空间、人物这三个位置相关的关键信息[1],满足用户在特定时间、特定地点的实际需求。位置获取与服务提供具有很强的时效性要求,如果服务在用户离开商家后再提供,那么服务提供的效果就会大打折扣,甚至会转变成对客户的骚扰。
Storm、Spark是两个典型的分布式计算框架,可以解决服务提供的海量数据处理和实时性问题。其中,Storm属于事件驱动的实时处理框架,处理性能可达秒级,例如用户兴趣点统计等实时应用;Spark为基于内存的计算框架,中间处理结果放置在内存而不是磁盘,因此,适用于内存承载数据、迭代式计算以及交互式查询。位置营销要结合用户近期搜索、点击等互联网使用行为来预测用户兴趣点,同时,还要结合用户实时位置和用户兴趣预测推送满足用户需求的服务,因此,需要综合使用Storm和Spark技术。
实现精准化营销的关键是将位置三要素(时间、空间、人物)精准匹配。时间可以切分为多个时间点或者多个时间段,地点可以分为地理数据和属性数据,地理数据描述空间的绝对位置,属性数据描述地名、空间功能、空间类型等地理位置对应的特征信息,人物则需要描述客户的消费偏好。时间、地点和客户偏好可以组成不计其数的个性化情境。如图1所示。
图1 移动客户营销情境
由图1可见,实现基于位置的精准营销需要把时间、空间、人物三者紧密地结合起来,在某个时点、特定的位置,将营销信息传递给恰当的人。比如,当客户在家庭居住区域内的非工作时间(比如晚上或者周末)可以向用户推送一些居家用商品的营销信息;当客户处于乘坐地铁等公共交通工具并且是上下班时段,商家可以在推送商品信息的同时推送一些让人轻松或提示性的信息,比如冷笑话或者天气变化等;当客户处于商场或者超市等购物环境时,可以根据用户年龄、性别、以往购买历史等为用户推荐商品与优惠券等信息。总之,要结合客户所在的时空属性,推送客户最可能需要的服务。
日常生活中,我们通常会借助各种无线通信技术在不同的出行场景访问移动互联网:在上下班的途中乘坐地铁,会上网浏览、阅读电子书、观看视频短片等;在外面游玩时,会通过地图软件查询周围的餐饮店以及打折促销信息;在登山或者轮船上休息时,您或许希望商家提供户外商品的营销信息;在商品琳琅满目、商家众多的商场里,您或许希望快速找到自己想要的商品。移动生活的各种场景如图2所示。
图2 使用各种无线通信技术的移动生活场景
从图2可以看出,移动终端、通信网络、云端应用构成了满足各种使用场景的技术支撑体系。无线通信技术多个维度的对比如表1所示。
从表1可以看出,不同的无线通信或者移动通信技术具有不同的特点,它们在满足人们工作与生活的各种需求方面相互补充。比如,地上的无线通信可以采用移动通信和卫星通信,地下隧道内的无线通信需要采用泄露电缆作为信号收发天线;在人口密集的区域,通常采用无线基站(含室内)满足移动通信需求,而在高山、海洋、高速公路等遮挡物少、难以架设无线基站的地方则采用卫星通信;在有建筑物遮挡的区域采用铺设Wi-Fi、ZigBee无线网络的方式;在小于10米的近距离通信场景下,采用蓝牙、NFC、RFID等近距离通信方式。
表1 典型的无线通信技术特征与能力对比
不同的无线通信技术都有其适用的场景。比如卫星通信可以实现全球范围7×24小时的覆盖,地球上几乎所有室外环境都可以覆盖,但是到了森林、隧道、办公室等室内或者地下环境它就无能为力了;对于无线基站这样的移动通信技术,在不同的区域其定位能力也不同,通常人口稠密的城市或地区会架设更多的基站,因此,定位精度较高;而对于人口稀少的乡村地区由于无线基站数量少,定位精度也就低得多;Wi-Fi是无线局域网(WLAN)的典型通信技术,可以铺设在家庭、办公室、商场、机场等场所,可以达到1米以下的定位精度。从无线通信技术对于通信需求满足的角度看,不同的通信技术具有互补性。
目前,大多数移动终端集成了各式无线通信模块,移动终端逐渐成为人与环境的接口,成为用户的贴身秘书,可以说,获得移动终端位置就意味着找到了客户的位置。
获取移动终端的位置有多种物理测量方法,比如按照测量精度从高到低可以分为:距离测量、角度测量、区域测量、跳数测量以及邻居测量。三种典型的测距数据模型为:基于接收信号强度的测距模型(Received Signal Strength,RSS)、基于信号到达时间的测距模型(Time of Arrival,ToA)、基于信号到达时间差的测距模型(Time Difference of Arrival,TDoA)。由于每种测距模型都具有各自的优缺点,位置计算通常会综合多种测距模型来实现。
下面介绍典型的无线通信技术获取移动终端位置的思路与方法。
1)通过通信卫星的位置定位获取。通过移动终端到通信卫星的扩频信号传播时间算出移动终端到通信卫星的距离(ToA),然后,再结合卫星广播的星历信息计算卫星的空间位置,完成定位计算。当有3颗卫星时,就可以实现二维定位;当有4颗卫星时,就可以实现三维定位;移动终端可以根据接收的多颗卫星的导航信息,计算出自己的三维位置(经纬度与海拔高度)、运行速度与方向以及精确的时间信息[2]。
2)通过无线基站的位置获取。通过测量移动终端到无线基站的下行导频信号的时间或者时间差,结合无线基站的坐标,采用三角公式估计算法,就可以得到移动终端的位置。还可以采用基于通信网络的定位技术,通信记录中记录了时间戳、位置区域代码(LAC)、基站小区(cell-ID)等信息[3],可以获取移动用户的位置与运动轨迹,定位精度最高可达到150米,误差通常大于125米,在人口稀少的地区电信运营商架设的基站通常较少,定位误差可能会超过1千米。
3)通过Wi-Fi的位置获取。Wi-Fi无线网络主要应用于室内环境,在室内定位中,受设备及成本限制,通常都采用基于RSS的测距[1]。如果采用无线信号的定位技术,由于室内环境复杂多变,无线信号在室内环境下的衰减、多径和衍射等效应导致无线信号强度的波动,进而带来定位误差[1]。相比于室外,室内空间通常分为多个功能区,因此,对于定位精度的要求更高。
4)通过泄漏电缆的位置获取。地铁通信环境由站厅层、站台层和双向隧道区间3个部分组成[4],地铁站之间的隧道内部通常是采用两条泄漏电缆分别向隧道中间延伸的方式,隧道内信号从地铁站口到隧道内部逐步减弱,因此,可以采用RSS的物理距离测量方式,借助泄漏电缆的信号强度确定移动终端在地铁隧道内部的位置[5],由于地下隧道有转弯、高低等地形变化,会影响到获取移动终端位置的准确性。
融合通信是指同一台移动终端借助移动通信(GSM/CDMA/LTE等)、Wi-Fi、蓝牙、红外、卫星通信等多种无线通信技术与外部同时通信的场景。在多种无线通信技术同时使用的情况下,由于不同的无线通信技术的定位能力不同,最理想的情况是获取尽可能多的与位置计算相关的数据,为位置计算模型提供更多的辅助数据,让位置计算结果更为准确。例如,卫星信号通常无法覆盖到室内,但是当移动终端偶尔处于室内能够接收卫星信号的位置,比如靠近窗户、大门等,就可以利用这些偶尔获取的数据提升位置获取的能力。
此外,信号反射、散射、遮蔽等信号传播动态特性也会影响位置计算的精度,因此,需要实施误差控制,将移动终端位置精度控制在一定范围之内。
要实现融合通信场景下移动终端的混合定位,对移动终端和位置服务平台的计算能力有非常高的要求。一方面,按照就近计算原则,移动终端应当采集并计算出自身的绝对位置,如果移动终端首先获取的是相对于参照物的相对位置,还需要根据参照物绝对位置算出自身的绝对位置。另一方面,移动终端应当将自身绝对位置和位置误差区间传递到位置服务平台,位置服务平台模糊匹配客户所在位置与预先分析出来的消费倾向,将匹配结果以服务的形式推送给客户。
位置服务需要解决客户兴趣分析和在特定场景下的消费行为预测与服务投递两大问题,由于客户所处位置经常变化,因此,需要位置服务平台实时地解决以上两大问题。例如,如果客户在商家附近使用手机搜索某些关键词,那么这些关键词通常就是客户迫切需求的信息,具有非常高的时效性特征,这就要求位置服务平台具备快速匹配供需的能力,以便及时有效地为客户推送商品与服务信息。由开源组织阿帕奇(Apache)开源的实时流式计算框架Storm和Spark,可以帮助解决以上两大问题。
Storm将分布式计算环境称为拓扑(Topology),拓扑由数据流、Spouts(Stream Producers)、Bolts(Operations)组成[6]。Storm的核心数据结构为元组(Tuple)。Spouts是Storm拓扑主要的数据入口点,Spouts承担数据源适配器的角色,它将数据转换为元组并且将元组作为数据流发送。Bolts被视为计算的运算符(operators)或者函数(functions),Bolts常用的函数包括过滤元组、联合与聚合、计算、数据库读/写。采用Storm流式计算过程如图3所示。
图3 Storm流式计算过程
Storm属于事件驱动的流式计算模型,适用于单个数据量小的分析计算场景,其存放中间运算结果的磁盘占用了大量的I/O,这种实现方式降低了数据处理效率。与Storm相比,Spark将中间运算结果置于内存之内,更适用于存放中间结果数据的迭代运算;其采用与MapReduce类似的计算模型,更适用于内存容量可以承载的批量数据处理应用;其采用时间片(缺省为0.1s)切割数据的方式,具有更长的时间延迟,并同时支持SQL、机器学习、图形处理、流式计算等计算模型,是一款通用的计算引擎[7]。
Spark采用弹性分布式数据集(Resilient Distributed Datasets,RDD)的方式管理数据,Spark流计算模型将输入的数据流以时间片(0.5秒到几秒)为单位进行拆分,然后再以类似批处理的方式处理每个时间片数据,由于每个数据流代表某个时间到达的RDDs序列,故称之为离散式数据流(Discretized Stream,DStream)。Spark流计算过程如图4所示。
根据对两种分布式流式计算技术的特点分析,可以将两种技术结合起来使用。对于类似用户搜索、浏览、点击等行为,由于产生的数据量小,对以上行为的分析可以发现用户最新需求,因此,可以考虑采用Storm技术;对于来自于电信、金融、交通、公共事业等反映用户行为的数据,由于数据量大,实时性要求高,可以考虑基于内存计算的Spark计算,通过机器学习挖掘用户消费行为偏好,根据用户位置变化实时查询和匹配用户需求并推送满足需求的服务。
位置营销属于移动电子商务的核心功能,移动电子商务主要包括5个需要实时完成的活动,即位置(人或物)、导航(到达路线)、跟踪(移动轨迹)、绘图(图形化展示)、时间(从A位置到B位置的时长);其基础架构包括9个组成部分,即位置发现(定位)组件、移动定位中心、用户、移动终端、移动通信网络、服务或应用提供商、数据或内容提供商、地理信息系统、选择性加入应用[8]。精准化移动营销平台总体架构如图5所示。
图4 Spark流计算过程
图5 精准化移动营销平台总体架构
从图5可以看出,移动终端首先基于各种通信模块计算移动终端的绝对位置或者相对位置,然后以移动终端位置为输入,借助精准化移动营销平台查询/匹配适合于用户的需求,并将需求对应的服务推送给用户,而精准化移动营销平台则基于客户大数据、空间大数据等形成位置三要素的营销用基础数据集,成为实现位置服务的前提和基础。
移动终端借助蓝牙、Wi-Fi、GSM、CDMA、GPS等各种无线通信模块以及各式传感器在运行过程中形成数据,为更加精确地完成位置计算提供了前提和基础。通过在融合通信环境下的混合位置计算,可以为基于位置的精准化营销提供有力支持。
客户的购物偏好是提供位置服务的需求预测基础,是实现精准化营销的三大要素之一,应当融合移动用户位置、用户偏好、营销服务推送策略,实时地为客户提供营销信息,提高营销的成功概率,同时,由于位置服务的时效性特征明显,需要借助实时分布式流式计算技术,才能快速地完成位置获取与服务提供。
制定位置营销方案还需要在如下三个方面进行权衡和取舍:第一,需要平衡定位精度和资金投入,保证较高的成本效益;第二,需要平衡位置计算算法的复杂度和移动终端用电消耗;第三,需要平衡服务质量和隐私触犯与信息安全问题。
参考文献
[1] 杨峥,吴陈沭,刘云浩.位置计算:无线网络定位与可定位性[M].北京:清华大学出版社,2014:2-4,112,116
[2] 李勇,徐小涛,杨志红,等.位置信息服务(LBS)关键技术及应用[M].北京:人民邮电出版社,2013:49,62
[3] 李福东,黄文良,罗云彬. 基于目标IP大数据分析提升移动用户上网体验研究[J]. 邮电设计技术,2014(12):65-67
[4] 黄艳福,戚喜成,姚赛彬,等. 地铁移动通信无线网络建设研究[J].邮电设计技术,2011(1):23-25
[5] 张柯军.论基站定位功能在地铁中的应用[J].通信设计与应用,2015(3):9
[6] Jonathan Leibiusky,Gabriel Eisbruch,Dario Simonassi.Getting Started with Storm[J]. O'Reilly Media,2012(9):1
[7] Holden Karau,Andy Konwinski,Patrick Wendell,et al.Learning Spark[J].O'Reilly Media,2015(1):276
[8] Efraim Turban,David King,Jae Kyu Lee,et al. Electronic Commerce:A Managerial and Social Networks Perspective,Eighth Edition[M].Springer International Publishing AG,2015(2):281-282