移动大数据赋能的移动边缘缓存技术研究*

2019-06-25 06:02林尚静
通信技术 2019年6期
关键词:蜂窝边缘基站

马 冀 ,刘 超 ,林尚静 ,田 锦

(1.北京邮电大学网络空间安全学院,北京 100876;2.中国电子科技集团公司第五十八研究所,江苏 无锡 214000;3.北京邮电大学电子工程学院,北京 100876;4.金陵科技学院网络与通信工程学院,江苏 南京 211169)

0 引 言

伴随着移动互联网的迅猛发展,移动终端数量的持续增长,以及高清视频、文件下载等数字多媒体业务的飞速普及,移动数据业务呈现爆发式增长。大量移动用户经过核心网对相同热门内容的冗余性下载行为将耗费大量宝贵的回程链路资源,并相应增加网络的拥塞概率,进而对业务时延性能造成显著影响。边缘缓存技术秉承以“存储换带宽”的思路,通过将业务内容预先性地由核心网云端向边缘网络进行“下沉”至由蜂窝基站或者小蜂窝基站组成的边缘网络,以便用户实际发起内容请求时能够直接从蜂窝基站获取内容信息[1]。一方面,边缘缓存技术可以有效缓解业务忙时的网络拥塞,缩短用户的获取信息内容的时延,另一方面,边缘缓存技术可以减少网络中冗余数据的重复传输,减轻骨干网的传输压力。

目前,大数据与无线网络融合的趋势日益显著,为边缘缓存策略的智能化设计提供了可能性。本文提出了一种大数据赋能的移动边缘缓存技术。首先,本文通过数据爬虫技术收集用户社交关系大数据,建立用户的社交网络拓扑图。其次,基于社交网络拓扑图,构建内容流行度的演化微分方程,通过求解演化微分方程的稳定解,预测业务内容流行度。

1 传统边缘缓存技术

蜂窝基站在具体实施边缘缓存的过程中包含两个阶段:在实际用户业务请求到达前,基于所采用的缓存策略进行内容缓存的阶段,以及在用户发出请求后对缓存内容进行传输的阶段。按照缓存策略的异同,采用边缘缓存技术的蜂窝基站又进一步分为,主动缓存基站和被动缓存基站。

被动式缓存指,蜂窝基站只在用户发出业务请求后才进行有条件的内容缓存。典型的被动缓存策略有最近最少使用(Least Recently Used,LRU)策略。采用LRU策略的蜂窝基站,将缓存所有用户请求过内容。对于每一个新到达的用户请求,如果自身没有缓存该业务内容,则通过回传链路把该业务内容下载到本地缓存空间中;如果蜂窝基站的本地缓存空间已满,则先删除最不常用(在最长的时间内未被请求)的业务内容,再缓存所服务用户最新请求的业务内容。

主动式缓存指,蜂窝基站预测业务内容的流行度提前将热门的内容进行本地缓存并且推送到用户端。这种蜂窝基站主动式缓存并提前推送方式可以降低用户的平均时延,还可以提高无线网络的吞吐量。在现有移动边缘缓存研究中,通常直接借鉴互联网服务器的文件请求模型,即假设用户对文件的请求数服从Zipf分布[2-4],这并不适用于移动边缘缓存场景。这是因为,随着移动客户端的崛起,移动用户获取内容信息的方式已经从搜索引擎和门户网站(即Web1.0)转向从移动社交网络(即Web2.0),微博,朋友圈,今日头条的崛起即是证明,而文件请求模型无法适应依托移动社交网络进行的信息传播过程。

2 移动大数据赋能边缘缓存技术

伴随着频谱的拓宽、用户与基站密度的增加以及业务的多样化(例如,物联网,车联网,移动互联网),当前移动通信具有大数据的显著特性。依据数据的来源,移动大数据可以分为传输层大数据、网络层大数据以及应用层大数据。传输层大数据:包括信道大数据,频谱大数据以及缓存计算资源大数据,例如信道链路增益数据,宽频谱各条链路增益数据,海量用户的链路增益数据以及基站的缓存空间大数据等。网络层大数据:包括网络负载数据,信令流程数据,信令交互数据以及用户轨迹数据等。应用层大数据:包括社交网络数据,语音通话数据,日常生活数据等。

如图1所示,从外界注入社交网络(微信,微博,今日头条)的信息内容,或者由社交网络内部产生信息内容,沿着用户之间所结成的各种形态的社会关联,依托用户之间交互行为(分享、转发、推荐)在线上社交网络上形成传播扩散;紧接着,线上社交网络上的用户对信息执行动作行为,即采纳行为,通过移动用户所携带的智能终端渗透到线下通信网中形成移动用户的业务需求,并伴随着用户在地理空间范围的移动,转化成移动用户对其服务基站的业务请求,最后,蜂窝基站根据所服务区内的所有移动用户的业务请求,进行缓存区间的动态分配和缓存内容动态更新。

由此可见,为了实现智能化边缘缓存技术,涉及到应用层大数据(即社交网络用户行为数据)和传输层大数据(即缓存资源数据)的关联分析和挖掘。

图1 移动大数据赋能的移动边缘缓存技术

3 基于社交网络内容流行度预测的移动边缘缓存技术

移动社交网络不仅描述了用户之间的关系结构,同时也反映了用户共享兴趣内容的意愿和发生相似行为的同质性。用户对一项内容信息的偏好,极大程度上取决于与其具有社交关联用户对此项内容信息的兴趣和推荐程度。

3.1 基于移动社交网络的内容流行度预测

通过大数据爬虫技术分析用户的移动社交网络的拓扑结构发现,移动社交网络呈现出的无标度特性。无标度指移动用户之间的连接状况(度数)具有严重的非均匀特性。少数移动用户具有极多的连接(图2中深色节点),而大多数移动用户只有很少量的连接(图2中浅色节点)。无标度特性又称幂律分布特性,网络中任意一个节点的节点度为k的概率为P(k)=k-α,α的取值由具体的移动社交网络决定。

基于前述分析,移动社交网络被证实为是一个无标度网络。本文基于无标度网络上传播动力学理论的“易感染-感染-易感染”(Susceptible Infected Susceptible,SIS)模型对某一内容的流行度演变过程进行建模分析。在SIS传染模型中,将移动社交网络中任意用户对某一业务内容的兴趣以下两个状态进行描述:感染状态(I),易感染状态(S)。感染状态I表示用户具有业务兴趣。一个处于感染状态的用户依据一个事先被设定痊愈概率μ恢复为易感染用户;易感染状态S表示用户不具有业务兴趣。一个处于易感染状态的用户和一个处于感染状态的邻居用户接触,则以概率λ被感染成为感染用户。μ和λ的大小由该业务内容需求实际传播场景反馈估计决定。

图2 移动社交网络的无标度特性

将时刻t节点度k的感染用户占据总用户的比例定义为相对感染节点密度ρk(t)。依据平均场理论(具有相同度相同状态的节点在网络中的分布是均匀的),ρk(t)满足如下微分方程[5]:

在式(1)中,由节点从感染状态向易感染状态的转移概率μ以及相对感染节点密度ρk(t)的乘积组成,等式右边第二项表示产生项,由节点从易感染状态向感染状态的转移概率εk(t)以及相对易感染节点密度 [1-ρk(t)]的乘积组成。

节点从易感染状态向感染状态的转移概率εk(t)可以进一步写为 εk(t)=λkΘ(t)[5],其中,Θ(t)为时刻 t易感染节点与感染节点的连接概率。Θ(t)不依赖于边的起始点(也就是易感染节点)的节点度,但是却与边的终止点(也就是邻居节点)的节点度有关。这是因为,邻居节点是一个感染节点的概率,与时刻 t该邻居节点的节点度 k´相关 εk´(t)。因此,Θ(t)可以由给定节点度为k的易感染节点的一条边,这条边所指向的邻居节点的节点度为k´的概率P(k´|k)以及在时刻t节点度为k´的邻居节点是一个感染节点 的 概 率 εk´(t)联 合 计 算 而 得, 即 是为该移动社交网络的最大节点度,P(k)是所构建的移动社交网的节点度k,k∈(0,n)分布概率,〈k〉是社交网络的平均节点度。忽略移动社交网络的节点度的关联性,即进一步可以解释为。更进一步,依据平均场理论,邻居节点的感染概率可以由与邻居节点具有相同节点度的所有节点的平均情况代替,因此,

在湮灭项和产生项的共同作用之下,当微分方程达到稳态平衡时(即令),可以得到稳态相对感染用户密度。将带入,可以得到关于ρ的自洽方程。k某一项内容信息在移动社交网络中的流行度的ρ=P (k)ρ即是稳定感染节点密度k。从上述推导过程可以看出,某一项内容信息的流行度由该内容信息的传播载体-体移动社交网络的网络结构度分布P(k),内容信息对用户的吸引程度-感染概率λ,以及用户的业务习惯-痊愈概率μ共同决定。

图3显示了基于SIS传播模型的用户业务兴趣传播过程的初期、中期、中后期和尾期各个阶段,感染用户的概率分布以及累计概率分布。

3.2 基于内容流行度预测的移动边缘缓存技术

首先,移动大数据平台通过爬虫技术构建用户社交关系拓扑图,并依据3.1节信息传播模型分析用户对内容信息的偏好,自动形成热门内容推荐。其次,假如用户的运动轨迹和网络资源的平均使用情况可预测,那么,移动大数据平台可以为用户制定一个传输计划,即何时何地以及用多少资源向用户推送什么内容,并将传输计划发送 给该用户运动轨迹经过的蜂窝基站。再次,当移动用户发出获取信息请求时,用户终端首先在本地存储器内搜索,对于预先已推送至用户终端的信息则直接调用已存储的数据,对于未推送的信息,则通过蜂窝网络的单播数据传输通道完成数据传输。最后,移动用户终端对终端存储器内的预先推送的数据进行智能管理,定期删除用户未使用的过期数据,更新接收新的推送数据,并更新用户的信息定制需求。

图3 基于SIS传播模型的用户业务兴趣传播过程各个阶段感染用户的概率分布以及累计概率分布

4 结 语

海量移动大数据蕴藏着巨大的价值,并结合行业大数据构建新的价值链,实现大数据下的价值变现。本文的研究对深化5G异构网络分布式存储的“存储换通信”能力、提升无线通信网络效能具有一定的理论价值。

猜你喜欢
蜂窝边缘基站
热塑性蜂窝板的平压性能分析
蜂窝住宅
5G IAB基站接入网络方案研究*
5G基站辐射对人体有害?
“蜂窝”住进轮胎里
基于移动通信基站建设自动化探讨
可恶的“伪基站”
一张图看懂边缘计算
为什么蜂窝是六角形的?等4则
在边缘寻找自我