无线传感网与移动通信网融合业务流模型和预测算法研究

2020-07-23 06:28唐宾徽陈睿周振兴
现代电子技术 2020年5期

唐宾徽 陈睿 周振兴

摘  要: 由于移动通信网和无线传感网各有特点,且各自的网络结构和协议栈差别较大,两网异构融合产生的多业务数据流量将同时具备局部性、周期性、随机性、突发性等多重特点,结构复杂,对网络运营能力及安全监测带来了技术难题。文中针对多业务流的场景,分析各类业务流模型的特点,提出一种基于异构网的融合业务流模型,并对业务流量通过预测算法进行预测。仿真结果表明,该模型算法的预测精度较高,为异构网的多业务融合起到了重要的支撑作用。

关键词: 异构网; 融合业务流模型; 预测算法; 无线传感网; 移动通信网; 模型分析

中图分类号: TN92?34                          文献标识码: A                           文章编号: 1004?373X(2020)05?0014?05

Research on service flow model and prediction algorithm for integration of wireless sensor networks and mobile communication networks

TANG Binhui1, CHEN Rui2, ZHOU Zhenxing3

(1. School of Computer and Software, Jincheng College of Sichuan University, Chengdu 610000, China;

2. School of Humanities, Xihua University, Chengdu 610000, China;

3. A Military Representative Office of PLA Rocket Force, Chengdu 610000, China)

Abstract: Since both the mobile communication networks and the wireless sensor networks have their own characteristics, and their network structures and protocol stacks are quite different, the multi?service data flow generated by the heterogeneous integration of the two networks are of the characteristics of locality, periodicity, randomness and burst property, as well as complex structure, which brings technical problems to network operation capability and security monitoring. In view of the above mentioned, the characteristics of various service flow models are analyzed on the basis of multi?service flow scenarios, and an integrated service flow model based on heterogeneous network is proposed, and the service flow is predicted by the prediction algorithm. The simulation results show that the prediction accuracy of the model algorithm is high, which plays an important supporting role for multi?service integration of heterogeneous networks.

Keywords: heterogeneous network; converged service flow model; prediction algorithm; wireless sensor network; mobile communication network; model analysis

0  引  言

隨着新一代移动通信网络技术和物联网技术的不断发展,大力推进无线传感网与移动通信网的异构融合已是大势所趋。无线传感网通过末端感知可为移动通信网提供有效、可靠且实时的前端数据;而移动通信网作为信息传送的承载网可为无线传感网提供有效的管理、运营和维护。两网的异构融合,不仅有助于海量传感信息的传输、分发与共享,还可作为一种全新的增值业务推动移动通信网的发展,为建立无处不在的泛在网络[1]奠定基础。本文主要针对异构网融合业务流的特点,建立与之相适应的业务流模型,并使用预测算法对其进行流量预测,为异构网络性能评估提供解决方案。

泛在网络就是将通信服务的对象从人扩展到任何一件物品,通信不只发生在人和人之间,还发生在人与物之间、物与物之间,泛在网络的联网设备规模将比传统网络大得多,它们可像互联网上的计算机一样形成机器对机器(Machine to Machine,M2M)的通信方式。无线传感网与移动通信网融合而成的异构网,就是为满足上述需求而采用的最现实和最便捷的通信方案。无线传感器网络(WSN)将大量微型、有计算能力的传感器节点部署在监测区域内,以短距离无线低功率的通信方式形成一种多跳自组织网络系统。在这个系统中,传感节点将监测到的数据按照约定的路由规则传输给汇聚节点,再将接收到的传感数据发送给管理节点,用户可通过管理节点对整个传感网络进行配置、控制和管理。基于移动通信系统的WSN可以将传感节点数据通过有限的分层传输到汇聚节点[2],再通过具有移动终端功能的传感网关回传到移动通信系统,或者直接由移动基站直连具有移动终端能力的传感器,此时这些传感器既是传感节点也是网关,可以最大限度地降低传输延迟来支持对实时性要求很高的监控应用。

1  融合业务流量特性与技术分析

移动通信网与WSN的融合,不仅要考虑基于移动终端的无线传感节点的网络通信以及移动基站与无线传感节点的网络融合问题,还需要从业务融合角度考虑应用层的开发、承载双网的移动传感设备以及网络资源分配、业务流量分析等。该系统在实现有效数据传输基础上,对移动传感终端进行合理分配,监视终端的连接状态、异常告警和业务流量预测,为融合网络的运营、管理和维护奠定坚实基础。

传统的业务流分析模型都是将预测数值和监控数值与历史数据进行比对分析,业务流的建模方法主要包括半马尔柯夫模型、Poisson模型、基于自回归滑动平均ARMA(Auto Regressive Moving Average)模型及ON/OFF模型等[3?6]。这些方法的特点是将业务流数据理解为一个平稳的随机过程,通过对过往数据建模来分析数据流量的变化。虽然这些方法运算简单,也取得了良好的预测效果,但基于移动通信网与WSN这种异构网络融合的业务数据来说,这些方法就过于简单了。异构网的业务数据流具有局部性、周期性、突发性和随机性等特点,因此将业务数据简单理解为平稳的随机过程是不全面的。基于异构网这些特点,国内外很多研究者引入了小波多尺度分析以及固态模函数分解(Empirical Mode Decomposition,EMD)[7]等手段,将异构网络信号在特定尺度上建立起ARMA模型,使其分解后的业务流量信号平稳或近似平稳,从而提高模型预测的准确性[8?11]。也有不少研究者基于神经网络、支持向量机及模糊决策等理论,通过非线性拟合近似的方法来分析业务流量的变化规律,这些方法为解决业务流量预测问题提供了参考。但是,小波分析或者EMD等方法在特定尺度上分析业务数据时有可能丢失其他尺度上的信息,通过神经网络来分析则存在过拟合问题,即模型对于拟合使用数据的解释能力强而外展能力差,这是因为基于神经网络这类方法通常会将部分噪声也当成信号进行拟合,使得模型过度解释当前的观测数据[12?13]。本文针对异构网特点,研究构建基于多传感节点的融合业务流模型,并通过多元自适应滤波算法对预测数值进行平均,对该业务的数据流量精确预测,这一方法相比传统的ARMA模型,更能准确地预测业务数据流量。

2  融合业务流量模型研究

这几年,随着物联网的发展,基于移动通信网与WSN融合的多业务M2M设备将会越来越多。设备里集成的数据流差异较大,在设计业务流量模型时,为了更好地使其在异构网状态下传输,必须对各种不同业务流量模型的特点进行分析,这种多类型传感集成将会带来新的业务特性。目前常见的数据流大多数是多媒体数据流和语音流,这类应用延迟要求相对较低,也可以容忍少量丢包,如远程视频监控业务;网络中也存在对实时性要求较高的控制和报警业务,这类业务对时延和可靠性具有苛刻的指标要求。对多业务M2M终端来说,针对突发性的业务分析,可以用指数分布来表征发送数据的长度和突发间隔的概率密度:

[f(x;λ)=λe-λx,      x>00,     x<0]

式中:[λ=1t],[t]表示傳输时间。

突发间隔的均值为:

[EX=1λ]

突发间隔的均值方差为:

[DX=1λ2]

针对周期性的数据流,将[x]设为常数[d],根据周期性业务数据构成的Poisson分布建模可得概率密度函数为:

[f(d)=λ1+λ2+…+λne-λ1+λ2+…+λnd,    d>0]

间隔均值为:

[Ed=1(λ1+λ2+…+λn)]

间隔方差为:

[Dd=1(λ1+λ2+…+λn)2]

针对长时间连续发送的数据流量,可以用高斯分布来表征数据长度的概率分布:

[f(x)=1(2λσ)2exp-(x-μ)22σ2]

长度均值为[μ],长度方差为[σ2],随机变量长度落在[(α,β)]内的概率函数为:

[pα

多种不同的业务数据流由多维高斯分布建模可得,概率密度函数为:

[fl1,l2,…,ln=22πnDσ1σ2…σn?exp-12Di=1nk=1nDik(li-ai)σi(lk-ak)σk]

长度方差为[n]阶行列式:

[D=r11r12r13…r1nr21r22r23…r2nr31r32r33…r3n?????rn1rn2rn3…rnn=1r12r13…r1nr211r23…r2nr31r321…r3n?????rn1rn2rn3…1]

式中:[rii=1],[rik=rki]。

在任意时刻,管理节点可收集到传感器发送过来的多业务数据,这些业务数据在时间序列上的分布是相似的。假定时间序列是平稳时间序列,为[X1],[X2],…,[XK],其中,[Y]是预测对象的量测值,[Z]为误差,则:

[YT=β1X1+β2X2+…+βPXP+Z]

作为预测对象,[YT]受到自身变化的影响,其规律可由下式体现:

[YT=β1XT-1+β2XT-2+…+βPXT-P+ZT]

误差项在不同时期具有依存关系,由下式表示:

[ZT=ξT+a1ξT-1+a2ξT-2+…+aqξT-q]

由此,获得模型表达式如下:

[YT=β0+β1YT-1+β2YT-2+…+βPYT-P+ξT+a1ξT-1+a2ξT-2+…+aqξT-q]

从上式可以看出,这个统计模型的主要缺点是丢失了流量序列中重要的周期信息和趋势信息,异构网的数据结构复杂,宏观流量往往多变,业务流量数据中又含有多种周期类波动数据,针对随机因素的干扰很难用单一的模型来描述。本文采用多元的自适应模型对异构网中的业务流量使用平均误差估计原理[14?15]来建模。根据多个时刻收集到的样本数据,对相关系数进行回归计算,该模型建立的前提是管理节点随时间推移而收集到的业务数据形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性,假设[f(t)]代表1个测量间隔收集到的样本流量数据,[fm(k)]表示[m]个测量间隔收集到的流量数据的平均值,如下所示:

[fm(k)=1mi=(k-1)m+1kmf(i)]

从上式可得,如果已知[fm(1),fm(2),…,fm(k)],可通过计算前[K]个流量的加权和来预测下一个测量间隔的业务流量[fm(k+1)]。本文研究的业务应用场景中多业务的M2M节点在不同时刻可收集到不同类的业务数据,这些数据之间的表现关系如下所示:

[vT=a1v1+a2v2+…+aqvq]

式中:[v1,v2,vq]是各类传感器的业务数据;[a1,a2,aq]是该任意时刻下各类数据的相关系数。根据多个时刻收集到的多个样本数据,对相关系数进行回归计算,可求得各类数据的损失函数[af1,af2,…,afn],当对下一个时刻[fm(k+1)]进行预测时,可得:

[fm(k+1)]=[af1,af2,…,afn?fm(1)fm(2)?fm(k)]

[af0,af1,af2,…,afn=R(n)    …    R(1)?R(1)…R(n)R(2)…R(n-1)???R(n)…R(1)-1]

式中[R(n)]为时间序列的协方差函数。从此过程中不难看出,此模型根据预测过程中各类数据所产生的误差,运用误差原理,通过多元的自适应模型来建模,提高流量预测的准确性。

3  仿真验证及结果

用于流量预测的基本方法都普遍采用事先获取一段时间的正常(异常)流量,少则1天,多则数月,然后对采集到的历史流量数据进行模式训练、正常(异常)行为的刻画或方差分析等,在得到某个间接统计量后再进行流量预测和异常检测。

具体步骤如下:

1) 获取[m]个不同时刻的业务数据流量[FX(t)];

2) 对[FX(t)]选用[m]个不同时间尺度的线性滤波器对网络流量信号进行多元的低通滤波,每个时刻的窗体点长为[2m],窗体选择高斯窗,得到[m]个滤波信号,表示为[FXm(t)];

3) 对[m]个不同的滤波信号按上文提及的业务流量模型进行预测,从而得到下一个时刻的预测值;

4) 对各个预测值取数值平均值作为异构模型的预测值,并与传统的ARMA模型的预测值进行对比。

本文使用[σ2]表示[X]时刻以前[M]个原始值和预测值之间的估计误差的平方和均值,即[σ2=ξ2n(n-1)m],用检测统计量[τ]表示[n]时刻估计误差与[σ]的比值,即当[σ>0]时,[σ2=ξ2n(n-1)m,γ=ξ(n+1n)σ],否則,[τ=0]。进行异常检测时,若当前[τ]值超出容许范围,则表示异常(为1),否则表示正常(为0)。

为了对算法性能进行评估,本文利用实验室采集的传感器数据集在Matlab 10.1平台上进行仿真实验[16?17],选取区域集合里1 000个传感节点作为ARMA流量预测模型的预测数据点,再将这1 000个传感节点作为异构网业务模型测试算法性能的预测数据点,通过比较两者之间的误差值,可以证明后者的算法预测能力更强。本文采用高斯窗,主要考虑其设计简便,在处理滤波前对原始数据进行标准化,[M]取3,得到3个不同间隔时刻的滤波信号,以及各自的预测值,最后取预测值的平均值。

两种不同模型在3个不同时刻的对照图如图1~图3所示。

ARMA建模数据平均后的预测值波形图和频谱图如图4所示。

异构网建模数据平均后的预测值波形图和频谱图如图5所示。

从以上各图的对比可以看到,相比ARMA模型,异构网模型的滤波信号波形图更多地保留了信号变化的趋势和特点。通过异构网模型进行数值预测,可以将信号在不同时间与能量上的特点看得更清晰,从而进一步得到准确度较高的预测数据。

将异构网的预测模型与实测数据模型进行对比,可以看出,异构网模型的预测数据与实测数据非常接近,误差基本控制在±0.050之间,预测误差在10-3量级。

4  结  语

本文针对异构网融合将出现的多业务集成场景下的数据流特点,提出与之相匹配的业务流量模型以及有效的流量预测算法,通过数据仿真比对,证实了其预测精度相比传统的ARMA模型预测算法更优,可广泛应用于异构网环境下的网络流量预测。下一步,将充分考虑针对多元业务数据的自适应权重,以期进一步提高流量预测精度。

注:本文通讯作者为陈睿。

参考文献

[1] 陈智,罗平,岳文静,等.一种用于无线传感器网络络的能量拓扑控制算法[J].中国传感器与驱动器学报,2013,23(3):382?387.

[2] 潘立强,高慧君,洪高,等.一种基于空间相关的无线传感器网络络自适应缺失数据估计算法[J].国际无线信息网络杂志,2014,21(4):280?289.

[3] 姚萌.网络流量组合预测模型的研究[D].无锡:江南大学,2008.

[4] LEI Jianjun, XIA Ying, ZHAO Kuo. Energy efficient data collection protocol for wireless sensor net?works [J]. Journal of Chongqing University of Posts and Telecommunications (Natural science edition), 2014, 26(5): 582?586.

[5] TIAN Haimei, HUANG Nan. Network traffic prediction based on ACO?LSSVM [J]. Computer engineering and applications, 2014, 50(1): 91?95.

[6] 颜若愚,郑庆华,牛国林.自适应滤波实时网络流量异常检测方法[J].西安交通大学学报,2009,43(12):1?5.

[7] 郑若金,韩力群,陈天华.基于小波分析和神经网络的心音信号研究[J].计算机仿真,2010,27(5):170?173.

[8] 周强,彭辉.基于自回归滑动平均的网络数据流量预测模型[J].计算机科学,2014,41(4):75?79.

[9] 段文轩,蒋文贤.无线传感器网络中一种ARMA流量预测的拥塞控制算法[J].小型微型计算机系统,2012,33(5):1098?1103.

[10] 刘亮,江汉红,王洁,等.基于小波分析的ARMA?SVR网络流量预测方法[J].计算机工程与设计,2015,36(8):2021?2025.

[11] 朱苗苗.基于结构方程模型改进ARMA模型参数估计[[J].软件导刊,2016,15(9):6?9.

[12] 陈文清.一种基于多标签学习的网络流量预测算法[J].科学通报,2016,32(4):147?151.

[13] LIU Yang, ZHANG Linfeng, GUAN Yong. A distributed data streaming algorithm for network?wide traffic anomaly detection [J]. ACM SIGMETRICS performance evaluation review, 2009, 37(2): 81.

[14] 季琳琳,廖军,宗先鹏.异方差线性测量误差模型的平均估计[J].系统科学与数学,2018,38(6):688?701.

[15] FENG Feifei, PENG Fenghua, YAN Bo, et al. QoS?based LTE downlink scheduling algorithm for smart grid communication [C]// IEEE 9th International Conference on Communication Software and Networks. Guangzhou, China: IEEE, 2017: 548?552.

[16] 溫祥西,孟相如,马志强,等.小时间尺度网络流量混沌性分析及趋势预测[J].电子学报,2012,40(8):1609?1616.

[17] 邱婧,夏靖波,吴吉祥.网络流量预测模型研究进展[J].计算机工程与设计,2012,33(3):865?869.