基于云计算的移动通信数据采集方法改进研究

2017-03-16 07:30王留洋俞扬信
淮阴工学院学报 2017年1期
关键词:时频鲁棒性特征向量

王留洋,章 慧,俞扬信

(淮阴工学院 计算机与软件工程学院,江苏 淮安 223003)

基于云计算的移动通信数据采集方法改进研究

王留洋,章 慧,俞扬信

(淮阴工学院 计算机与软件工程学院,江苏 淮安 223003)

针对传统的采集方法在有外界因素干扰的情况下对移动通信网络数据的采集效率低、精度差的问题。提出就云计算的移动通信网络数据采集方法,从移动通信网络设备采集到的时频分布对数据的特征向量进行提取,排除外界的干扰,完成对数据特征向量的有效识别,采用ADASYN算法,去除冗余信息,基于云计算实现对移动通信网络数据精准地采集,实验结果表明,文章提出的方法能够有效地实现移动通信网络数据的采集,精度高,效率好。

移动通信网络;云计算;数据采集

0 引言

随着移动通信技术的发展与国家对通信产业的布局,我国移动通信网络建设规模数量均达到了世界上的顶级水平[1-3]。目前国内地区移动通信网络中用户量成比例地迅速增加,使得移动通信网络数据量增多[4-6]。在这种情况下,再加上移动通信网络投诉量迅速增加,移动网络规模逐渐增加,网络用户的业务逐渐变化,导致移动网络通信数据出现了多样性,需要对移动通信网络数据进行采集,而如何有效快速的对移动通信网络数据进行采集[7-8],成为了该领域亟待解决的问题,受到广大学者的关注,也出现了很多好的方法。

文献[9]提出基于线性回归的数据采集方法,通过应用线性回归分析法构建通信数据模型,保持通信数据的特征,使节点仅传输回归模型的参数信息,实现对通信数据的采集,但是存在采集的数据不完整的问题;文献[10]针对现有的数据采集方法存在的问题,提出基于交互式数据迁移技术的数据采集方法,该方法可对冗余数据进行清理,增加数据的精度,但是存在数据采集速度慢的问题;文献[11]提出基于主题爬虫的数据采集方法,该方法利用主题网络爬虫的概念和方法,运用正则表达式进行匹配,有效地增加数据采集的性能,但是存在数据采集效率低的问题。

针对上述问题的产生,提出就云计算的移动通信网络数据采集方法,从移动通信网络设备采集到的时频分布对数据的特征向量进行提取,排除外界干扰,完成对数据特征向量的有效识别,采用ADASYN算法,去除冗余信息,基于云计算实现对移动通信网络数据精准地采集,实验结果表明,文章提出的方法能够有效地实现移动通信网络数据的采集,精度高,效率好。

1 移动通信网络数据采集方法研究

1.1 移动通信网络数据特征向量提取

对移动通信网络数据特征进行提取,能够排除外界的干扰、更精准有效地实现对移动通信网络数据的采集。云计算对用户的位置没有严格的限制,用户可以使用终端系统获取所需的服务,就算通信距离再远也可以借助云端来实现通信网络数据的采集和处理。数据资源存储在云端而不是传统固定的有形实体,而是在云计算下某处运行,实际上终端无需了解应用运行的具体位置,只需要借助网络就可以实现数据的处理,甚至包括超级计算这样的任务也能在云端随时提供强大的运算功能下得以实现,且运用容错机制维护了数据识别和处理的稳定性。

基于时频分析理论能够有效地识别移动通信网络数据特征向量。时频变换广泛应用于数据处理领域,对数据信息理论的各个方面都产生了广泛的影响,取得了很多研究成果。并且广泛地应用于通信网络数据奇异性检测、图像处理与分解、计算机视觉与编码、信号估计、语音分析与合成、故障诊断等领域,为数据信息的采集提供了一个新的工具,时频分布理论成为数据采集、信号处理的一个重要基础。尤其是基于时频分布理论,由于其自身特点,成为研究的热点。时频变换理论在数据信息采集和信号处理中的一些应用和研究情况,其中Cohen类双线性时频分布构成了时频分析理论的基础和核心。平滑WVD是时频分析中应用最多的时频表示,平滑 WVD具有良好的时频聚集性,是一种典型的Cohen 类时频分布,文章采用了WVD时频分布方法,提取通信数据的特征向量进行,能够有效地对通信网络数据进行识别和采集。提取移动通信网络数据特征向量首先求信号的WVD,对信号数据的边缘频率分布进行计算求解,平滑处理移动通信网络数据的边缘频率分布和最终对其进行归一化处理。其次对数据的频带范围进行计算,根据频带信息,从原始 时频中截包含数据特征的部分。最后调整分离出的数据的大小,调整后的二维矩阵转化为一维向量,即为所求的特征向量,通过对特征向量的求解,实现对移动通信网络数据的采集。

提取移动通信网络数据的特征向量通过以下公式(1)和公式(2)估计局部均值和局部方差,分析频率边缘向量A'(b)。移动通信网络的信噪比较低、采集得到的数据频带位置变动较大,首先需要平滑处理移动通信网络数据的边缘频率分布,使用自适应滤波器降低来自外界噪声,然后采用平均滑动滤波器来抑制极大值点和边缘效应。本文根据输入数据信号的统计特性使用维纳滤波器调整移动通信网络数据的参数,根据边缘频率分布向量当前元素相邻的2a+1个元素来估计局部均值μ(b),局部方差σ2(b):

(1)

(2)

根据计算得出的均值和方差进行新的特征向量的提取和转换:

(3)

A'(b)是频率边缘分布向量,P2为平均局部方差,与局部方差呈现相反的变化趋势。当局部方差变小时,滤波器进行较大幅度的平滑;当局部方差变大时,滤波器进行局部幅度的平滑。经过滤波器对移动通信网络周围环境噪声等干扰因素的排除能够提高数据的清晰度和数据采集的有效性。将经过滤波器处理过的输出结果进行再次平滑处理,能够消除局部的干扰,优化移动通信网络数据采集结果,降低局部脉冲干扰:

(4)

最后归一化处理输出结果:

(5)

通过公式(4)和公式(5)降低特征向量局部的脉冲干扰,对滤波器做归一化处理完毕,对采集到的数据做门限处理,提取特征向量,实现移动通信网络数据特征向量的提取。

1.2 移动通信网络数据采集方法改进

在对移动通信网络数据的特征向量进行提取的基础上,引入云计算方法对移动通信网络数据进行采集,提高移动通信网络数据的准确性、降低漏检率。

针对传统的采集方法一直存在采集精度低、效率差的问题,提出基于云计算的移动通信网络数据采集方法,能够使采集到的数据最佳化。首先要组建平稳状态下的数据处理模型,获得常规样本数据特征矢量。既能够体现常规系统或用户行为模型的特性,将异常行为数据的特征和常规行为中特征的差异相比较,来辨别移动通信网络数据特征,处理得到方法如下:

假设移动通信网络数据特征样本点由xi代为表述,将数据处理范围中数据特征样本点都当作参照,依据重构误差函数式获取,全部间距都采用模糊规则算法对移动通信网络有效距离进行定义,其公式为:

(6)

式中:a(i)和b(j)表示相邻的距离的平均值,之后求解在移动通信网络数据中运算各点xi到最近相邻点之间的权重wij,运用模糊规则求解各数据特征样本点的最优解,固定权重Φ(Y)能够使函数的采集损失降到最小的程度,其公式如下所述:

(7)

通过上述公式(7)可求解各相邻数据点的权重,使函数损失降低,提高通信数据采集的有效性。在进行数据采集过程中,冗余信息干扰正常数据的识别和处理,针对如何处理冗余信息,文章提出的方法综合考虑可靠性、可操作性、以及实际情况,采用ADASYN算法根据冗余数据自身的分布特征,生成冗余数据集,并进行删除。

首先,按照下列公式计算整个小类样本所需生成的数据样本数目:

S=(Nmaj-Nmin)×β;β∈[0,1]

(8)

其次,对每个小类样本,根据欧式距离给出它的K近邻,计算冗余数据的密度:

(9)

式中:Ai是第类样本的K个最近邻中属于大类样本的样本数目,Z是一个常量,则可以确定冗余数据量为:

ni=Ωi×S

(10)

则在满足下列条件的情况下,可对冗余数据进行删除,增加数据采集的精度,约束条件如下所示:

(11)

仅当S≤1时,为冗余数据去除结果最优的状态,再次基础上,采用云计算法对移动通信网络数据进行采集结果可用下式进行表示:

(12)

文章算法通过采用时频分析理论对移动通信网络数据特征向量的识别和提取,排除外界干扰,基于云计算完成移动通信网络数据的采集。

2 试验结果与分析

文章通过仿真试验证明本文提出的方法能够将移动通信网络数据采集过程中来自外界复杂干扰因素大幅度降低。

图1 文献3方法数据的频率分布

图2 本文方法数据的频率分布

对比图1和图2采用本文的方法进行数据采集能够明显地降低外部干扰。图1显示文献3方法在采集移动通信网络数据时干扰因素明显,会导致数据信号的强度和清晰度降低。而采用文章提出的方法能够有效地降低来自外界干扰因素的影响,如图2所示。

文章提出的基于云计算的移动通信网络数据采集方法,在低信噪比的情况下仍然可以对通信数据保持较高的识别率。

图3 识别概率

由图3可知文章提出的方法在信噪比为-4dB时,仍可得到较高的正确识别概率。

图4 文献4方法

图5 本文方法

本文算法可以在有噪声数据集中发现任意形状的簇,并且有效地解决了文献[4]算法所存在的问题,文献[4]算法高密度的聚类结果被完全包含在相连的低密度的聚类结果中。对比如文献[4]算法图4与本文算法图5所示的不同数据集,本文算法能够如实地反映了数据集中数据的分布情况,并且能够降低干扰因素。

文章在对移动通信网络数据进行采集时采用基于云计算方法,在挖掘过程中找出通信网络数据中最小支持度阀值和最小置信度阀值条件的模糊关联规则,通过大量复杂而精确的云端计算,完成对移动通信网络数据的采集。通过仿真模型对使用本文算法和文献[4]方法的500组样本数据对比,可以得出本文算法的优越性。

表1 试验数据对比分析

图6 数据识别准确率

从表1试验数据中看出对于文献[5]方法样本数据的移动通信网络数据检测准确率仅有75%,而本文采用的方法准确率可以达到92%。

表2 试验数据对比分析

图7 数据识别漏检率

从表2试验数据看出对于文献[5]方法样本数据的移动通信网络数据识别漏检率达到7%,而本文采用的方法漏检率可以控制到2%。

在实际数据采集处理时,不可能得到全部理想的数据,我们得到的数据常常带有一些干扰数据,通信数据的处理也不能完全达到理想状态,因此算法具有一定的鲁棒性是十分重要的。文章以试验数据为基础分别绘制了传统方法下和本文算法下数据处理的鲁棒性曲线。

图8 文献4方法鲁棒性

图7、图8中所示,虚线是理想状态数据处理的鲁棒性曲线。传统方法下实际的鲁棒性曲线与理想状态的下的曲线偏差明显。而在本文算法下,实际的鲁棒性曲线和理想状态的曲线仍有偏差,当相比传统方法,鲁棒性有大幅度提高,如图9所示。

试验证明文章提出的基于云计算的移动通信网络数据采集方法能够有效地排除外界干扰,准确地完成对数据的采集。

图9 神经网络算法鲁棒性

3 结语

本文提出就云计算的移动通信网络数据采集方法,从移动通信网络设备采集到的时频分布对数据的特征向量进行提取,排除外界的干扰,完成对数据特征向量的有效识别,采用ADASYN算法,去除冗余信息,基于云计算实现对移动通信网络数据精准地采集,实验结果表明,文章提出的方法能够有效地实现移动通信网络数据的采集,精度高,效率好。

[1]PolydorosA,WooKT.LPIdetectionoffrequencyhoppingsignalusingautocorrelationtechniques[J].IEEEJournalonSelectedAreasinCommunications, 2009(5): 714-726.

[2]PoiselRA. 现代通信干扰原理与技术[M].陈鼎鼎,等译.北京:电子工业出版社,2005.

[3]XuR,DonaldWI.Surveyofclusteringalgorithm[J].IEEETrans-actionsonNeuralNetworks,2005(3): 645-678.

[4]ZHANGYan-xia,DAIFeng-xian.Newschemesoffeederprotectionfordistributionnetworksincludingdistributedgeneration[J].AutomationofElectricPowerSystems,2009(12): 71-74.

[5] 钱怡,武传华. 跳频信号检测和参数估计技术研究[J].空间电子技术,2007(2):14-18.

[6] 周琳,杨绍全. 时-频分析算法在通信信号调制识别中的应用[J].航天电子对抗,2002(5):40-45.

[7] 郭军,刘和平,刘平.基于大电流检测的霍尔传感器应用[J].应用技术,2011(5):142-145.

[8] 谭涛.NET远程控制excel在储量管理系统的应用研究[J].计算机应用与软件,2007(2):43-44.

[9] 阎飞,汪生,朱磊明.基于数据融合和数据挖掘技术的入侵检测系统设计[J].计算机工程与科学,2004(4):15-18.

[10] 李辉.基于支持向量机的网络入侵检测[J].计算机研究与发展,2003(6):799-807.

[11]ZhouAY,ZhouSG,CaoJ,etal.ApproachesforscalingDB-SCANalgorithmtolargespatialdatabase[J].JournalofComputerScienceandTechnology.2000(6):509-526.

(责任编辑:孙文彬)

Research on the Improvement of Data Acquisition Method for Mobile Communication Network Based on Cloud Computing

WANG Liu-yang, ZHANG Hui, YU Yang-xin

(Faculty of Computer and Software Engineering, Huaiyin Institute of Technology, Huai'an Jiangsu 223003, China)

There is a problem of low efficiency and poor accuracy of data acquisition in mobile communication network; it is caused by the interference from external factors in the traditional collection method. In terms of mobile communication network data acquisition method by cloud computing, the feature vector of data is extracted from time-frequency distribution collected from mobile communication network equipment, data feature vectors are effectively identified by excluding external interference. Using ADASYN algorithm to remove redundant information, the accurate acquisition of the mobile communication network data based on the cloud computing was achieved; the experimental results show that the proposed method can effectively fulfill the mobile communication network data acquisition with high precision and efficiency.

mobile communication network; cloud computing; data collection

2016-12-27

江苏省产学研合作项目(BY2015051-07)

王留洋(1974-),男,江苏淮阴人,副教授,硕士,主要从事信息管理与信息系统、智能信息处理技术方向的研究。

TP393

A

1009-7961(2017)01-0025-05

猜你喜欢
时频鲁棒性特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
荒漠绿洲区潜在生态网络增边优化鲁棒性分析
基于确定性指标的弦支结构鲁棒性评价
基于稀疏时频分解的空中目标微动特征分析
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
基于非支配解集的多模式装备项目群调度鲁棒性优化
非接触移动供电系统不同补偿拓扑下的鲁棒性分析
基于时频分析的逆合成孔径雷达成像技术