基于SPSS Modeler的无线网络规划建模及应用探讨

2014-08-30 20:03陈儒宫晓强
无线互联科技 2014年8期
关键词:数据挖掘

陈儒 宫晓强

摘 要:数据挖掘作为一门新兴的学科,随着大数据时代来临,越来越受到各行各业的青睐。通过业界强大的数据挖掘工具SPSS Modeler进行建模,结合实例展示其数据分析处理的独特功能,探讨了其在无线网络规划中的应用,为更好地在中国移动四网协同背景下进行无线网络规划提供了一种新的思路。

关键词:数据挖掘;SPSS Modeler;无线网络规划

1 概述

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。大数据时代的来临,数据挖掘作为一个交叉学科,成为新兴的研究领域。数据挖掘把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。业界通用的数据挖掘工具主要有:SAS Enterprise Miner、IBM SPSS、IBM SPSS Modeler(原名Clementine)、SGI MineSet等软件。SPSS Modeler以其卓越的分析能力、可视化的操作方式、高度可扩展性受到全世界数据挖掘人员和企业用户的青睐。

随着中国移动4G网络的建设,中国移动真正进入了“四网协同”时代。无线网络规划的复杂程度越来越高,不仅进行大量的统计分析,同时需要不同的网络间的关联分析,并对未来的业务发展趋势进行预测,本文将基于数据挖掘工具SPSS Modeler在无线网络规划中建模及应用探讨,通过建立标准化的数据模型并应用于无线网络规划中,为中国移动在大数据时代下更好地落实四网协同战略提供新的思路。

2 SPSS Modeler简介

IBM公司出品的SPSS Modeler原名Clementine,SPSS Modeler采用图形化的界面,主界面分为:建模区、节点区、模型描述区、项目管理区共四个区域。通过选择节点,在建模区可快速构成数据流并建立模型。SPSS Modeler主要的节点为源节点、记录选项、字段选项、图形、建模、输出、导出等。

3 SPSS Modeler建模及优化

本节基于SPSS Modeler软件对某地区本地网TD/GSM分流比进行建模,通过流程化的模型快速达到数据分析的目的。

分析TD/GSM分流比,通用的做法是根据TD-SCDMA和GSM话务网管报表,通过小区ID间的关联关系进行匹配,找到TD-SCDMA和GSM共址的小区,从而得到计算分流比,进而得到分覆盖区域分流比的均值、分布情况等。针对不同的数据源,所有的分析过程都必须重复进行。

而基于SPSS Modeler软件,我们可以对整个分析过程进行数据流模型建立并加以固化,每次只需要更新数据源即可得到想要的结果。

下面我们通过案例来阐述下如何基于SPSS Modeler进行建模:

3.1 数据准备

从话务网管报表中提取GSM和TD-SCDMA话务报表,报表中含有所属地市、小区ID、数据流量等字段。

3.2 建立数据流模型

根据TD/GSM分流比的分析流程,建立一个标准的数据流模型。

⑴建立2个源节点,用于区分两个数据源: GSM和TD-SCDMA话务报表;

⑵由于报表中含有大量的数据,同时GSM报表中数据流量是分GPRS和EDGE,因此需要对2张报表进行过滤、汇总;

⑶对处理完的报表数据,根据小区ID进行合并;

⑷对共站址的小区进行分流比的计算,最终可以输出共站址列表、计算平均TD/GSM分流比、输出分覆盖区域的TD/GSM分流比直方图等。

3.3 模型优化和运行输出结果

对模型的每一个节点进行检验,如有问题可以针对模型进行一些优化,最终完善模型。点击“运行流”按钮,即可输出统计分析结果(如图1)。

根据统计分析结果,可以通过图形界面来展现,如分区域的TD/GSM分流比直方图等。

通过SPSS Modeler软件建立了TD/GSM分流比分析模型后,就可以用来分析同一类型不同数据源下的TD/GSM分流比指标。当然,TD/GSM分流比的分析,只是无线网络规划中一个简单地应用,不过也足以展现SPSS Modeler软件强大的数据挖掘能力、良好的可操作性和可扩展性。对于无线网络规划的分析,只需要建立一个标准的数据流模型,达到快速规划的目的。

4 SPSS Modeler在无线网络规划中的应用探讨

无线网络规划是指根据网络建设的整体需求,设计无线网络的目标,以及为实现该目标确定网络的配置。数据挖掘工具SPSS Modeler在无线网络规划中的应用主要表现在网络统计分析、网络关联分析和网络预测分析等几个方面。

4.1 网络统计分析

中国移动GSM/TD-SCDMA/TD-LTE/WLAN四网共同组网,无线话务网管数据越来越海量化,使用Excel等简单的数据处理工具来进行无线网络规划中海量数据的统计分析显得越来越力不从心,同时也会掩盖多业务类型下大量的有用信息。通过数据挖掘工具,可以找出因为分析手段能力不足而被忽略的高价值信息,从而可以帮助运营商进行科学的决策。

4.2 网络关联分析

四网融合背景下,各制式网络之间存在的一些潜在的关联性,比如GSM/TD-SCDMA/TD-LTE/WLAN分流特性、无线网利用率等。通过数据挖掘进行关联分析,可以找到四网协同发展的关键信息,从而指导市场、业务和网络建设部门的协同工作,发挥最大效益,达到四网的定位目标。

4.3 网络预测分析

无线网络规划中常常需要进行业务量的趋势预测,而这也是数据挖掘工具的强项。

业务预测分析一般以时间为单位,通过对以往某一时间系统数据的分析,来预测未来某一时间点可能的结果,从而指导网络扩容和市场发展。

5 小结

各运营商多网协同大环境下,网络之间的关联性使得无线网络规划中变得越来越复杂,加上数据信息量的持续增加通过对数据挖掘工具SPSS Modeler的介绍,结合TD/GSM分流比分析展现了如何基于SPSS Modeler工具进行无线网络规划的建模。最后,探讨了SPSS Modeler工具在无线网络规划中的多种应用,为更好地在中国移动四网协同背景下进行无线网络规划提供了一种新的思路。

[参考文献]

[1]朱东照,等.TD-SCDMA无线网络规划设计与优化(第2版).2008年7月.

[2]IBM.SPSS Modeler 14.2简体中文教程.

猜你喜欢
数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
数据挖掘技术在中医诊疗数据分析中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究