关联规则挖掘在CMMB网络分析中的实现*

2010-08-10 07:47谭泽富廖明霞谢小维金学广戴闽鲁
电视技术 2010年2期
关键词:测试数据电平信噪比

王 燕 ,谭泽富 ,,廖明霞 ,谢小维 ,金学广 ,戴闽鲁 ,

(1.重庆邮电大学 移动通信重点实验室,重庆 400065;2.重庆三峡学院 物理与电子工程学院,重庆 404000;3.日本芝测株式会社 北京代表处,北京 100052)

1 引言

移动多媒体广播(CMMB)[1]已经开始商用,许多城市都在进行网络建设、扩大覆盖范围。应用实际路测的数据基于关联规则挖掘来分析网络,可以向正在建网的城市提供参考,也可以给网络优化提供基础数据。

目前CMMB网络主要进行下行无线覆盖,网络测量的主要参数包括:信号强度指示RSSI,信噪比SNR,LDPC/RS的误块率LDPC/RS_BLER,LDPC的迭代次数,频率偏移,调制误差率MER和调制精度—误差矢量幅度EVM以及星座图等[2]。CMMB网络覆盖的质量与RSSI,SNR以及LDPC/RS_BLER密切相关,确定它们的门限值可以给CMMB网络优化提供依据。

针对实验室测试仪器和高端网络测试仪器昂贵的缺点,可以利用VC++6.0和SQL2000编程,给出实现方法,采用关联规则数据挖掘技术分析路测数据。

2 关联规则挖掘与CMMB路测系统

数据挖掘(data mining)就是从大量不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[3]。关联规则挖掘(association rules mining)本质是从大量的数据中或对象间抽取关联性,它可以揭示数据间的依赖关系,根据这种关联性可以从某一数据对象的信息来推断另一对象的信息[4]。关联规则可以直观地发现数据库中任意项集之间的联系和数据中隐含的信息。这种联系不依赖于某种特定的分布,仅依靠数据在特定模型中经过多次迭代拟合,且根据项集在数据资料中出现的概率而构建的。因而,它有别于传统的统计学方法,其优势在于结果明确且容易解释[5]。

关联规则挖掘的CMMB网络分析系统主要实现对数据采集及预处理、关联规则挖掘、获取规则后处理这3个部分。数据预处理主要工作是数据转换,关联规则挖掘主要采用改进的Aprior算法。

利用日本芝测公司的CMMB信号分析仪Tx701A对北京的CMMB网络进行测试获取数据。路测系统包括测试用车、GPS、接收天线和Tx701A,以及路测前台和后台采集软件。测试地点的地理信息内容包括:时间、经纬度、高度、速度、信号电平、信噪比、RS误块率。

通过测试得到的数据是连续的数据,首先必须将连续的数据离散化。这一步是整个数据挖掘来说至关重要。

3 数据库程序详细设计

3.1 初始化

初始化程序主要完成数据库的初始化,包括数据的物理存放位置,逻辑存放,数据库的创建,所有表的创建,主键、外键、索引、约束的建立。通过预先写好的脚本文件,通过ADO接口函数实现。

3.2 入库模块功能

将测试文件(test data)导入到数据库,测量文件对应的类是CInputData。对应的入库处理在类中实现。同时将部分中间结果分析处理,并且写入数据库中。

读取SCA测试文件,获得基站测试数据,同时统计测试的记录数,测试的时间,并且将基站测试数据写入TEST_DATA表中,当处理完成测试文件的所有记录时,将统计信息写入PROJECT表中。同时分析测试中每个点,即根据SCAN的测量值,结合缺省的Threshold判断某个基站是否满足条件,如满足,则将数据写入CMMBThreshold表中。然后根据CMMBThreshold进行缺省事件的分析,并写入CMMBThreshold表中。

3.3 数据实体描述

数据实体描述见表1。

表1 数据库表及数据实体描述

3.4 主框架设计

程序的主体框架采用MFC的MDI架构,程序框架由应用程序类CM999AApp、主窗口类CMainFrame及子窗口类、文档类、视图类组成。

子窗口类从CMDIChildWnd继承过来,每个子窗口类都保存有相应视图类的指针,窗口类通过该指针操作视图。如果子窗口类从CChildFrame继承,可以把子类的相同属性和操作放在父类,设计会更加简洁,也更符合面向对象的原则。

初始化COM库以后接着连接数据库,连接数据库失败退出程序初始化。连接数据库成功调用QueryProject函数获取最新一个工程的起始和结束时间并存放在Project,这个时间是给Mapx视图使用的。

登录数据库成功则创建和显示主窗口CMainFrame,在创建主框架窗口的OnCreate函数里创建工具条、回放控制条,状态条和用于显示工程树的控制条。回放控制条的的控制(显示时间、滚动位置、控制拖动时的数据显示等)在CReplayScrollBar里实现。主框架窗口创建后在显示主窗口的OnShowWindow函数里,函数通过保存在CM999AApp的文档模版指针,调用CreateChildWnd函数创建子窗口和视图。

主要数据包括CMMB系统信息表和测试数据表。使用SQL Server 2000建立测试数据库[7],使用脚本语言建立数据库,数据库表格包括:测试数据表、GPS位置表、测试系统信息表及其他辅助表等。

3.5 参数门限设定

在存储过程中使用门限值来分析数据并生成分析数据表。参数门限设定对话框如图1所示。

图1 参数门限设定对话框

导入数据时,首先将原始数据分解到测试数据表,GPS位置表,测试系统信息表等数据表中,根据设定的参数表对已测数据信号电平RSSI和信噪比SNR进行分析得到相应的视音频质量参数,并存入数据表中,为其他分析显示提供数据。

4 关联规则的数据挖掘算法模块

4.1 算法描述

从数据库模块中可以看出,CMMB网络的测试数据是多维多层的,由于Apriori算法只是在单维单层的数据模型上进行挖掘[8],不适合对多维多层的数据模型进行挖掘,要想对上述的路测的数据(信号电平、信噪比、误块率)进行分析,Apriori算法必须进行一定的改进。将数据模型的每个维看成是一个项目,就可以挖掘多维关联规则。

计算过程如下:

4.2 算法实现

首先产生频繁1-项集L1,本项目中频繁集为L1={信号电平,信噪比,误块率}。

测试数据操作界面如图2所示。

图2 数据操作界面

对CMMB网络分析系统进行数据挖掘,首先需要清除无关的数据,挑选出有用的数据,再将这些数据转换成关联数据挖掘需要的形式。采用基于求拐点对数量属性进行划分的方法来将连续数据转换成离散数据,用抽取时间间隔的方法,将绝对时间数据转换成相对时间数据。其中,需要将连续数据转换成离散数据,将绝对时间数据转换成相对时间数据。

根据文献[9]中对北京CMMB单频网络的测试数据(SNR单位为dB,PWR单位为dBm,本文仅采用测试数值),对信噪比、信号电平、误块率进行分级,设置门限值,表2~4分别为信噪比分级表、信号电平分级表和误块率分级表。

表2 信噪比分级表

表3 信号电平分级表

表4 误块率分级表

根据设置的门限值,PWR=-90,SNR=5,改进的Apriori算法的项目集合是I={{信噪比1,信噪比2,…,信噪比 7},{信号电平 1,信号电平 2,…,信号电平 7},{优秀,良好,一般,差}}。 111 表示 PWR>-75,SNR>20,BLER<0.005。 当 A={信噪比 1, 信号电平 1},B={优秀}时,A=>B的蕴涵式表示的规则是信号电平数值大于-75,信噪比数值大于15时信号质量为优秀。这样仅仅通过信号电平和信噪比数值就能确定信号的覆盖情况。

通过实验结果和分析可见,各个挖掘参数的设置对系统的效率和产生规则都有影响。用户可以根据自己的具体需求设置各个参数,从而得到想要的挖掘结果。

5 小结

笔者研究了关联规则数据挖掘技术在CMMB无线网络分析中的实现,并结合实际数据给出了分析结果。通过对关联规则挖掘的理论研究,针对挖掘门限值提出了具体步骤,并用VC实现了算法。实验结果表明,该算法对CMMB网络优化有一定参考价值,该分析结果可以应用到实际的网络分析中去,为CMMB网络的进一步优化提供依据。

[1]解伟.移动多媒体广播(CMMB)技术与发展[J].电视技术,2008,32(4):4-7.

[2]戴闽鲁.CMMB无线网络测试与分析[M].北京:电子工业出版社,2009.

[3]顾泽元.关联规则数据挖掘频繁项目集发现算法的研究[D].哈尔滨:哈尔滨工程大学计算机工程学院,2005.

[4]陈安,陈宁,周龙骤.数据挖掘技术及应用[M].北京:科学出版社,2006.

[5]宋魏,高萌,曾春秋,等.数据挖掘中关联规则在睡眠对躯体疼痛影响评价中的应用[J].现代预防医学,2008,35(5):831-835.

[6]史晓蕾,李明东,刘宏博.关联规则挖掘在检验信息系统中的应用研究[J].电脑开发与应用,2008,21(1):40-42.

[7]王欣,徐腾飞,唐连章,等.SQL Server 2005数据挖掘实例分析[M].北京:中国水利水电出版社,2008.

[8]王云,苏勇.关联规则挖掘在道路交通事故分析中的应用[J].科学技术与工程,2008,8(7):1824-1827.

[9]王燕,谭泽富,戴闽鲁,等.CMMB单频网络的分析[J].电视技术,2009,33(10):98-100.

猜你喜欢
测试数据电平信噪比
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
基于深度学习的无人机数据链信噪比估计算法
测试数据管理系统设计与实现
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
基于自适应粒子群优化算法的测试数据扩增方法
NPC五电平Z源逆变器的设计研究
空间co-location挖掘模式在学生体能测试数据中的应用
基于三电平光伏并网逆变器控制系统的研究与实践
保持信噪比的相位分解反褶积方法研究
基于NPC三电平变换器的STATCOM研究