基于智能技术的移动物联网数据深层挖掘技术

2022-10-21 00:48郭霏霏
黑龙江工程学院学报 2022年5期
关键词:深层数据挖掘基站

郭霏霏

(泉州职业技术大学 智能制造学院,福建 泉州 362000)

移动物联网通过传输网络将信息传输至指定地点或用户,现已经成为人们日常生活与工作中不可或缺的一部分[1]。移动物联网随着科学技术的不断创新,使其在现代互联网行业占据主要地位,具有明显的海量性与异构性等特征[2]。移动物联网的数据挖掘结果决定了用户能否获得高质量服务体验,在海量移动物联网数据中,深层挖掘出对用户有价值的信息对日后的移动物联网发展具有十分重要的意义。

针对移动物联网数据深层挖掘问题,陆兴华等[3]基于大数据的智能家居物联网用户行为模式挖掘方法,构建智能家居物联网用户行为模式的大数据分析模型,根据用户行为特征的聚类性实现智能家居物联网用户行为特征挖掘和自适应聚类,提高用户行为模式挖掘的自适应性,但该方法冗余参数较多,在挖掘数据方面较为缓慢。李洪波[4]提出一种物联网环境下舰船监控网络高维异常数据挖掘方法,结合舰船监控网络异常数据的高维特点,引入支持向量机对舰船监控网络高维异常数据进行挖掘,找到舰船监控网络异常数据的变化趋势,但该方法数据深层挖掘结果可靠性不高。

为准确获取移动物联网真实数据深层挖掘结果,提出基于智能技术的移动物联网数据深层挖掘技术。通过Hadoop平台完成数据存储功能,使用智能技术进行数据深层挖掘,运用不同的测量统计数据实现准确的移动物联网数据深层挖掘结果分析。

1 基于Hadoop的数据存储平台构建

构建基于Hadoop的数据存储平台,为移动物联网数据深层挖掘相关的分析工作提供数据支撑。融合海量数据分布性、多样化特征,切实考虑系统编程内容,使用三层分布式结构,让平台具备优秀的拓展性,平台全局结构如图1所示。

图1 基于Hadoop的数据存储平台结构

根据图1可知,显示层为用户提供性能优良的界面,一般用户可利用界面观看与搜索移动物联网信息,高级用户利用接口完成平台拓展[5]。业务逻辑层可同时处理大量网络信息,配置管理平台设备。数据资源层是平台的关键因素,保存并管理移动物联网有关数据。从实际性能出发,把平台分成3个层次,如图2所示。

图2 平台功能层级架构

根据图2可知,第一层为数据访问层,针对大量移动物联网数据储存情况,在保存或提取数据过程中不会仅限制对一种数据库的操作,该层可以屏蔽不同数据库供应的数据源,拥有数据库访问功能,这样平台才会符合数据处理需求。第二层为数据处理层,也是该平台的关键部分,是平台研发的核心,运用分布式数据库技术与Linux集群技术,实现对大量数据的高速处理,并将处理完毕的数据保存至平台的分布式数据库。此层共具备5个板块,分别为系统管理、加载储存、并行查找、数据字典及备份修复板块。第三层是业务应用层,内部包含用户界面与算法库。

平台内涵盖若干数据库,其中,最为重要的是HBase分布式数据库,数据库使用列储存模式完成数据记录,数据行有三类基础类别:行关键字、时间戳与列[6]。各行均包含一个可排列的行关键字,也是数据行在数据库中的唯一识别特征。移动物联网数据储存模式如表1所示。

表1 移动物联网数据储存模式

2 智能技术下移动物联网数据深层挖掘

通过所建平台完成移动物联网数据存储与计算后,利用智能技术中的数据挖掘工具,通过海量数据实现用户价值、感知与行为解析,多角度呈现用户对移动物联网的需求,制定适宜的行动方案,完成精准移动物联网数据深层挖掘。

数据深层挖掘分析是移动物联网建设的根本条件,基站之间距离较远或数据深层挖掘结果冗余均会导致某些位置的数据覆盖,且数据挖掘深度明显不足。与此同时,基站之间距离较短,叠加挖掘数据也会形成极大干扰,无法提供优质的移动物联网服务,增加投资成本。移动物联网结构要在保障用户移动性的基础上使得叠加方位处于一个很低的水准。

利用Cost-Hata模型判断移动物联网叠加水准,将其计算解析式记作:

LTERSRP=TDSRSCP+Offset_Power-

Offset_Frequency+Offset_AntGain-

Offset_FeederLoss+Offset_UEGain-

Offset_PenetrationLoss.

(1)

运用网络真实数据,参照工作参数、扫频等大数据信息,使用矩阵定理计算,利用频段自由空间传播模型耗损、仿真叠加和耗损矩阵,快速评价移动物联网的叠加状态。

干扰现象是影响移动物联网质量的重要因素,代入一个干扰贡献指数评价移动物联网叠加程度。设定干扰相邻区域的能量总和与移动物联网主要区域的能量总和比率为干扰贡献指数,指数越高,证明移动物联网主要区域对外界的干扰越高,亟需修改的优先等级值越大。

将干扰贡献指数的计算公式描写为

(2)

采用式(2)评价移动物联网范围和干扰相邻区域能量之间的耦合性,由上至下排列,挑选高干扰指数的区域范围,融合真实场景与工作参数,了解干扰指数较高的原因。

以往的移动物联网状态主要包括叠加和干扰两个因素,无法有效获得高价值基站方位,致使搭建移动物联网之后发生许多问题。而智能技术下的移动物联网叠加状态能从话务热点、用户终端和价值业务等多方面采取相关性计算[7]。划分数据与话务热点使用次数频繁的区域,评估网络流量价值较高的区域,挖掘数据业务应用率高的范畴,重点分析影响用户感知的核心问题,减少移动物联网资源管理投资金额。

运用基于栅格的价值评估体系,在高流量范围筛选基础上完成移动物联网地理化特征感知,获得若干区域组成的价值分数,评估过程如图3所示。

图3 价值评价过程

按照移动物联网数据实际特性,对其采取数据降维,降低数据复杂性。使用不同的聚合模型实现关联整合,譬如在深层挖掘过程中将道路检测、路面测量扫频、用户测量报告等数据根据关联的大小进行整合,在价值评估时把业务分布、用户分布等数据采用固定比例完成关联整合。

将用户地理方位作为搜寻目标,探索与之有关的方位信号强度、干扰状况、终端支持数据类别及周边基站布局情况,组建一个全方位多样化的移动物联网用户行为整合模型。依据用户行为整合模型,划分出绝对静态用户数量[8-9],综合基站方位分布形态,明确移动物联网业务成熟度较高的范围,了解不同用户使用移动物联网的地理位置,提升移动物联网建设精准性。

3 基于测量统计数据的移动物联网数据深层挖掘

通过上述过程完成移动物联网数据深层挖掘相关准备工作,下面提出一种基于测量统计数据的移动物联网数据深层挖掘方法,得到移动物联网挖掘区域实际结果。测量统计数据包含邻居小区支持(Neighbor Cell Support,NCS)与排序倒数(Mean Reciprocal Rank,MRR)。

若要明确挖掘链路传播情况,就要提取挖掘路径耗损与挖掘距离等信息,挖掘路径耗损可从MRR与NCS的测量报告中获取。使用均值思维,也就是挖掘路径耗损值是全部移动物联网用户的平均值,挖掘距离也是一个均值[10-11]。将每个区域的所有用户归入一个用户点,使它位于网络区域主方向与移动物联网中心之间的距离为d。

真实的物联网接收信号强度的概率分布函数计算比较繁杂,受到用户分布、相邻区域位置等因素影响。为方便计算,设定接收信号强度符合平均值是μ、方差是σ的正态分布。信号强度高于α的情况下才会被记录于测量报告中,被记录的概率为p。将NCS结果内的挖掘路径耗损值设定为η,而想要求解的值是μ,二者之间的差值是Δ,则Δ就是要校准的偏移值。

挖掘信号强度高于α的概率为

(3)

挖掘信号强度高于α的均值为

(4)

由此得到

(5)

移动物联网传播模型可描述为挖掘路径耗损方程[12],通常记作

PL=f+Hb+D+α(HbD)+Hm.

(6)

式中:PL为挖掘路径耗损;D为传播长度;f为频率;Hb为基站天线长短;Hm为用户天线长短。同时针对某个固定区域,f与Hb的值都是一个固定值,假设存在如式(7)的等价关联,把式(6)化简成式(8)。

A=Hb,B=f+Hb.

(7)

PL=B+D+α(AD)+Hm.

(8)

式中:A,B均为挖掘待定指数,要求解两个挖掘待定指数的具体数据,将式(8)转变成

PL=Pt-Lf+Ga-Lθ-Pr.

(9)

式中:Pt为功率;Lf为挖掘耗损;Ga为天线增益值;Lθ为夹角相对衰退值;Pr为接收功率。

将空中传播间距描述成

(10)

式中:(Xt,Yt)为基站实际坐标;(Xr,Yr)为信号接收位置的坐标,也就是输送测量报告的归一化坐标。假设两个坐标的经纬度依次为LONi与LATi,则将经纬度变换成坐标的方程式为

Xi=(LONi-LON0)×102 320,

Yi=(LATi-LAT0)×111 160.

(11)

式中:LON0、LAT0的取值不受任何条件限制,文中设定两者分别为110与20,这样计算获得的数值较为适中,方便运算。

针对每个移动物联网挖掘区域,因为在该区域范围内产生的移动物联网测量报告中均包含了研究区域的移动物联网测量信息[13],即每个移动物联网基站包含若干(PL,D),以便推算出待定指数A,B。计算方式有两种,第一种是使用最小均方误差准则计算挖掘路径耗损方程,得到

PL=B+D+α(AD)+Hm.

(12)

第二种是利用最小均方误差拟合Okumura-Hata挖掘路径耗损,得到

PL=(44.9-6.55Hb)D+B.

(13)

针对第一种方法,详细描述待定指数A,B运算过程。将代价函数定义为

(14)

式中:PLi为第i条链路的挖掘路径耗损;di为第i条挖掘链路的距离,共拥有K条挖掘链路。

针对第二种方法,天线高度Hb是已知量,则使用(PL,D)来计算待定指数B,得到

(15)

在这种方法中,采用多个(PL,D),由于具有不同的偏差值,很可能包含了错误的样本点,可信度很低。因此,可预先去除可信度较小的(PL,D)。去除过程是:依次运算K次,每次都去除一个样本点,使用(K-1)组(PL,D)完成推理过程,再对比其均方误差J,挑选均方误差最低的挖掘路径耗损方程为可信度较小的解[14-15],由此清除错误样本点,保证移动物联网数据深层挖掘分析的合理性与准确性。

通过上述过程,获得移动物联网每个方向的挖掘路径耗损方程,然后将方程与基站发射功率、天线增益等数据进行融合计算,得到任意点接收到的网络覆盖信号强度,将信号强度从高到低排列,获取挖掘盲点区域与重复挖掘区域,并利用已有数据获得移动物联网挖掘图,完成高精度移动物联网挖掘计算。

4 仿真实验

为了验证基于智能技术的移动物联网数据深层挖掘技术的可靠性,对其进行仿真实验。在实际场景中的研究分析会受到人工、时间等因素的影响,因此,使用Forsk Atoll移动物联网规划仿真软件作为实验平台完成实验内容。实验参数配置:客户端选用移动客户端,中心业务服务器为2个,存储节点为10个,挖掘路径耗损为0.01 dB,无线路由器发射功率为100 mW,基站之间的距离为200 m。选择某城市密集工业区域作为实验对象,移动物联网覆盖情况如图4所示。

图4 移动物联网覆盖情况

根据图4可知,该区域基本已全面铺设移动物联网,且覆盖面积较大,但移动物联网覆盖不够均匀,某些区域出现叠加现象,而某些区域并无网络覆盖,这样可能会增加覆盖投入资金成本,形成通信浪费。

将目标区域均分为A,B,C,D四部分,如图5所示,图5中圆点代表信号发射中心。

图5 移动物联网信号区域划分

根据图5所示,以时间为变量,24 h为周期,实验数据用户为在各区域随机选取100人采样,将数据集传送到移动物联网深层挖掘系统中,在计算机软件程序下运行数据集,分别记录程序在不同区域上所需的时间,采用判断分析、相关分析和多元回归分析对数据进行处理与统计,运用所提方法验证不同时段下移动物联网用户数据挖掘情况,并将文中方法与文献[3]和文献[4]方法进行对比,挖掘标准为81~100(全部挖掘)、59~80(部分挖掘)、59以下(未全部挖掘),结果如表2所示。

表2 不同方法的移动物联网数据挖掘情况

根据表2中的数据可知,不同区域用户对移动物联网挖掘分数走向大致相同。其中,A,B区域服务分数基本相同,符合客观移动物联网用户需求,但从图4看出,A区覆盖均衡,B区存在大面积重叠覆盖区域,造成资源浪费;C区服务评分最差,还需搭建更多信号发射中心;但在移动物联网覆盖较少的D区域,用户评分要高于其他3个区域,表明该地区用户数量较少,移动物联网覆盖水平能够满足人们的日常需求。相比两种文献方法,文中方法移动物联网数据挖掘分数较高,且均在81~100范围内,能够实现全部挖掘。

综合上述分析可知,所提出方法具有较高的数据挖掘分数,能够有效获得目标区域真实的移动物联网数据挖掘情况,准确分析移动物联网数据挖掘,为制定合理的移动物联网建设规划提供有效依据。

5 结束语

为准确获得目标区域真实的移动物联网数据挖掘情况,基于Hadoop构建数据存储平台,在有效保存移动物联网数据的同时,使用智能技术进行数据深层挖掘。该方法体现出用户对于移动物联网的具体需求,运用邻居小区支持与排序倒数两个因素得到目标区域移动物联网覆盖图像,通过仿真结果表明所提出方法的可靠性,为移动物联网深入发展提供参考。

猜你喜欢
深层数据挖掘基站
改进支持向量机在特征数据挖掘中的智能应用
中深层套管式地埋管换热器换热性能模拟研究
深层搅拌桩在水利工程地基处理中的应用分析
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
哈贝马斯科学技术批判的深层逻辑
5G基站辐射对人体有害?
5G基站辐射对人体有害?
基于移动通信基站建设自动化探讨
可恶的“伪基站”