基于随机森林的RFID室内区域定位方法

2021-07-19 06:39赵圣健王雅妮
关键词:决策树标签定位

赵圣健,朱 翠,王雅妮

(北京信息科技大学 信息与通信工程学院,北京100101)

0 引言

随着基于位置服务(location-based services,LBS)业务的不断发展,全球定位系统(global positioning system,GPS)和蜂窝移动通信系统可以在室外环境中提供较为准确的定位服务,但其传输信号无法穿透墙体进入室内,无法提供准确的室内定位服务。与此同时,大型医院、大型图书馆、地下停车场、大型商场等场所,都需要较为精确的位置服务,人们对室内位置服务的需求变得日益迫切[1]。

典型的室内定位技术包括:无线局域网定位、蓝牙定位、红外定位、超声波定位、超宽带定位和射频识别(radio frequency identification,RFID)定位[2]。与其他定位技术相比,RFID具有抗干扰及穿透能力强、定位范围广等优势具有良好的适应性[3],且因定位速度快、成本低、非视距(non-line-of-sight,NLOS)等特点被广泛应用于应急救援、资产管理、人员跟踪等领域[4-6]。

近年来,随着人工智能的快速发展,机器学习、深度学习等算法被广泛应用于各个领域。合适的机器学习算法应用于室内定位系统,能够有效地提高定位精度、增强系统鲁棒性和降低成本[7]。常见的机器学习算法有支持向量机(support vector machines,SVM)、K-近邻、人工神经网络(artificial neural network,ANN)、朴素贝叶斯、决策树以及随机森林等[8-9]。其中SVM处理小样本、非线性问题时具有较好的性能,但高维空间的复杂性则会带来较大的计算量和存储空间等问题[10]。K-近邻算法在定位过程中要对数据库中所有的样本数据进行计算,当数据量过大时会造成计算量过大的问题,无法实现实时定位[11]。ANN模型能适应噪声数据进行训练,具有良好的数据拟合能力,但前期需要大量数据训练网络模型来调整其权值、阈值等参数,训练成本非常高[12]。基于贝叶斯分类算法定位具有计算量小、可处理多分类问题等优势,但它是建立在条件相互独立假设基础上的,实际应用中目标特征之间不可能绝对地独立,会影响实际定位效果[13]。通过决策树算法进行定位分类准确率较高,建树分类过程具有较好的可视化效果,但建树过深、分支过多容易造成过拟合。而随机森林作为一系列决策树的集成学习算法,继承了决策树的多种优势,且其随机性也提高了模型的泛化能力,降低了过拟合[14-16]风险。在多领域研究中发现,随机森林分类模型通常优于回归模型,尤其在解决大量样本、具有高维度特征或多分类问题时被研究者们广泛应用[17]。

基于以上分析,本文针对基于RFID的收发分离室内定位系统,设计了随机森林分类算法,该方法适用于较大空间内二维放置的、具有多维度特征的货物放置区域定位。仿真结果表明,在20 m×20 m的空间内,均分为16个5 m×5 m的区域,每隔0.1 m一个采样点,40 000个采样点的区域预测准确率可达93%,可以满足实际应用中针对区域定位的需求。

1 基于RFID的收发分离定位系统

RFID是一种非接触式自动识别技术,可以快速读写、长期跟踪管理,因而在智能识别领域受到广泛关注。传统的RFID定位系统由阅读器和RFID标签组成。RFID标签具有唯一的标识符(ID),附着在定位目标上。当目标进入阅读器天线工作范围内,阅读器和标签通过电磁场耦合的方式实现数据通信。

RFID系统依据其工作频率可分为低频、高频、超高频和微波4个频段。低频和高频系统基于电感耦合的基本原理,通信距离较短;超高频和微波系统基于电磁耦合反向散射原理,通信距离较长。其中超高频RFID系统凭借通信距离远、通信速率快及天线尺寸小等优势被广泛应用。

RFID标签可分为无源、有源和半有源3种。无源RFID标签通过阅读器发射的信号为内部芯片的工作提供能量,信号能量达到其工作的激励门限,芯片即可发射带有ID和位置信息的信号;有源RFID标签依靠本身电池主动发射射频信号,其通信距离远,但寿命短且成本较高;半有源RFID标签本身也有电池提供芯片的工作能量,但须阅读器信号来激活其发射信号。其中有源和半有源RFID标签仅用于少数贵重物品的管理,无源RFID标签凭借成本低、寿命长等优势被广泛使用。

传统的RFID室内定位系统中,阅读器天线发射无线信号激励无源RFID标签并接收标签反射的信号,对天线频率带宽有较高的要求。阅读器天线收发分离的应用使RFID室内定位系统可实现收发信号解耦,抑制了收发信号之间的干扰,同时大大降低了系统的成本。

本文采用的RFID收发分离定位系统包括多个信号发射器、超高频无源RFID标签和信号接收器。信号发射器负责发射无线信号,RFID标签在信号覆盖范围内被激活后发送带有信息的无线射频信号,信号接收器接收并处理被激活标签的反射信号进行定位。一个典型的RFID收发分离定位系统如图1所示,3个发射器依次激励目标标签,接收端接收到被激活标签的反射信号。下行链路(信号从发射器到标签)和上行链路(信号从标签到接收器)分别用虚线和实线表示。

图1 基于RFID的收发分离室内定位系统

2 两层随机森林区域定位算法

本文针对较大空间中多个区域内的所有目标进行区域定位。为了覆盖定位空间中所有位置,须部署多个信号发射器,因此每个目标将有一个多维的信号强度特征。基于以上分析,针对较大空间、大量样本、高维度特征且多分类的情况,本文选择随机森林分类算法进行目标的区域定位。

2.1 随机森林

随机森林是基于集成学习的思想对多棵决策树投票决定分类结果的一种算法,它的基本单元是决策树。假设现有数据集拥有N个样本,M个特征。每棵树建立时,从N个训练样本中以有放回抽样的方式随机取样形成训练集(即bagging取样),再从训练集数据的M个特征中随机选择m个特征作为树的分类节点,其中m

图2 随机森林算法

2.2 基于两层随机森林的分类模型

当空间中包含区域较多,即数据集有较多分类时,由于室内多径及噪声的影响,随机森林预测结果易出现分类差别较大的情况。通过仿真发现,一层随机森林错误分类中,有些目标预测结果与实际放置区域相差较远,区域定位准确率并不能满足实际需要。因此,本文提出了一种两层随机森林分类模型,有效地消除了定位区域差别较大的情况,并提高了空间内的总体区域定位准确率。

算法流程如图3所示:

图3 两层随机森林分类模型预测流程

对比一层的随机森林分类模型,两层随机森林模型的优势在于当定位空间较大、分类区域较多时,通过使用第一层分类模型,得到准确的区域粗定位之后,再使用该区域的第二层分类模型定位目标的实际放置区域,可以大幅提高分类准确率;缺点是增加了模型数量,提高了训练成本。因此本文所提出的基于两层随机森林模型的分类方法适合用于定位空间较大、分类区域较多情况下的区域定位。

3 仿真结果与分析

为了验证RFID收发分离系统及两层随机森林模型分类方法的有效性,搭建了仿真环境,通过与传统三点定位方法及一层随机森林分类模型的对比,验证方法的准确性和有效性。

仿真环境设置如下:定位空间大小为20 m×20 m×5 m(长×宽×高),空间包含16个5 m×5 m的放置区域,空间内每隔0.1 m布置一个采样点(标签),总共40 000个采样点均匀分布。区域分布如图4所示,16种颜色表示16个区域内的标签;空间均匀部署9个信号发射器,相邻间隔为10 m,空间正中央部署信号接收器,高度均为5 m;无源RFID标签高度为1 m,定位场景如图5所示。传输信号的频率为920 MHz;信号发射器的信号强度为33 dB;信号发射器、RFID标签及信号接收器的增益分别设置为6 dB、2 dB、6 dB。标签和接收器的灵敏度分别为-15 dB和-101 dB;调制损耗为-20 dB;地板反射系数为-0.8;当标签不在可读区域时,接收器的接收信号强度(received signal strength,RSS)设置为-100 dB。

图4 空间区域分布

图5 收发器位置部署

在两层分类模型定位过程中,第一层模型将目标粗定位于4个大区域A、B、C、D中,再通过第二层分类模型,将目标定位于大区域中的4个子区域1、2、3、4中,从而实现整个空间内的区域定位,两层区域划分如图6所示。

图6 区域划分

对空间内40 000个采样点分别使用三点定位方法、一层随机森林分类模型和两层随机森林分类模型进行区域定位,区域分类准确率分别为66.06%、86.93%和92.82%,定位效果分别如图7~9所示。

由图可知,随机森林分类效果明显优于传统基于信号强度的三点定位方法。图8和图9相比可以发现,一层随机森林分类模型的预测结果中,出现定位区域偏差较大的情况,如有些实际放置于A1区域中的目标,定位区域是D4。而图9中这种情况出现次数显著减少,且放置区域预测的错误结果大多为其原本放置区域周围较近的区域,由此降低了获取目标的难度,这种误差在大多数实际应用中是可以接受的。因此基于两层随机森林模型的分类方法提高了目标区域定位的准确率,可以满足实际应用的需求。

图8 一层随机森林模型

图9 两层随机森林模型

4 结束语

针对大型室内环境中的多分类区域定位的问题,本文提出了一种基于两层随机森林的RFID收发分离室内定位方法。利用第一层随机森林对目标标签进行较为准确的粗定位,再根据粗定位的结果选择对应的第二层随机森林模型进行最终的区域定位。较一层随机森林分类模型,虽增加了模型数量,一定程度增加了训练成本,但以较小的训练成本为代价获得了更为准确的区域定位性能,解决了部分采样点预测区域与真实区域差别较大的问题,满足实际应用的需求。由于真实室内环境中存在的噪声和多径干扰会影响接收信号强度,未来将在实际仓储空间内部署设备进行实际测量并试验该方法的定位性能,以实现大型制造业、大型商场等行业对货物的位置监管和存取。

猜你喜欢
决策树标签定位
简述一种基于C4.5的随机决策树集成分类算法设计
不害怕撕掉标签的人,都活出了真正的漂亮
少儿智能定位鞋服成新宠
把握新定位、新要求 推动人大工作创新发展
难与易
决策树学习的剪枝方法
让衣柜摆脱“杂乱无章”的标签
科学家的标签
科学家的标签
决策树在施工项目管理中的应用