摘 要:传统基于指纹库构建的无线地图没有考虑室内环境中指纹会随着接收信号强度的变化而变化这一因素,所以系统鲁棒性较差。为了解决这一问题,提出了一种基于特征迁移的室内定位算法,采用最小化最大均值差异算法来减小离线与在线兩个阶段所收集数据的分布差异。通过多次应用算法的实验研究,结果表明,在复杂多变的室内环境中定位准确率得到大幅提升,有效地克服了两个阶段指纹特征分布差异带来的影响。
关键词:室内定位;特征迁移;最大均值差异
中图分类号:TN92 文献标识码:A 文章编号:2096-4706(2021)02-0044-05
Abstract:The traditional wireless map constructed based on fingerprint database does not consider that fingerprint in the indoor environment will change with the change of the received signal strength,so the system has poor robustness. In order to solve this problem,an indoor positioning algorithm based on characteristics migration is proposed,using minimization the maximum mean discrepancy algorithm to reduce the distribution difference of the collected data between the offline and online stages. By means of several times of experimental study on application of algorithm,the experimental results show that the positioning accuracy in the complex indoor environments has greatly improved,and it effectively overcomes the influence of the distribution difference on fingerprint characteristics between the two stages.
Keywords:indoor positioning;characteristics migration;maximum mean discrepancy
0 引 言
基于指纹的室内定位一般包含两个阶段:离线阶段和在线阶段[1]。在离线阶段,将定位区域划分为具有已知标签的小区域,各个接收点(Receiving Point,RP)在各个采集区内的固定位置收集接收信号强度(Received Signal Strength,RSS)值以构建指纹数据库。在在线阶段,一旦收集到一条待定位的RSS样本,系统则通过匹配算法从指纹数据库中找到与待定位样本最相似的点进行位置估计。很多科研团队已经陆续将很多不同算法运用到室内定位领域,文献[2,3]采用了K近邻法(K Nearest Neighbor,KNN)和加权K近邻法(Weighted K Nearest Neighbor,WKNN),但是这两种算法只对距离敏感,对所收集数据中其他有用信息的运用较少,所以很难提升室内定位的精度;文献[4]运用了支持向量机(Support Vector Machine,SVM),由于室内定位是多分类的问题,SVM是一个二分类器,所以当数据较多时,训练起来比较耗时;为应对室内接入点(Access Point,AP)的不断增多,文献[5]采用了卷积神经网络(Convolutional Neural Networks,CNN),因为CNN可有效处理高维数据,且对特征有更好的学习能力。虽然这些室内定位算法在定位性能上表现优异,但都是建立在默认离线收集的指纹和在线测试的指纹遵循相同的分布规律这一前提下。然而,在实际的定位中,RSS指纹的分布会随着周围环境的变化而发生偏移,这往往会导致定位性能下降[6],重新收集数据训练模型又耗时耗力,缩小离线阶段与在线阶段RSS指纹分布差异是提升系统性能的关键,事实证明,迁移学习是该问题的有效解决方案[7,8]。
为解决这个问题,本文提出了基于特征迁移的室内定位算法,在离线阶段,通过大量的源域带标签和少量目标域带标签的指纹构造最优迁移矩阵,以最小化最大均值差异并利用迁移后的源域RSS指纹对分类器进行训练;在在线阶段,对迁移后的目标域RSS指纹进行预测。实验结果表明该算法使系统鲁棒性在一定程度上得到增强。
1 室内定位影响因素分析
1.1 RSS的波动性
由于受非视距传播、多径效应和阴影效应的影响[9-11],RSS值在复杂的室内环境中并非是一成不变的。为验证RSS的波动性,本小节采用同一智能手机在固定位置进行测试,实验所用设备为MEIZU,所用系统为Android 5.0,用该手机收集两个AP的RSSI值在半个小时内的变化情况,其结果如图1所示。可以看出,在该情况下两个AP的RSS值分别在某一固定值附近上下波动,较为稳定,可以在短期定位中获得满意的结果,但是在实际定位中,定位时长远远不止半个小时,如图2所示,反映了之后15天所采集的RSS变化盒图。RSS的样本分布每一天都有较大的不同。所以传统基于指纹定位方法的鲁棒性较差,需要及时更新训练模型。
1.2 接入点的不稳定性
本小节利用文献[12]提供的公共数据集UJI-DB进行相关的测试和仿真。图3给出了每个月份检测到的所有AP,其中黑色圆点表示该AP被检测到。AP的出现和消失并没有呈现出明显的规律,例如前100个AP出现频率很高,中间部分的AP则呈现出间断性消失的现象,还有部分AP在前几个月并没有出现,但是在后续的月份却被频繁地检测到。表1展示了第一个月采集到的训练数据的AP数量统计信息,第一月仅过了20天,新增和消失的AP数量就已经十分可观。随着时间的推移,在后续月份的在线定位过程中,第一月采集的训练指纹库有效性会降低。
2 基于特征迁移的室内定位系统
2.1 源域与目标域
从上文可知,由于RSS的波动性和AP的不稳定性,源域和目标域中同一地点所得到的RSS特征分布并不一致,从而导致定位系统鲁棒性较差,因此选择一种合适的度量方法来减小两域之间RSS特征分布的差异,这也是提高定位系统精确度和鲁棒性的关键。在WiFi指纹定位中,采集到所有RSS值RSSI={,…,,…,,…,,…,}。i为第i个定位RP,i=1,2,…,N,N为RP总个数,k为采集的第k条指纹,k=1,2,…,K,K为指纹样本总数,其中带标签的指纹数量为L,j为第j个AP,j=1,2,…,M,M为在环境中可测AP总个数。将每条指纹样本表示为xk={,…,},则可将RSS指纹库表示为X={x1,…,xL}。假设第z个区域的采集点采集到了第k条测量指纹,则在该条指纹上贴标签yk=z,其中z=1,2,…,Z,Z为定位区域的总个数。通过该方式获得了标签集Y={y1,…,yL}。我们将离线阶段收集的RSS指纹库和标签集作为源域 ,相反,将在线定位阶段收集的RSS指纹库作为目标域DT,在线阶段数据一般不包含标签集,即。Ls和LT分别为源域和目标域的指纹样本总数。
2.2 最小化最大均值差异算法
本文采用最大均值差异(Maximum Mean Discrepancy,MMD)算法[13,14],假设源域和目标域的RSS数据的边缘分布为P(Xs)和P(XT),当P(Xs)=P(XT)时,两个分布的条件概率Q(Ys|Xs)=(YS|XT)。基于此条件,当P(Xs)≠
P(XT)时,MMD可以表示为:
表示将源域与目标域数据映射到再生核希尔伯特空间(Reproducing Kernel Hilbert Space,RKHS),再通过计算RKHS中映射过来的两域数据距离均值来判断两域之间的差异。Φ(·)为将两域RSS数据映射到RKHS的映射函数。由式(1)可知,MMD的关键在于找到一个合适的Φ(·)作为映射函数。但是这个映射函数随着任务的不同而不同,难以直接求出。将式(1)展开:
结合支持向量机(SVM)中的核函数k(·),不需要显式的表达Φ(·),所以MMD又可以表示为:
为使式(3)取值最小化,可将其表示为:
其中,tr代表矩阵求秩运算,Gram矩阵K∈?(Ls+Lt)×(Ls+Lt),需要注意的是KST=(KTS)′,核函数k(·)采用的是高斯核k(x,y)=,带宽γ为源域与目标域成对距离的平均值,,将K分解为 ,令,,v≤NM,w为本文所求的特征迁移矩阵,为中间变换矩阵,v为RSS指纹映射到RKHS之后的维度,所以式(4)可写作:
其中,tr(wTw)为正则项,加入的原因是考虑到实际环境里RSS长时间分布不稳定,其方差往往大于噪声方差,希望减小MMD算法保留较多的噪声成分带来的影响。C为中心矩阵,E为单位矩阵。
2.3 矩阵优化
为了让式(5)取得最小值,需要得到最优迁移矩阵w,因此,由拉格朗日乘数法可得:
其中,λ为参数对角矩阵,对式(6)关于w求偏导,并令其等于0,则有:
左右两边同乘wT:
由式(8)可知,(KMK+αE)-1KCK的v个最小非零广义特征值对应的特征向量构成的最优迁移矩阵W即为所求,通过该迁移矩阵可以使源域和目标域分布差异缩小,使其在在线定位阶段获得更可靠的定位结果。
3 实验结果与分析
3.1 实验数据集
本文利用2.2节提及的UJI-DB数据集进行相关测试和仿真。该数据集在西班牙Jaume I大学图书馆楼的两层(第3层和第5层)收集了长达25个月的RSS值,在这段测量时间内总共检测到620个AP,因此十分适合用于RSS时变特性的研究。整个实验区域占地308.4 m2,分为48个网格点(每层24个),定位实验中将该区域划分成18个子区域(每层9个),采集区域、参考格点和子区域设置如图4所示。数据采集人员在第一个月采集了15组训练数据集和5组测试数据集,并在接下来的24个月采集了一定数量的补充训练数据和测试数据。
3.2 结果与分析
图5(a)、图5(b)、图5(c)分别表示KNN、SVM、CNN在使用MMD算法和不使用MMD算法情况下每个月的定位准确率,可以看出,文中提出基于特征迁移的定位算法的方法使三种算法的准确率均得到提升,可以有效地减少源域与目标域分布不同带来的不良影响,使系统在较长时间的定位中依然可以做出较为精准的预测。
表2展示了使用MMD后三种算法25个月的平均準确率,可以发现对KNN算法的提升较为明显,因为该算法在预测过程中对距离较为敏感,传统的长时间定位下离线阶段的指纹库和在线收集到的样本分布不一致,使KNN无法得到令人满意的结果。
4 结 论
为解决离线阶段和在线阶段RSS指纹分布不一致的问题,本文提出了一种基于特征迁移的方法,通过寻找一个最优迁移矩阵将两个阶段RSS指纹分布映射到同一空间,使两个阶段的特征差异具有最小MMD,总之,所提出的方法在一定程度上抵制了环境变化对定位准确性带来的影响,并增强了系统的鲁棒性。同时定位设备的差异和核函数选择方式也会影响到定位系统的性能,这将作为后续研究的方向。
参考文献:
[1] 张明华.基于WLAN的室内定位技术研究 [D].上海:上海交通大学,2009.
[2] ADEGE A B,YAYEH Y,BERIE G,et al. Indoor localization using K-nearest neighbor and artificial neural network back propagation algorithms [C]//2018 27th Wireless and Optical Communication Conference (WOCC).Hualien:IEEE,2018:1-2.
[3] YEN L,YAN C H,RENU S,et al. A modified WKNN indoor Wi-Fi localization method with differential coordinates [C]//2017 International Conference on Applied System Innovation (ICASI).Sapporo:IEEE,2017:1822-1824.
[4] CHRIKI A,TOUATI H,SNOUSSI H. SVM-based indoor localization in Wireless Sensor Networks [C]//2017 13th International Wireless Communications and Mobile Computing Conference (IWCMC).Valencia:IEEE,2017:1144-1149.
[5] IBRAHIM M,TORKI M,ELNAINAY M. CNN based Indoor Localization using RSS Time-Series [C]//2018 IEEE Symposium on Computers and Communications (ISCC).Natal:IEEE,2018:1044-1049.
[6] LIU Z Y,DAI B,WAN X,et al. Hybrid Wireless Fingerprint Indoor Localization Method Based on a Convolutional Neural Network [J].Sensors,2019(20):4597.
[7] 莊福振,罗平,何清,等.迁移学习研究进展 [J].软件学报,2015,26(1):26-39.
[8] DAY O,KHOSHGOFTAAR T M. A survey on heterogeneous transfer learning [J].Journal of Big Data,2017,4(1):29.
[9] 高威,王可东.基于WiFi的RSSI指纹定位方法 [C]//第十一届中国卫星导航年会.成都:中国卫星导航系统管理办公室学术交流中心,2020:5.
[10] 张明华,张申生,曹健.无线局域网中基于信号强度的室内定位 [J].计算机科学,2007(6):68-71+75.
[11] 甘露,杨君,郭娅婷.基于室内指纹定位的优化算法 [J].数据采集与处理,2020,35(5):903-909.
[12] MENDOZA-SILVA G R,RICHTER P,JOAQU?N T,et al. Long-Term WiFi Fingerprinting Dataset for Research on Robust Indoor Positioning [J].Data,2018,3(1):3.
[13] SMOLA A,GRETTON A,SONG L,et al. A Hilbert Space Embedding for Distributions [C]//10th International Conference Discovery Science.Sendai:Springer,2007:40-41.
[14] GRETTON A,BORGWARDT K M,RASCH M, et al.A Kernel Two-Sample Test [J].Journal of Machine Learning Research,2012,13(25),723-773.
作者简介:万祥(1996—),男,汉族,湖南岳阳人,硕士在读,研究方向:室内定位。