一种面向室内环境变动的人员目标无源定位算法

2021-08-11 01:03刘嘉伟毛文宇鲁华祥

哈尔滨工业大学学报 2021年8期

刘嘉伟，毛文宇，鲁华祥,3,4

(1.中国科学院大学,北京 100089;2.中国科学院半导体研究所,北京 100083;3.中国科学院脑科学与智能技术卓越创新中心,上海 200031;4.半导体神经网络智能感知与计算技术北京市重点实验室(中国科学院),北京 100083)

近些年来，基于接收信号强度(RSS)的无源室内定位技术因其良好的便利性和用户隐私性，得到了广泛的研究。该方法一般分为两种，一种是基于损耗模型的方法，通过非线性函数拟合目标位置与相关链路 RSS 变化关系实现人员目标的定位。Wang等[1]建立了目标位置的观察模型，通过粒子滤波来定位人员目标。Kaltiokallio等[2]建立了基于信号衰落特征的RTI模型，提出了辨别并滤除非敏感链路的算法从而提高了定位精度。Yang等[3]综合了路径损耗、天线高度等参数对接收功率的影响，提出了适用于室内走廊环境的路径损耗定位模型。这些方法通过利用固定模型和固定特征来进行普通室内环境下的人员目标无源定位，并取得了良好的定位精度。但当室内环境发生变化时，链路属性与目标位置的对应关系也会发生变化，致使该方法的定位准确率下降。另一种是基于机器学习的方法，通过离线采集数据并训练模型进行室内定位。Youssef等[4]和Zhang等[5]分别利用指纹匹配进行了无源室内定位的初步研究。Wagner等[6]将检测区域以不同坐标划分并利用人工神经网络模型对目标进行定位。Wang等[7]提出一种曲线拟合和位置搜索的室内定位方法，利用穷举搜索和梯度下降搜索来找出距离误差最小的位置。Mao等[8]通过双向小波滤波对RSS数据进行优化并利用集成学习模型实现目标在复杂环境下的定位。Fazelinia等[9]使用一种基于ROC曲线的特征选择技术将RSS数据降维，然后利用优化的贝叶斯决策模型进行定位。

在实际场景中，室内布局和物品摆放的位置会经常发生变化，造成RSS链路模型和样本特征的改变，从而导致原定位模型不再适用于变动后的环境。对此，许多研究人员也展开了研究。Chen等[10]提出一种动态调整室内定位算法，减少了环境变动和功率变化对定位系统的影响。Guo等[11]提出多指纹分类器模型，提高了指纹和分类器之间的互补性从而增加了模型环境适应性。Manh等[12]提出一种多维核密度估计方法，该方法对信号噪声和动态环境都具有较强的鲁棒性。这些方法虽然取得了一定进展，但是很难同时兼顾人工工作量、时间消耗、计算复杂度和定位准确率之间的平衡。

本文基于迁移学习的思想和数据增强的手段，提出了基于迁移聚类和FusVAE的室内环境变动后的人员目标无源定位算法，研究主要解决的问题如图1所示。在环境变动后，采集少量变动后环境的无标签RSS样本，使用本文提出了基于度量学习的半监督模糊C均值聚类(SFCMML)对其进行精确聚类和标签标注，并对原定位模型进行重训练，得到能够适应变动后环境的定位模型。以较小的时间、工作量和计算代价，提高了变动后环境下的定位准确率、提升了定位精度。同时，为了解决变动后环境下RSS样本较少，模型训练不充分的问题，本文利用生成模型对RSS样本进行数据增强，改善重训练过程。为了使生成的RSS新样本更符合变动后环境下的样本特征和分布，定位过程更适应变动后的环境，对变分自编码器(VAE)进行了改进，提出了基于坐标融合的变分自编码器(FusVAE)，增加了训练数据的数量和质量，提高了模型的泛化能力。实验结果表明，在环境变动的情况下，本文提出的算法的平均定位准确率达到了88.6%，与同领域同类型算法相比具有较高的定位精度和较好的环境变动适应性。

图1 本文研究解决的问题Fig.1 The research problem in the study

1 基于迁移聚类和FusVAE的人员目标无源室内定位算法

本文提出的基于迁移聚类和FusVAE的室内环境变动下人员目标无源定位算法的整体架构见图2。先在原环境中通过逐个坐标点站定采集的方法获得原环境下的已标签RSS数据，使用该样本集训练随机森林定位模型。在环境改变后，被定位目标在定位区域内快速遍历各个坐标点，并在被定位目标移动的过程中采集RSS数据获得新环境下的无标签RSS样本，这种采集方法消耗时间较短，且不需要进行繁琐的标签标注工作。然后利用本文提出的基于度量学习的半监督模糊C均值聚类(SFCMML)算法对这些新样本进行聚类和标注标签，生成定位模型重训练所需的新环境下带标签的样本。用处理后的样本进行重训练，原定位模型只需进行微调，便可以很好地适应环境变动后人员目标的定位过程，且具有较高的定位精度。在重训练的过程中，使用基于坐标融合的变分自编码器(FusVAE)算法，利用原环境和新环境下的先验知识，生成新环境下的高质量RSS样本进行数据增强，进一步提高了定位准确率。

图2 基于迁移聚类的人员目标无源室内定位算法的整体架构Fig.2 Overall architecture of device-free indoor localization based on transfer clustering

1.1 基于度量学习的半监督模糊C均值聚类(SFCMML)

当环境改变后，在改变后的环境中采集少量的数据，和原环境每个坐标站定采集RSS数据不同，被定位目标只需在环境中随机走动，遍历每个坐标点即可完成RSS数据的采集。与原环境中繁琐的数据采集相比，可以节约大量样本采集时间，但是这样采集的数据为一个无标签样本集，无法直接用于定位模型的重训练。为获得新环境下的已标签样本集，需要对其进行聚类及标签标注。传统的聚类算法没有将原环境和变动后环境数据之间的联系运用到聚类的过程中，利用原环境的先验知识对变动后环境的聚类进行指导，导致RSS数据聚类效果较差。针对这个问题，本文提出了基于度量学习的半监督模糊C均值聚类算法(semi-supervised fuzzyC-means clustering based on metric learning，SFCMML)，算法架构见图3。该算法通过系数矩阵Ai在原环境中学习出不同坐标点样本每个维度不同的权重，使用Ai修改新环境坐标点在聚类过程中使用的距离函数，使新环境下每类样本在聚类过程中都能遵循原环境坐标点数据的结构，实现了坐标点样本的精确聚类，相比于传统的聚类算法，该算法将原环境下的先验知识运用到了新环境的聚类中，提高了聚类和标签标注的准确率，从而使重训练后的定位模型能够更好地适用于变动后的环境，提高了定位准确率。接下来对SFCMML算法的原理进行详细介绍。

图3 SFCMML算法整体架构Fig.3 Overall architecture of SFCMML

Ds是被定位目标在原环境中各坐标点上站定采集得到的样本集，Ds中的数据为已标签样本，样本的标签为目标所站的坐标点的标号。Dt是被定位目标在新环境中随机走动采集得到的样本集，Dt中的数据为未标签样本。对于Ds和Dt，在数据分布上存在一个假设，即在同一环境下，不同坐标点的数据分布完全不同，在不同环境下，相同坐标点的分布虽然不同，但是有一定的相似性。所以只要找到原环境和新环境数据分布的潜在关系，就可以建立联系，将原环境的知识迁移到新环境中，对Dt中的样本进行指导聚类。

本文首先引入成对约束，成对约束可以用于改变底层的距离度量，对聚类过程进行引导，达到更好的聚类效果。从Ds中的每类样本中随机选取若干样本组成样本对，S⊂Ds×Ds是相似样本对集合，集合中每个元素为一个样本对(Xp，Xq)，其中Xp和Xq都为同一类的样本。D⊂Ds×Ds是不相似样本对集合，集合中元素为一个样本对(Xp，Xq)，其中Xp和Xq都为不同类的样本。这样就构建了成对约束，对于同类样本，我们希望样本间的距离越小越好，对于不同类样本，我们希望样本间的距离越大越好，所以希望可以找到一个功能函数f满足

minf(Xp,Xq)(Xp,Xq)∈S

maxf(Xp,Xq)(Xp,Xq)∈D

(1)

对于每一类坐标点样本，每个维度代表了每条链路的RSS值，由于网络中存在易受影响、RSS值变化较大的活跃链路和基本不会受到影响、RSS值基本不变的非活跃链路，所以每个坐标点样本的维度的权重不同，都有自己的数据分布特征。本文使用对称正定矩阵Ai作为系数矩阵对欧氏距离进行修改，修改后的距离度量函数如式(2)所示，这样就可以在计算距离函数的时候使样本每个维度的权重都不同，表示出该类样本的数据结构特征。所以只要求解出原环境数据集Ds每类样本的Ai，就可以将其数据分布的先验知识通过系数矩阵Ai进行知识迁移，在Dt聚类过程中起到指导作用。

fAi(Xp,Xq)=‖Xp-Xq‖Ai=

(2)

使用修改后的距离度量函数可以将式(2)转化为下式

(3)

如果t是一个正的对角矩阵，可以将式(3)中的最优化问题转换为式(4)，通过求解式(4)的最小值就可以求得系数矩阵Ai。

(4)

求解出原环境下每类坐标点样本的系数矩阵Ai后，就可以使用能够反映出原环境各类样本分布的距离函数对Dt进行聚类，这样的距离度量对于每个坐标点都使用的不同度量，使得数据的聚类可以是不同的形状，同类样本间的距离更小，从而提高聚类的准确率，SFCMML 的目标函数

(5)

式中:k为坐标点的数目;n为Dt中样本的数量;ci为第i类的类中心;U为隶属度矩阵;uij为第j个样本属于第i类的隶属度;m为控制算法柔性的幂指数参数，取值范围为[1,∞)，如果m过大，则聚类效果会很差，如果m设置为1，则算法会接近硬聚类算法HCM，在许多聚类问题中，m的取值一般为[1，3]，而在本文的聚类问题中，经过充分的实验证明，m取值为2效果最好。

ci和uij计算公式分别如式(6)和式(7)所示：

(6)

i=1,2,…,k;j=1,2,…n

(7)

1.2 基于坐标融合的变分自编码器(FusVAE)

在迁移聚类过程中，为提高定位效率，在变动后环境下采集的RSS样本数量较少，Dt的样本数量远小于Ds的样本数量，导致采集的数据并不能完全反映出每个坐标点数据的概率分布，如果直接对原定位模型进行重训练，虽然可以提高定位准确率，但是提升不大，还有很大的改进空间。所以，可以使用生成模型生成变动后环境的样本进行数据增强。对于目前主流的生成模型，对抗生成网络(generative adversarial networks，GAN)调参过程复杂，生成的样本多样性差，本文引入数据增强方法的目的是提高研究和定位效率，如果使用GAN生成模型，会生成大量无效或重复样本，样本多样性不高，不适合本文的应用场景。流模型的生成函数需要精心设计，求解过程复杂，在本文研究的定位过程中，室内环境多变，每次环境变动后都需要重新设计生成函数，增加了定位过程的计算复杂度，降低了定位效率。而变分自编码器(variational auto-encoder，VAE)不需要调试过多参数，计算复杂度低，且生成样本质量较高，所以选用VAE作为生成模型生成新环境下的样本进行数据增强。但是普通的VAE不能很好地与变动后环境下的定位问题结合起来，变动后的数据既有新环境的数据分布特点，又保留了一部分原环境中的数据分布特点，普通的VAE只考虑了新环境对生成样本的影响，完全舍弃了原环境的知识，缺少了原环境中先验知识的指导和限制，从而导致了生成样本质量较低。所以本文提出了一种基于坐标融合的变分自编码器(FusVAE),算法架构见图4。

图4 FusVAE的算法架构Fig.4 Overall architecture of FusVAE

(8)

FusVAE的损失函数分为3部分，第1部分是VAE原有的损失函数，由于篇幅限制，对于VAE的原理本文不再赘述，可详见参考文献[13-14]。该损失函数是为了使后验分布的近似分布qφ(z|x(i))趋近于标准正态分布N(0,1)，保证模型生成能力的KL散度，可以表示为

(9)

式中第2部分和第3部分是本文为了使生成的新样本更接近Xsi和Xti，对原损失函数进行的改进。

引入重构损失函数作为约束条件，将其添加到FusVAE的损失函数中，其中与Xti的重构损失函数记为R1，计算公式为

R1=EXti[‖Xti-X‖]

(10)

与Xsi的重构损失函数记为R2，计算公式如式(11)所示

R2=EXsi[‖Xsi-X‖]

(11)

所以FusVAE完整的损失函数如式(12)所示

L=DKL(qφ(Z|X)‖N(0,1))+λR1+(1-λ)R2

(12)

式中λ为一个超参数，取值范围为[0,1]，可以用来调节两个重构损失函数的权重。如果我们希望生成的新样本更接近Xti中的样本，可以将λ设置地比较大，如果希望生成的新样本更接近Xsi中的样本，可以将λ设置地较小。

和传统的VAE相比，本文提出的FusVAE可控性更高，原因在于，不仅在隐变量空间中利用了原环境和新环境中的先验知识，还可以通过超参数λ控制新样本与两个环境中样本的相似程度，这样生成的样本在分布上可以更接近我们希望接近的坐标点样本，将其用于模型微调，可以进一步提高定位准确率。

本文算法的具体步骤和流程见图5。

图5 本文算法流程图Fig.5 Flow chart of the proposed algorithm

2 实验设计与结果分析

2.1 实验设置

为验证本文提出算法的有效性与优越性，将办公室环境和实验室环境作为定位区域并分别设置实验。两个环境的面积分别为30 m2和4相邻坐标点距离为0.7 m。将6个射频节点如图5所示布置在定位区域周围。环境实拍图和平面图分别见图6、7，被定位的单人员目标在每个坐标点上站定一段时间采集RSS数据，每个坐标点的采集时间为120 s。射频节点使用的芯片是CC2530,工作频率在2.45 GHz，使用IEEE 802.15.4通信协议。

图6 环境实拍Fig.6 Picture of the environment

为了体现环境的动态性，设置5组实验依次移动环境中的物品，最开始移动椅子、书籍等对环境变化影响较小的物品，再逐渐移动显示器、实验器材等对环境变化影响较大的物品，呈现出环境变动由小到大的效果。在每次环境变动后，被定位的单人员目标在环境中随机走动30 s，完成RSS数据的采集。办公室环境下的环境变动图见图8，同时在实验室环境下做出类似的5组实验。

图8 环境变动Fig.8 Change in the environment

2.2 结果评价标准

为了验证本文算法的有效性，使用定位准确率和RMSE作为评价标准。

定位准确率C计算公式为

(13)

式中,xr为坐标点正确分类的数目，xw为定位过程中所有定位结果的总数目，这是一种直观体现分类准确率高低的方法。

图7 环境平面Fig.7 Plan of the environment

RMSE计算公式如式(14)所示

(14)

式中:Pc为预测的坐标点，Rc为目标所处的真实的坐标点，|Pc-Rc|为两个坐标点间的物理距离。当一个坐标点错分时，错分为相邻坐标点和距离很远的坐标点对定位精度的影响是不同的，所以RMSE可以在空间上体现出算法的定位精度。

2.3 实验结果分析

2.3.1 不同聚类算法的定位准确率对比

为了体现本文提出的SFCMML算法聚类的优越性，和目前主要使用的DBSCAN[15]及模糊C均值聚类(FCM)[16]算法进行对比，将几种算法都应用到本文的算法中。同时为了体现本文算法的必要性，体现出迁移学习对定位准确率的提升，将环境改变后不做任何处理的定位准确率和RMSE一起进行对比，定位准确率对比见图9，RMSE对比结果见表1。

图9 不同聚类算法定位准确率对比Fig.9 Comparison of positioning accuracy of different clustering algorithms

表1 不同聚类算法的RMSETab.1 RMSE for different clustering algorithms m

通过实验结果可以得出结论，所提基于迁移聚类的人员目标无源室内定位算法可以提升变动环境后的定位准确率，但是如果在聚类过程中选择效果较差的算法，不仅提升效果不明显，在有些情况下甚至会使准确率下降。所以在迁移学习过程中要选择本文提出的SFCMML聚类算法，聚类准确率高，定位准确率改善效果明显，准确率的提升基本都在10%以上，最高准确率提升高达17%，定位的误差都控制在0.5 m以内。

2.3.2 FusVAE对定位准确率的影响

FusVAE通过超参数λ控制生成的新样本与原环境样本或新环境样本的相似程度。为了选取最优的λ，选择任意坐标点在原环境下和新环境下的样本集作为FusVAE的输入，调节λ的值生成不同的样本集，使用PCA降维，将30维的数据映射到三维空间中，观察数据分布，见图10。

图10 新生成样本集与原样本集分布散点图Fig.10 Distribution scatter diagram of the generated sample set and the original sample set

图中深色点为新环境下坐标点的样本集，浅色点为新生成的样本，通过对比可以发现当λ=0.8时，生成的RSS样本在分布上与原样本更接近、更紧凑、质量更高，从后续的定位准确率也可以证明将λ设为0.8时生成样本质量最高，数据增强效果最好。所以将λ的值设置为0.8，生成新环境下的RSS样本对定位模型进行重训练。

为了检验FusVAE生成的样本能够起到数据增强，提升定位准确率的效果，并且体现FusVAE在数据增强时相较于普通VAE有更好的效果。将λ的值设置为0.8，在5组实验中分别不使用数据增强、使用VAE进行数据增强、使用FusVAE进行数据增强，然后对比定位准确率，定位准确率对比结果见图11。

图11 VAE和FusVAE定位准确率对比Fig.11 Comparison of positioning accuracy of VAE and FusVAE

实验结果表明通过VAE对基于迁移聚类的无源室内定位进行数据增强，可以提高最终的定位准确率。但是本文提出的FusVAE因为充分利用了原环境和新环境中的先验知识对样本生成过程进行约束和控制，生成的新样本更接近新环境下的样本数据分布，对定位准确率的提升效果更明显，对定位准确率的平均提升约8%，比VAE的提升率高约4%。

2.3.3 本文算法与其他变动后环境下的定位算法对比

为了体现本文提出的变动后环境下的基于迁移聚类和FusVAE的人员目标无源室内定位算法的优越性。与其他变动环境下室内定位算法进行对比，包括KAAL[11]、ILSITL[17]、RA[12]。ILSITL是一种基于实例迁移的室内定位算法，将新环境下采集的数据直接和原环境采集的数据对原定位模型进行调整。KAAL的方法通过训练多个指纹分类器，利用指纹和多分类器之间的互补性提高动态环境下的定位准确率。RA是一种基于区域定位的定位方法，建立的不是RSS值与坐标点之间的联系，而是通过RSS值与坐标区域的联系来降低环境变化为定位准确率的影响。准确率对比见图12,RMSE结果见表2。

表2 不同定位算法的RMSETab.2 RMSE for different localization algorithms m

图12 不同算法定位准确率的对比Fig.12 Comparison of positioning accuracy of different algorithms

通过对比可以发现本文算法在每次环境变动的定位准确率都很高，平均定位准确率为88.6%，平均RMSE为0.312 m，高于其他算法的定位准确率。而且环境变化时，定位准确率基本不发生变化，极大程度地降低了环境变动对于定位准确率的影响，说明了本文算法的有效性和相比于其他算法的优越性。

2.3.4 整体定位结果展示

为了直观地体现本文算法对环境变动后定位准确率的改善，设计实验让被定位目标按照坐标点1→坐标点2→坐标点3→坐标点4→坐标点5→坐标点6→坐标点7的顺序遍历坐标点，同时采集RSS数据作为测试集用于检验定位的效果。在办公室环境和实验室环境，对比本文算法的定位结果、未改进前的定位结果和目标实际移动路径，见图13。

3 结论

1)提出了一种将迁移聚类和FusVAE结合使用的数据增强型人员目标无源室内定位方法，通过迁移聚类对新环境中的无标签数据进行指导聚类和标注标签，解决了环境变动后定位模型的重训练问题，然后使用FusVAE对新环境RSS样本进行补充，实现了模型重训练过程的数据增强，有效提高了定位算法的变动环境适用性和定位准确率，实验结果表明，该方法在办公室环境下的平均定位准确率达88.6%；

2)提出了基于度量学习的半监督模糊C均值聚类(SFCMML)算法，根据原环境中的先验知识修改聚类过程中的距离函数，赋予坐标点样本每个维度不同的权重，有效提高了聚类准确率，实验结果表明，该算法对变动后环境的定位准确率提升明显，在办公室环境下准确率的提升最高可达16%；

3)提出了基于坐标融合的变分自编码器(FusVAE)算法，利用原环境和新环境下的先验知识，改进了隐变量结构并在损失函数中添加了生成样本与原环境样本和新环境样本间的重构误差，增强了生成的RSS数据的样本质量，进一步提高了模型的泛化能力。综合实验结果表明，该算法可以进一步提升环境变动后的定位准确率，在办公室环境下准确率的提升最高可达13%。