党小超,邓琦研,郝占军
(1.西北师范大学 计算机科学与工程学院,兰州 730070; 2.甘肃省物联网工程研究中心,兰州 730070)
随着无线通信设备的普及,基于指纹的位置服务受到越来越多的关注,其中,基于WiFi的无源检测和定位方法成为研究的热点[1-2],但在现实应用中,已有的检测技术存在许多不足。基于摄像头[3]的入侵检测方法受到视距的影响,如果环境有遮挡或光照不足,其很难检测出人员的入侵行为,并且非法人员通过联网等对该方法进行操作,容易泄露用户隐私。基于传感器[4]的入侵检测需要在环境中布置传感器节点,工作量很大。基于红外[5]的入侵检测可以在非视距环境下工作,但是其需要特定的设备,而且工作范围有限。在实际环境中,无需人员携带设备的入侵检测和定位方法更受关注,借助WiFi信号[6-7]实现无源被动检测和定位,不仅能够降低成本,还可以提高检测和定位的精确度。基于信道状态信息(CSI)[8-9]的人员入侵检测包含了MAC层不可获得的信道信息,其通过提供细粒度的信息来提升稳定性,因此,该方法广泛应用于室内人员检测任务中[10]。
针对基于CSI的室内无源定位,文献[11]中的FIFS将CSI数据应用于指纹定位,利用贝叶斯最大概率估计算法进行定位。文献[12]实现了CSI和MIMO的融合,应用CSI的多样性并同时考虑其幅值特征进行定位。文献[13]研究CSI的相位信息问题,将其相位差的特征应用于室内定位。文献[14]将CSI与深度学习进行结合,进一步提高了定位性能。文献[15]将测量距离与WiFi位置指纹技术相融合,提高了室内无源定位的精度。上述文献在选择取样点时均将检测区域进行等间距的网格状划分,然后取点取样,将测试点数据与指纹库数据进行比较,选取最匹配项的对应位置并作为测试点的位置,但这些点的选择在一定程度上会影响定位精度。
本文提出一种基于30°角同心圆环形取样的室内人员检测方法Wi-Dqy,通过获取WiFi信号物理层的CSI来实现入侵检测与定位。感知检测阶段,在无人情况下采集CSI数据,计算数据的相似度阈值α,然后根据Wi-Dqy方法建立样本点,进行样本点CSI数据采集。离线阶段,采用PCA算法[16-18]对原始CSI数据进行降维和降噪处理,提取差异化特征并建立指纹库。在线阶段,利用陆地移动距离(EMD)算法检测是否有人员入侵,使用基于高斯核函数的支持向量回归(SVR)[19]方法与指纹库进行特征匹配,最终计算得到入侵人员位置。
信道状态信息是衡量信道情况的物理层信道属性,包括子载波信号的相位信息和幅度信息,是细粒度化的物理信息,可对周围环境进行感知,提供频域更宽泛的信道信息,并精细地描绘频率选择性信道[20-21]。
EMD是一种概率分布距离的度量[22],用以衡量特征图像分布上的差异性,相较于其他同类型方法,其避免了量化带来的影响。设P是含有m个元素的集合,其表示无人环境下数据的CFR方差概率直方图,Q是含有n个元素的集合数据,其表示在线时数据的CFR方差概率直方图,P={(p1,wp1),(p2,wp2),…,(pm,wpm)},Q={(q1,wq1),(q2,wq2),…,(qm,wqm)},D=[di,j]是距离矩阵,其中,di,j是pi、qj的距离。则P、Q间的EMD定义如式(1)~式(5)所示:
(1)
(2)
约束条件为:
fij≥0,1≤i≤m,1≤j≤n
(3)
(4)
(5)
EMD(P,Q)是直方图之间的距离最小值。
本文提出一种基于30°角同心圆环形取样的室内人员检测方法Wi-Dqy,以对人员进行入侵检测和定位,该方法分为3个阶段:
1)感知检测阶段,首先对无人情况下的检测区域进行CSI数据采集,然后根据30°角同心圆环形取样法建立样本点,进行样本点CSI数据采集。
2)离线阶段,将感知检测阶段2类原始CSI数据进行PCA处理,提取差异化特征,然后根据处理后的CSI数据建立2个指纹库(检测型指纹库N1、定位型指纹库N2),由指纹库N1得出有人和无人情况时的EMD值。
3)在线阶段,将测试点收集到的CSI值与指纹库N2建立联系,计算EMD值,进行入侵检测。若检测到有人存在,则对其进行定位,使用基于高斯核函数的SVR定位方法将测试点CSI指纹信息代入SVR回归模型,通过计算可得到人员位置坐标。
本文室内人员检测方法流程如图1所示。
图1 室内人员检测方法流程Fig.1 Procedure of indoor personnel detection method
基于CSI的指纹定位方法通常将检测区域进行网格状划分,以人为方式制定长度相等的固定间距并进行取点,然后在各样本点采集原始CSI信号,测试过程中,在随机非取样点处设置测试点。根据WiFi信号的传输特性和信道的衰落特征,一般发送端(AP)向外产生以圆形传播的信号且被接收端(MP)接收,在传播过程中存在不同原因的衰减,网格状取样点并未考虑这些因素对定位精度的影响,并且其样本点设置的间距大小、稀疏程度,对后续测试点与指纹库特征的匹配以及最终定位精度都会产生一定程度的影响。网格状样本点取样示意图如图2(a)所示。
本文Wi-Dqy方法设计一种30°角同心圆环形取样法。基于发送端所在的位置,以发送端到接收端的连线作为x轴,垂直方向为y轴,中点O为圆心,以r,2r,…,kr(k≥1)为半径绘制同心圆,将待测区域划分为环形,圆环的半径每次增加r。然后,以30°角为基准,制作12条射线(包括涉及的坐标轴,即6条直线),从x轴正方向(定为0°)开始,逆时针旋转360°,每隔30°以圆心为顶点制作一条射线,与x轴正方向的夹角分别为0°、30°、60°、90°、120°、150°、180°、210°、240°、270°、300°、330°、360°,令各条射线与每一个同心圆的交点为选取的样本点集合I,则Wi-Dqy方法总样本点集合为样本点集合I和圆心O。样本点的个数取决于k值,k值的选取与检测区域的大小有关。r值越小,则定位精度越高,同时,构建的指纹库也越复杂。考虑实验环境、场地大小等因素的影响,Wi-Dqy方法根据常规人体臀宽为30 cm~33 cm,将r值选取为1 m,k值选取为3或4。Wi-Dqy方法取样示意图如图2(b)所示。
图2 2种方法样本点示意图Fig.2 Schematic diagram of sampling points oftwo methods
按照30°取样方法,点与点间相对位置易于通过公式进行推导和计算,如勾股定理。与30°取样相比,60°取样点过少,15°取样点间隔过于紧密。从取样点间距、个数等方面考虑,相比其他角度,30°取样更合适。
Wi-Dqy方法的特点是在图形显示上,样本点的选取具有随机性,两点之间距离远近不等,且多个点之间连线并非都为线性,这符合未来室内定位对样本点的要求。根据上述分析可以得知,点之间的距离具有内在联系,距离和半径呈现倍数关系,可以通过简单计算得到,而且距离不再是人为指定的等距,增加了样本点的复杂性,这使得测试点与指纹库的特征匹配更易于选择。而根据信号的传播波形特征,采取环状取样法更为合理。Wi-Dqy方法为样本点选取提供了一种新思路,使样本点的选取方法不再单一。Wi-Dqy方法的样本点特点如图3所示。
图3 Wi-Dqy方法样本点示意图Fig.3 Schematic diagram of sampling points of Wi-Dqymethod
Wi-Dqy方法需要建立2个指纹库,分别为检测型指纹库N1和定位型指纹库N2。检测型指纹库N1用来检测区域是否有人员存在,当检测区域内无人存在时,发送端连续向接收端发送数据包,提取接收端CSI数据构建N1。定位型指纹库N2用来定位室内人员所在的位置,构建N2时,让测试员分别站在事先部署好的n个样本点处,在每个样本点处提取接收端CSI数据并作为该样本点的指纹,采集每个样本点处的数据构建N2。Wi-Dqy方法提取CSI特征值的过程如下:
1)输入待提取特征的CSI矩阵N。
2)去中心化:计算N的每列得到均值,组成向量η,再用N的每列减去η,最终得到去中心化后的矩阵M。
3)用矩阵M计算得到矩阵V,V=M′M/T。V为M的协方差矩阵。
4)通过解‖V-λI‖=0计算V的特征值。T个特性向量和特征值分别组成矩阵φ和α,如式(6)、式(7)所示:
(6)
(7)
6)从大到小依次输出前k个主成分[λ1λ2…λk]。
PCA提取k个主特征值[λ1λ2…λk]后,得到CSI的指纹库N1和N2。N1中每个信号特征表示为n1j,n1j=(j,csij),则指纹库表示为N1={n11,n12,…,n1j},其中,j表示子载波索引,(j,csij)表示第j个子载波的CSI值。N2中每个样本点的信号特征记为n2i,n2i={(xi,yi),csii},则指纹库表示为N2={n21,n22,…,n2i,…,n2m},其中,i 图4 经PCA处理后的CSI曲线Fig.4 CSI curve after PCA disposal 入侵检测阶段先选取方差距离方法对CSI幅值进行建模,再采用EMD法来对比各CFR采样序列的差异化特征,以判断检测区域是否存在人员。 2.3.1 CSI幅值建模 选取方差距离方法对CSI幅值进行建模,利用方差的性质判断检测区域是否有人员存在。在无人的环境下,CSI的幅值分布要比有人时更为聚集[21]。本文使用一个长度为M的滑动窗捕获这些CSI幅值信息,计算得到均方差,如下: (8) 经过计算得到CFR序列方差概率直方图,在无人环境下,大部分的采样方差值较为集中,概率密度趋于1,而在有人的环境下,采样方差较为分散。 2.3.2 EMD方法 通过EMD法对比采样序列的特征差异,以判断检测区域是否存在人员。使用EMD方法的步骤如下: 1)在无人状态下采集多组数据,根据数据计算无人时的相似度EMD,将每组相似度累加求取平均值,将该值设为阈值α,实验计算得到α为4.3。 2)根据上述过程计算无人情况和实时情况下数据的方差概率直方图。 3)通过1.4节所述方法计算得出CFR方差概率直方图的EMD距离。 4)当EMD<α时,判断为无人环境;当EMD≥α时,判断为有人入侵环境,进行后续的人员定位。 因为室内环境复杂,本文在定位阶段采用基于高斯核函数的SVR来建立CSI的幅度(或相位)信息和位置间的非线性回归关系。通过回归原理,利用映射的非线性方法[23]在立体空间中找到一个最优超平面,将其替代原始空间的非线性关系。在数值上,维度不同的指纹数量级差别较大,与高数量级相比,低数量级的指纹特征对回归模型的影响权重非常小。因此,在建立回归模型前,先进行归一化处理[24]。 根据已经建立好的指纹库数据,使用数据集{(ri,xi)|i=1,2,…,n}和{(ri,yi)|i=1,2,…,n},其中,ri表示对应(xi,yi)位置处的CSI指纹信息。通过SVR算法,建立CSI特征信息与x轴坐标xi、y轴坐标yi的非线性关系fx、fy,从而建立每组CSI特征信息对应的位置坐标,最终通过计算预测测试点的位置坐标。基于高斯核函数的SVR定位主要步骤为: 1)选取模型回归自变量和因变量。构造回归的线性估计函数,得到位置坐标的计算函数,以x轴为例,如式(9)所示: (9) 2)归一化处理,如式(10)所示: (10) 其中,rmax表示最大值数据,rmin表示最小值数据,rnorm表示最终计算所得数据。 3)引入高斯核函数m(xi,yj),将目标函数进行修正和改写,得到函数function,如式(11)所示: (11) 4)利用得到的参数训练模型。 5)将测试点数据代入回归模型,分别计算得到x轴与y轴的位置坐标,预测人员位置。 本文在WiFi无线网络环境中进行实验,采集设备为2台安装Atherors 9380网卡的机器,使用距地1.0 m的1.5 m长外接天线。选定2个不同场地进行实验,一个场地是10×8 m2的大厅,如图5所示,另一个场地是7×6 m2的实验室,如图6所示。2个实验场地相比,实验室空间较小,物品摆放较多,易产生多径效应,是非视距场景;大厅空间开阔,无其他堆放物品,是比较理想的实验场景。 图5 大厅场景布局Fig.5 Layout of hall environment 图6 实验室场景布局Fig.6 Layout of laboratory environment 离线阶段,在不同的时间段采集数据进行训练,为了减少由人体的不同朝向引起的偏差,实验时让测试者在样本点处面向不同方向收集多组CSI数据;测试阶段,由一名测试者以任意朝向站在测试点(测试点设置在样本点附近),在接收端读取CSI测量值,然后通过本文方法进行检测和定位。本文采取3条链路进行实验,为提高方法的鲁棒性,在数据采集的过程中,每一个样本点处进行多次采样。为了减少外界因素对WiFi信号的影响,测试者和其他操作员在实验场地内均保持静止,为了避免手机等电子设备产生的信号对实验结果的影响,在实验场地内断开其他网络连接及信号,由此来提高实验的可靠性。 3.3.1 入侵检测分析 本文引入4个指标对入侵检测性能进行分析:1)假阳率(FPR),指环境内无人存在但判断为有人入侵的情况;2)假阴率(FNR),指将有人入侵判定为无人的情况;3)真阳率(TPR),指准确判断出有人入侵的情况;4)检测率(DR),指有人入侵时判断为入侵的概率。DR用式(12)表示: (12) 由图7可知,本文方法在2种实验环境下,检测率均在96%以上。通过比较可知,实验室环境的检测精度低于大厅,原因是大厅的空间较大,环境较为简单,而实验室空间较小,设备较多,易产生多径效应。实验结果表明,利用EMD方法和CSI进行室内人员入侵检测具有可行性。 图7 本文方法的检测率与假阳率结果Fig.7 Results of detection rate and false positive rate ofthe proposed method 3.3.2 定位性能分析 本文引入累积分布函数(CDF)来分析定位性能,将本文方法与CSI指纹定位方法CSI-MIMO[11]、采用贝叶斯概率法进行定位的方法FIFS[10]进行对比,2种环境下的定位误差CDF结果如图8、图9所示。 图8 大厅场景中3种方法的定位性能比较Fig.8 Comparison of positioning performance in hallenvironment of three methods 图9 实验室场景中3种方法的定位性能比较Fig.9 Comparison of positioning performance in laboratoryenvironment of three methods 从图8可以看出,在大厅场景中,本文方法总平均误差为1.41 m,在x轴上的定位误差为0.94 m,在y轴上的定位误差为0.98 m。本文方法的定位误差CDF较FIFS方法提高了18.2%,较CSI-MIMO方法提高了7.0%。 从图9可以看出,在实验室场景中,本文方法总平均误差为1.53 m,在x轴上的定位误差为1.03 m,在y轴上的定位误差为1.09 m。本文方法误差CDF较FIFS方法提高了23.4%,较CSI-MIMO方法提高了24.3%。 通过这组实验对比可以得出,本文方法在一定程度上提高了室内定位的精确率,原因是:指纹特征采用CSI,包含更多的信号特征,细粒度更高;离线阶段对采集的指纹进行预处理,能够保留数据主要特征;定位阶段,核函数的使用提高了算法定位性能并减小了计算量。 由2.1节得知,Wi-Dqy方法将r值选取为1 m,k值选取为3(实验室)或4(大厅)。将本文Wi-Dqy方法与网格状划分取样法CSI-MIMO和FIFS在大厅中进行实验对比。在后续离线和在线处理过程中,Wi-Dqy方法中的r=1.0 m,k=4,则一共有49个样本点,而在网格状取样方法中,将检测区域划分成7×7的网格,取49个等间距样本点,然后在检测区域不同的方位随机设置10个测试点,使用这2种方式分别采集CSI信号并建立指纹库。 由图10可知,Wi-Dqy方法总的平均误差为1.39 m,网格状取样方法总的平均误差为1.50 m,Wi-Dqy方法定位精度提高了7.3%。Wi-Dqy方法误差累积分布函数在0.9处对应的距离误差为2.06 m,而网格状取样方法为2.31 m,两者相差0.25 m。上述数据表明,Wi-Dqy方法能够减小定位误差,提高定位精度。 图10 3种方法定位性能比较Fig.10 Comparison of positioning performance of threemethods 在进行指纹库构建时,将半径r依次设置为1.0 m、1.5 m、2.0 m,计算不同半径对定位准确性的影响。由图11(a)、图11(b)可知,r值越小,则定位精度越高。例如,当半径为1.0 m时,Wi-Dqy方法误差累积分布函数在0.9处对应的距离误差在1.2 m以内,而半径为2.0 m时,误差在1.5 m以内,两者相差0.3 m。当r值越小时,样本点越多,则指纹库需要对比的数据就越多,工作量越大,虽然定位准确性有所增加,但是在一定程度上会使系统的时间复杂度增大,因此,需要选择合适的r值。实验结果表明,在实验室和大厅中r值取1 m左右可以取得较理想的综合性能,因此,本文实验将r值取为1 m。 图11 2种场景下取不同半径时的定位性能比较Fig.11 Comparison of positioning performance of two scenes with different radii 分别在大厅和实验室场景中,依次将取样角度设置为15°、30°、60°进行取样,并观察不同角度值对定位精度的影响。由图12(a)、图12(b)可知,角度过大,定位精度降低,因为随着角度的增加,样本点间距增大,匹配指纹库内数据减少;角度过小,样本点间隔越小,容易产生误判。实验结果表明,角度选取30°时能使得结果精度最高。 图12 2种场景中不同角度取样时检测率与假阳率比较Fig.12 Comparison of detection rate and false positiverate in two scenes with different angle sampling 本文提出一种基于30°角同心圆环形取样的室内人员检测方法。使用PCA、EMD、SVR算法对CSI中的振幅信息进行处理,用30°角同心圆环形取样法建立指纹库,采集测试点数据并与指纹库进行特征匹配,从而实现入侵人员的检测与定位。实验结果表明,与CSI-MIMO和FIFS方法相比,该方法定位误差更低,精度更高。下一步将对信号传输波形进行研究,并利用同心圆环形取样法实现室内多人员的检测与定位。2.3 人员入侵检测
2.4 人员定位
3 实验结果与分析
3.1 实验环境
3.2 实验设计
3.3 系统性能分析
3.4 Wi-Dqy方法对定位精度的影响
3.5 Wi-Dqy方法半径取值对定位精度的影响
3.6 Wi-Dqy方法30°角度选择验证
4 结束语