朱志慧
(河南商业高等专科学校计算机系,河南郑州450044)
随着无线网络的发展与普及,出现了不少与定位相关的技术和应用。特别是自从802.11无线局域网(WLAN)标准问世以来,WLAN的各种应用得到迅速发展,其中很多应用是基于WLAN所提供的位置服务的,典型应用包括:为用户提供周边环境信息查询、定位或者跟踪特殊目标、路径导航、基于位置的游戏等。
理论上,全球定位系统(GPS)可以为用户提供位置信息,但其成本较高,加之室内传播环境复杂,严重影响GPS在室内无线定位中的应用。与GPS相对应,适用于局部网络的定位系统称为本地定位系统,这些系统使用一些射频基站,然后通过测量接收到的用户信号强度(RSS)、信号到达角(AOA)、信号达时间差(TDOA)、信号到达时间(T0A)等方法来实现定位。基于这些技术的定位结果只能在视距传播信号占支配地位的情况下才是可靠的,但由于室内网络距离短、传播环境复杂,因而无法适用于室内环境。此外,TOA或TDOA信息需要发射机与接收机之间的准确同步,这些要求在许多场合都难以达到;而AOA需要智能天线,价格昂贵且有定位盲点。另外一种可供选择的定位方法是基于信号强度的解决方案,它并不测量到达信号的时间或角度,而是利用移动站(mobile station,MS)感测来自基站(base station,BS)或者接入点(access point,AP)的信号功率[1]。
在无线局域网中,基于信号强度定位的难点除了室内距离近、环境复杂、噪声干扰等影响外,如何使定位方法具有对环境变化的良好的适应性也是一大难点。所谓适应性是指当定位系统所在的环境发生变化后,其算法也能探测出来并自动地进行修正,以保证算法的正确性。本文对这一难点进行了研究。
回归分析[2]思想是采用数理统计的方法,利用大量的观测数据,来确定变量之间相互关系的一种数学方法。这种思想在涉及多因素、多变量的问题中常被采用,通常根据训练数据,找出自变量和因变量之间的回归模型,根据回归模型来保证结果的准确性,体现出归回的实用价值。回归问题分为线性归回和非线性归回两大类,根据变量的不同又可分为一元线性回归和多元线性回归。
一元线性回归是最简单的,涉及一个响应变量y和一个预测变量x,并用x的线性函数对y建模:
其中y的方差假定为常数,b和w是回归系数,分别指定直线的y轴截距和斜率。回归系数b和w也可以看作权重,因此我们可以等价地记作:
这些系数可以用最小二乘法求解,它将最佳拟合直线估计为最小实际数据与直线的估计值之间的误差的直线。设D是训练集,由预测变量x的值和与其相关联的响应变量y的值组成。训练集包含D个形如(x1,y1),(x2,y2)…(x|D|,y|D|)的数据点。归回系数可以用下式估计:
多元线性回归是直线回归的扩展,涉及多个预测变量。它允许响应变量y用描述元组Y的n个预测变量(A1,A2,……An)的线性函数建模[4]。训练数据集D包含形如(X1,y1)(X2,y2)…(X|D|,y|D|)的数据,其中Xi是n维训练元组,具有相关联的响应变量值yi。一个基于多个属性或变量的线性回归模型为:
其中βi(i=0,1,…m)为回归因子,利用最小二乘法来求解回归系数;ε为误差,xi(i=1,2,…,m)为精确测量的值。
利用信号强度定位的重要前提是用户收到的信号强度随着与AP间距离的增大而减小。这一基本规律在RADAR系统的实验中已经得到了验证,但是这种变化只是近似的线性变化,在室内距离近、结构相对复杂的环境下,障碍物的影响难以忽略。各种噪声的干扰是室内定位的困难之一,例如同一个频道上其它设备的干扰,用户方向的变化,以及由于室内建筑布局复杂,信号传播中受家具、门窗、墙壁、天花板的阻挡引起的多径传播效应等。另外,在实际生活当中,室内环境会发生一些改变,例如室内布局的变换,人员的流动,以及温度的变化;而目前我们所研究的室内定位技术对环境变换都没有良好的适应性[3],而本文提出的定位算法,通过添加参考点,建立移动端和参考点之间所接收信号强度的关系,来预测实时定位时移动端的估计信号强度,以此更新指纹数据库的数据,提高对环境变化的适应性。
首先假设试验环境中有p个接收点(Access Point,AP),m个参考点(Refer Point,RP),L为n个网格位置的集合L={l1,l2…li},1≤i≤n;在一特定位置li,移动端所接收到的信号强度集合为S={s1,s2…si},其中sj表示移动端从第j个AP所接收到的信号强度值;参考点接收到的信号强度集合为R={r1j,r2j…rkj,rkj},表示第k个参考点从第j个AP所接收到的信号强度,其中1≤k≤m,m表示总共有m个参考点。我们的目的是,在环境变化时,利用参考点的作用,使对移动端的定位能够适应其变化。因此,如何建立移动端和参考点之间信号强度之间的关系是研究的重点。
在该方法中,引入一定数量的参考点,在每一个位置对于每一个AP通过多元线性回归方法,分别建立参考点和移动端所接收的信号强度的模型关系,在某一特定位置,对于第j个AP有:
其中ε是随机误差。在实时定位阶段,利用每个参考点所接收到的信号强度,根据以上所建立的函数关系,计算出每个位置每个AP多对应的预测信号强度Sest=(s1,…,sp),移动端接收到的实时的信号强度为Sact=(ss1,ss2,…ssp),对于一个位置li,1≤i≤n,计算出预测信号强度和实时信号强度的最小欧几里德距离:
则li为预测的位置。
由于参考点与移动端所处的环境以及所受的影响相同,一次利用参考点可以实时动态地更新位置信息,因此,该方法可以较好地适应室内环境的变化,但是为了更好地提高定位的精度以及对环境变化的适应性,我们提出分区域划分的多元线性回归模型。
将试验环境根据室内的具体情况以及参考点的选择划分为不同的区域[5],每一个区域将会利用最优的几个参考点,这将会使移动端与参考点之间的模型关系更优,具体方法分为离线阶段与在线定位阶段。
(1)离线阶段模型
在离线阶段,根据所选参考点对室内试验环境进行划分,在每个区域内,AP所接收的信号强度与参考点所接收的信号强度尽可能接近。在每一个区域,每一个位置li,收集p个AP与m个参考点所接收的信号强度,其中p>m+1,这样对于第j个AP,我们有p个线性等式,而每一个等式有m+1个因子,因此当p>m+1时,可以利用最小二乘法计算出每个AP与参考点所接收信号强度关系的回归因子。
(2)在线阶段定位
在线阶段时,收集参考点的信号强度,根据离线阶段所建立的参考点与AP所接收的信号强度的回归模型,计算出每个位置,每个AP所对应的预测信号强度Sest,计算预测信号强度与移动端所接收的实测信号强度Sact的最小欧几里德距离,确定移动端的最终位置。
本文利用分区域的多元线性回归方法对移动端与参考点所接收的信号强度进行建模,用来在环境变化时对室内信号强度进行预测,以适应室内环境的变化。该方法一方面通过建模,提高环境变化后的信号强度的精度,另一方面,通过分割区域,使每一个区域的环境更单一,避免外界对信号强度的干扰,因此从理论考虑,可以一定程度上提高定位的精度,并且可以较好地适应室内环境的变化。
[1]Waesi G I,Despins C,and Grenier D,et 0L.Indoor location using received signal strength of IEEE 802.11 access point[C].Canadian Conference Electrical and Computer Engineering,Saskatoon,Canada,2005:1371-1374.
[2]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2001.
[3]Adaptive Temporal Radio Maps for Indoor Location Estimation.In Proceedings of the 3rd Annual IEEE International Conference on Pervasive Computing and Communications(IEEE PerCom 2005),Hawaii USA,March,2005.
[4]肖建华,林健,刘晋等.带约束的最优多元回归模型及其应用[J].计算机科学,2005,32(10).
[5]徐凤燕,李樑宾,王宗欣.一种新的基于区域划分的距离-损耗模型室内WLAN定位系统[J].电子与信息学报,2008,6.