方潜生,黄 晶,王 萍,张振亚
(1.安徽建筑大学智能建筑与建筑节能安徽省重点实验室,安徽合肥 230022;2.安徽建筑大学电子与信息工程学院,安徽合肥 230601)
现阶段我国建筑能耗约占全国社会终端总能耗的22%,远高于发达国家的平均水平[1],建筑节能势在必行。建筑物的使用与人员关联甚紧,建筑物内人员数量、流量和位置分布均为节能调控提供了重要的数据参考。
当前,室内人员辨识及其在建筑节能领域的应用已成为学术界和工业界的一大研究热点[2-9]。其中,人员计数、人群密度估计属于计算机视觉领域的重要研究内容。例如,Alzaydi 等[10]对高密度视频图像的人员计数方法进行了研究;Chen 等[11]首次提出利用移动设备的麦克风和扬声器等音频技术实现人员计数的方法;Meyn 等[12]基于SUN(Sensor-Utility-Network)框架实现了室内人员计数,准确率比直接观察提高了70%;Huang 等[13]首次提出基于二氧化碳浓度对室内人员数目进行估计,但准确率受外界环境影响较大。目前,上海交通大学、清华大学、香港中文大学、中国科学院自动化研究所等机构的专家学者们相继开展了遮挡检测和补偿技术、背景消除技术、回归算法(模型)等基于视频图像的人员计数方法研究[14-16]。
除人员计数外,人员定位也是人员状态监测的重要组成部分。例如,Want 等[17]设计了第一个室内标记感测原型系统Active Badge;Valle 等[18]采用智能手机的Wi-Fi 信号、GSM、加速度计/磁场传感功能实现了人员室内定位;Priyantha 等[19]研究了基于WLAN、蓝牙、WiFi、RFID 等无线信号强度的人员室内定位方法,精度可达到厘米级;Sun等[20]基于惯性/磁传感、无线通信技术,结合惯性导航算法实现了基于信号强度的人员室内定位;Kotaru 等[21]研发了基于Wi-Fi 的可精准到厘米级别的人体定位系统SpotFi;Wang 等[22]提出一种基于光学无线通信技术的室内定位系统。
以上人员计数与定位方法依赖于大量硬件设施,成本高昂,且很少将人员定位与计数相结合。为此,本文提出一种无需额外铺设昂贵硬件设施和人员主动参与的室内人员自动计数方法。该方法基于当今社会人员与移动终端的强依赖关系,在感兴趣区域部署多个可持续监测Wi-Fi 连接请求信息的低廉商用Wi-Fi 探针,以检测人员的存在性。考虑到不同建筑物、区域、背景环境对Wi-Fi 信号存在不同程度的反射、折射、散射以及衍射等影响,本文从Wi-Fi 数据采集和模型构建两方面着手,通过部署多探针装置采集数据并构建通用室内人员辨识模型,以降低环境对模型性能的影响,提高其泛化能力,实现室内人员精准计数。
如图1 所示,根据IEEE 802.11 系列协议,当移动终端打开Wi-Fi 模块后便会广播Wi-Fi 探测请求(Probe Request)帧,扫描所在区域内目前有哪些802.11 网络可接入(图1 中用虚线框表示无线接入点可有可无),该帧中包含终端MAC 地址、接收信号强度、信道号等信息。Wi-Fi 探针即利用Wi-Fi 探测请求帧的明文特性监测并解析出其中的有用信息。
Fig.1 Schematic diagram of Wi-Fi probe sniffing Wi-Fi terminal图1 Wi-Fi探针嗅探Wi-Fi终端示意图
除加密性和广播性外,只要移动终端开启Wi-Fi 模块,无论是否成功接入到某个无线接入点,终端都会间歇性、突发性地广播Wi-Fi 探测请求帧。加之室内无线传播环境的复杂性,位于终端通信半径内的Wi-Fi 探针不可能持续周期性地正确接收到来自于同一终端的Wi-Fi 探测请求帧;且在相同的时间间隔内,不同探针检测到的帧数量也不尽相同。如图2 所示,同一时间段内不同探针接收到的来自同一终端Wi-Fi 的探测请求帧相互独立,具有间歇性和突发性。
Fig.2 Characteristics of Wi-Fi terminal network access detection request frame图2 Wi-Fi终端入网探测请求帧特性
Fig.3 Data acquisition array device based on multi Wi-Fi probe图3 基于多Wi-Fi探针的数据采集阵列装置
如图3 所示,为降低Wi-Fi 信号间歇性和突发性对室内人员辨识模型性能的影响,在建筑物空间内部署n 个商用WiFi 探针,记为R=(R1,R2,…,Rn),形成一个多Wi-Fi探针的数据采集阵列装置。图4 为本文设计的基于Wi-Fi的室内区域人员辨识模型,其中正数据指区域内移动终端的接收信号强度(Received Signal Strength Indication,RSSI)向量,负数据指区域外移动终端的RSSI 向量。为降低模型对环境的依赖性,提高其泛化能力,本文采集了多个不同区域的Wi-Fi 终端样本数据并进行了标注。图4(I)展示了离线阶段模型训练的过程,该阶段采用粒子群优化(Particle Swarm Optimization,PSO)算法优化BP 神经网络的方法训练分类模型。图4(II)为在线辨识阶段,首先采用区域的Wi-Fi 探针联合装置捕获Wi-Fi 数据帧;然后对Wi-Fi 数据帧进行解析,获取探针ID、移动终端MAC 地址、RSSI 等信息;最后将解析后的信号强度处理成适合模型输入的向量,通过模型分类识别获取区域内人员数量。
Fig.4 Wi-Fi-based indoor occupant identification model图4 基于Wi-Fi的室内人员辨识模型
Wi-Fi 信号在传播时易受室内物品及人员的影响,存在严重的多径现象。为此,将多Wi-Fi 探针的数据采集装置置于区域某个高处(具体高度并不作要求),如柜子顶部等,尽可能使Wi-Fi 终端与探针装置之间存在视距传输(LoS)。数据采集来源于室内多个区域,采集到的原始数据经过处理才能送入人员辨识模型进行训练和判断。
使用离差标准化对降噪后的RSSI 序列进行归一化处理,使其取值范围为[0,1],具体转换公式为:
式中,min(RSSI)和max(RSSI)分别为当前一个时间窗口内探针检测到的RSSI最小值和最大值。
为辨识终端是否在指定区域内,基于多探针感知到的同一终端的RSSI 值,围绕多探针数据集构建基于BP 神经网络的区域内人员辨识模型,其由输入层、隐含层和输出层组成,结构见图5。对于同一个移动终端,可将同一时间周期内不同探针(如n 个)探测得到的RSSI 值(预处理后)构成一个n维向量,表示为:
Fig.5 BP neural network structure used by personnel indentification model图5 人员辨识模型采用的BP神经网络结构
将该向量作为模型输入,其中RSSI′i表示第i 个探针探测到的移动终端的接收信号强度值(预处理后)。当输出值为0时表示被感知的移动终端在指定区域外。
隐含层神经元的激活函数表示为:
输出层神经元的激活函数表示为:
模型训练过程中,采用PSO 算法优化BP 神经网络的内部权重和阈值。PSO 算法可在更大的空间内搜索最优解,具有很强的全局寻优能力,在一定程度上弥补了BP 神经网络易陷入局部最优的不足,能进一步减小神经网络输出误差。PSO-BP 算法的具体流程如图6所示。
Fig.6 PSO-BP algorithm flow图6 PSO-BP算法流程
首先,根据BP 神经网络的结构初始化输入层、隐含层、输出层的神经元个数以及各层之间的权重与阈值;然后初始化区域的邻域拓扑结构,以及粒子的位置和速度,每个区域并行计算并比较粒子的适应值,寻找个体最优值和本地最优值,对本地最优值和邻域最优值进行比较,寻找区域最优值;最后根据区域最优值更新粒子的位置和速度,算法迭代到最大迭代次数时终止,得到最终的区域内人员辨识模型。
由于Wi-Fi 终端入网通信具有固有的间歇性和非周期性,加之受室内环境的影响,位于移动终端通信范围内的每个Wi-Fi 探针不能够持续周期性地正确接收同一个移动终端信号,即使在相同的持续时间间隔内,不同探针检测到的移动终端次数也不尽相同,且漏检现象十分严重。为此,本文设计了如图3 所示的Wi-Fi 探针联合装置,4 个Wi-Fi 探针同时工作,以降低上述问题对人员统计造成的影响。这4 个Wi-Fi 探针组成的数据采集装置对应24-1 种组合方式,数据集可分为15 种情况,根据输入数据的不同可以训练15 种模型。此外,为了降低室内人员辨识模型对环境的依赖性,在训练时需采集多种不同区域的大量数据,因此模型训练任务重、耗时长。为此,本文引入并行计算的思想,使用实验室服务器,配置为Intel Xeon E5-2637 的CPU,4 个NVIDIA Tesla k80 的GPU 和192G 内存。根据使用到的Wi-Fi 探针个数,模型可分为1-探针模型(包括4 种模型)、2-探针模型(包括6 种模型)、3-探针模型(包括4 种模型)和4-探针模型(包括1 种模型)4 种类型。采用并行训练方式能够同时训练多个分类模型,采用分布式方法迭代优化粒子群,能大幅度缩短模型的训练时间。每类模型的训练时间如表1 所示。可以看出,采用并行计算可有效提高模型训练效率。
Table 1 Training time of personnel identification model based on parallel computing表1 基于并行计算的人员辨识模型训练时间
为测试人员辨识模型的性能,本文基于新型建筑智能化平台搭建了一套分布式人员辨识系统,并在智能建筑与建筑节能安徽省重点实验室4 楼开展了验证实验。该楼层的区域布局和Wi-Fi 探针装置部署如图7 所示,401、402、403、404、405、407 等标记为区域编号,在以上区域内部分别配置1 个WiFi 联合装置,放置在实验区域的固定位置,离地高度约为2m。
Fig.7 Schematic diagram of experimental site layout and Wi-Fi probe deployment location图7 实验区域布局及Wi-Fi探针部署位置示意图
将15 种数据集分别标记为data1、data2、data3……data15,具体信息如表2 所示。使用并行计算方法,在计算能力比较强大的服务器上训练15种模型。
3.2.1 模型对Wi-Fi探针组合方式的泛化能力
为研究本文模型对探针组合方式的泛化能力,在407区域使用4 个Wi-Fi 探针同时采集数据,经过数据解析、处理,共得到31 517 个样本,并对其进行标注。针对表2 中的15 种数据集并行训练15 种区域内人员辨识模型。前文提到,根据使用到的Wi-Fi探针个数,15 种模型可分为4 大类。对4 种类型的人员辨识模型分别进行泛化性讨论,分析模型在不同数据集之间的泛化能力。
4 种1-探针模型的召回率计算结果见表3。可以看出,1号Wi-Fi探针采集的Wi-Fi数据作为训练集训练出的模型能有效辨识1 号Wi-Fi 探针、2 号Wi-Fi 探针、3 号Wi-Fi 探针、4 号Wi-Fi 探针采集的数据,召回率达0.893 以上。同样的,2 号Wi-Fi 探针、3 号Wi-Fi 探针、4 号Wi-Fi 探针训练出的模型能以较高的召回率辨识其他Wi-Fi 探针采集的数据。4 种1-探针模型的准确率计算结果见表4,可以看出,1-探针模型的准确率可达0.893以上。
Table 2 Data set name and number of samples表2 数据集名称和样本数
Table 3 1-sniffer model recall rate表3 1-探针模型召回率
Table 4 1-sniffer model accuracy表4 1-探针模型准确率
2-探针模型、3-探针模型的召回率和准确率分别见表5、表6、表7、表8。可以看出,1 号和2 号Wi-Fi 探针同时采集的Wi-Fi 数据作为训练集训练出的模型能有效辨识1 号和3号Wi-Fi探针、1号和4号Wi-Fi探针、2号和3号Wi-Fi探针、2 号和4 号Wi-Fi 探针、3 号和4 号采集的数据,召回率可达0.995 7 以上。同样的,其他2-探针模型均表现出很好的召回性能。
Table 5 2-sniffer model recall rate表5 2-探针模型召回率
Table 6 2-sniffer model accuracy表6 2-探针模型准确率
Table 7 3-sniffer model recall rate表7 3-探针模型召回率
Table 8 3-sniffer model accuracy表8 3-探针模型准确率
验证试验结果表明,本文模型对Wi-Fi 探针的组合方式泛化能力很强。因此,可以合并4 类1 种Wi-Fi 探针采集的数据集训练1-探针模型,合并6 类2 种Wi-Fi 探针采集的数据集训练2-探针模型,合并4 类3 种Wi-Fi 探针采集的数据集训练3-探针模型。综上所述,本文提出的基于Wi-Fi 的室内人员辨识模型对探针组合具有良好的泛化能力,即15 种不同探针的模型最终可简化为1-探针辨识模型、2-探针辨识模型、3-探针辨识模型和4-探针辨识模型。
3.2.2 模型对不同区域的泛化能力
为进一步研究人员辨识模型对不同区域的泛化能力,采集6 个实验区域(401、402、403、404、405 和407 区域)内的Wi-Fi 数据,每个实验区域同时使用4 个Wi-Fi 探针采集数据。经过数据解析、处理,共得到79 995 个样本作为实验数据。打乱后随机选取80%的样本,共63 996 条数据作为训练集,剩余20%的样本共15 999 条作为测试集。训练数据为训练集中全部数据,并行训练4 个人员辨识模型,设置BP 神经网络的隐含层个数为6,迭代次数maxGen为1 000,学习因子c1 设置为2,学习因子c2 设置为2,惯性因子设置为0.8。模型训练过程中,根据误差MSE 值使用链式法则进行每层梯度参数变化的计算和不断迭代调整。
对每个区域的召回率进行计算,结果如表9 所示。可以看出,各区域召回率均能达到90%以上。计算训练得到的4 种辨识模型的准确率,结果如表10 所示。可以看出,各模型准确率均可达到91%以上。实验结果表明,该模型能准确辨识人员是否在区域内,且具备较强的泛化能力,大大降低了不同室内环境因素对模型性能的影响。
Table 9 Recall rate of each area表9 各区域召回率
Table 10 Accuracy of each model表10 各模型准确率
本文结合Wi-Fi 探针技术与智能计算方法,设计并实现了一种基于Wi-Fi 的室内人员辨识通用模型。该模型采用PSO 算法优化BP 神经网络内部的权重和阈值,不仅收敛速度快,而且不易陷入局部极值,具有较强的泛化能力。面对人员辨识通用模型繁重的训练任务,本文采用并行计算方法,有效提高了模型训练速度。验证实验结果表明,该模型对不同Wi-Fi 探针的组合方式具有良好的泛化能力,召回率可达到90%以上,准确率可达91%以上。此外,该模型对不同区域亦具有良好的泛化能力,解决了传统人员辨识模型部署一次训练一次的难题,满足建筑物智能化系统快速部署人员计量方法的实际应用需求。
由于室内环境复杂,Wi-Fi 信号传播特性多样化,Wi-Fi 终端接入网络时连接请求信号具有间歇性。本研究使用4 个Wi-Fi 探针,以降低Wi-Fi 信号间歇性和突发性对室内人员辨识模型性能的影响,但尚未考虑探针数量对模型检测结果的影响,未来还需要对此进行进一步研究。同时,后续仍需针对WiFi 信号的特征进行更深层次的挖掘,建立既能反映人员的存在性与WiFi 信号特征关联,又能抵抗室内环境影响的人员识别模型,以满足建筑智能化系统对人员准确刻画的需求。