张蓝天,王光霞
(信息工程大学 地理空间信息学院,河南 郑州 450052)
现代信息科学技术、通信技术、传感器技术等技术的飞速发展将全球迅速推入了大数据时代,人的地理位置、社会关系甚至行为动作都可以作为数据被记录下来。地理位置信息——作为人类日常生活中最基本的、获取途径便捷的数据之一,对它的研究应用十分广泛。室内定位数据描述物体的空间位置和属性随时间的变化,它多用于交通、气象、生态和移动服务等领域。据统计,现在人们的生活有87%是在室内,而随着人类生活的丰富,室内环境也变得更加复杂,室内环境与室外地图的表现方法有很大不同。目前人类在日常生活中对于室内位置服务的需求是巨大的,这使得室内位置服务成为当今的热点问题,而用户的定位数据是位置服务中不可或缺的关键信息,将室内定位分布以专题地图的方式进行绘制,可以帮助人们从海量的室内定位数据中发现隐藏的模式、趋势、网络和关系[1],对室内定位数据背后隐藏的信息进行分析,不仅可以辅助室内场所的设计规划者更好地结合人群普遍存在的习惯模式规划出更加合理的室内场所的设计布置,也可以帮助大型室内场所的管理者、店铺商家等更好地进行资源配置,以获得更大的收益。
本文结合专题地图设计的基本理论,梳理了大数据时代下室内定位数据的特点及应用,结合北京西单大悦城商场采集到的人的移动定位数据,进行定位分布专题地图设计与分析,发现室内定位分布的潜在特征与规律,使该数据能够为使用者提供更好的室内位置服务。
大数据时代,数据以Zb量级不断增长[3],目前世界上90%以上的数据是最近3年才产生的[4]。数据具有规模大、流转快、类型多、价值密度低的特点。而空间大数据逐渐成为战略决策、市场分析、商业选址以及O2O、物流、外卖等即时服务的重要保障,如何对海量数据进行有效利用成为近年来的热点问题。
大型商场、超市、机场、会展中心等室内场所的规模越来越大,结构设计也日趋复杂。而研究这些室内场所的服务对象——人在其中的定位数据可以帮助挖掘出人群普遍存在的习惯模式,通过对人群定位数据的挖掘探索与分析不仅可以辅助室内场所的设计规划者更好地结合人群普遍存在的习惯模式规划出更加合理的室内场所的设计布置,也可以帮助大型室内场所的管理者、店铺商家等更好地进行资源配置,以获得更大的收益。随着人们在室内活动的增多,定位数据的数量也越来越庞大。一幅图胜过千言万语,人类从外界获得的信息约有80%以上来自于视觉系统[6,8]。将人的室内定位分布绘制成专题地图,可以将海量数据以视觉感受的形式清晰直观地传达给读图者,提升巨量价值密度低的数据的利用率。
获取室内定位数据离不开室内定位技术,卫星定位系统在室外定位中的应用已经发展得非常完善,但其在室内的定位效果受制于其所使用的卫星电信号无法穿透墙壁、用户进入室内无法接受到其信号,因此卫星定位系统在室内定位的效果较差。若要进行室内定位,则需要额外安装大量设备。室内定位的方式有很多种,包括红外信标、无线电信标、超声波系统、基于视频的系统、蜂窝网络、无线局域网等,由于移动通信设备的广泛普及,智能手机的人均拥有率高达86%,而wifi具有成本低、使用率高、方便快捷的特点,因此当前大多数的室内定位都采用wifi定位技术[9-12]。
本文对北京大型商场西单大悦城一层在2014-09-30下午15:00:00—15:30:00的人流定位数据进行室内定位分布专题图的绘制。西单大悦城座落于一栋独体建筑内,该数据是由路由器来进行室内定位数据的采集获取,只要西单大悦城内的顾客把智能手机上的wifi打开,该顾客的位置信息即可被路由器采集到,并不需要顾客将其智能手机连接到大悦城免费wifi上,这样可以更全面地采集到西单大悦城内顾客的位置信息,避免出现大量顾客未使用西单大悦城的wifi使其定位数据被遗漏的情况出现。
采集到的原始定位数据往往具有噪声多、数据量过大的特点,且在定位数据的采集过程中因路由器信号不稳定等问题不可避免地会重复采集或是遗漏掉一些数据,因此需要对数据进行预处理,以利用数据制作室内定位分布的专题地图,帮助人们通过对大数据的分析挖掘到更加精准的数据背后隐藏的信息。
由于定位数据的采集设备可能接收到并非在商场内部而是在商场附近范围内活动的信号,即偏离了定位点的空间维度上的噪声数据[13];采集到的移动目标也包括该商场的工作人员;手机店铺里的手机产品也有可能接入该商场的wifi、作为一个定位点而被获取。因此在研究该商场内顾客室内定位的问题时需事先将这些可能存在的影响最终可视分析结果的数据进行筛选过滤,剔除噪声用户。除了对非消费者数据的剔除,还要考虑到时间维度上的噪声数据,即时空缺失点[14],时空缺失点的产生往往是由于路由器的信号不稳定而引起的。
专题地图既可以表示普通地图上有的,也可以表示普通地图上没有的地理要素;既可以表示实际可见的地物,也可以表示实地看不到的现象[15]。其可表达的内容范围大于普通地图,因此应用十分广泛。室内专题地图的研究对象主要针对任何大到足以让人迷路的建筑的内部空间[16-17]。随着互联网的广泛应用和位置服务的迅速发展,基于位置的服务是当下的热点问题[18],这迫切需要在室内专题地图基础上的实时人机交互活动。而对实时采集到的人的移动定位大数据的分析与利用,是当前地理位置服务的前提,基于此才可以完成一系列的诸如多媒体广告价值评估、位置定位的精准营销服务、商业地块价值评估预选址等应用。
目前室内专题地图的应用主要在机场、大型商超、会展中心、医院等建筑规模较大的场所,基于位置的服务在向“个性化”与“人工智能”的方向发展。以大型商场超市客户的室内定位分布专题地图为例,通过对其进行分析,可以改善传统实体零售行业用户转化靠“缘分”、管理商户靠“经验”、收集数据靠“目测”的局面。对用户的定位大数据进行深度挖掘,可以通过不同的可视化形式显示出客流时间高峰、室内场所的冷热区域分布、客户驻留时长的分布、到访频次的分布等关键信息,辅助基于位置服务的应用环节中进一步的分析与决策。
在商场内采集的室内定位数据具有数据量巨大、受到建筑空间构造以及室内定位技术制约的特点。如图1所示,使用wifi定位采集到的定位数据是一个个离散化的坐标点,每一个坐标点代表了后端的定位引擎获取的移动电子设备在某一时刻的停留点。将从西单大悦城商场所获取到的商场楼层店铺平面图的CAD图进行矢量化,并用ArcMap软件绘制出来,得到图2所示平面图。在QGIS软件中通过对室内定位数据与商场楼层店铺平面图进行叠加,可以清晰显示出人群在商场内停留点的分布情况,如图3所示。
图1 使用wifi定位采集到的定位数据
图2 西单大悦城一层商家平面图
图3 室内定位数据与商场楼层店铺平面图进行叠加
通过图3可以清晰看出北京西单大悦城商场一层在2014-09-30T15:00:00—15:30:00内的人流定位数据量已经非常庞大,定位点密密麻麻地分布在商场的各个角落,定位点之间存在着严重的叠加问题。因此,人们很难通过直接的目视判读出在这0.5 h内西单大悦城商场一层哪些区域是热门区域,哪些地区的客流量较少。而获取商场的冷热门商家店铺信息对于基于位置的服务具有非凡的意义。由此,使用热力图来进行室内定位分布专题图的表示。通过对室内定位数据进行热力图分析,可以清晰地发现商场的热门区域与冷门区域,对热门区域和冷门区域的地理分布进行分析,可以辅助商场的管理者就如何安排商家店铺的空间位置分布以促进该商场的整体营业额进行决策,如在一个热门店铺周围安插一些知名度不够高的小众品牌,通过提高经过这些小众品牌店铺的整体人数来提升该品牌的知名度,增加可能成为该商家的消费人群的顾客数量。同时,也可以根据不同时间点生成的热力图查看任意时间点的人流移动趋势,实现对时空大数据的深度挖掘。
利用ArcMap软件与QGIS软件进行热力图的绘制具有相同的原理,在本文中均用到了核密度分析的方法绘制热力图,核密度分析的绘制结果与其他方法相比较具有分布较平滑的优点,该方法涉及到了核函数选择的问题,常见的核函数有高斯核函数、三角核函数、二次核函数等,在本实验中,采用不同的核函数进行分析,得到的二维平面图区别十分细微,几乎可以忽略不计。而核密度分析的另一个关键参数——带宽的选择不同,该实验的结果将有明显的差异。
图4所示为设置带宽为10 m所生成的原始热力图,其中更明亮的区域代表了更密集的定位点聚集。修改热力图色调得到了如图5所示热力图。
图4 原始热力图
图5 修改色调后的热力图
为了更加清晰地显示出热力图与商场内分布的定位点以及商场平面图的相应分布,将热力图的透明度调整为50%,得到图6。
利用相同的方法,分别在QGIS软件中绘制不同带宽的热力图。选取具有代表性的几幅热力图进行分析对比,可以得出带宽参数的选择对生成热力图效果的影响,在绘制定位分布专题地图时,需要选取合适的带宽参数,以根据定位分布专题地图的不同用途绘制出满足用户需求的热力图。如图7—图9所示,分别为带宽为1 m、带宽为5 m、带宽为20 m的热力图,结合图6带宽为10 m的热力图,经过对比可以发现,热力图的带宽越大,所能表现出来的结论越粗略和抽象,但能够反映出整体性的趋势;而当选取的带宽较小时,热力图的细节程度较高,显示出的是局部性的趋势。带宽的选取过程需要进行尝试和比对,在选择上具有一定的主观性。基于挖掘热门区域和冷门区域的地理分布的目的,选取带宽为10 m的热力图作为该实验生成的定位分布专题地图,既能反映出商场内部在这一时间段内宏观上的热门区域与冷门区域,也能不失细节地辅助分析冷、热门区域的形成原因等问题。
图6 透明度调整为50%的热力图
图8 带宽为5 m的热力图
图9 带宽为20 m的热力图
如图2所示,原始的商场楼层店铺平面图色彩单一,读图者需要通过注记来获取不同位置的商家店铺名称,不同的店铺对应的消费类型的信息并不能够直观地传递给读图者,需要读图者在头脑中对该商家所属的购物类型作出判断,有许多陌生的品牌可能读图者也并不明晰。
而色彩作为地图语言的一种,可以表达和传递地理空间信息,同时,它也是地图上显现科学内容的重要整饰。色彩能够提高地图的视觉感受和传输效果,增大地图的信息负载量,能够使读图者获得更多的知识与信息[16,19-20]。在改进商场楼层店铺平面图的过程中,充分利用色彩这一视觉变量,以设计成更加清晰、便于进行可视分析的商场楼层店铺平面图。平面图整体色彩的选择应注意避免色彩的饱和度过高,使得整体色彩效果给人以清新、平和的感受。对于不同类型的商家店铺,应使用不同的色彩加以区分,便于一目了然地对店铺类型有一个直观清晰的认识,读图者对于许多陌生的品牌也可以迅速判断出其销售商品的类型,获得更好的读图感受,在进行后续分析的过程中也辅助人们结合商铺类型等信息挖掘出大数据背后隐含的规律。
根据图2西单大悦城一层的商家平面图可以获取商场一层所含商铺信息并对其进行分类,如表1所示。
表1 商场一层所含商铺及其分类
如表1所示,可以将西单大悦城一层所入驻的商家店铺根据其销售商品的类型结合其所面向的顾客人群范围进行分类,主要分为以下8类:“品牌鞋专卖”、“配饰专卖”、“综合时装”、“电子设备专卖”、“潮流女装”、“男装专卖”、“包饰专卖”、“美妆护肤”。
接下来,根据商铺的类型将其进行归类,如表2所示。
表2 按类划分的商铺
利用色彩这一视觉变量按照前文所述思路对使用ArcMap软件绘制出来的商家平面图进行改进,生成图10所示商场店铺平面图,这样一来,不同的店铺对应的消费类型等信息可以直观地传递给读图者,在进行后续分析的过程中也得以更加清晰直观地结合商铺类型等信息挖掘出数据背后所隐藏的规律。
图10 改进后的商场店铺平面图
结合图6和图10,人们可以清晰地判断出商场内在这0.5 h里人的定位点集中分布的地理位置。即西单大悦城的南门出入口、综合时装卖场ZARA的西南角落处、综合时装卖场GAP的东侧、西单大悦城南侧出入口都为定位点密集分布的热门区域。结合热力专题图,人们可以根据人群密集分布的地区挖掘人的行为模式,也可以根据一个商场内热点区域的分布合理配置资源。以综合时装卖场ZARA的西南角落处为人流密集分布区域,可以结合ZARA的销售模式推测此热点区域为ZARA时装卖场的试衣间或者是收银台,经过实地调研,发现ZARA时装卖场的收银台和试衣间果然位于该热点区域内,完全符合根据热力专题图的推测。与此同时,也可以在此处安置一些广告推送设备,在不同时间段推送有价值的广告信息,例如在就餐时间向排队等候结账或是试衣服的顾客推送该商场内餐饮店铺的广告信息,此时顾客正处于等候状态,推送广告信息顾客的吸收率较大。
本文对北京大型商场西单大悦城一层在2014-09-30T15:00:00—15:30:00的人流定位数据进行了室内定位分布专题图的绘制,根据生成的热力专题图对热点区域人流密集的原因进行了推测,并对热点区域的利用提出了一定建议。但是,根据室内人流定位数据绘制生成的专题地图仍存在不少需要提升改进之处。首先,热力图的生成受到半径等参数的影响,设置不同的参数,将得到不同的表达效果,参数的设定值也受到该室内场所的面积以及热力图的用途等问题的影响,因此参数的设置将是需要进一步深入研究的问题。室内场所不同于开阔的室外环境,尤其是建筑结构复杂的大型商场,其内部含有一个个小的商铺由隔断隔开,有时所生成的热点区域无法自行绕过这些墙壁或者隔断,因此我们无法判断该热点区域精确集中于哪里。而对热力图进行更有价值的利用也是今后需要思考、研究的问题。