王远帆 张世良
摘要:大数据时代的到来以及网络科学的发展,使得空间交互研究成为目前信息科学领域的研究热点。以往的研究和分析方法已经不是那么适用于基于大数据的所得到的空间交互数据。本文针对空间交互可视化、距离衰减方法、粒子群优化算法及BGLL算法等进行研究和实现。空间交互可视化的研究对于认识许多社会经济现象,理解空间在其中发挥的作用是十分重要的。
关键词:空间交互;距离衰减;BGLL算法;可视化
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)19-0008-02
开放科学(资源服务)标识码(OSID):
空间交互的研究对于人们认识许多社会经济现象,理解空间在其中发挥的作用是十分重要的。由于大数据时代所带来的便利,我们现在可以轻松地获取不同尺度上的空间交互数据。但是同样由于大数据的大量、高速、多样化等特点,我们获取到的空间交互数据也往往是海量的、多样化的。以往的研究和分析方法已经不是那么适用于基于大数据的所得到的空间交互数据。那么为了能更好地利用大数据时代提供给我们的便利,更好地进行关于空间交互作用的研究,如何研究和分析这种包含了“大数据”特点的空间交互数据,是目前十分重要且亟待解决的问题[1]。本文从可视化、距离影响、社区发现等方面出发,总结目前基于大数据的空间交互研究,应用实际数据进行了相关的空间交互研究并对结果进行评价。
数据可视化技术指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互等多个领域[2]。空间交互数据的可视化主要关注数据的显示方面,而流地图则是表现空间交互数据的一种最常用的表现形式。流地图中的点是根据实际地理位置固定的,代表实际的地点;流地图中使用直线或者曲线来连接起点和终点,代表起点和终点之间的流。流地图能够使人清晰、快速地理解所要表达的流的含义、大小、方向等,能够直观地展示出流的空间模式。但是随着数据规模的增大,大量的线之间的交叉以及覆盖使得流地图很快的失去它的有效性。
1 算法分析
1.1 距离衰减方法
空间交互的三大基础:互补性、可转移性和干扰机会[3]。其中可转移性和干扰机会都是与距离相关的,可见距离对于空間交互的影响应该是十分巨大的,而这种影响就是距离衰减。在空间交互中,随着距离的增长,交互强度相应减弱,这种现象称为距离衰减。距离衰减有宏观和微观两个层面的表现形式:宏观层面上,由于距离衰减,两个地理实体之间的交互总量在其他变量相对稳定的情况下,与距离表现为负关系;微观层面上,在不考虑其他影响因素下,由于距离衰减,单个目标移动到不同目的地的概率与距离呈负相关。距离衰减的形成可以从与之相关的空间交互的两个基础上找原因。首先,根据可转移性,空间移动的成本与距离成正相关,为了最小化成本,需要降低长距离交互的强度;其次,在交互目的地的选择过程中,由于干扰机会的存在,降低了长距离交互的概率。目前根据实际交互强度来求解距离衰减系数的方法主要可以分为两种,根据实际交互强度来求解距离衰减系数的方法主要可以分为两种;一是通过公式推导或问题转换的方法来计算出距离衰减系数解析值,称为解析法;另一种是通过给定的假设条件,由计算机给定的假设条件,由计算机模拟大量的重复实验,得到符合条件的距离衰减函数值,称模拟法。
1.2粒子群优化算法
PSO算法求解重力模型也是基于逆重力模型的,思路是把估算节点规模的问题转化为优化问题[4]。对于包含n个节点的空间交互网络,粒子Xi被定义为Xi={PI,P2,-Pn},□□是每个节点的规模。初始化一群粒子后,给定距离衰减系数B,并求出相应的规模估算结果。在给定不同的B得到的结果中,选取估算结果最优的p值。粒子群优化算法( Particle Swarm Optimi-zation,PSO)是KennedY等(Kennedy et al.,1995)受鸟群捕食行为的启发,提出的一种随机搜索算法。它将优化问题的每一个解看作一个粒子,初始时每个粒子都获得一个随机的位置和初始速度。下一时刻的位置由当前位置和速度决定,而速度则是与所有粒子中最优的那个粒子有关。粒子通过不停迭代直到找到满足给定的拟合优度的最佳位置,即最优解。
算法描述如下:
a)相关定义:首先,我们进行如下定义:粒子Xi={P1,P2,-Pn},其中Pi是每个节点的规模;粒子速度Vi={VI,V2,…Vn};实际观测到的交互流量{T},其中每一个Tij是实际观测到的节点i、j之间的交互流量;计算得到的交互流量{T'),其中每一个Tij是根据当前粒子中的节点规模,由重力模型算出来i、j之间的交互流量;
b)拟合优度(fitness value)评价函数fv0,输入实际交互流量{T}和由粒子Xi计算得到的交互流量{T'},返回两者之间的相似度,作为评价粒子Xi的指标。实质是一个求皮尔逊相关系数的函数;第i个粒子所找到的最优解pBesti_ {P1,P2,…,Pn),其中pi是每个节点的规模;第i个粒子所找到的最优解的拟合优度pBestFVi,记录pBesti的拟合优度值;整个粒子群所找到的最优解gBest=(P1,P2 -,Pn},其中Pi是每个节点的规模;第i个粒子所找到的最优解的拟合优度gBestFV,记录gBest的拟合优度值。
1.3 BGLL算法
BGLL算法是Blondel、Guillaume、Lambiotte和Lefebvre提出的一种基于模块度优化的社区发现的算法。它的运行效率极高,即使是大型的复杂网络,也能很快得出结果;与此同时,结果的模块度也往往较高[5]。在计算结果与实际情况的对比中发现,该算法发现的社区的准确度也是极高的。更值得一提的是,该算法的结果是一个分层级的社区集合序列,可以得到不同空间尺度上的社区发现结果。
该算法分为两个部分:
第一部分的步骤如下:
1)给定一个N个顶点的带权图,首先把每一个顶点都标记为不同的社区,即一共有N个社区;
2)对于每一个顶点i,我们考虑与i相邻的每一个顶点j。计算把i从i的社区中删除并加入j的社区所带来的模块度的变化。如果存在一个最大的模块度的增加,那么就把i加入那个j的社区;如果结果都是模块度减少,那么i就仍在原社区中:
3)重复步骤2)直到模块度不再增加,第一部分结束。
至此,我们达到了一个局部上的最优,单个顶点的变动已经不能再使模块度增加。
进行第二部分:
1)将第一部分得到结果中的社区转变为顶点。新的顶点之间边的权重是对应的两个社区之间边的权重的和,社区内部的边变为新顶点上的自环。
2)对1)得到的结果进行第一部分的操作。我们发现BGLL算法实质上是一个从下而上的聚合算法,每進行一次聚合,都能得到一个尺度上的社区发现的结果。最后我们得到结果是一系列从下到上的社区集合,空间尺度由小变大,社区数量由多变少。算法示意图如图1所示。
2 交互实现过程
数据预处理将采集来的信息进行预处理和加工,使其便于理解,易于被输入显示可视化模块。预处理内容包括数据格式及其标准化、数据变换技术、数据压缩和解压缩等[6-7]。有些数据也需要做异常值检出、聚类、降维等处理,绘制的功能是完成数据到几何图像的转换。一个完整的图形描述需要在考虑用户需求的基础上综合应用各类可视化绘制技术。显示和交互显示的功能是将绘制模块生成的图像数据,按用户指定的要求进行输出。除了完成图像信息输出功能外,还需要把用户的反馈信息传送到软件层中,以实现人机交互。针对可视化的主要任务,即总览、缩放、过滤、详细查看、关联等,交互技术主要包括动态过滤、全局+详细、平移+缩放、焦点+上下文及变形、多视图关联协调等技术。其可视化实现过程如图2所示。
3 结论
可视化是人通过视觉观察在头脑中形成客观事物印象的过程,以人类惯于接受的图形、图像为媒介,并辅以信息处理技术,将客观事物及其内在联系表现出来。其不仅是客观现实的形象再现,也是客观规律、知识和信息的有机融合,同时还提高了人对复杂事物的观察能力及整体概念的理解.可视化在空间数据分析和认知中起重要作用,其直观形象地展示了空间数据的结构特征和复杂关系,是对知识更高层次的抽象概括,被广泛应用于空间数据的分析和理解、信息的提取和表达、知识的发现和决策中。空间交互是从一个地理实体到另一个地理实体的流过程,这个过程中的流可以是人口的流动,可以是货物的运输,也可以是信息的传播,抑或是金钱的投资。研究空间交互,对于人们认识许多社会经济现象,理解空间在其中发挥的作用是十分重要的。随着大数据时代的到来,我们现在能够容易地从多种渠道获取各种各样的空间交互数据,比如基于手机和GPS可以得到海量个体的移动轨迹数据,通过社交媒体提供的API可以得到带有位置标记的社交媒体签到数据等等。这些数据为我们研究不同类型的空间交互作用提供了极大的便利。但是这些数据带有大数据时代海量、多样化的特点,我们需要不同于以往的、有针对性的方法来对这些数据进行处理和研究,才能更好地帮助我们理解空间交互。
参考文献:
[1]刘智慧,张泉灵.大数据技术研究综述饥.浙江大学学报(工学版),2014,48(6):957-972.
[2]宋树华,程承旗,关丽,等.全球空间数据剖分模型分析[J].地理与地理信息科学,2008,24(4):11- 15.
[3]刘锡铃,张世良.空间高维数据可视化方法研究[J].许昌学院学报,2013,32(5):59-63.
[4]刘锡铃,张世良.自然灾害智能化应急救援信息系统关键技术研究[Jl‘韶关学院学报,2018,39(9):32-37.
[5]张世良,王远帆,刘锡铃,基于Slice-Oriented算法的宁德市森林健康分类研究[J].中国管理信息化,2019,22(21):170-171.
[6]张世良,基于Android的宁德茶叶电商平台研究[Jl,信息与电脑,2018(15):67-68,71.
[7]周亚男.遥感云环境下影像数据产品生成与可视化服务研究[D].北京:中国科学院大学,2014.
【通联编辑:梁书】
基金项目:福建省自然科学基金计划项目(2018J01579);福建省中青年教师教育科研项目(JAT170652);宁德师范学院创新团队项目(2017T05)
作者简介:张世艮(1973-),男,硕士,副教授,通讯作者,主要研究方向为空间信息科学与信息工程。