王莹霞 ,陈 珂 ,刘 滋 ,尚 晓 *
(1.玉林师范学院 数学与统计学院,广西 玉林 537000;2.山东省滕州市第二中学,山东 滕州 277500)
地点是组织地理空间数据和人类认知的地理环境表达方式的重要元素。日常生活中人们习惯用地名来交流和传递信息,但这些信息通常是不精确的。因此,地点的定量表示在地理信息科学中是一个重要的问题。以数字形式记录的地点空间足迹会提供显著的识别信息,说明空间足迹的定量表示在推断空间关系中是有价值的。在本文中,通过空间部分——整体关系连接多个地点来构建地点之间的空间层次结构,以等级方式组织空间结构知识。与此同时运用空间层次对关联分析和定性空间的推理方法及模糊集理论来揭示地方之间的空间等级的两大问题进行研究[1,2]。借助FFCA数据分析方法来处理不确定信息并自动推断出位置之间的层次关系,完善以往对空间层次结构模糊性的忽略和弥补在空间层次结构定量表征形式化的欠缺。我们使用标记用户生成数据生成模糊集的足迹,通过用户原创内容中对兴趣点的统计分析和签到数据的分析来检测到该地点的空间层次结构关系。面对地方间没有清晰的边界问题,模糊集能够表示空间模糊隶属度的不规则变化,使之成为一种有效的模糊空间足迹定量建模方法。下面介绍本文所需要的基本概念,没有涉及的请参考文献[4-10]。
在本文研究中主要运用模糊集,借助FFCA和数据预处理形成POI点构成用户数据生成系统,然后运用模糊集进行空间层次结构分析,最后实现对空间层次结构简化的目标,处理地方间模糊的边界问题。具体可参照文献[3],可分为三个步骤:
数据预处理:在本研究中,我们选择了一种广泛使用的插值方法——核密度估计,来计算每个模糊位置的连续隶属函数。
场所的模糊形式概念分析:重点研究了场所空间背景的定义和表示场所的模糊形式概念的生成。一组由特定的场所的模糊形式语境所组成的空间概念集合,是场所的模糊概念格,即场所空间层次结构。
空间层次简化:在FFCA中,由于概念是以数学方式生成的,因此属性稍有差异的对象将被分类为不同的概念,而格中的概念数将成倍增长。由于模糊形式概念格的大尺寸,使得所得到的概念和层次难以在实际应用中使用。因此,将格中相似的空间概念聚为概念簇,并在这些概念的基础上生成简化的空间层次结构。
图1 江山市仙霞古道区域图
图2 地点的空间层次结构
现今,微信在中国的广泛使用,本案例中使用微信的登录数据作为数据来源。我们收集了2018年在浙江省江山市仙霞古道发布的朋友圈。仙霞古道中有14个点名被我们选为我们的名胜古迹,总共有21753条朋友圈和与此相关的1085个POI点。(POI可以由专业组织和用户创建,并包含详细的地点信息。值得注意的是,一个POI可以与多个地名相关联,因为其中许多都是使用多个地名来描述的;一个地名通常也与一个或者一个以上的POI相关联。)
在这个案例研究中,我们从登记数据中生成了一个特定的模糊形式背景。通过均匀采样获得上下文的点集,地名集是由14个选择的地名构成的。对于给定的地名,成员值应与相关的POI相符合,从而成员值更高。我们应用基于FFCA的方法来揭示场所的层次结构并且进行问卷调查以验证结果,相应地提出方法。
该方法引入了用于模糊形式概念分析的置信阈值Tp和用于简化空间层次结构的相似阈值Ts。在案例研究中,我们设置Tp=0.1和Ts=3.2,简化的结果空间层次结构如图2所示。
理论上,这两个阈值可以设置为[0,1]之间的任何值。随着阈值的变化,相应的格点和简化的层次结构也会发生变化。格点结构的一些基本指标有着不同的Tp点如表1所示。Num(I)、Num(C)和Num(≤)分别为采样点个数、位置概念个数和主要位置关系分别在晶格个数;Avg(Sim)是地点概念与其较低邻域概念相似性的平均值;IR称为继承丰富度,在这里,它是每个位置概念的子位置的平均数量。随着Tp的增加,由于在构造格的过程中忽略了采样点与拓扑的关系,相应的格的结构将变得非常简单。我们需要选择一个阈值Tp从R中去除一些隶属度较低的关系,因为这些关系不那么重要,会增加计算量。与此同时,我们应该保留足够的样本来捕捉这些地方成员值的变化。因此,一个相对较低的阈值将是可取的,我们选择了Tp=0∶1根据表1。
一些基本指标的简化层次与不同的Ts(Tp=0∶1)被表示在表3中。同样,Num(C)、Num(I)分别是概念集群的数量和集群之间近似层次关系的数量。IR表示表3中每个簇的近似层次关系的平均数量。随着Ts的增加,模糊区域的简化层次结构将更接近于原始网络,概念聚类的条件将变得更加严格。为了选择一个阈值Ts,使简化结果更加合理,我们既考虑了不同Ts下简化结构的变化,又考虑了位置概念之间相似性的分布。基于实验和经验知识,选取非零相似度值0.32的第三个四分位数作为Ts。
表1 模糊形式格的几个基本指标具有不同的阈值
选定的14个地名是廿八都古镇,浮盖山,戴笠故居,仙霞森林公园,仙霞关,石鼓香溪,松风亭,“东南锁钥”石碑,浣霞池,天雨庵,霞岭亭,率性斋遗址,古碉堡遗址,福口亭。地方间简化的等级制度的验证需要丰富的研究场所的本土知识。图2显示了基于FFCA的方法生成的这些地方之间的简化空间层次结构。白色的节点表示案例研究中的研究区域(即包括本案例研究中所有位置的地方)。在深灰色中的节点代表要调查的地方。浅灰色的节点表示位于所选地点重叠区域的位置。重叠区域可以借助它的上级邻域的地名,并且可能有自己的地名。
为了验证简化的空间层次结构的合理性,我们采用问卷调查的方法对这些场所之间的空间关系进行了研究。一百位熟悉仙古道和廿八都古镇周边环境的参加者,要求用确定的一个空间关系来描述他们对任何两个地方的看法。要选择的空间关系包括根据RCC-5,五个基本空间在不考虑区域间拓扑关系的情况下,两区域间的拓扑关系得到了广泛的应用区域边界。它们断开(DC),部分重叠(PO),相等(EQ),适当的部分(PP)和适当的部分逆(PPI)和选项“我不知道”。我们发现显然存在着共同的观点,并且地方的简化等级与主要的部分-整体关系很好的匹配,除少数几个地方外。通过问卷调查知道,我们的方法将戴笠故居和仙霞古道聚集在一起,而在调查问卷中有30个参与者将戴笠故居视为仙霞古道的一部分。有32人认为这两个地方相邻,只有5人认为戴笠故居和仙霞古道处于同一位置。地图上这两个地方的中心位置不在同一位置。同时,我们注意到仙霞古道与戴笠故居是相互关联的。这就是为什么我们的方法产生的这两个地方的概念有很高的相似性。因为参与者主要是游客及当地居民,而当地居民主要住在故居附近,在一些参与者对戴笠故居的看法存在着认知偏差。有25人认为浮盖山属于仙霞古道的一部分,这显然是错误的。实际上,浮盖山在仙霞古道外围,与廿八都古镇毗邻。在本案例研究的大多数地方,基于FFCA的方法的结果与问卷调查的结果相当一致,从而验证了该方法。
此外,我们还发现,当被问及浮盖山与廿八都古镇之间的关系时,超过80%的人不确定。然而,85%的参与者认为浮盖山属于廿八都古镇,96%的人认为廿八都古镇属于仙霞古道的一部分。这个有趣的现象意味着许多人可能不善于表达多层次的空间知识关系。因此,从UGC中揭示地方间的空间层次是对经验认知实验的一种有价值的补充。
基于FFCA,构建我们所调查的地方之间的次地超级关系,并在概念集群中利用这些概念,生成更易读的地方的简化空间层次结构。获得的场所空间层次结构IDE是一种在不同规模上组织多个场所的有效办法,并能进一步讨论场所可供性与不同空间层次之间的联系。对于地名的模糊形式概念分析的输入是抽样点及其对应的不同地名的隶属值,我们还可以使用其他用户生成的数据和其他插值方法进行认知实验。同时,通过问卷调查,我们发现我们构建的地方的简化空间等级与参与者的认知相对应。为了提取其中包含的空间层次结构,地理标记的UGC更能够作为合适的数据源进行实验,其数据内容涵盖了不同的地方、地方间的空间等级、各地方的集体意识,从而更贴近日常生活,且购置成本较低,数据的处理更快。
显然,UGC不可避免的存在弊端。不同地方的人对于不同地方的看法也不同。因此,在除去用户隐私保护限制的前提下,我们将使用不同类型的UGC,结合其不同的特征,对异构数据进行汇集与分析,从而减少偏差。