结合微博数据挖掘的城市群时空特征

2017-11-09 11:50董飞
电子技术与软件工程 2017年19期
关键词:断裂点新浪微博

董飞

摘 要结合新浪微博数据,利用重力模型,以珠三角城市群为例,获取 2009年以及2013年珠三角城市群各城市之间的微博数据进行挖掘,测算两个年份珠三角城市群城市之间的联系强度,结果表明,随着时间的演进,珠三角城市群各个城市之间的联系在加强。

【关键词】新浪微博 重力模型 联系强度 断裂点

1 绪论

当前,我国进入了快速城镇化的时期,从而形成了多个城市群,城市群是指在城市化过程中,特定地域范围内,若干不同类型和等级规模的城市基于区域经济发展和市场联系而形成的城市网络群体。以往的城市群网络研究主要基于传统数据展开,如路旭等通过对高级生产者服务业布局研究珠三角城市网络的空间格局,唐子来等从交通等基础设施流角度切入研究长三角的城市体系演化,这些研究多基于统计数据,往往存在时间滞后或统计口径不一等缺陷,本研究借助海量社交网络数据,采用重力模型,以珠三角城市群为例,测算2009年及2013年内部城市之间的联系强度,分析时序变化反映的城市群演进趋势,并计算2013年广州同其他珠三角城市的断裂点,从而验证微博数据的合理性和其具有丰富的内涵。

2 数据获取

微博是社交网络的典型应用,本研究所使用的数据是通过新浪微博开放平台获得的,首先进入平台进行微博开发者注册,接着向新浪微博提交成为开发者申请,待申请通过后会得到一个密钥。数据的获取是基于申请成功得到的密钥以及调用新浪微博开发平台提供的API接口。由于API接口返回的是json结果,所以还需对结果进行抽取并进行数据清洗,形成可用的数据结果。

3 重力模型及阻尼系數

重力模型最初来源于物理学万有引力定律在空间相互作用理论研究中的应用,反映了地理学的第一定律,即地理事物以及其属性在空间位置关系上是有联系的,并且这种联系随着距离的增加会衰减。很多地理学家将重力模型应用在地理实体空间关系的研究中,实体空间关系的研究中,重力模型的理论认为:地理实体是具有质量的,地理实体之间也存在相互的作用力,地理实体间质量乘积越大,空间距离越小,相互的吸引力也就越大,其中质量是地理实体自身实力的体现。

重力模型的一个重要应用是计算最适阻尼系数,β取从0到1范围内多个值,通过线性函数相关系数R2的大小得到最适的β。

4 珠三角城市群最适阻尼系数测算

利用新浪微博获取的数据,借助重力模型,以城市总的社交入向通量作为城市质量,两个城市之间的总社交通量作为实际的相互吸引力,β分别取0、0.2、0.4、0.6、0.8、1,分别计算2009年以及2013年两个年份珠三角城市群最适阻尼系数,得到图1。

从图1中可以直观地看到,2009年当β=0.6时,重力模型线性拟合的相关系数最大,2013年当β=0时,重力模型线性拟合的相关系数最大。从β值的变化可以看出2009年到2013年珠三角城市群城市之间的联系越来越多,城市群的发展速度也越来越快。

5 结论与讨论

本文利用微博数据,结合重力模型,分别测算2009年及2013年两个年份珠三角城市群的城市联系强度,结果表明,随着时间的演进,珠三角城市群城市之间的联系在加强。

由于微博数据本身数据量很大,并且存在很多不真实的数据,从技术角度讲,比较难完全过滤掉噪音数据以及不真实数据,这也是微博数据利用面临的一个比较大的问题,所以获取到的微博数据会包含不真实的数据以及杂质信息,基于微博数据挖掘会有一定的误差。随着网络数据获取技术的提高,未来能够获得更准确的数据。那么挖掘、分析的结果会更加理想。

参考文献

[1]Kwan,M.P.(2007)."Mobile Communications, Social Networks, and Urban Travel: Hypertext as a New Metaphor for Conceptualizing Spatial Interaction *."Professional Geographer ,2007,59(04):434-446.

[2]Libennowell, D., et al. (2005). "Geographic routing in social networks.(COMPUTER SCIENCES: SOCIAL SCIENCES)(Author Abstract).",2005.

[3]Cui,A.X.,et al.(2012)."Emergence of Scale-Free Close-Knit Friendship Structure in Online Social Networks." Plos One 7(07):e50702,2012.

[4]Camagni,R.P.(1993).From City Hierarchy to City Network:Reflections about an Emerging Paradigm,Springer Berlin Heidelberg,1993.

作者单位

广州海洋地质调查局 广东省广州市 510760

猜你喜欢
断裂点新浪微博
染色体平衡易位断裂点与男性不育关系探讨
某三代核电厂电气厂房外侧至常规岛主蒸汽及主给水管道断裂防护设计研究
基于断裂点理论对武汉城市圈中心城市影响范围的测算
社交媒体平台医患关系报道特点研究
断裂点位置对GIS中无拓扑闭曲线简化的影响
基于断裂点模型的可持续发展辐射效应研究