与规划编制相关的网络开源数据获取应用研究

2016-01-21 18:32李楠
中国科技纵横 2015年24期

【摘 要】城市规划,涉及到社会的方方面面,并对生活在其中的人们产生千丝万缕的联系,它并不是静态的设计,而是为社会动态发展,人类动态生活而服务的。本文介绍了网络开源数据在规划编制中的应用前景,分析讨论了几种可行的网络开源数据的获取方法,就开源数据的的安全性及具体在在Gephi软件的展示应用进行了简单的介绍。

【关键词】开源数据 规划编制 数据获取 数据展示

随着这些年互联网的蓬勃发展,已经积累了相当量级的待挖掘数据。这些数据产生于人们日常生活中依赖互联网工作、生活留下的痕迹,将人们生活的形态在大尺度上向世人展示。基于这些特点,我们几乎可以断言 “网络开源大数据”应该会成为城市规划未来发展提供有利的分析基础和条件。而实际上,有很多研究学者已经就大数据挖掘出的数据信息应用于城市规划中。大数据的产生获取途径繁多,很多并不源于规划部门,如通信、电商、交通、社交媒体、医疗、银行等。如何获取这些数据,获取后如何应用? 本文就大数据的获取及应用举例如下。

1 大数据获取应用

1.1 百度地图API获取开源免费数据

百度地图API是为开发者免费提供的一套基于百度地图服务的应用接口,包括JavaScript API、Web服务API、Android SDK、iOS SDK、定位SDK、车联网API、LBS云等多种开发工具与服务,提供基本地图展现、搜索、定位、逆/地理编码、路线规划、LBS云存储与检索等功能,适用于PC端、移动端、服务器等多种设备,多种操作系统下的地图应用开发。

我们通过对百度地图Place API接口的调用,在Visio Studio 2010编译软件中,通过以下程序提取调用出四川周边城市,如泸州、绵阳、自贡等地的银行、医院、学校等公共配套设施的分布地理坐标及其他详细信息,以便于日后对这类地区规划分析提供参考。Place API 是一类简单的HTTP接口,用于返回查询某个区域的某类POI数据,且提供单个POI的详情查询服务,用户可以使用C#、C++、Java等开发语言发送HTTP请求且接收json、xml的数据。返回的Xml数据可直接在程序中处理后存入MS Sql数据库中,以备后续使用。百度地图提取部分程序代码 图1所示。

图1 百度地图提取部分程序代码

1.2 新浪微博数据提取与应用

新浪微博拥有数量巨大的用户群基础,用户状态、用户关注及粉丝等已经形成非常庞大且具有价值的数据,如何获取及处理这些数据,已经成为十分热门且值得关注的研究方向。

此外,随着越来越多的规划师开始使用微博等新媒体,新浪微博上规划师成为一个活跃的群体,2012年黄虎对北上广深的规划师群体进行调查,发现规划师群体微博使用比例明显高于整个网民群体中的微博使用比例。如何突破传统方法,通过新兴媒体数据积累分析出规划师群体间的交流及人脉关系? 北规院的茅明睿[1]给我们提供了一个新的思路与解决方案,即通过新浪微博api数据接口对微博上中规院、清规院、和北规院的三院用户的粉丝和好友数据进行可视化分析,总结比较出三个院的用户的粉丝和好友数据进行可视化与分析,总结比较三个院的人脉特征、组织特征和相互联系与影响的情况,从而实现传统技术手段难以达成的分析效果,成功给予我们对规划行业利用大数据进行分析的启示。

从数据的获取手段来看,目前主要有两种方法获得新浪微博的数据,一是利用爬虫程序通过解析微博页面获得微博数据;二是通过创建应用,利用新浪官方API获取微博数据,步骤如下:

(1)下载weibo 开发的SDK开发帮助包;(2)注册用于获取数据的新浪微博账号;(3)在新浪微博开放平台注册应用,并获取APP Key和App Secret;(4)由App Key和App Secret 得到PIN值码,并得到token 和密码。

利用新浪API接口进行获取数据更加简洁高效,在OAuth2.0标注下调用新浪微博APi,返回均为Json格式的数据。Json是一种轻量级的数据交换格式,文件不具有明显的强结构特征。但在使用API之前,需要了解新浪微博API的接口定义及各个参数含义。新浪微博接口限制用户每个小时请求的次数。为了避免过高频率的访问新浪API接口,一方面可以通过接口实时查询当前剩余的访问次数,另一方面,需要对程序进行线程控制,以品均访问频率。

1.3 网络爬虫工具获取开源数据

以上例子均需要借助一定的计算机编程实现,但也有一些互联网上的网络数据抓取软件,只要对计算机的正则表达式掌握和了解,也可以自行配置进行抓取目标网站的数据。如火车头采集器、网络快车、gooseeker等。

2 数据分析展示工具——Gephi简介

在我们得到了一定量的数据后,往往需要进行对数据的分析和展现, 在此介绍一个非常强大的可视化展现工具——Gephi。被称为数据可视化领域的photoshop。 它是一款开源免费跨平台基于JVM的复杂网络分析软件, 其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。可用作:探索性数据分析,链接分析,社交网络分析,生物网络分析等。gephi是一款信息数据可视化利器。Gephi 内嵌数据展示算法,只需要通过导数将不同数据赋予其边和点的信息,就可进行强大的分析和展现。 在上文我们介绍的新浪微博展现三个规划院的人脉分析,也是通过Gephi 软件分析得出的。以下是一些用Gephi做出的数据分析效果图2-3所示。

图2 某社交网站用户注册情况 图3 个人邮件可视化来往分析

3 结语

大数据的获取有许多不同的方式,大数据的展现也将带给我们新的思路和启迪。只要我们细心抓取数据,并通过再加工和生产,大数据定能为规划编制做出更好的服务!

参考文献:

[1] 茅明睿.北京城市规划设计研究院.规划行业微博人脉特征分析——以中规院、清规院和北规院为例,10045.

作者简介:李楠(1988—)女,四川成都,硕士研究生,助理工程师,研究方向:规划信息化、规划编制的知识管理。