自发地理信息研究进展综述

2015-03-30 03:43梁发宏
测绘通报 2015年2期
关键词:贡献者研究

梁发宏,杨 帆

(西安测绘总站,陕西 西安710054)

在Web 2.0的大环境下,随着卫星定位技术和移动终端技术的发展,地理信息传递和服务的模式经历着深刻的变化。网络用户不仅被动地消费信息,也开始自己创建或编辑网页内容。相应的一些项目蓬勃发展,用户数量显著增加,如维基百科、Flickr、YouTube等。

通用数据贡献常常被称为用户生成内容(usergenerated content,UGC),如维基百科条目或博客文章。UGC中有一种包含地理组件的特例,被称为众源地理数据[2]或协同地理信息[3],更常见的名称为自发地理信息(volunteered geographic information,VGI)[1]。笔者以OpenStreetMap为例,侧重于数据及贡献者分析的方法和结论,介绍了协作收集地理数据和相应的贡献者模式,全面回顾了VGI研究的现有成果,并展望其前景,指出需要解决的问题。

一、自发地理信息简介

自发地理信息由Goodchild[1]在2007年提出,他认为VGI是指使用工具创建、收集、传播个人自发提供的地理信息。目前关于VGI还没有形成一个统一的定义。维基百科中对VGI的定义是指用户通过在线协作的方式,以普通手持GPS终端、开放获取的高分辨率遥感影像,以及个人空间认知的地理知识为基础参考,创建、编辑、管理、维护的地理信息。李德仁等[4]从广义和狭义两个角度对VGI进行了解释,认为狭义的VGI是由大量非专业用户利用3S技术自发创建的地理信息;广义的VGI是与狭义的VGI相关的概念、模式、方法和技术。

笔者认为VGI的主要特征为:①向VGI平台贡献的信息必须匹配地理位置,地理位置既可以通过地理参考航空影像跟踪采集,也可以通过指定设备主动收集GPS轨迹来获取;②数据收集具有公众自发性和非专业性,没有专业技能的用户也可以基于个人目的贡献地理信息,协作完成空间数据处理。

1.近期代表性VGI平台

近年来VGI急速发展,表1中列出了5种不同的VGI项目的比较,比较不包括一些广泛使用的LBS平台,如谷歌地图,因为其VGI功能有限。VGI项目之间的主要区别在于数据许可证类型和信息可用性。

表1 VGI项目比较

2.OpenStreetMap(OSM)

OSM项目于2004年启动,主要数据库和网络服务托管在伦敦大学的多个服务器。所有创建和共享OSM数据的服务器和接口主要由志愿者开发和管理。该项目的主要目标是建立一个免费的全球地理信息数据库。贡献数据前必须注册并创建一个账户。新注册的会员在注册后就可以立即添加、修改或删除OSM数据库中的地理对象。而对于其他VGI项目,如Google Map Maker,新会员所作的编辑首先要通过审查。最初几年,OSM地理信息收集大多是应用GPS手持设备。2007—2011年间,雅虎地图、微软Bing Map均对其进行影像数据支持,这对OSM新对象的收集有很大的影响。此外,一些地区通过导入商业或政府数据集获取了大量数据,如荷兰、奥地利、美国、西班牙和法国。近年来,随着OSM项目的蓬勃发展,一些公司全部或部分地将其地图应用转换为OSM,如苹果、Flickr和foursquare。

二、自发地理信息研究热点及成果

1.数据质量分析

(1)路网评估

OSM质量分析多为道路网络评价,多数是将政府或商业数据集作为参考数据进行对比。2008年Haklay[5]将英国的OSM数据与军械测量局(OS)的数据集进行了比较。结果表明,OSM覆盖英国面积的29.3%。2009年重复了这项分析,覆盖范围提高到65%[6]。OSM在英国的数据质量和覆盖率显示出明显的区域差异,城市地区路网密度高,但缺少街道名称等细节,而有些农村地区完全没有数据。Girres等[7]对法国进行了研究,重点为路网,也包含其他要素,如兴趣点、水系和海岸线。该研究表明,法国OSM数据集也具有类似的区域差异。对德国2007—2011年OSM数据集的综合分析[8]表明,如果比较机动车路网,OSM比专有数据少9%;如果包括人行道和小路时,OSM超过专有数据集27%,但专有数据集中包含的其他重要信息,如转弯限制,在OSM数据集中常常缺失。

2011年,Zielstra等[9]将整个佛罗里达州(美国)OSM数据集与TomTom和Navteq的专有数据进行了比较。与之前在欧洲的发现不同,在佛罗里达州农村地区,OSM具有较强的覆盖,而在城市地区也比专有数据表现出更好的覆盖。研究人员认为这是由于2008/2009年美国TIGER/Line普查数据导入了OSM。

总体来看,OSM路网数据在不同区域质量差别较大,城市优于农村,局部地区数据非常详细。是否应该使用OSM或其他VGI资源,需要针对兴趣区域和项目目标进行评估。

(2)兴趣点(POI)评估

导航过程中,将描述地点的地址或文本准确转换为一个地理位置非常重要,这个过程被称为地理编码。Amelunxen[10]将谷歌地图的地理编码功能与OSM进行了比较,对于市政、街道、门牌号码,OSM都没有达到足够的详细程度来支持空间分析。Jackson等[11]将OSM与其他专有数据集的点要素地址信息比较,显示出类似的结果。Mashhadi等[12]对伦敦(英国)和罗马(意大利)来自专有数据集的POI数据与OSM进行了比较,发现在地理位置精度方面基本一致。

OSM中志愿者收集的非传统兴趣点与专有数据库有差别,详细程度不足,位置精度基本一致。

(3)数据信任和人为破坏

为了简化数据评估,建立某种形式的信任机制非常必要。一些研究人员提出将志愿者作为一种质量测量参数。Bishr等[13]探讨了基于社交网络信任评级的解决方案。Kessler等[14]基于贡献对象的历史来确定信任值。

OSM项目的普及也带来了一些需要注意的问题,特别是人为破坏。Coleman[15]总结了如何验证贡献者及其空间信息的一些方法,Neis等[16]自动检测人为破坏,在OSM数据库中每天至少检测到一起人为破坏,有的是故意破坏,有的是操作失误。

2.贡献者分析

VGI研究的第二大方向是项目贡献者行为,可以将用户分为普通用户(使用数据或在线信息)、注册会员(拥有VGI项目账户)和贡献者(积极为VGI项目做贡献)[24]。普通用户数量基本无法确定,注册会员和贡献者数量可以从OSM数据库确定或分析。

(1)参与不均衡

参与不均衡的现象在开源项目或以在线社区为基础的项目中往往类似。Nielsen[17]以90-9-1规则描述了这种现象,即90%的用户从来没有对项目作出贡献,只是充当“潜水者”,9%的贡献者不定期地增加信息,1%的贡献者提供了项目收集到的几乎所有的信息。OSM也有类似现象[18-19]。

2010年,注册会员人数增至30万,其中近5%(16 500)按月积极为项目做贡献,所有成员中仅占3.5%(12 000)的会员贡献了占98%的数据量[8]。图1表示了注册会员的增长及其活动,可以看出注册会员与活跃贡献者在数量上的巨大差异。

Neis等[18]进行的研究还按周和日分析了贡献者的活动。结论为平日贡献模式相似,周日数据编辑的人数略多,而下午和晚上是OSM一天的活动高峰期。

(2)区域分布

OSM贡献者的区域分布表现出与前述数据质量分析类似的区域差异。因为OSM会员在项目注册时不必提供位置信息,研究人员通过不同的方法确定会员的区域。Budhathoki[19]分析了贡献者为不同国家加入注释的数目,Neis等[18]关注贡献者首次编辑或编辑最多的区域。这两项研究显示贡献者中3/4位于欧洲,剩下的1/4分布在北美和亚洲,南美、非洲和大洋洲只有少量贡献者。活跃贡献者在德国密度最高,德国OSM数据集也表现出了较高质量。然而,OSM贡献者并不只限定在自身区域收集数据,少数非常活跃的OSM会员在至少两个或更多的国家收集数据[18-19]。

图1 2005—2015年OSM会员增长

(3)贡献者动机、行为和人口因素

贡献动机是研究人员调查的主要内容。Budhathoki[19]认为对特定区域的个体认知是最显著的动机,当用户看到他们所关心的领域信息空白或错误,往往会利用自己拥有的知识编辑数据。Coleman等[20]将VGI激励因素分为积极和消极两类。表2总结了上述研究中主要动机。

表2 VGI激励因素

过去许多研究指出,VGI主要的贡献者是非专家或未经训练和不合格的志愿者[5]。但是,有调查显示近50%的受访者有相关学位或曾在地理、测绘、城市规划或计算机/信息科学等领域工作,说明OSM社区并不像经常猜测的那样只有GIS爱好者[19]。Coleman等[20]将VGI项目成员分为新手、业余兴趣、专业人士、专业专家和权威专家等。

对贡献者人口因素也有详细的分析,如项目参与者的年龄、性别或教育背景。研究表明,大多数OSM贡献者(97%以上)为男性[21]。对于其他门户网站,数据并没有显示出这种性别偏向,但引入地理信息时女性参与率大幅下降[22]。OSM大多数贡献者(>60%)在20~40岁之间,大约20%为40岁以上[21-22]。63%—78%有大专、本科及以上学历[21-22]。

三、自发地理信息应用前景

1.构建世界范围地理空间基础数据库

VGI的优势源于其开放式数据收集方法,可以说VGI是最廉价的地理信息来源,往往也是唯一的来源。尤其是对于世界范围而言,其丰富的数据内容和形式,是对现有地理信息数据的一个很好的补充和完善。

2.应急响应辅助决策支持

OSM和其他VGI项目的另一潜力是危机及灾害等应急响应行动中的辅助决策支持功能。2011年海地地震期间,志愿者基于OSM最新卫星影像和移动GPS设备采集道路及兴趣点数据,标注救护站、帐篷和倒塌的大桥,在48 h内构建了最 完 整 的“Haiti OpenStreetMap”[23]。VGI在洪灾损失评估[25]、野生消防疏散[26]和其他重要的风险及自然灾害管理和响应[27-29]等方面也已显示出很多潜力。

3.地理监测

地理监测工作量大,现势性要求高。VGI用户分布广泛,贡献的数据类型多样(矢量数据、图片、视频等),客观性和现势性强,获取周期短,成本低,未来的地理国情监测完全可以借助VGI手段。

4.特殊用途地图应用

近年来涌现出许多基于OSM的应用程序、在线地图及可打印地图,志愿者协同收集地理信息,满足特殊需求,如货车、自行车、滑雪、轮椅、盲道及公共交通。如Wheelmap共享公共场所轮椅无障碍信息,OpenRouteService提供自行车和货车路径查询功能。

5.三维应用

随着三维应用的日益普及,研究人员测试了OSM对三维应用程序或三维基于位置服务的适用性[30],有文献探讨如何将OSM数据转换到规范的城市地理标记语言(CityGML)模型[31]或室内疏散模拟[32]。

四、结束语

本文首先介绍了VGI的概念和特征,比较了有代表性的几个VGI平台,重点介绍了其中影响最大的OSM;接着全面回顾了VGI研究热点,研究工作分为两个主要领域:数据质量和贡献者分析,详细讨论了每个领域的最新文献中阐述的各项研究的方法和结果;最后展望了VGI的应用前景。

VGI的发展很快,但也存在许多亟需解决的问题:数据质量不可预测,数据分布不均,连续性和一致性不能保证;没有严格的数据规范或质量标准,如何有效地进行数据质量控制需要进一步研究;VGI数据来源多样,类型复杂,数据量大,如何管理这样的海量多源数据,需要设计简单、高效、扩展能力强的数据管理方案;如何基于数据集中的现有对象导出其他类型的地理要素,或是通过多源数据融合集成并丰富当前的数据集,未来的研究都可以详细探讨。VGI数据可能会涉及个人隐私、知识产权与国家安全,需要出台和完善相应的法律法规,以保证数据安全。VGI的持续性依赖于志愿者,相关部门也需要制定政策鼓励志愿者加入。

现有的VGI系统主要集中在西方发达国家,对语言的支持也比较单一,大多数仅支持英语。其他地区服务稳定性不高,用户数量有限。与国外的研究相比,当前国内VGI的研究仍处于初始阶段。但作为完全开放的免费数据源,我们可以看到其巨大潜力,VGI这种日益普遍的新现象正在改变着地理信息数据获取、传递和应用的传统模式。

[1] GOODCHILD M F.Citizens as Sensors:The World of Volunteered Geography[J].GeoJournal 2007,69(4):211-221.

[2] HEIPKE C.Crowdsourcing Geospatial Data[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(6):550-557.

[3] BISHR M,MANTELAS L.A Trust and Reputation Model for Filtering and Classifying Knowledge about Urban Growth[J]. GeoJournal,2008,72(3-4):229-237.

[4] 李德仁,钱新林.浅论自发地理信息的数据管理[J].武汉大学学报(信息科学版),2010,35(4):379-383.

[5] HAKLAY M.How Good is Volunteered Geographical Information?A Comparative Study of OpenStreetMap and Ordnance Survey Datasets[J].Environment and Planning.B,Planning&Design,2010,37(4):682.

[6] HAKLAY M,ELLUL C.Completeness in Volunteered Geographical Information-the Evolution of OpenStreetMap Coverage in England(2008-2009)[J].Journal of Spatial Information Science,2010.

[7] GIRRES J F,TOUYA G.Quality Assessment of the French OpenStreetMap Dataset[J].Transactions in GIS,2010,14(4):435-459.

[8] NEIS P,ZIELSTRA D,ZIPF A.The Street Network Evolution of Crowdsourced Maps:OpenStreetMap in Germany 2007—2011[J].Future Internet,2011,4(1):1-21.

[9] ZIELSTRA D,HOCHMAIR H H.Digital Street Data:Free Versus Proprietary[J].GIM Int,2011(25):29-33.

[10] AMELUNXEN C.An Approach to Geocoding Based on Volunteered Spatial Data[M]. Heidelberg:[s.n.],2010.

[11]JACKSON SP,MULLEN W,AGOURIS P,et al.Assessing Completeness and Spatial Error of Features in Volunteered Geographic Information[J].ISPRSInternational Journal of Geo-Information,2013,2(2):507-530.

[12]MASHHADI A,QUATTRONE G,CAPRA L,et al.On the Accuracy of Urban Crowd-sourcing for Maintaining Large-scale Geospatial Databases[C]∥Proceedings of the Eighth Annual International Symposium on Wikis and Open Collaboration.[S.l.]:ACM,2012:15.

[13] BISHR M,JANOWICZ K.Can We Trust Information?—the Case of Volunteered Geographic Information[C]∥Towards Digital Earth Search Discover and Share Geospatial Data Workshop at Future Internet Symposium.Vol-640,CEUR-WS,2010.

[14] KEBLER C,de GROOT R T A.Trust as a Proxy Measure for the Quality of Volunteered Geographic Information in the Case of OpenStreetMap[M].[S.l.]:Springer International Publishing,2013:21-37.

[15] Coleman D J.Volunteered Geographic Information in Spatial Data Infrastructure:An Early Look at Opportunities and Constraints[C]∥GSDI 12 World Conference.Singapore:[s.n.],2010.

[16] NEISP,GOETZ M,ZIPF A.Towards Automatic Vandalism Detection in OpenStreetMap[J].ISPRSInternational Journal of Geo-Information,2012,1(3):315-332.

[17] NIELSEN J.Participation Inequality:Encouraging More Users to Contribute[J].Jakob Nielsen’s Alertbox,2006(9):2006.

[18] NEISP,ZIPF A.Analyzing the Contributor Activity of a Volunteered Geographic Information Project—The Case of OpenStreetMap[J].ISPRS International Journal of Geo-Information,2012,1(2):146-165.

[19] BUDHATHOKI N R.Participants Motivations to Contribute Geographic Information in an Online Community[D].Urbana-Champaign:University of Illinois,2010.

[20]COLEMAN D J,GEORGIADOU Y,LABONTE J.Volunteered Geographic Information:The Nature and Motivation of Produsers[J].International Journal of Spatial Data Infrastructures Research,2009,4(1):332-358.

[21]BUDHATHOKI N R,HAYTHORNTHWAITE C.Motivation for Open Collaboration Crowd and Community Models and the Case of OpenStreetMap[J].American Behavioral Scientist,2013,57(5):548-575.

[22] STEPHENS M.Gender and the GeoWeb:Divisions in the Production of User-generated Cartographic Information[J].GeoJournal,2013,78(6):981-996.

[23] 张红平,顾学云,熊萍,等.志愿者地理信息研究与应用初探[J].地理信息世界,2012,8(4):67-70.

[24] NEIS P,ZIELSTRA D.Recent Developments and Future Trends in Volunteered Geographic Information Research:The Case of OpenStreetMap[J].Future Internet,2014,6(1):76-106.

[25] POSER K,DRANSCH D.Volunteered Geographic Information for Disaster Management with Application to Rapid Flood Damage Estimation[J].Geomatica,2010,64(1):89-98.

[26] PULTAR E,RAUBAL M,COVA T J,et al.Dynamic GISCase Studies:Wildfire Evacuation and Volunteered Geographic Information[J].Transactions in GIS,2009,13(S1):85-104.

[27] MANFRÉL A,HIRATA E,SILVA J B,et al.An Analysis of Geospatial Technologies for Risk and Natural Disaster Management[J].ISPRSInternational Journal of Geo-Information,2012,1(2):166-185.

[28] HORITA F E A,De ALBUQUERQUE J P.An Approach to Support Decision-making in Disaster Management Based on Volunteer Geographic Information(VGI)and Spatial Decision Support Systems(SDSS)[C]∥Proceedings of the 10th International Conference on Information Systems for Crisis Response and Management.Baden-Baden.Germany:[s.n.],2013.

[29]GOODCHILD M F,GLENNON JA.Crowdsourcing Geographic Information for Disaster Response:A Research Frontier[J].International Journal of Digital Earth,2010,3(3):231-241.

[30] SCHILLING A,OVER M,NEUBAUER S,et al.Interoperable Location Based Services for 3D Cities on the Web Using User Generated Content from OpenStreetMap[C]∥Urban and Regional Data Management:UDMS Annual,2009.London:Taylor and Francis,75-84.

[31] GOETZ M,ZIPF A.Towards Defining a Framework for the Automatic Derivation of 3D CityGML Models from Volunteered Geographic Information[J].Internatio-nal Journal of 3-D Information Modeling(IJ3DIM),2012,1(2):1-16.

[32] GOETZ M,ZIPF A.Using Crowdsourced Geodata for Agent-Based Indoor Evacuation Simulations[J].ISPRS International Journal of Geo-Information,2012,1(2):186-208.

猜你喜欢
贡献者研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
从“学习者”到“贡献者”:中国管理学发展的路径
视错觉在平面设计中的应用与研究
“‘一国两制’杰出贡献者”国家荣誉称号
EMA伺服控制系统研究
爆笑大本营
笑话碰碰车