王铮
(中国科学院科技政策与管理科学研究所 北京 100190华东师范大学地理信息科学教育部重点实验室 上海 200062)
计算地理学是地理学的新兴学科,正在获得越来越多的应用,同时也越来越多地提出地理学的理论问题。对计算地理学的一般理解是:应用计算科学解决地理问题的学科。与早年的计量地理不同,计算地理学除了数据处理,还致力于建模、计算模拟模型、知识发现、算法和计算平台等的研究。就如数学物理方法之于物理学一样,计算地理学作为地理学的工具促进了地理学科的发展。
建模非常重要。在物理学中,模型的基本构架是理论性的,有牛顿第二定律、麦克斯韦方程、薛定谔方程。可是地理学缺少明确的方程,这就使得建模成为了地理学深入研究的一个障碍关。建模这一工作也就使得计算地理学承担了一部分理论地理学的功能。
1970年代,以Wilson为代表的地理学家发起了第二次地理计量革命,提倡用物理学原理来建模,进而解释地理现象。Wilson给出了成功的实例,用热力学系统逼近地理系统。Wilson取得了成功,此后受这一成功的带动,系统分析方法在地理学中迅速发展。80年代,Wilson继续出版了用系统论方法分析地理问题的著作,例如他的Catastrophe Theory and Bifurcation:Applications to Urban and Regional Systems[1], 给 出了一种分析模式。1983年起,钱学森先生连续写了许多封信给中国地理学家,提倡地理学应用系统方法。系统分析方法的优点就是他的缺点,它可以对具体对象建立模型,但是离开这个具体,模型就没有适应性了,系统论带来的是方法学的进步。然而人们很快就发现,系统论带来的是思想革命而非方法革命,因为地理问题的复杂性,地理学即使建立了模型也往往难以解析求解。这就意味着地理学需要方法的改进。许多学者由此认为,第二次计量革命失败了。
在地理学第二次计量革命发展的同时,地理信息系统 (Geographical Information System,GIS)发展起来。地图作为地理学分析的基本工具已经有数千年的历史,它的第一次突破是洪堡发明了等值线。在信息技术发展的现代,地图的延伸成为了地理信息系统。地理信息系统是1960年代发展起来的一门计算技术。最初的地理信息系统,其最主要的作用是利用当时的计算机技术,提高空间数据的管理水平和处理水平。进入80年代,由于计算机技术的发展,尤其是PC机的出现,GIS得到了快速发展,在许多领域得到了广泛的应用。进入90年代,网络的快速发展又进一步推动了地理信息系统的发展,网络上的数据共享发布技术以及开放式GIS成为这一时期研究的热点。地理信息系统的这种应用,立即暴露出它的基本形态——电子地图的不足,GIS缺少分析功能。虽然GIS的出现在很大程度上增强了计算机的空间表达能力,但是GIS在某种程度上是地理学的一种倒退,因为它所提供的数据模型和分析方法从地理学意义来看并不丰富,不能满足地理分析的要求,GIS系统连那些最早引起计量革命的地理问题也不能解决[2]。在这种情形下,地理信息系统的权威人士Goodchild提出了地理信息科学的概念[3]:他认为地理信息科学主要研究在应用计算机技术对地理信息进行处理、存储、提取以及管理和分析过程中所提出的一系列基本问题。“分析”一词使得地理信息系统学科的发展需要模型,需要理论。因此在80年代开始冷寂的以建模为中心的第二次计量革命的余烬被发现蕴藏着巨大的热量。把建模方法与计算机技术结合成为了新的潮流。就在Wilson任职的英国Leeds大学,Openshaw提出一个新概念:geocomputation,地理计算,并出版了第一本专著 Geocomputation:a Primer[4]。Openshaw和Abrahart[5]指出,地理计算是GIS的一种后继发展,当GIS的数据库建立起来并不断扩展时,地理计算就开始起作用了。它是在科学研究范畴内,关于利用各种不同的地学数据以及开发相关方法的地学工具。Longley、Goodchild、Maguire[6]认为,在许多重要方面,地理计算和地理信息科学是同义词,和其他的许多相似词汇,如Geomatics/Geoinformatics、空间信息科学、地理信息工程等等,都意味着采用科学的方法来研究GIS和相关技术所带来的基本问题。在后来的发展中,地理计算基本上以地理信息科学的分支或核心学科形式发展。
1998年Couclelis[7]提出根据操作数和运算的类型将地理计算分为4类:利用非空间运算来解决非空间问题(类型4);用非空间运算来解决空间问题(类型2);用空间运算来解决非空间问题(类型3)和用空间运算来解决空间问题(类型1)。关于空间运算来解决空间问题的典型代表是元胞自动机、形状文法、分形自相似等。这种认识实际上提出了元胞自动机等的建模,这就意味着一种新的理论描述工具,不是牛顿的方程式,而是运算规则。这种运算规则,为地理学的理论提供了另外的描述工具,地理学可以以运算规则理论化,一个新的理论地理学时代开始了。这时,仅仅用地理计算表述新的学科不准确了,计算地理学(computational geography),一个包含着分析技术和包含着理论模式的学科开始了。
在后来的发展中,Gahegan(2002)认为地理计算中仍存在的问题是:(1)将地理“领域知识”变成工具以提高性能和可信度;(2)设计合适的地理算子(operators)来进行数据挖掘和知识发现;(3)发展能够计算跨越时空尺度的鲁棒的聚类算法(clustering algorithms);(4)针对目前软硬件还无法解决的复杂地理问题,提出可计算方法;(5)将地理现象可视化,提供虚拟现实范式(paradigm)帮助人们探索、理解地理现象,交流地理知识。Gahegan的思想最重要的一点是突破了“空间”的约束,而强调了时空。空间是地理学的一个基本概念,但是这个概念优势成为了一种硬性的不合适的约束。例如中国地理学的一个重要成果,竺可桢的“中国近5000年气候演化曲线”,研究的是一个时间过程,采用的是数据挖掘和知识发现的方法。按Gahegan的分类,竺可桢的研究永远只能排斥在地理学的计算分析之外。在地理学中,存在大量的类似中国5000年气候变化序列这样的问题。这时中国地理学家陈述彭提出两个概念,第一个是地球信息科学,他把计算地理学的分析范围不再限定为“地理信息科学”,后者过分地依赖空间概念。另一个是“图谱”,尽管人们以各种各样理解来解说图谱,图谱本质上是物理学pattern。Pattern使得地理学的理论表述回到了统计物理学,理论正在完备化。
20世纪末兴起的基于自主体的模拟方法,很快就深入到计算地理学中。基于自主体模拟(Agent-based Simulation,ABS)被认为是针对复杂系统的科学分析方法。所谓复杂系统,就是有多种类型个体但是这些个体具有一定可识别性和自主行为,数量多但是不足以多到在宏观观察层面具有稳定的统计特征的系统,它的核心是自主体(agent)。自主体这个词最初来自于人工智能领域[8],虽然之后被广泛应用于计算机科学、经济学、社会学、人类学、地理学、生物学等领域,它在性质上类似于统计物理学的粒子,与粒子相比它不仅具有原则上可统计的特征,而且具有感知和行为的能力,基于它们在系统中的角色、技能以及所处的环境,自主体具有自主的能力。
Wooldridge和 Jennings(1995) 认为,Agent应该具有以下特性:自主性(autonomy):Agent能够在不受人类或者其他实体的直接干扰的情况下独立操作,并且能够在一定范围内控制自己的行为与内在状态。社交性 (social ability):Agent通过Agent交流语言与其他Agent进行交互。适应性(reactivity):Agent能够感知环境,并能够对环境的变化做出相应的反应。自发性(pro-activeness):Agent并不只是简单地对环境做出反应,它能够通过主动性的行为展开有目的的行为。
Franklin和Graesser[9]认为,自主体是处于一定环境下的一个系统,它能感知环境并对环境做出反应。在时间演化中,自主体具有各自的事件流程,并以此影响到它们将来要感知的信息。王铮、吴静、杨念[10]则从物理学角度认识自主体:单个自主体具有个性:自主体系统中的个体或者说粒子,具有自身区别于其他个体的关键属性,这种属性是具有标识性的。借助这种属性,我们可以对任何单个粒子进行跟踪,在时间序列上同步获得粒子的状态。另外,自主体粒子总是按照自己的“思想意识”来进行决策,不同的个体具有不同的行为决策过程,由此得到的行为方式不同于一般布朗粒子或者不可辨识的全同粒子;其次,自主体间具有关联性:在一般物理系统中粒子被强调作独立随机运动,在自主体体系中,更多地强调自主体之间的联系,实际上正是这种联系使得自主体模拟具有一般粒子分析不能达到的结果。虽然单个粒子的“思想”、“行为”是具有个性的,但是在粒子进行决策之前,粒子往往需要充分获取环境中其他粒子的状态以作为自身行为决策的参考因素。也就是说,环境中的粒子相互之间是关联的关系,一个粒子的状态会影响到其他粒子的行为决策。这与粒子的个性并不矛盾,关联性为粒子提供决策所需的信息,在获得足够多的信息之后,粒子的个性即体现在它们之间不同的行为方式上。
总之,自主体是一个自主的、自我行为的实体,它们通过使用可支配资源以实现目标集合。由于自主体这种特性,用它就可以描述有大量个性个体构成地理系统的内部行为,因此基于自主体的算法就可以模拟地理现象,特别是一些空间信息,比如聚集、扩散。因此基于自主体的模拟就成为计算地理学的主要方法。现代计算地理学,正在以基于自主体的模拟ABS为骨干。
展览室内,毛主席像章满墙、满柜。墙上一个个镜框里,用像章拼成的毛主席诗词、题字与五角星、红太阳、长城、长征路线等图案,琳琅满目。毛主席塑像、毛主席著作与红宝书等等,不胜枚举。64岁的收藏家、馆长李建明头发斑白,背稍微驼,面带微笑,指点讲述。
ABS作为一种非数值计算方法,也就绕过了传统的理论表达的方程式,它以个体行为特征及其活动约束来构成理论基础,地理学关于地理学现象的各种经验认识,都可以成为各自主体行为规则,构成理论地理学元素。这就为理论地理学开辟了一条新的模型道路。而ABS又作为一种算法解决模型的求解。在过去的理论地理学中,即使得到模型,也不可能得到解析解,只能数值求解。现在借助ABS的理念和计算机,可以得到理性的和定量的认识。ABS因此从根本上开拓了理论地理学。
到目前为止,带有理论地理学特色的计算地理学形成了如下一系列分支。
王铮等[11]认为,计算地理学的数据挖掘是从地理学问题出发,对各种数据作地理学的模型处理、结果计算、发现地理知识的过程。地理数据与其他方面的数据不同之处在于:它具有空间属性。这些数据除了具有明显的含义之外,还有丰富的隐含意义,需要通过分析或挖掘才能显示。常见的地理数据挖掘的问题范畴包括数据恢复、信号提取、指标的权重估计、地理事物关联分析、地理演变特征分析、地理结构特别是空间结构发现。以遥感图像为例,遥感图像的去云彩处理就是数据恢复,遥感图像增强就是信号提取,遥感图像聚类分析就是联系分析。
空间运筹是计算地理学的另一个主要领域。1970—1980年代末期地理学研究领域引进了规划方法、网络分析方法和决策方法等运筹学方法,并吸收了系统分析方法、系统优化方法等现代系统学方法,在此环境中空间运筹学逐步形成,并向着更为严密的理论方向发展。一方面,地理学为运筹学提供了研究问题的空间,扩大了其研究的范围和深度;另一方面,运筹学为地理学中的空间管理问题提供了技术解决手段。90年代以后,随着计算机技术和GIS的迅速发展,使用运筹学的方法处理大数据量空间问题成为可能。空间运筹学在地理学中的运用已越来越广泛,涉及军事、物流管理、环境管理以及设施区位等方面。目前的发展是向着选择算法更简单、精度更高,问题更为繁琐的方向发展,力图解决更多实际问题。可以预测的是,随着风险管理思想的引入,空间运筹理论将会有突破,而且由此发展地理学的一些理论学科,实际上地理学的经典理论——区位论,就是借助空间运筹的发展,形成了设施区位理论这一新分支,被应用于城市与区域规划、军事地理等领域。
在计算地理学中不可忽视的是数值模拟。数值模拟以方程为基础,例如我们经常提到的地貌学计算,其很多计算基于原理清楚的动力学方程。基于原理清楚的动力学,是科学计算的主流,在地理学的水文分析、气候分析、生态分析、经济地理分析都有广泛的应用,例如洪水灾害的淹没范围、滑坡灾害的发生临界值、气候变化的区域影响、企业竞争的区位共轭都离不开数值模拟。当然,由于地理问题的复杂性,特别是边界条件难于确定,往往是数值计算劳而无功,但是这可以随着理论的完善,计算技术的提高来完成。在这方面,数学方程模型,往往作为科学的数据基础,为许多地理数值计算提供支撑。
非数值计算是近年最热门的研究领域之一。所谓非数值计算是依赖计算机的高速计算性能及其大容量存取技术,通过关系运算来求解问题的计算方法。关系运算不同于传统基本代数运算(如加、减、乘、除),而是在给定前提条件下进行的逻辑运算。常见的非数值计算包括神经网络算法、进化算法、元胞自动机算法和基于自主体模拟等。这里主要讨论基于自主体的算法的地理学意义。
自主体模拟的亚类元胞自动机。这种方法把空间划分为若干单元,赋予每个单元在外界刺激或者相互作用下的变化规则,因此适合描述地理现象。从20世纪80年代开始,它被用于描述城市的发展。此后,由于GIS技术的发展,元胞自动机方法被广泛地应用。
多自主体系统以较元胞自动机更优越的自主性、智能性、可移动性、动态性受到了学术界的青睐,现在多自主体模拟方法已经被用于模拟许多现象,特别是城市社会现象、人口地理现象、产业创新扩散甚至经济危机及经济管治的研究中。在2000年以后,自主体模拟成为科学研究的一种主体方法。
关于ABS作为地理学方法,目前主要的问题还不在于与GIS的结合,而是发展适合地理现象的模型,这就是一种理论探索。例如在地理系统中,企业作为自主体个体,它们又组织为区域,区域作为一种特殊组实行同一政策,分别影响个体,这就意味着自主体系统分为了两层。这种含层结构的模型需要新的自主体理论和软件包。
地理计算平台由于其兼顾时间和空间要素的建模特点,正在各行各业得到逐步的推广。地理计算平台的开发是一个系统工程,需要基于软件工程理论,全面了解用户需求,合理选择模型的接口,科学设计平台界面,定期维护平台的运行。只有建立用户友好、模型科学、数据完备、高效计算的地理计算平台,才能为各个领域的用户提供真正有价值的决策支持。
目前流行的地理计算平台按类型分有:地理信息管理平台,即常规GIS;地理规划平台,即在常规GIS基础上叠加空间运筹功能的计算平台,支撑地理空间规划;地理过程模拟平台,支撑地理过程的模拟,如国际上一些水文、气候过程模拟,在这个平台中,GIS已经蜕化为信息显示模块;实验人文地理学平台,是本文作者提出的新型平台类型,该平台利用GIS构成一个虚拟地理环境,针对某些人文现象,设计实验,让现实的人在虚拟地理环境中做出行为选择,发现人文地理规律,检验人文地理理论。
地理计算平台的开发,实际上已经成为地理信息科学主要应用领域。
顾名思义,高性能计算(HPC,High Performance Computing)指的是利用高性能计算系统来解决问题。计算机是一种多功能的机器,可以用于科学和工程中的计算,可以用于数据存储,也可以用于网络服务,不同的功能需求对于性能的定义是不一样的,因此衡量计算系统性能高低的标准并不唯一。本文所讨论的计算性能的高低,指的是科学和工程计算的性能。地理计算在许多场合涉及大规模计算问题,因此地理计算与高性能计算密切联系。事实上,多年来高性能计算都被列为Geocomputation年会的主题。
高性能计算中的许多问题是计算机科学问题,但是也存在一些地理学约束系统如何组织高性能地理计算的问题,这就引出地理计算模式问题。计算技术领域积累了许多成功的计算模式,如共享内存(Shared Memory)计算模式、主从(Master-Worker)计算模式、客户机/服务器(Client/Server,C/S)模式、浏览器/服务器(Browser/Server,B/S)模式、点对点(Peer-to-Peer,P2P)模式等等。针对网格计算环境,典型的计算模式包括主从计算、C/S计算、汇聚计算、点对点计算等。这些模式如何与地理学计算特色结合,还在研究中。
计算地理学作为一个新兴学科,不仅是一个方法性学科,而且从根本上创新了地理学思想和分析模式。长期以来,由于地理学对象的复杂性,基于解析动力学过程的经典理论物理学思维在地理学领域遭遇了众多困难,计算地理学为克服这些困难提供了途径,因此它将促进理论地理学的发展。计算地理学的出现,也将从根本上改变地理学在理论上依赖于其他学科的局面,形成一个更具自我创新特色的科学学科。王铮、吴静等的《计算地理学》[12]对这一学科开展了系统的探索。
1 Wilson A E.Catastrophe Theory and Bifurcation:Applications to Urban and Regional Systems.London:Croom Held Ltd.,1981.
2 Gahegan M.What is GeoComutation?A history and outline.2002.www.geocomputation.org
3 Goodchild M F.Geographical information science.International Journal of Geographical Information Science,1992,6(1):31-45.
4 Openshaw S.Geocomputation:A Primer.Chichester:Wiley,1998.
5 Openshaw S,Abrahart R J.Geocomputation.Taylor and Francis,2004.
6 Longley P A,Goodchild M F,Maguire D J et al.Geographic Information Systems and Science.(2nd Edition).Chichester:Wiley,2005.
7 Couclelis H.Geocomputation and space.Environment and Planning B:Planning and Design(Anniversary Issue),1998:41-47.
8 Wooldridge M,Jennings N R.Intelligent agents:theory and practice.Knowledge Engineering Review,1995,10(2):115-152.
9 Franklin S,Graesser A.A Software Agent Model of Consciousness.Consciousness and Cognition,1999,8(3):285-301.
10 王铮,吴静,杨念.多自主体在地理学中应用的回顾与展望.复杂系统与复杂性科学,2005,2(3):52-60.
11 王铮,隋文娟,姚梓璇等.地理计算及其前沿问题.地理科学进展,2007,(4):1-10.
12 王铮,吴静等.计算地理学.北京:科学出版社,2011.