黄永坚 陈科玚 闫茂华 王景辉 张学虎
(1中国地质环境监测院,北京 100081;2广东工业大学管理学院,广东广州 510520;3宁波市自然资源整治储备中心,浙江宁波 315042;4中国地质大学水资源与环境学院,北京 100083;5自然资源部矿山生态效应与系统修复重点实验室,北京 100081;6中国地质科学院,北京 100037)
土地利用(即土地覆盖变化LUCC)是对生态环境产生影响的重要因素。土地利用研究的一个重要方法和手段就是对其进行建模和模拟,这也是进行有关土地利用驱动机制等方面研究的重要工具。元胞自动机CA 由一系列模型构造的规则构成[1-2],因其时空建模能力强大,已成为当今全球土地利用研究进行模拟的主流模型。为此,本文梳理了CA模型在土地利用模拟中的相关文献,总结了CA模型在土地利用模拟中的研究进展,并讨论了土地利用模拟的发展方向。
基于循证管理思想的系统文献回顾法[3-4],以结构化和系统化的研究步骤,采用明确的筛选标准对传统文献回顾法本身所固有的局限性进行弥补,以增强研究的客观性与说服力,对“CA 模型是什么(What)”“CA 模型的前因与后果(Why)”及“如何有效模拟未来土地利用(How)”3 个根本问题进行综述。第1 步:设定研究目标。系统梳理国内外在土地利用模拟中CA 模型的研究现状,将构建CA 模型研究的知识框架作为本文研究的主要目的。第2步:明确概念边界。CA模型概念的明晰,有利于理解其优越性和不足之处,从而有针对性地提出解决问题的办法。第3 步:二次人工筛选。对于原始文献中可能有与研究目标不相称或不符合的内容,需要进一步筛选剔除[5]。①剔除非学术类文献,如会议通知、会议综述、新闻通讯等;②CA模型应用领域较为广泛,要明确的是CA模型在土地利用模拟领域的应用,对文献的研究对象以及其实施目标进行比较与判别,若偏向于其他领域,则予以剔除。第4 步:样本编码。首先,按照本文的研究目标,根据以下4个方面对收集到的文献进行独立编码:①文献基本信息,即出刊时间、作者、作者单位、研究对象、文献来源及写作目的;②CA模型的内涵;③CA模型的前因后果;④如何有效模拟未来土地利用。然后,确定最终的框架构成要素。最后,围绕文献编码所形成的框架报告研究结果。
参考学者[6]观点,按照是什么(What)、为什么(Why)和怎么办(How)3个基本问题,梳理并提炼文献编码内容,构建现有CA模型研究知识框架。研究框架如图1所示。
图1 CA模型研究知识框架
2.1.1 土地利用模拟模型近年来,主要有ABM模型、DLR模型和CA模型等用于区域土地利用模拟方面的研究。ABM 模型由多个彼此互联的智能体Agent 组成,其更能反映复杂的人地关系,其在模拟土地利用变化的时候会将复杂空间决策行为及人文因素考虑在内[7],如政府、利用者、开发商等多种人文主体。DLS模型从宏观和微观2个方面,系统探测表征某土地系统在时间和空间上的演化过程,实现区域范围内的土地系统结构变化及格局演变的动态模拟[8],可以明确折射出区域社会经济和自然系统对土地利用变化的影响。CA 模型能与GIS、RS 数据高效接合,极大地提高现有GIS 分析复杂自然现象的能力和时空动态建模的功能[6,9]。但在城市模拟过程中CA 模型偏重于自然环境因素,对于造成土地利用变化的人文影响因素考虑较少,因此在运用的时候要与其他模型结合,进一步挖掘转换规则,以增强其模拟效果。
2.1.2 发展历程20世纪70年代,大量学者先后对CA 模型进行了系统深入的理论研究、对城市CA研究展开了大量工作[10-15],进一步完善CA模型的理论框架、拓展了其应用。20 世纪90 年代末,我国开始应用CA 模型与其他模型相结合来预测城市空间演化发展。周成虎[1]、何春阳[9]、黎夏[6,11]、刘小平[13,16-17]和杨青生[18-19]等都对CA 模型的城市扩展模拟研究作出了积极贡献,提出了“地理元胞自动机”(GeoCA)的概念,并在DUEM模型的基础上构建了GeoCA-Urban 模型[1]以及提出将地理特征、地貌实体等内容添加到CA模型的构建方法。
2.1.3 类型多年来,随着学者们的深入研究,CA模型的研究呈现多元化发展的特点,极大地丰富了其内涵。CA按照维数可以分为一维CA、二维CA和三维CA。一维CA的元胞在一条直线上等间距排列,每个元胞只有前后2个邻居元胞。一维CA主要被用来模拟交通流,学者们[20-22]利用一维CA来模拟高速公路或城市交通环线上的一维交通流后加入了速度变量,之后又进行简化等多次改进。二维CA的元胞分布在一个平面上,其邻域的定义与表示就相对复杂[23]。通过某些简单的规则CA 模型就可以改变元胞状态,从而使土地利用产生宏观的明显的变化结果,目前我国关于土地利用模拟工作绝大部分是以二维CA进行的。三维CA的元胞分布在三维空间中,其邻域元胞的获取比二维更复杂,目前应用范围不如二维广泛。
2.1.4 研究现状
2.1.4.1 转换规则研究转换规则对于模拟结果的可靠性和合理性起着决定作用,是土地利用模拟的重点和关键。近年来,国内学者将CA模型与多学科模型进行结合,提出了利用Logistic 回归、神经网络ANN、主成分分析、多智能体、FLUS、马尔科夫链等方法获取CA模型的转化规则和参数[24-27]。
2.1.4.2 元胞大小和形状研究标准元胞自动机模型的元胞一般具备相同转变规则的几何形状,如正方形、正六边形等,是按照相同规则且严格定义邻域范围的元胞来构成的,这与现实中纷繁复杂的土地利用类型并不相符[28-29]。有学者探索用不规则的元胞来代替规则元胞来构建模型,如,刘兴权等[30]利用二分Logistic 回归方法,引入邻域因子,并建立了可控邻域元胞自动机模型,成功模拟并预测了长沙市区及其周边地区的城市扩张过程。
2.1.4.3 矢量元胞自动机的研究因栅格数据易于匹配遥感数据、数据计算方便等优点,现有的CA模拟研究中大都是以栅格数据的像元作为元胞[31-33]。基于栅格数据建立的元胞自动机模型,元胞形状统一、大小一致,但是现实中大部分地理实体都是不规则的形状,将对模拟结果造成影响。因此现阶段学者们探讨如何用矢量数据来代替栅格数据,以使其模拟结果更贴合现实。
2.1.4.4 多种土地利用类型之间的演变为了响应近年来提出的国土空间规划、闲置宅基地整治等措施,土地利用模拟也需作出相应变动[34-36]。以往的土地利用模拟往往只是模拟非城市用地到城市用地的转变,随着土地利用的集约化、高密度化利用趋势,单一的土地利用类型转化方式已不合时宜。比如,有学者利用2 种方案对广州市未来土地利用方案进行CA预测模拟的对比研究等[37],因此多种土地利用类型之间的演变模拟成为相关专业学者新的研究方向。
2.2.1 研究进展现有CA 模型的研究在2 个方面得到了发展:①虚拟城市模拟与理论验证。在地理学领域,CA模型早期用于对虚拟城市的模拟和某些城市理论的验证上。如,应用CA对虚拟城市进行模拟时,余洋等[38]证明了即使很复杂的宏观格局,通过CA 简单的部分规则就可以形成。②现实城市模拟与规划评估。随着CA理论和应用的日臻成熟,学者们应用城市CA 模拟现实中城市的扩张、蔓延等。比如,马世发等[39]用CA模型评估预测土地规划是否合理,是否达到规划目的。郭欢欢等[40]将多主体与元胞自动机结合,初步探讨并分析了该模型的应用优势及存在问题。
2.2.2 存在问题通过梳理相关文献可以发现,目前CA 模型的研究主要存在以下3 个问题:①Kappa 等验证模型精度的指标存疑。国内学者们的研究通常是CA 模型上套取研究区以往一段时间的数据,得到模拟结果后与已发生的结果作比较来论证模型精度,Kappa≥0.75 就能得出模拟结果与现实结果一致性较好的结论[41-43]。但在对研究区进行模拟时,一般来说城镇用地的面积、比例是最大的,而学者们设定的模拟时间一般是未来的10~20 年,短时间内那些占比小的非城镇用地原本变化就不大,作为基数最大的城镇用地面积已经对Kappa 等指标作了极大的解释成分,因此即便模型预测精度一般,也不会对Kappa 等指标造成大的影响,那仅靠这类指标如何能说明模型可行呢?②模拟所用的数据都是研究区往年的经验数据,用来预测未来的土地利用欠妥。一般情况下用间隔较短的数据来模拟未来利用的误差是较小的[44-47],但得排除个别极端事件的发生,如我国2016 年全面放开二胎政策和2020 年发生的新冠疫情,人口的井喷式增长和经济的停滞都是影响极大的不可预测事件,再用以往的经验数据来预测未来所得出的结论明显偏颇,因此要谨慎选择基础数据,所选择的数据要具有普遍性。此外还要探讨新的方式来预测模拟,利用动态的、时效性强的数据或动力模型会使得结果更准确。③近年来,学者们把CA 模型和多学科模型结合进行模拟,或是加入更多的变量因子、追求更复杂精细的转化规则来提高模拟精度,忽视了土地利用模拟的根本目的。模拟精度固然重要,但对未来土地利用的模拟原本是为政府规划、决策提供参考的,最终目的是服务于现实生活的[48-50]。因此,应该在模拟相对“准确”的基础上提出相应的、有效的措施来改善现状,而不是一味追求“精确”。
在新的时代背景下,信息、科技和全球化发展迅猛,有必要进一步认识和理解城市地理系统演变的基本机理和规律,向大尺度城市扩展CA 模型、描述微观细致的方向转变[51-54]。为此,本文针对以上提出的现状和不足,为CA模型的进一步研究提出自己的见解。
2.3.1 二维模型向三维模型发展在高楼林立的现代城市,若仅用二维空间动态发展的模拟,已不能满足准确描述现代城市空间的发展变化。正如前文提到的对未来模拟“不准确”的问题,已有的土地利用模拟模型大多基于二维平面角度,无论再结合更多的模型或者是考虑更多的因子变量,始终是需要突破到三维地理空间的。因此在构建CA 元胞空间时,需要充分考虑建筑物高度、建筑物三维形态的影响,提高土地利用的模拟精度、准确度将是重要的发展方向和趋势[6,9]。
2.3.2 结合地理时空大数据传统的土地利用数据主要来源于地区统计年鉴或具体的样本调研数据,所得出的模拟结果缺乏普遍性和可复制性。近年来,随着大数据信息的发展,挖掘个体行为空间再结合时空数据、城市扩张CA 模型和诸如ABM 模型等,使综合模型不仅能反映人地交互关系,而且比传统的数据模拟更真实精准体现个体属性。
2.3.3 高性能并行元胞自动机随着全球信息化发展的趋势和全球生态环境变化整体研究的深入,土地利用模拟研究将向着大区域尺度的方向发展。为了满足城市精细化发展的需求,城市CA的数据信息和运算时间会呈指数级增长,在实际应用时要达到此类运算的要求,高效率的CA并行运算算法就显得格外迫切[54]。结合目前已有的图形处理器GPU通用计算技术与地理元胞自动机构建GPU-CA 模型,在保证模拟结果有效性的基础上可大大提高计算效率[21]。
本文通过对元胞自动机模型的类型、发展历程、研究现状、研究进展、存在问题和未来发展方向等内容进行了论述和分析,将以上知识模块构成1 个元胞自动机模型研究的“2W1H”知识框架。通过文献梳理,在“CA 模型是什么(What)”上,发现土地利用模拟模型包括DLR、ABM、CA 等模型,通过整理CA模型的发展历程,按照模型维度划分成一维、二维和三维3种类型,并有转换规则研究、元胞大小和形状研究、矢量元胞自动机和多种土地利用类型之间的演变4 个研究热点;在“CA 模型的前因后果(Why)”上,分析了已有研究中的相关进展和存在问题;在“如何有效模拟未来土地利用(How)”上,根据CA模型在土地利用模拟的现状和相关研究,对未来的研究方向和内容提出建议和参考。
然而,由于研究按照框架模块进行分析,在一定程度上弱化了成果阶段发展特征与具体内容。未来,相关研究可以按照不同阶段对有关内容加以丰富、完善,逐步实现对元胞自动机模型知识模块与知识框架动态变化的综合分析与趋势研判。