1 中国林业科学研究院森林生态环境与保护研究所, 北京 100091 2 中国林业科学研究院资源信息研究所,国家林业局林业遥感与信息技术重点实验室, 北京 100091
格局; 生态学; 概括性统计量; 零模型; 群落物种多样性格局
近20年来,空间格局分析引起了越来越多生态学家的关注,它已成为联系生态学过程、研究物种分布与共存机制、检验多样性维持相关假说的一个重要途径[1- 16]。由于格局与尺度关系密切,而点格局分析方法能揭示不同尺度的格局,因此点格局分析方法是空间格局分析的最主要方法[17-19]。点格局可以保留影响生态学对象格局的过程的痕迹、保存描述生态学对象特征的属性的取值[10-11],因此,通过点格局分析能提取到关于潜在过程的有价值信息[20-23]。
要使用空间格局提供的信息,首先要精确描述它们的空间结构。空间统计学家用概括性特征(summary characteristics)[18],亦称概括性统计量(summary statistics)[20],来实现这一目的。最广为人知的概括性统计量是Ripley的K函数[24],表示给定距离r内格局的点的期望值。除了K函数,还有很多其他形式的概括性统计量,描述点格局的不同方面[18, 20]。这些概括性统计量的计算可通过R语言[25]程序包“spatstat”[19]和“spatialsegregation”[26],以及Programita[20, 27]、ADE- 4[28]等专门软件包来实现。商业软件SAS(SAS/STAT 13.2)也增加了点格局分析程序。
国际上,在应用研究需求增加的激励下,点格局分析的基础研究十分活跃,成果丰富,但较偏重数学和统计学理论,不易理解和掌握,在应用研究中使用最多的仍然是K函数,有些方法已提出20年以上却仍不为广大生态学家熟悉[29]。在国内,有学者介绍了点格局分析方法[30]、总结了研究与应用概况[31- 33],但是对使用步骤、基本要点缺乏系统总结。只有个别国内学者就点格局分析方法本身做了研究[34- 37],大量存在的是应用研究。
本文只检索期刊文献,不能包括所有研究成果(不含图书、论文集、学位论文),但是按上述方法进行文献检索可保证检索对象的代表性。在分析国内文献前,本文通过检索相同主题的英文期刊文献(检索平台:ISI Web of Knowledge核心库)和查阅工具书[17- 20],总结了点格局分析方法的主要步骤,介绍了其中的要点和相应的研究进展。
2.1 点过程与点格局的定义
在数学中,d维实数集d中的点过程就是随机数N在可测度的空间,N中的取值,其中为d的点的所有序列{xn}族,满足局部有限性条件,即每一个d的有界子集只包括有限数量的点[38]。术语“过程”是一种习惯表达,在大多数情况下并不代表时间动态,因此用“随机点场(random point field)”这一术语更为确切[39]。
2.2 主要步骤及要点
本文根据文献和专著[17- 20, 24, 27, 39, 41-43]总结常见概括性统计量列于表1。单变量形式可方便地拓展为多变量形式[19],且多以完全随机(complete spatial random, CSR)为假设条件[18],故表1只列出基于CSR的单变量形式。
表1 点格局分析常用概括性统计量
(i)一阶统计量 密度λ给出待查位置周围小范围内单位面积的平均点数[18],密度函数λ(x)与位置x周围的点密度呈正比。密度函数λ(x)反映了异质性的一个重要方面,即局部点密度的变化。
(ii)二阶统计量K(r)函数[24]用于判断不同尺度的格局类型,它提出较早、应用广泛。其变形L1(r)、L2(r)函数较好地解决了K(r)估计值的波动性(均值和方差随尺度r的变化而变化),也得到了广泛应用[18, 41]。应注意,K(r)的定义决定了它(及其变形)的计算是个累计过程,小尺度上的效应会传递到大尺度上[27, 42],从而影响对所观测格局的分析。
g(r)函数[39]、O(r)统计量[43]与K(r)有一定关系,但它们基于圆环内的点进行计算,不存在累积效应。空间统计学家Stoyan D.一直积极提倡使用g(r)函数[39]。g(r)函数被认为是最好的二阶统计量[18],但直到近期才有研究[27, 42, 44-45]注意到它,因此无论是在国外[29]还是国内(图1B)应用研究使用的概括性统计量中,K-函数与其变形占主导地位。
(iii)最近邻体统计量F(r)被称为“真空函数(empty-space function)”,是“点-事件(point-event)”的分布,G(r)即最近邻体距离分布函数,是“事件-事件(event-event)”的分布[19-20]。F(r)、G(r)均为累积分布函数,能保留(空白区的和最近邻体的)平均距离之外的有用信息,除了稳态格局,也可以用于描述非稳态格局。F(r)也作Hs(r),称作球形接触分布(spherical contact distribution)。G(r)也作D(r),可扩展到Dk(r),k(k=1, 2, …,n)是到典型点由近到远排序的相邻个体的序号[18,20]。由最近邻体(nearest-neighbor, NN)扩展到第k个邻体(kth nearest-neighbor,kNN),可描述格局的大尺度结构特征,应用实例可参考一项关于热带林空间结构的研究[46]。
表1中的二阶统计量可以较容易的扩展到双变量形式,用于分析两两对象之间的关系[17- 20, 47],即对象之间是相互吸引、排至还是不发生相互作用。有时候需要用到带有标记的概括性统计量,常见的有标记连接函数(mark connection function)和标记相关函数(mark correlation function)。前者适用于带有定性标记的点格局数据,后者适用于带有定量标记的点格局数据,表达式可参考相关文献[18, 20]。
处理更多变量(意味着更多类型的对象)、更复杂的结构是空间统计学家们努力的一个方向。有研究者在常见的“种—面积关系”和Ripley的K(r)函数基础上,提出了“单个种-面积关系”(individual species-area relationship, ISAR)[48],用于测量以某个物种为典型点时,不同尺度上的物种多样性结构,由此推断它对群落物种多样性的作用。还有研究者在二阶统计量K(r)函数基础上提出三阶统计量[49]和对应的软件包[19]。空间统计学家还进行了很多针对异质点过程的研究[50- 55],提出了异质版的基于K(r)函数的概括性统计量[56],和异质版的基于最近邻体距离的F(r)、G(r)和J(r)函数[57]。一些模型研究方法[58-59],特别是动态的时空格局模型[54, 60]也值得注意,它们能帮助生态学家探讨与生态学格局动态性相关的科学问题。
生态学家们通过零模型和点过程模型来检验生态学假说。根据前人的总结[20],零模型和点过程模型有3种用途,(i)析因,根据对观测格局特征的全面了解,找出格局的成因,即格局背后的过程是什么;(ii)求证,通过建立原假设和备择假设,验证已有生态学理论和学说(假说)的正确性;(iii)多重模型推断和拟合,它是(ii)的扩展,通过增加备择假设的数目来找出最受观测数据支持的假说,这种多角度分析模式能减少在建立过程与格局之间联系时遇到的生物学限制和统计推断问题[23],例如对位于古田山和BCI岛两块生物多样性长期监测大型样地的研究[61],采用了同质泊松过程、异质泊松过程、同质托马斯过程和异质托马斯过程4种零模型检验扩散限制和异质性的单独效应以及它们的交互效应,并借助统计指标对4种模型对观测数据的描述能力进比较,找出了最佳模型。虽然点过程模型的统计学基础研究正处于发展初期[23],但是在参数估计方法和应用[19, 61-65]方面已取得一定进展。
对于单变量格局,最简单、最重要的点过程是同质泊松过程(homogeneous Poisson process),它具有稳态和各向同性的性质[18, 26],其重要用途是检验完全随机(complete spatial randomness,CSR)格局。在分析经常遇到的空间异质性时,如果格局只由非生物因子驱动,使用异质泊松过程(heterogeneous Poisson process,HPP),其建立基础是可变动的密度函数,可以用参数或非参数方法估计[19, 27,66]。聚集是另一种常见现象(例如,林木幼苗在灌木层中的聚集分布),使用聚集过程(cluster processes)也称泊松聚集过程(Poisson cluster processes)对该现象进行检验。泊松聚集过程是一大类的统称,其中使用最多的是托马斯聚集过程(Thomas cluster process)。复杂的托马斯过程可描述大斑块中的小斑块格局,例如多种草本植物聚集形成的大斑块中单独某一物种的小斑块。若要描述种间关系,在拟合模型时需要Gibbs或Markov过程等更为复杂的程序[67]。
对于双变量格局,常用零模型有“前提条件(antecedent condition, AC)”、环形转换(toroidal shift, TS)、同质泊松过程和异质泊松过程[20]。前提条件零模型用于描述一种格局对另一种格局形成控制的情形,例如森林群落中,成熟大树对幼树格局的形成具有影响。若两种格局没有明显的相对优势,则使用环形转换检验两种格局的独立性。对于带有标记的格局,常用的零模型是随机标签,亦称独立标记(random labeling, RL; or independent marking, IM)[27,68]——保持生态学对象位置不变的同时令标记(标记的取值)随机变换,它用于评价对于所有位置,标记过程是否以空间相关的方式发挥作用。随机标签与格局独立性检验不同[69],应避免误用。
3.1 国内研究概况
图1 文献检索分析结果Fig.1 Results of the literature reviewed (A)学科分布比例;(B)年刊发量;(C)研究对象;(D)概括性统计量(“+”:原函数的变形);(E)单变量分析采用的零模型(NS: 未指明;CSR:完全随机;HP:异质泊松过程);(F)双变量分析采用的零模型(AC:前提条件;RL:随机标签;TS:环形变换;MW:移动窗口)
3.2 国内研究状况评价
本文所分析的189篇国内期刊文献中,只有4篇进行了点格局分析方法研究,分别探讨L(r)函数的边缘校正方法[35-36]、样方数量与形状对分析结果的影响[37]、和随机区块法在点格局分析中的应用[38],另有综述性文献3篇[31- 33],其余182篇均为应用研究。可见,国内生态学点格局研究中,应用研究占据主导地位,方法研究和软件工具开发工作薄弱,二阶或更高阶概括性统计量、零模型及点过程模型等基础研究方面几乎空白。
全面分析格局特征是空间格局研究的重要部分,也是探讨产生格局的潜在过程的前提条件,尽管研究者建议使用不同统计量的组合来全面刻画所观测的格局[18, 70],但大部分国内研究只使用一种统计量(占总数的88%),且以K-函数族为主(占总数的70%)。
观测到的格局通常不是单一过程的结果,检验它们的相对重要性是当前研究的热点之一[71-72]。由于生态学过程的尺度依赖性,不考虑空间尺度,就无法理清这些过程的相对重要性[73]。对浙江古田山亚热带天然阔叶林树种分布的研究表明,环境因素的相对重要性(确定性因素)随着样地面积的缩小而变小,而随机因素的相对重要性增大[74]。对巴拿马BCI岛热带雨林的研究表明,随研究尺度由50 hm2扩大到1560 hm2,生态位的重要性增大而中性过程的重要性降低[75]。可见,不考虑尺度效应情况下研究物种分布和群落多样性维持机制,得到的结果可能是无意义的[73],在今后的点格局分析方法的应用研究中,特别是生态学机理研究中,怎样强调尺度的重要性都不过分。
MA Zhibo1,2, XIAO Wenfa1,*, HUANG Qinglin2, ZHUANG Chongyang2
Point pattern analysis, i.e., spatial point pattern analysis (SPPA) is a tool used in ecological pattern research and has recently become increasingly popular in ecology. To better understand SPPA research and its application in China, in this review we examined articles regarding SPPA published from 1996 to 2015 in China, which was based on a summary of the research progress, using steps and key points of SPPA. It was found that most articles focused on application research. Although there were extensive study objects, including forests, shrubs, grasslands, and landscapes, trees in forest communities were the main focus in all these application studies. Fundamental studies were found to be underdeveloped, such as studies regarding summary statistics and null models or point process models in SPPA, and the development of specific software packages for SPPA. Two important problems were found in SPPA applications: Firstly, although there are many alternatives, researchers preferred single summary statistics and only selected theK-function or its transformations; and secondly, although selecting null models as null hypotheses was a key step in SPPA, more than half of the research examined did not specify explicit null models. Therefore, it is recommended that different types of summary statistics are used to capture detailed spatial pattern structures, and the ecological questions or hypotheses should be clearly stated and correctly translated into statistical language, i.e., the null model and tests. Vertical layers and different generations should also be considered when studying systems with complex spatial structures, such as in tropical rainforests and subtropical evergreen broad-leaved forests. To enhance basic SPPA applications, these aspects discussed should be strengthened.
