郭汝梦
引言:克里格方法又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地学统计的主要内容之一。
一、克里格插值来源
克里格插值方法是由南非采矿工程师克里格(Krige)于1951年首次提出,故命名为“克里格”法。这个方法被广泛应用于地下水模拟、土壤制图等领域,成为GIS软件地理统计插值的重要组成部分。这种方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。地理统计方法为空间插值提供了一种优化策略,即在插值过程中根据某种优化准则函数动态的决定变量的数值。Matheron,Krige等人研究的插值方法着重于权重系数的确定,从而使内插函数处于最佳状态,即对给定点上的变量值提供最好的线性无偏估计。
二、克里格插值基础
克里格方法是空间统计方法的一种。所谓空间统计方法,其基本假设是建立在空间相关的先验模型上的。假设空间随机变量具有二阶平稳性,或者是服从空间统计的本征假设,则它具有这样的性质:距离较近的采样点比距离较远的采样点更相似,相似的程度或空间协方差的大小,是通过点对的平均方差度量的。点对差异的方差大小只与采样点间的距离有关,而与它们的绝对位置无关。空间统计内插的最大优点是以空间统计学作为其坚实的理论基础,物理含义明确可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;它也不会产生回归的边界效应。不但能估计测定参数的空间变异分布,而且还可以估算估计参数的方差分布。克里格方法的缺点是计算步骤较繁琐,计算量大,且变异函数有时需要根据经验人为选定。
克里格方法的使用范围为区域化变量存在空间相关性,即如果变异函数和结构分析的结果表明区域化变量存在空间相关性,则可以利用克里格方法进行内插或外推,否则,是不可行的。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏、最优估计。无偏是指偏差的数学期望为0,最优是指估计值与实际值之差的平方和最小。也就是说,克里格方法是根据未知样点有限邻域内的若干已知样本点数据,在考虑了样本点的形状、大小和空间方位,与未知样点的相互空间位置关系,以及变异函数提供的结构信息之后,对未知样点进行的一种线性无偏最优估计。
三、克里格插值优点
克里格插值与常规的插值方法相比,具有以下优点:
(1)克里格方法建立在空间随机场结构分析的基础上,因而在计算时可以充分利用空间随机场中的结构性信息,降低估计的不确定性。
(2)克里格插值方法充分考虑了已知点与待估点之间的空间相关性。一般情况下,已知点离待估点越近,其权系数越大,但如果在某一方向上几个已知点之间的距离较近,那么这几个点的权值将会有较大的差别,其中,靠近未知点的权值较大,而稍远一些的就变得很小。
(3)在进行克里格插值时,可根据待估点与已知点间的方位关系选用不同方向的变差函数,故而其估计结果也反映了空间随机场的各向异性。
(4)克里格估值可以给出估计方差的大小,因而可以从一定程度上对估计的精确程度进行评价。
四、克里格插值类型
克里格方法主要有以下几种类型:普通克里格(Ordinary Kriging)、简单克里格(Simple Kriging)、泛克里格(Universal Kriging)、协同克里格(Co-Kriging)、对数正态克里格(Logistic Normal Kriging)、指示克里格(Indicator Kriging)、概率克里格(Probability Kriging)、析取克里格(Disjunctive Kriging)等。
不同的方法有其适用的条件,当数据不服从正态分布时,若服从对数正态分布,则选用对数正态克里格;若不服从简单分布时,选用析取克里格;当数据存在主导趋势时,选用泛克里格;当只需了解属性值是否超过某一阈值时,选用指示克里格;当同一事物的两种属性存在相关关系,且一种属性不易获取时,可选用协同克里格方法,借助另一属性实现该属性的空间内插;当假设属性值的期望值为某一常数时,选用简单克里格;当假设属性值的期望值是未知的,选用普通克里格。
五、克里格插值的发展
对于平稳线性估计方法难以满足的要求,非平稳线性克里格的出现则突破了这一限制。在非平稳的克里格方法中,具有代表性的是可以解决非平稳区域化变量插值的泛克里格方法。除了非平稳之外,有些区域化变量的空间性质特别不稳定,用线性估计方法已经无法满足要求,非线性克里格方法由此应运而生,如析取克里格等。由平稳线性克里格到非平稳线性克里格再到非线性克里格,克里格的每一步发展都是对原有假设的突破,其应用范围更加广阔。不过上述方法都只局限于利用单变量的自相关特征进行插值计算,还未利用除主要变量之外的任何信息。
自20世纪80年代以来,以马特隆为首的枫丹白露地统计学派注意到不同空间随机变量之间的互相关关系,从而提出了协同区域化思想,并创建了协同克里格方法。随后他们又将不同变量之间的互相关扩展为同一变量的时序互相关,又创立了时空克里格方法。在这一时期,克里格插值理论所利用的信息就不仅仅局限于主变量本身,而是扩展到了辅助变量、主变量的时空信息、尺度信息等。
克里格插值理论的另一巨大发展就是以儒奈尔(Journal)为首的非参数地统计学派提出的以条件概率为核心思想的指示克里格方法,从而奠定了非参数地统计学理论的基础。非参数地统计通过引入高斯变形及指示函数等概念,可适用于各种类型的概率分布,并能有效克服离群值得影响,由此获得了广泛的应用。与多元地统计学理论不同,非参数地统计学理论更加注重随机变量的概率分布信息。
近年来,克里格插值方法的发展趋势可用交叉与综合来概括,产生了诸如指示协同克里格、多元因子克里格、指示条件模拟、多元动态条件模拟等方法,这些方法的交叉融合再次从某种程度上反映了克里格估值理论的发展不断扩大了使用空间信息的范围。
纵观克里格估值理论的发展历史,新的估计方法对空间信息的不断包容性可以说是一个鲜明的特点,而每一次对原有假设的突破以及对新型信息的利用,都意味着理论方法的一次创新。可以预见,未来的克里格估值理论也将会遵循这条主线继续发展下去。
参考文献
[1]周成虎,裴涛等.地理信息系统空间分析原理.科学出版社.2011.
[2]邬伦,刘瑜,张晶等.地理信息系统-原理、方法和应用.科学出版社.2001.
[3]池建等.精通ArcGIS地理信息系统.清华大学出版社.2011.