什么是克里格插值?
距离权重倒数插值和样条法插值被归类为确定性的插值方法,因为它们是直接基于周围已知点的值进行计算或是用指定的数学公式来决定输出表面的平滑度的插值方法。
而第二个插值方法家族包括的是一些地统计学的插值方法(如克里格插值),这些方法基于一定的包括诸如自相关(已知点间的统计关系)之类的统计模型。因此,这些方法不仅有能力生成一个预测表面,而且还可以给出预测结果的精度或确定性的度量。
克里格插值与距离权重倒数插值相似之处在于给已知的样本点赋权重来派生出未知点的预测值。这两种内插方法的通用公式如下,表达为数据的权重总和。
其中, Z(Si)是已测得的第i个位置的值;λi是在第i个位置上测得值的未知的权重;S0是预测的位置;N 是已知点(已测得值的点)的数目。
在距离权重倒数插值中,权重λi仅取决于距预测位置的距离。
然而,在克里格插值中,权重不仅建立在已知点和预测点位置间的距离的基础上,而且还要依据已知点的位置和已知点的值的整体的空间分布和排列。应用权重的空间排列,空间自相关必须量化。因此,运用普通克里格插值(Ordinary Kriging),权重λi取决于已知点的拟合模型、距预测位置的距离和预测点周围的已知点间的空间关系。
利用克里格方法进行预测,必须完成以下两个任务:(1)揭示相关性规则。(2)进行预测。要完成这两项任务,克里格插值方法通过以下两个步骤完成:(1)生成变异函数和协方差函数,用于估算单元值间的统计相关(也叫空间自相关),而变异函数和协方差函数也取决于自相关模型(拟合模型)。(2)预测未知点的值。因为前面已经说过的两个明确的任务,因此要用克里格方法对数据进行两次运算:第一次是估算这些数据的空间自相关而第二次是做出预测。
变异估计(Variography)
变异估计就是拟合一个数学模型或空间模型,像已知的结构分析。在已测点结构的空间建模中,首先得出经验半变异函数的曲线图,计算如下:
半变异函数(距离h)= 0.5*均值[ (在i 位置的值-在j 位置的值)2 ]
用于计算被距离h分隔的每一点对相对应的位置。公式用于计算一点对的差值的平方。下面的示意图显示了一点对中的一点(红色点)的位置和其它所有已测点位置的相应关系。这样步骤延伸了每一个已测点。
某点(红色点)和已测位置所构成的点对示意图
通常,每一个点对间都相距有一定的距离,而且又有许多对点对。快速绘制所有的点对并不容易,替代方式是将这些点对归类在不同的步长分组(lag bins)中来绘制。例如,计算距离大于40米小于50米范围内的所有点对的半变异的均值,经验半变异函数就是这样一个曲线图,其y轴表示平均半变异函数的值而x轴表示距离(或叫步长)(请看下面的图表)。
空间自相关量化了地理学的基本原理;空间分布愈接近的地理事物愈具有相似性。因此,空间上分布愈接近的点对(在半变异函数曲线图上,愈靠近x轴的左边)应该具有更相似的值(在半变异函数曲线图上,愈靠近y轴的下边)。而距离愈远的点对(在半变异函数曲线图上,沿x轴方向向右移动),应该具有更多的不相似性和更高的平方差(在半变异函数曲线图上,沿y轴方向向上移动)。
根据经验半变异图调整模型
接下来的一步就是根据来自经验半变异图的点来调整模型。半变异函数建模是空间描述和空间预测间关键的一步。克里格方法主要用于预测非样本点位置的值。我们已经看过了经验半变异函数如何提供数据集的空间自相关的信息。然而,它不能提供所有可能的方向和距离信息。因此,为确保克里格预测能有正的克里格方差,根据经验半变异函数来调整一个模型(即一个连续函数或曲线图)是非常必要的。理论上讲,这样拟合连续的直线或曲线的方法和回归分析有些相似。
我们选择了一些函数来作为我们的模型——例如,一个球面模型,首先随距离增加而上升,超出一定距离范围后开始变平。该模型与经验半变异函数模型得出的点有一些偏差。一些点在曲线上方,有些点在曲线下方。但是,如果我们将曲线上方的点的偏差值加在一起的值和将曲线下方的点的偏差值加在一起的值相比,将会非常接近。有许多不同的半变异函数模型可供选择。
不同类型的半变异函数模型
空间分析模块提供了以下经验半变异函数可供选择:三角函数(Circular)、 球面函数(Spherical)、指数函数(Exponential)、高斯函数(Gaussian)和线性函数(Linear)。所选用的模型影响着未知值的预测,特别是当邻近原点的曲线的形状有明显不同时。曲线愈陡峭,在预测过程中此点的预测将愈受最邻近单元的影响,因此,输出的表面的则较不光滑。而每一个模型都是为拟合不同类型的现象而精心设计的。
下面的曲线图显示了两个普通模型并反映了函数间的差别:
球面模型
这一模型显示了空间自相关性逐渐步降低(等于说,半变异在逐渐升高)的,直到达到一定距离,超出这一距离自相关为零。球面模型是常用模型中的最普通模型之一。
指数模型
随着距离的增大而空间自相关性呈指数下降时,要运用指数模型。这里,仅在无穷远处相关性完全消失,指数模型也是一常用模型。
在空间分析中选择哪种模型来进行分析是建立在数据的空间自相关性和研究现象的先验知识的基础上的。
半变异图——自相关阈值(range)、基台值(sill)和块金效应(nugget)
正如前面讨论的一样,半变异图描述已测样点的空间自相关性。因为地理学的基本原理(愈近的事物愈具有相似性),总体来讲,距离愈近的已测点间和距离较远的已测点间相比,前者具有较小的平方差。一旦每一样点对都被画出来后(分组后),就可以用一个模型来拟合它们。有几个重要的参数可用来描述这些模型。
自相关阈值和基台值
在观察半变异图模型时,可以注意到:当达到一定的距离时,拟合半变异模型就变成水平的了。半变异拟合模型第一次变水平的这个距离就叫做自相关阈值。样点按间隔距离分开,当这个距离越近并且小于自相关阈值的样点具有相关性,而其距离大于自相关阈值就不具备自相关性了。
半变异模型在自相关阈值点获得的值(Y轴上的值)就是基台值。偏基台值(也叫结构方差)等于基台值减去块金效应。
块金效应
理论上讲,当间隔距离为0时(即步长=0时),半变异函数的值应该为0。事实上,在一个无穷小的间隔距离上,观测值的方差并不趋近于0。这就叫做块金效应或块金方差。例如,当半变异模型与Y轴相交于2时,块金效应就为2。
块金效应是在间隔距离小于抽样间距时的测量误差或空间变异性或者是二者的和。测量误差是仪器内在的误差引起的。自然现象可以在一定尺度的空间范围内变化(即微观尺度或宏观尺度)。在小于抽样间距的微观尺度上空间变异也是块金效应的一部分。在收集数据之前,了解一些有关空间变异的尺度信息是相当重要的。
进行预测
克里格插值的第一项任务即揭示研究数据间的相关(自相关)已经完成。同时也结束了数据的第一次使用,该数据的空间信息(进行距离运算)用于模拟空间自相关。一旦有了空间自相关的信息,就可以运用调整好的模型进行预测运算;然后,就可以把经验半变异函数放在一边。
第二项任务即再次运用数据进行预测。象距离权重倒数插值一样,克里格插值方法利用所求单元的周围已知单元的值产生权重来预测这一单元的值,并且距离所求单元越近的单元将对计算产生越大的影响。然而,利用克里格方法从周围邻近单元来获得权重则较距离权重倒数内插方法更为复杂。距离权重倒数插值利用一个基于距离的简单算法,而克里格权重则来自通过查看数据的空间状态而开发的半变异函数模型。生成一个表示地理现象的连续的表面或地图,在半变异函数模型和邻近已知点的空间排列的基础上,对研究区内的每一位置的点值(单元中心)都进行了预测。
搜索半径
根据地理学的基本原理,我们知道邻近的地理事物较距离远的地理事物更相似。利用这一原则,我们可以假设通过距离较远点进行预测,已知点和预测点之间则较少空间自相关。
因此,我们可以排除那些较远的对计算影响较小的点。不仅是因为其间的关系较差,而且,如果较远的点所在的区域与预测点所在区域有较大差异时,它还可能带来负面影响。使用搜索邻域的另一个原因是计算速度的问题。搜索的邻域越小,计算起来越快。在预测计算中通过规定搜索邻域来限制点的个数是常用的操作。邻域的指定形状限制了在每一点的预测中选取多远、在哪里的一些已知点。其它邻域参数限制了这一范围内的位置,象在邻域中要用到的已知点的最大数目和最小数目。
在模型和半变异函数的调整中,可以利用为预测位置指定的邻域内有效点的结构来决定已知点的权重。通过权重和值,可以完成预测位置的值的计算。
空间分析模块提供了两种邻域类型:固定搜索半径和可变搜索半径类型。
固定搜索半径
固定搜索半径要求给出距离和最少点数目。距离规定了环形邻域的半径(地图单位)。半径的距离是一个常数,所以,对于每一个内插单元来说,用于寻找已知点的环形的半径是相同的。而最少的点的数目规定了在邻域内所用的已知点的最少数目。所有落入这一半径内的已知点都将用于内插单元的运算。当邻域内的已知点少于规定的最小数目时,搜索半径将扩大直至邻域内的已知点的数目达到规定的最小数目。
指定的固定搜索半径将用于研究区内的每一个内插单元的运算。因此,如果已知点没有平均的散布开来(它们很少这样平均散布),那么不同的邻域在变化预测中很可能使用了不同数目的样本点。
可变搜索半径
利用可变搜索半径,用于进行内插单元的预测运算的点的数目是指定的,这使得每个内插单元运算中邻域半径的距离是可变的,这依赖于每个内插单元的邻域到达指定数目的输入点的边界距离内插单元有多远。因此,有些邻域可能很小,另一些邻域可能大,这取决于内插单元周围的已知点的密度。也可以指定搜索半径不能超出的最大距离(地图单位)。如果某一邻域的搜索半径在未寻找到规定数目的已知点时已达到了最大半径,这一位置的预测将通过最大搜索半径内的已知点来完成。
克里格插值方法
空间分析模块提供了两种克里格插值方法:普通克里格插值法和全局克里格插值法。
普通克里格方法(OrdinaryKriging)
普通克里格方法是最普通和应用最广的克里格方法。它假设常数的均值是未知的。这是一个合理的假设除非你有一些科学的理由来否定这些假设。
全局克里格方法(UniversalKriging)
全局克里格方法假设数据中有主导趋势(例如盛行风),它可以用一个确定性的函数或多项式来模拟。从原始已知点中减去这一多项式,从随机误差中模拟自相关。在进行预测运算前,需要先完成从随机误差中拟和自相关的工作,然后将多项式加回到预测模型以获得有意义的结果。全局克里格方法将仅用于知道数据的趋势并能合理而科学地描述它的情况。