1
简介
空间自相关(spatial autocorrelation)是指一些变量在同一个分布区内的观测数据之间潜在的相互依赖性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。
当高值与高邻域值相关或低值与低邻域值相关时,空间自相关为正;当高值与低邻近值相关时,存在负空间自相关,反之亦然。
正空间自相关的存在会导致信息的丢失,这与较大的不确定性、较低的精度和较大的标准误差有关。
空间自相关系数(相对于时间上的对应系数)不受-1/+1的约束。它们的范围取决于权重矩阵的选择。
空间计量中有很多度量相关的方法指数,但最主要的有两种指数,即Moran的I指数和Geary的C指数。在统计上,透过相关分析(correlation analysis)可以检测两种现象(统计量)的变化是否存在相关性,例如:稻米的产量,往往与其所处的土壤肥沃程度相关。如果这个分析统计量是不同观察对象的同一属性变量,就称之为「自相关」(autocorrelation)。因此,所谓的空间自相关(spatial autocorrelation)就是研究「空间中,某空间单元与其周围单元间,就某种特征值,透过统计方法,进行空间自相关性程度的计算,以分析这些空间单元在空间上分布现象的特性」。
计算方法编辑 有许多种,然最为知名也最为常用的有:Moran’s I、Geary’s C、Getis、Join count等等。但这些方法各有其功用,同时亦有其适用范畴与限制,当然自有其优缺点。一般来说,方法在功用上可大致分为两大类:一为全域型(Global Spatial Autocorrelation),另一则为区域型(Local Spatial Autocorrelation)两种。
全域型的功能在于描述某现象的整体分布状况,判断此现象在空间是否有聚集特性存在,但其并不能确切地指出聚集在哪些地区。且若将全域型不同的空间间隔(spatial lag)的空间自相关统计量依序排列,还可进一步作空间自相关系数图(spatial autocorrelation coefficient correlogram),分析该现象在空间上是否有阶层性分布。
而依据Anselin(1995)提出LISA(Local Indicators of Spatial Association)方法论说法,区域型之所以能够推算出聚集地(spatial hot spot)的范围,主要有两种:一是藉由统计显著性检定的方法,检定聚集空间单元相对於整体研究范围而言,其空间自相关是否够显著,若显著性大,即是该现象空间聚集的地区,如:Getis和Ord(1992)发展的Getis统计方法;另外,则是度量空间单元对整个研究范围空间自相关的影响程度,影响程度大的往往是区域内的「特例」(outliers),也就表示这些「特例」点往往是空间现象的聚集点,例如:Anselin’s Moran Scatterplot。
2
空间自相关检验命令汇总
主要包括spatgsa、spatlsa、spatcor等命令。
1、spatgsa
spatgsa计算三个全局空间自相关统计数据:Moran's I, Geary's c, and Getis and Ord's G。spatgsa计算并以表格形式显示统计本身的期望值、全局空间的零假设下的独立零假设,标准差的统计,z值和相应的单尾或者双侧检验。
全局自相关检验用到的命令为spatgsa,语法格式为:spatgsa varlist , weights(matrix) [ moran geary go twotail ]
其中:
weights(matrix)总是需要权值(矩阵)。它指定用于计算请求的全局空间自相关统计信息的空间权重矩阵的名称。这个矩阵一定是由spatwmat生成的。
moran请求计算并显示moran的I和相关的值。
geary请求计算并显示Geary's c统计量。
go请求计算Getis and Ord's G。此选项要求由选项权值(矩阵)指定的空间权值矩阵为非标准化的对称二进制权值矩阵。
twotail请求计算和显示双尾p值,而不是默认的单尾p值。
要运行spatgsa,必须至少指定以下选项之一:moran、geary和go。
案例代码为:
use columbusdata.dta,clearspatgsa hoval income crime, weights(W) moran geary gospatgsa hoval income crime, weights(W) moran geary twotail
结果为:
2、spatlsa
局部自相关检验用到的命令为spatlsa,语法格式为:
spatlsa varname , weights(matrix) [ moran geary go1 go2 id(varname) twotail sort graph(moran|go1|go1) symbol(id|n) map(filename) xcoord(varname) ycoord(varname) savegraph(filename [, replace]) ]
spatlsa计算四种局部空间自相关统计:Moran's Ii, Geary's ci, Getis and Ord's G1i, and Getis and Ord's G2i.。对于每个请求的统计量和每个分析的位置对象,spatlsa以表格的形式计算并显示统计量本身、统计量在局部空间独立的原假设下的期望值、统计量的标准差、z值,以及相应的1尾或2尾的p值。作为一个选项,spatlsa还显示一个Moran scatterplot、一个Moran scatterplot值的映射、一个G1i z值的映射或一个G2i z值的映射。
案例代码为:
use columbusdata.dta,clear spatlsa crime, weights(W) moran go2
结果为:
局部自相关散点图代码为:
spatwmat using columbusswm.dta, name(W) standardizespatlsa crime,weights(W) moran graph(moran) symbol(n)
结果为:
3、spatcorr
spatcorr根据两个或多个连续的或累积的距离计算并可选地绘制Moran's I or Geary's空间相关图。spatcorr以表格的形式计算并显示所要求的统计量、在全局空间依赖的零假设下统计量的期望值、统计量的标准差、z值以及相应的单尾或双尾p值。
案例代码为:
use columbusdata.dta,clear spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y)默认Moran'sI 统计量;距离范围:0-5,距高带宽:1spatcorr crime,bands(0(1)5) xcoord(x) ycoord(y) geary 设置为Geary's c统计量spatcorr crime,bands(0(1)5)xcoord(x) ycoord(y) twotail 设置为双尾检验spatcorr crime,bands(O(1)5) xcoord(x) ycoord(y) cumulative设置为累计分段spatcorr crime, bands(0(1)5) xcoord(x) ycoord(y) graph //绘制指数图
结果为: