在GIS分析中经常会遇到通过离散点生成连续的曲面,来预测未知点的数据。或者根据已知数据对数据变化趋势和超越临界值的概率等问题,我们知道通过ArcGIS地统计分析模块就可以做到。今天主要讨论的是如何让我们更好的了解我们的采样数据,对数据进行分析,数据分析可以让用户更全面的了解到数据是否存在某种趋势。对数据的变化趋势了解后就可以对数据相关的问题做更好的决策,
ArcGIS地统计分析模块提供三个功能模块,探索性数据分析、地统计分析向导、以及生成数据子集。利用这些基本功能模块,可以方便的完成多种地统计分析,创建完善的专题地图,其中探索性数据分析模块能帮助我们确定统计数据属性,探测数据分布、全局和局部异常值(过大值或过小值)、寻求全局的变化趋势
1、首先了解一下直方图,直方图指对采样数据按一定的分级方案(等间隔分级、标准差分,等等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图可以直观的反映采样数据分布特征、总体规律,可以用来检验数据分布和寻找数据离群值。
该地区GDP数据分布具有明显的对数分布,符合正态分布的特征。但在最右侧有一个明显的值段内没有数据。
2、普通QQPlot(General QQPlot)分布图用来评估两个数据集的分布的相似性。普通QQPlot图揭示了两个物体(变量)之间的相关关系,如果在QQPlot图中曲线呈直线,说明两物体呈一种线性关系,可以用一个一元一次方程式来拟合。如果QQPlot图中曲线呈抛物线,说明两物体的关系可以用一个二元多项式来拟合。
3、半变异函数云表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。
半变异函数是事物空间相关系数的表现,当两事物彼此距离较小时,它们是相似的,半变异值较小;反之,半变异值较大。图中横坐标为样点对之间的距离,纵坐标表示半变异的函数值,图中所示的曲线为理想状态下半变异函数曲线图,而往往数据的函数图不能呈现如此状态,通过图中异常样对点,我们可以对数据的异常点进行判断
在地统计分析中,生成数据曲面的插值方法是建立在平稳假设的基础上,这种假设在一定程度上要求所有数据值具有相同的变异性。另外,一些插值法(比如说:克里格插值)都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,在进行地统计分析前,检验数据分布特征,了解和认识数据具有非常重要的意义
数据分析中发现的数据异常值可能就是真实异常值,也可能是由于不正确的测量或记录引起的。如果离群值是真实异常值,这个点可能就是研究和理解这个现象的最重要的点。反之,如果它是由于测量或数据输入的明显错误引起的,在生成表面之前,它们就需要改正或剔除。对于预测表面,异常值可能引起多方面的有害影响,包括影响建模和邻域分析的取值