毕设内容选择了从来没有接触过的空间统计,为了顺利毕业,开始接触时空数据等,希望自己能够学完。



文章目录

  • 一、什么是统计?
  • 二、统计与分析
  • 1.分析是统计应用中的一种手段
  • 2.统计为分析提供数据基础
  • 三、地理学第一定律
  • 四、空间分析的一般定义
  • 五、空间统计学基本概念
  • 1.空间概率
  • 2.概率密度
  • 3.不确定性
  • 4.统计推断
  • 5.零假设
  • 6.空间自相关
  • 7.空间异质性
  • 8.空间尺度
  • 六、空间关系概念化
  • 1. __距离__
  • 2.面邻接
  • 3.K临近
  • 4.Delaunay三角测量(自然相邻要素)
  • 5.空间时间窗
  • 6.空间权重矩阵



一、什么是统计?

统计学七大支柱:
1.复合:整体的描述
2.信息:度量与变化
3.似然:概率尺度上的校准
4.相互比较:样本内的变异
5.回归:多元分析、贝叶斯与因果
6.设计:实验方案与随机
7.残差:科学逻辑与模型比较

二、统计与分析

1.分析是统计应用中的一种手段

统计包含了数据的收集、整理、计算、分析等手段。

2.统计为分析提供数据基础

统计和分析都必须建立在大量数据样本的基础上。

统计和数据有关,所以统计更加形象和有意义
分析可以是与现象、事物、概念等客观存在的一切对象相关

三、地理学第一定律

Everything is related to everything else,but near things are more related to each other.
任何事物都相关,只是相近的事物关联更紧密。


地理空间分析:

  • 在什么地方,发生了什么事情?
    视角: 关于世界的一个独特的视角。
    范围: 上至无穷大的太空,下至最深的地底,人类已知的所有位置。
    足迹: 每个过程都将留下独特的足迹,我们将解释这些足迹的意义。
    人机:任何技术都是存在于人和计算机之间,人和计算机都发挥着重要作用

四、空间分析的一般定义

  • 基于空间数据
  • 以地学原理为依托
  • 获取地理对象新的空间信息
    位置、分布、形态、形成、演变等
    空间分析是能够揭示出比数据本身更多的信息和知识的已知分析技术或方法`

五、空间统计学基本概念

1.空间概率

空间概率是一种符合地理学第一定律的联合概率(joint probabilities)

  • 符合地理学第一定律:距离越近,影响越大
  • 若有A、B、D三个点P(A) = P(B) = P(D) = 1/2,而A、B相距较近,A、D相距较远,则可以推测 1/4 < P(A,B) < 1/2, P(A,D) <= 1/4

    P值 与 Z得分:
    P值(P-Value)代表概率,表示所观测的空间模式是由某一随机过程创建而成的概率
    Z得分(Z-Scores)表示标准差的倍数,代表显著程度。
    信息含量:
  • 方差越大,说明数据越具有多样性,相关性也就越强。

2.概率密度

空间测量的不确定性是概率在空间上的主要应用之一。

  • 例如,定位精度为5m, 是否可以理解为 采样的任何一个点与其真实位置之间的距离都是5m呢?
  • 不对,采样出来的每一个点,以真实位置为圆心,画一个半径为5m的圈,一定能将所有的采样点包含在这个圈内。
  • 定位点出现的概率在任意方向都呈现正态分布。

3.不确定性

  • 概率密度主要用在不确定性分析上
  • 不确定性产生的原因有可能是因为测量引发的
  • 不确定性会产生传递
  • 不同的观察者可能产生不同的观察结果(空间的异质性)

4.统计推断

  • 统计推断是科学研究最重要的工具之一。
    样本抽取如何保证空间相关性?
    空间异质性如何保证样本在不同的位置被提取出来的特征?
    样本能够代表多大的区域范围?
  • 分析的结果能否推断出关于总体的结论?
  • 空间分析的分析思路之一:
    总体分析,局部验证

在空间上的统计推断,与在属性上的统计推断是不同的。经典统计学 VS 空间统计学: 1.样本独立性:属性A发生变化,属性B被影响 2.空间异质性:空间位置发生变化,分析结果也会发生变化 3.多变量影响:被邻居影响,引发结果偏差

5.零假设

什么是随机?平衡、均等、无法预测。

6.空间自相关

通过数据在空间位置上的某一种聚集,来解释出某一种属性。同一属性在空间上的相关程度

7.空间异质性

“因地制宜”就是一种空间异质性的表现。
在空间统计中,空间异质性(Spatial Heterogeneity)指的是在空间中观测到的现象或变量在不同地理位置上存在差异或变异性。它表示了空间上的不均匀性和多样性。空间异质性是空间统计分析的一个重要概念,用于描述和量化不同地理区域之间的变量差异
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

8.空间尺度

  1. 制图尺度或地图尺度
  2. 测量尺度或分辨率
  3. 观测尺度或地理尺度
  4. 运行尺度或操作尺度

例如,一个比例尺为1:800万的图可能具有聚集的特征,而把它放到1:10万时,可能就变成离散的了。因为空间尺度发生了变化。所以,统计分析的核心在于对比,而不是绝对,世事无绝对。

六、空间关系概念化

空间关系是一切空间分析的基础。
如何定义空间关系?

__空间关系的客观性:__地理要素的类别、位置、距离等内容是客观存在的,不以人的意志所改变。
空间关系概念化分类:

  • 1.距离类
    距离与反距离、固定距离、无差别距离
  • 2.拓扑类
    触点相邻
  • 3.混合类
    时空相邻、属性化相邻
  • 4.逻辑类
    K邻接、自然相邻

1. 距离

距离函数:最简单的方式是直接采用几何距离公式计算。
时空加权的泊松回归 时空地理加权回归_数据
但在空间分析中,通常使用的是 反距离
时空加权的泊松回归 时空地理加权回归_学习_02
其中,p越大,距离近的点的作用越大,距离因素权重越大。p的值常规上不应该太大,一般在0.5到3之间。

曼哈顿距离 也是一种常用的距离概念
时空加权的泊松回归 时空地理加权回归_笔记_03
变种距离关系:无差别区域

  • 无差别区域是固定距离范围模型和反距离模型的混合空间关系概念
  • 距离范围或距离阈值内的所有要素都包含在对目标要素的分析中
  • 超过关键距离后,影响级别(权重)会快速下降。

距离类空间关系概念适用的场景
距离类空间关系是最常见和常用的空间关系之一,适用于绝大部分数据类型和分析场景。
尤其适用于对 连续数据 进行建模分析:

  • 生态环境类、自然资源类、水利、农业,如温度、降雨、气压、土肥植保等自然领域的数据建模分析
  • 部分距离成本类分析:如道路运输、出行成本、城市实施规划、房价学区、犯罪分析等。
  • 生物研究类:如动植物保护、物种迁徙。
  • …等

2.面邻接

  • Rook’s case:共享一个公共边的,视为相互连通
  • 时空加权的泊松回归 时空地理加权回归_空间分析_04

  • Bishop‘s case:共享一个公共点的,视为相互连通
  • 时空加权的泊松回归 时空地理加权回归_学习_05

  • Queen’s case:共享公共点和公共边的,都被视为相互连通
  • 时空加权的泊松回归 时空地理加权回归_笔记_06

  • 二阶邻域 Second-order neighbors
    (Rock’s case)与一阶邻域共享一个公共边的单元,称为二阶邻域。
  • 时空加权的泊松回归 时空地理加权回归_数据_07

  • 面邻接空间关系概念适用的场景:
  • 面邻接是以行政区划为主要空间信息载体的研究中,通常是默认的空间关系概念,如
  • 卫生疾控、传染病
  • 行政区域经济发展的研究:如省域经济发展研究、县域经济发展研究等
  • 国际政治经济相关研究:如地缘政治、边境纠纷、地区冲突、跨国贸易等。

3.K临近

K临近是一种可以构造相邻要素关系,以便每个要素都可以在其指定数量(K)的最邻近要素空间环境内进行评估的空间关系概念。

时空加权的泊松回归 时空地理加权回归_笔记_08


在要素密度高的位置处,分析的空间范围会比较小

在要素密度稀的位置,分析的空间范围会比较大。

4.Delaunay三角测量(自然相邻要素)

  • 通过点要素或要素质心创建Voronoi三角形,使得每个点或质心都是三角形结点。由三角形的边连接的结点被视为相邻结点。
  • 适用Delaunay三角测量可确保每个要素至少具有一个相邻要素,即使数据包含变化明显的要素密度
  • 注意具有重合要素时,不要使用Delaunay三角测量选项。

    K临近&自然相邻空间关系概念适用场景
  • K临近&自然相邻可以忽略数据的分布疏密,保证不会出现"孤岛“效应
  • 通常在地理实体以及探索性分析中适用,如
  • 带有岛屿的区域研究: 如海南省与广东、广西的邻接关系
  • 点要素相关的空间分析:如插值分析
  • 社会地理计算研究:如社会关系、六度关系连接理论
  • 有关于空间分布中疏密度的探索。

5.空间时间窗

  • 这是一种时空组合的空间关系概念模型。用这个模型时,需要数据同时具备空间属性和时间属性。
  • 同时同地
  • 同时异地
  • 异时同地
  • 异时异地

适用场景:
时空地理加权回归、时空立方体、地理加权时间序列分析、时空热点分析

6.空间权重矩阵

GIS软件中的空间关系,通常是以空间权重矩阵的方式进行记录和参与运算的。
如有邻接关系用1表示,无邻接关系用0表示。在计算机中,使用 稀疏矩阵 来记录

随着技术等发展,空间关系是可以重新定义的。如丝绸之路经济带、海上丝绸之路等