1.地理信息系统:

GIS:地理信息系统(Geographic Information System或 Geo-Information system,GIS)有时又称为“地学信息系统”。地理信息系统是一个可以建立、浏览、查询、分析地理空间数据的软件系统,其功能小至地图的展示,大至空间决策分析与支持。

功能:1.空间数据输入;2.属性数据管理;3.资料展示;4.数据查询;5.资料分析;6.地理模型建立

2.常用的GIS软件:

  •ArcGIS     

         ESRI公司的ArcGIS系列软件已成为中国用户群体最大,应用领域最广的GIS技术平台

         功能强大的专业的GIS数据处理工具

    •QGIS

        Quantum GIS,是一个开源的桌面GIS软件

        市面上难得一见一款免费且好用的GIS数据处理工具

3.GIS数据格式——矢量数据与栅格数据

矢量数据:矢量式资料以点、线、面构成,来表示真实世界的地理现象。点(point)由一组坐标组成,用符号表示,是最简单的空间地理单元,属于零维空间;线(Line)由一线段或连续线段组成,属一维空间之图征,具有长度、起点和终点。面(Polygon)由线所组成的闭合空间,是一个封闭的多边形,具有面积及周长,属二维空间之图征。矢量模式中的点、线、面都是带有属性的不连续性同质单元,其最大的特点就是在显示时不会失真。

        矢量数据(VectorData)是在坐标系中,用各个维度的坐标值(X、Y等)表示位置或描述形状的数据

        平常我们称呼的矢量数据,其实是一种包含了空间数据的集合,其中也包含了大量字段属性

矢量数据存储结构:

数据集(dataset)     以特定的文件存储格式,将数据存放在一起

层(layer/table)            一个数据库中包含多个层

字段定义(field)           一个层中可包含多个字段,字段定义用于一次性对数据属性进行描述

数据(Feature)            一个层中可包含多条数据,每条数据都具有字段描述的详细属性

空间对象                    一条数据中通常包含一个空间对象

矢量数据存储形式

    文件形式:

      Shp文件: .shp

      Csv文件:  .csv

      Mapinfo文件:.mif

      Sqlite文件: .db

    数据库形式:(多层数据)

      Oracle

      MySql

      PostgreSql

栅格数据:栅格数据则是以规律栅格单元(grid of cell)所组成,每一个栅格单元中都记录着一个数值,以不同的数值代表不同类别。其记录方式多以行、列的方式表示。栅格的的大小决定了栅格式数据的分辨率,格子愈小,图形愈清晰,数据愈精准,相对的资料量愈大。此种数据适合用于连续性数据储存,像是数字高程模型、土壤、土地利用等覆盖全地表类的数据。常见的栅格式数据如数值地图、卫星影像、航空照片、数值高程模型等。

矢量数据由于符合真实世界之形貌,比较容易被接受,故建立数据的时间及成本提高,也符合事实之需求。栅格式数据易于分析,比矢量式数据更容易表现地形地貌,所以被广泛应用于自然资源方面的研究计划与管理中。

4.文件格式

gdf文件:地理数据文件(Geographical Data File, GDF) 是一种保存地理数据的文件格式,用于描述和传输道路网络和道路相关数据。与传统的GIS数据格式相比, GDF为获取数据及标准特征、属性和关系的扩展分类提供更多详细的规则。

SHP文件

    一组SHP文件通常包含后缀名为shp、dbf、shx、prj、cpg、qix、sbn、sbx等的多个文件

          •shp文件用于存储矢量数据信息,记录的是每个图形元素的坐标位置信息,在gdal处理时,不可超过4G。文件大小最好控制在2G以内。

          •dbf用于存储字段属性与字段值信息,记录的是每个图形元素的特征信息。dbf字段名长度限制为10,字段值长度限制为255 ,文件大小最好控制在2G以内

          •shx是一个映射文件,关联shp和dbf,用于记录shp和dbf关联关系,很多情况下,缺失shx仍能正常处理,也能反向生成

          •prj记录的是整个文件用到的投影坐标信息。其中prj文件是可选的,其它三个是必需的。

          •cpg用于记录dbf的编码方式,可用文本方式查看

          •qix是一种形式的矢量数据空间索引

          •sbn和sbx是另一种矢量数据的空间索引文件

5.图幅

6.空间对象

    •基本对象:点(POI)、线(道路)、面(AOI)

    •复合对象:多点、多线、多面、空间集合

    •空对象(Empty):由于各种原因,存在一种空对象,工作中理论上不应存在,但数据处理时经常遇到这类数据引发的异常,不可忽视

空间对象的表达

  基本对象

     •点:点可以用坐标X,Y来确定位置

     •线:线可以认为是由连续的直线段组成的曲线,可以用坐标串的集合(X1,Y1,X2,Y2……Xn,Yn)来记录

     •面:面通常通过记录面状地物的边界来表现

WKT

      WKT(Well-Known Text)是一种文本标记语言,用以表示矢量几何对象,空间参照系统,以及空间参照系统之间的转换

      WKB(Well-Known binary)是wkt的二进制表达方式。它在传输和存储时占用更少的空间

    WKT描述几何对象    

       •POINT(6 10)

       •LINESTRING(3 4,10 50,20 25)

       •POLYGON((1 1,5 1,5 5,1 5,1 1),(2 2,2 3,3 3,3 2,2 2))

       •MULTIPOINT(3.5 5.6, 4.8 10.5)

       •GEOMETRYCOLLECTION(POINT(4 6),LINESTRING(4 6,7 10))

    WKT描述空间参照系

GEOGCS[

  "GCS_WGS_1984",

  DATUM[

  "D_WGS_1984",

  SPHEROID["WGS_1984",6378137.0,298.257223563]],

  PRIMEM["Greenwich",0.0],

  UNIT["Degree",0.0174532925199433],

  AUTHORITY["EPSG",4326]]

工作中的点、线、面

         •点:POI,Point of Interest,兴趣点。

地图中的门址,收派件网点、高速出入口,收费站点都属于POI

         •线:ROAD,道路。

包括各种高速、城市环线及大小干道、桥梁、隧道等

        •面:AOI,Area of Interest,兴趣区域。

包括楼块、小区、公园、绿地、水系等

电子围栏、图幅区域、行政区划

ADCODE

           •各省市的行政区域划分,是一种典型的面数据

•ADCODE即行政区号,由中国国家标准化管理委员会制定,用以标志各区域在国家行政级别上的编号,用9位数字表示。国家统计局补充了三位表示居委会、村委会的代码。

*我国公民身份证号码前6位即是出生时户口登记所在地行政区号的前6位

12位的ADCODE结构采用五层数字表示

•第一层:1~2位  标志省级码(省、自治区、直辖市)

•第二层:3~4位  标志地级码(地级市、地区)

•第三层:5~6位  标志县级码(县、县级市、市辖区)

•第四层: 7~9位  标志乡级码(乡、镇、街道、类似乡级单位)

•第五层: 10~12位  标志村级码(村民委员会、居民委员会、类似村民委员会、类似居民委员会)

           6位和15位的ADCODE

•常见的6位ADCODE省略了12位中的后6位

•也有15位的ADCODE,它在12位的基础上追加了3位表示城乡分类的代码

•111表示主城区

•112表示城乡结合区

•121表示镇中心区

•122表示镇乡结合区

•123表示特殊区域

•210表示乡中心区

•220表示村庄

城乡分类代码第1位为1,表示城镇;为2,表示乡村

空间对象的周边属性:质心

质量的中心,二维平面描述下,空间对象视作质量均匀的对象,此时与重心重合

 •重心:有重力场时,质量被相互吸引产生的力的集中点

 •质心不一定在空间对象内部

空间对象的周边属性:boundary

    •Boundary意为边界,可理解为边缘。

    •不同的对象的boundary类型不同。

•点:无Boundary,或理解自己本身就是

•线:线的两个端点

•面:包围面的线

空间对象的周边属性:Envelope和MBR

•Envelope也称包络线,是一个由最小x,y和最大x,y值组成的矩形区域,它定义了一个要素的空间范围。 Envelope构成的接矩形平行于x轴和y轴。

•MBR严格意义上讲是包围几何体的最小外接矩形,它不一定平行于x轴和y轴。

•MBR有最小面积外接矩形和最小周长外接矩形之分

•在很多场景下,如果没有同时这两个概念,则将两者视作同一个,即平行于x轴和y轴的最小外接矩形

空间对象的周边属性:ConvexHull

•凸包:包含空间对象的最小凸多边形

•凸多边形指如果把一个多边形的所有边中,任意一条边向两方无限延长成为一直线时,其他各边都在此直线的同旁

空间对象的周边属性:Buffer

•缓冲区:围绕空间对象周围一定宽度范围内的多边形

•建立缓冲区通常需要两个参数:宽度、导角细分数。宽度决定缓冲区的大小,导角细分数决定了导角位置过渡的平滑度

•缓冲区能在一定程度上反映空间对象环境,在地图渲染和电子围栏中应用广泛

空间位置关系

•分离(Disjoin):两个对象包含的点集不存在交集

•相交(Intersect):两个对象包含的点集存在交集

•相邻(Touch):交集为两者boundary的子集

•重叠(Overlap):交集类型与两者类型均相同,并且交集只能是两者子集

•交叉(Cross):与线类型相关的

•包含(Contain) /嵌入(Within):一个对象是另一个对象的子集

•相等(Equal):两者以及交集具有完全相同的对象属性

  •Intersection:两个空间对象的交集

  •Union:两个空间对象的并集

空间索引

•空间索引

•类似于一般数据使用的索引,使用某种算法使数据查询更高效

•牺牲一定空间,极大地提高查询速度

•空间索引原理

•使用MBR特性进行初次筛选,后续需再次求证真实位置关系

•存储形式

•文件索引

•内存索引

•数据库的空间索引(文件索引)

空间索引的存储形式

•Shapefile的文件索引

•QIX后缀

•SBN后缀

•内存索引常见算法基本思想

•四叉树:查询速度极快,但初次过滤会滤出很多无效对象

•右叉树(R树):查询速度相对四叉树稍慢,但初次过滤更精准

空间数据库

•越来越多的数据库支持空间数据存储,同时也必然支持空间索引,如

•Oracle(OracleSpatial)、

•MySql、

•Sqlite(Spatialite)、

•PostgreSql(PostGIS)

7.坐标与坐标系

•坐标:在一个参考体系内描述一个点的相对位置

•坐标系:描述这种相对位置的参考体系

地理坐标系:为球面坐标。 参考平面地是椭球面,坐标单位:经纬度;

地球椭球体中心与重心重合,适应于全球定位,例如WGS84 、 CGCS2000(大地2000)

地球椭球体中心通常不与重心重合,适用局部相对精确的定位,例如beijing54、xian80

投影坐标系:为平面坐标。参考平面地是水平面,坐标单位:米、千米等

        •Web墨卡托投影、BD09MC

典型的地理坐标系:WGS84,WGS84 由美国国防部制图局(Defense Mapping Agency)于 1980 年代所建立的地球参考坐标。以全球地心参考框架和一组相应模型(包括地球重力模型EGM 和WGS84 大地水平面)所组成,全球定位系统(GPS)所采用的坐标系统就是WGS84 坐标

常见厂商使用的坐标系

•谷歌(google):WGS84

•高德:GCJ02

•百度:BD09MC

•四维:GCJ02

•立得:GCJ02(单位为:秒)