本期推文,我们将介绍IDW(反距离加权法(Inverse Distance Weighted)) 插值的Python计算方法及插值结果的可视化绘制过程。主要涉及的知识点如下:
- IDW简介
- 自定义Python代码计算空间IDW
- 分别使用plotnine、Basemap进行IDW插值结果可视化绘制
IDW简介
反距离权重 (IDW) 插值假设:彼此距离较近的事物要比彼此距离较远的事物更相似。当为任何未测量的位置预测值时,反距离权重法会采用预测位置周围的测量值与距离预测位置较远的测量值相比,距离预测位置最近的测量值对预测值的影响更大。反距离权重法假定每个测量点都有一种局部影响,而这种影响会随着距离的增大而减小。由于这种方法为距离预测位置最近的点分配的权重较大,而权重却作为距离的函数而减小,因此称之为反距离权重法。(解释来源于网络),繁琐的公式也没放,这里我们给出几张示意图即可,原理不解的小伙伴可自行百度。
(基于采样点距离的IDW插值(左)从高程矢量点插值的IDW曲面(右))
自定义Python代码计算空间IDW
我们免去了了繁琐的IDW插值原理部分,这节我们直接根据原理自定义IDW函数,根据已有样例站点位置及对应值,计算IDW结果。在这之前,我们给出所需样例的预览及地图文件的范围(构建插值网格所需),结果如下:
样例点:
地图文件范围信息:
js_box = js.geometry.total_bounds
js_box
#array([116.36196 , 30.757975, 121.975185, 35.122924])
小伙伴们对上述计算结果有疑惑的地方可以详细阅读之前的插值文章(文前链接),或者等我将这系列做完会推出详细的源码及解释文档(目前在整理中)
定义IDW计算函数
这里主要涉及两个计算函数,计算经纬度点转实际距离(km)的haversine方法和计算IDW的函数,定义函数如下:
- haversine方法:
1 import math
2 import numpy as np
3 #更换求距离的函数
4 from math import radians, cos, sin, asin, sqrt
5
6 def haversine(lon1, lat1, lon2, lat2):
7 R = 6372.8
8 dLon = radians(lon2 - lon1)
9 dLat = radians(lat2 - lat1)
10 lat1 = radians(lat1)
11 lat2 = radians(lat2)
12 a = sin(dLat/2)**2 + cos(lat1)*cos(lat2)*sin(dLon/2)**2
13 c = 2*asin(sqrt(a))
14 d = R * c
15 return d
- IDW
1 def IDW(x, y, z, xi, yi):
2 lstxyzi = []
3 for p in range(len(xi)):
4 lstdist = []
5 for s in range(len(x)):
6 d = (haversine(x[s], y[s], xi[p], yi[p]))
7 lstdist.append(d)
8 sumsup = list((1 / np.power(lstdist, 2)))
9 suminf = np.sum(sumsup)
10 sumsup = np.sum(np.array(sumsup) * np.array(z))
11 u = sumsup / suminf
12 xyzi = [xi[p], yi[p], u]
13 lstxyzi.append(xyzi)
14 return(lstxyzi)
计算所需插值的网格
这里直接给出代码,阶段的结果需要更具上面的函数计算对应网格点出的IDW结果,这样就可以实现插值操作,代码如下:
1 js_box = js.geometry.total_bounds
2 #还是插入400*400的网格点
3 grid_lon = np.linspace(js_box[0],js_box[2],400)
4 grid_lat = np.linspace(js_box[1],js_box[3],400)
5 xgrid, ygrid = np.meshgrid(grid_lon, grid_lat)
较为简单,这里就不作多解释。
计算IDW结果
结合上面两个部分,我们进行了IDW插值结果,具体计算结果如下:
1 #将插值网格数据整理
2 df_grid =pd.DataFrame(dict(long=xgrid.flatten(),lat=ygrid.flatten()))
3 #这里将数组转成列表
4 grid_lon_list = df_grid["long"].tolist()
5 grid_lat_list = df_grid["lat"].tolist()
6
7 pm_idw = IDW(know_lon,know_lat,know_z,grid_lon_list,grid_lat_list)
8 IDW_grid_df = pd.DataFrame(pm_idw,columns=["lon","lat","idw_value"])
9 IDW_grid_df.head()
这样就可以得到IDW插值后的DF类型数据了,结果如下(部分):
可视化绘制
有了规整完的插值结果,那么接下来绘制可视化结果也就非常简单了,方法和之前的几篇推文类似,具体如下:
plotnine绘制
首先,我们还是给出样例点及对应值的映射散点图,绘图过程如下:
「散点图绘制」
1 import plotnine
2 from plotnine import *
3 plotnine.options.figure_size = (5, 4.5)
4 idw_scatter = (ggplot() +
5 geom_map(js,fill='none',color='gray',size=0.4) +
6 geom_point(pm,aes(x='经度',y='纬度',fill='PM2.5'),size=5) +
7 scale_fill_cmap(cmap_name='Spectral_r',name='PM2.5',
8 breaks=[30,40,60,80]
9 )+
10 scale_x_continuous(breaks=[117,118,119,120,121,122])+
11 labs(title="Map Charts in Python Exercise 02: Map IDM point",
12 )+
13 #添加文本信息
14 annotate('text',x=116.5,y=35.3,label="processed map charts with plotnine",ha="left",
15 size=10)+
16 annotate('text',x=120,y=30.6,label="Visualization by DataCharm",ha="left",size=9)+
17 theme(
18 text=element_text(family="Roboto Condensed"),
19 #修改背景
20 panel_background=element_blank(),
21 axis_ticks_major_x=element_blank(),
22 axis_ticks_major_y=element_blank(),
23 axis_text=element_text(size=12),
24 axis_title = element_text(size=14,weight="bold"),
25 panel_grid_major_x=element_line(color="gray",size=.5),
26 panel_grid_major_y=element_line(color="gray",size=.5),
27 ))
28 idw_scatter
可视化结果如下:
「IDW插值结果绘制」
1 idw_scatter_inter = (ggplot() +
2 geom_tile(IDW_grid_df,aes(x='lon',y='lat',fill='idw_value'),size=0.1) +
3 geom_map(js,fill='none',color='gray',size=0.4) +
4 geom_point(pm,aes(x='经度',y='纬度',fill='PM2.5'),size=4,stroke=.3,show_legend=False) +
5 scale_fill_cmap(cmap_name='Spectral_r',name='idw_value',
6 breaks=[30,40,60,80]
7 )+
8 scale_x_continuous(breaks=[117,118,119,120,121,122])+
9 labs(title="Map Charts in Python Exercise 02: Map IDM point",
10 )+
11 #添加文本信息
12 annotate('text',x=116.5,y=35.3,label="processed map charts with plotnine",ha="left",
13 size=10)+
14 annotate('text',x=120,y=30.6,label="Visualization by DataCharm",ha="left",size=9)+
15 theme(
16 text=element_text(family="Roboto Condensed"),
17 #修改背景
18 panel_background=element_blank(),
19 axis_ticks_major_x=element_blank(),
20 axis_ticks_major_y=element_blank(),
21 axis_text=element_text(size=12),
22 plot_title=element_text(size=15,weight="bold"),
23 axis_title = element_text(size=14),
24 panel_grid_major_x=element_line(color="gray",size=.5),
25 panel_grid_major_y=element_line(color="gray",size=.5),
26 ))
27 idw_scatter_inter
可视化结果如下:
这里加上了散点是为了更好的对比插值结果,不加的效果如下:
裁剪操作
对研究区域的结果进行裁剪,在之前的推文中我们介绍了很多次,这里主要使用geopandas的clip() 方法进行操作,具体过程不再赘述(可以看我之前的推文教程),我们直接给出裁剪结果:
Basemap绘制
上面介绍了plotnine包进行绘制的,这里我们再使用Basemap进行绘制,直接给出绘图代码:
1 from mpl_toolkits.basemap import Basemap
2
3 jiangsu_shp = r"F:\DataCharm\shpfile_data\JS\江苏省_行政边界"
4 fig,ax = plt.subplots(figsize=(6,4.5),dpi=130,facecolor="white")
5 map_base = Basemap(llcrnrlon=js_box[0], urcrnrlon=js_box[2], llcrnrlat=js_box[1],urcrnrlat=js_box[3],
6 projection="cyl",lon_0 = 119,lat_0 = 33,ax = ax)
7 # lat = np.arange(30,36,1)
8 # lon = np.arange(116,122,1)
9 map_base.drawparallels(np.arange(30,36,1), labels=[1,0,0,0],fontsize=12,zorder=0) #画纬度线
10 map_base.drawmeridians(np.arange(116,122,1), labels=[0,0,0,1],fontsize=12,zorder=0) #画经度线
11 map_base.readshapefile(shapefile = jiangsu_shp, name = "Js", default_encoding="ISO-8859-1",
12 drawbounds=True)
13 cp=map_base.pcolormesh(xgrid, ygrid, data=idw_grid,cmap='Spectral_r')
14 #ct=map_base.contour(xgrid, ygrid, data=idw_grid,colors='w',linewidths=.7)
15 #添加散点
16 vmin = pm["PM2.5"].min()
17 vmax = pm["PM2.5"].max()
18 ax.scatter(pm['经度'],pm["纬度"],c=pm["PM2.5"],s=90,ec="k",lw=0.5,cmap="Spectral_r",
19 vmin=vmin,vmax=vmax)
20
21
22 colorbar = map_base.colorbar(cp,size='3%',pad="5%",label="IDW_inter")
23 #设置colorbar
24 colorbar.outline.set_edgecolor('none')
25
26 for spine in ['top','left','right','bottom']:
27 ax.spines[spine].set_visible(None) #隐去轴脊
28
29 ax.text(.5,1.1,"Map Charts in Python Exercise 02:Map IDW Grid Charts",transform = ax.transAxes,ha='center',
30 va='center',fontweight="bold",fontsize=14)
31 ax.text(.5,1.03, "processed map charts with Basemap",
32 transform = ax.transAxes,ha='center', va='center',fontsize = 10,color='black')
33 ax.text(.83,-.06,'\nVisualization by DataCharm',transform = ax.transAxes,
34 ha='center', va='center',fontsize = 8,color='black')
可视化结果如下:
裁剪操作
裁剪的操作也在之前的推文中介绍多次,这里我们直接给出结果哈:
当然,你也可以通过basemap.contour() 添加二维等值线,可视化结果如下:
总结
这是IDW插值的第一篇推文教程,好多原理的部分也没有介绍,这里是自定义函数进行插值计算的,当然也是有优秀的第三方包可以完成。下次的R-ggplot2版本的IDW插值我们将使用现有的优秀三方包进行计算操作。文中有很多重复的知识点没有详细介绍,大家可以查看之前的推文,或者等这个系列完成后的详细源码、数据、解释文档的分享哈!(文中出错的地方小伙伴们可以私聊指出或者加群讨论哈)