本文介绍两个变量之间的分布图(Draw a plot of two variables with bivariate and univariate graphs.)。

本文内容速看

  • seaborn.jointplot绘制两个变量分布图

python所有变量分布图 python变量分布图怎么画_数据集

  • seaborn.JointGrid绘制两个变量分布图(更个性化)

python所有变量分布图 python变量分布图怎么画_reg类型变量综合电路_02

目录

1、绘图数据准备
2、seaborn.jointplot
 图形基本设置
 修改中部图
 修改边际图
 kind参数设置
 给中部散点图加上核密度图 
3、seaborn.JointGrid
 sns.JointGrid基础使用 
 分别绘制中心及边际图
 分别个性化绘制边际图 
 分别绘制x轴方向及y轴方向边际图 

1、绘图数据准备
2、seaborn.jointplot
 图形基本设置
 修改中部图
 修改边际图
 kind参数设置
 给中部散点图加上核密度图 
3、seaborn.JointGrid
 sns.JointGrid基础使用 
 分别绘制中心及边际图
 分别个性化绘制边际图 
 分别绘制x轴方向及y轴方向边际图

1、绘图数据准备

还是鸢尾花iris数据集:鸢尾花iris数据集介绍

#导入本帖要用到的库,声明如下:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd 
import palettable
from pandas import Series,DataFrame
from sklearn import datasets
import seaborn as sns
import palettable
#导入鸢尾花iris数据集(方法一)
#该方法更有助于理解数据集
iris=datasets.load_iris()
x, y =iris.data,iris.target
y_1 = np.array(['setosa' if i==0 else 'versicolor' if i==1 else 'virginica' for i in y])
pd_iris = pd.DataFrame(np.hstack((x, y_1.reshape(150,1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'])
 
#astype修改pd_iris中数据类型object为float64
pd_iris['sepal length(cm)']=pd_iris['sepal length(cm)'].astype('float64')
pd_iris['sepal width(cm)']=pd_iris['sepal width(cm)'].astype('float64')
pd_iris['petal length(cm)']=pd_iris['petal length(cm)'].astype('float64')
pd_iris['petal width(cm)']=pd_iris['petal width(cm)'].astype('float64')
 
 
#导入鸢尾花iris数据集(方法二)
#该方法有时候会卡巴斯基,所以弃而不用
#import seaborn as sns
#iris_sns = sns.load_dataset("iris")

#导入本帖要用到的库,声明如下:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd 
import palettable
from pandas import Series,DataFrame
from sklearn import datasets
import seaborn as sns
import palettable
#导入鸢尾花iris数据集(方法一)
#该方法更有助于理解数据集
iris=datasets.load_iris()
x, y =iris.data,iris.target
y_1 = np.array(['setosa' if i==0 else 'versicolor' if i==1 else 'virginica' for i in y])
pd_iris = pd.DataFrame(np.hstack((x, y_1.reshape(150,1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'])
 
#astype修改pd_iris中数据类型object为float64
pd_iris['sepal length(cm)']=pd_iris['sepal length(cm)'].astype('float64')
pd_iris['sepal width(cm)']=pd_iris['sepal width(cm)'].astype('float64')
pd_iris['petal length(cm)']=pd_iris['petal length(cm)'].astype('float64')
pd_iris['petal width(cm)']=pd_iris['petal width(cm)'].astype('float64')
 
 
#导入鸢尾花iris数据集(方法二)
#该方法有时候会卡巴斯基,所以弃而不用
#import seaborn as sns
#iris_sns = sns.load_dataset("iris")

数据集浏览下

python所有变量分布图 python变量分布图怎么画_数据集_03

2、seaborn.jointplot

seaborn.jointplot(x, y, data=None, kind='scatter', stat_func=None, color=None, height=6, ratio=5, space=0.2, dropna=True, xlim=None, ylim=None, joint_kws=None, marginal_kws=None, annot_kws=None, **kwargs)


同时绘制两个变量之间的分布图(Draw a plot of two variables with bivariate and univariate graphs.)
该图由三部分组成

  • 中间两变量关系图
  • 上部x轴变量分布边际图
  • 右侧y轴变量分布边际图

图形基本设置

sns.set(style="white",font_scale=1.5)#设置主题,文本大小
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#输入两个绘图变量
                 color='#098154',#修改颜色
                 )
g.fig.set_size_inches(10,8)#设置图尺寸

sns.set(style="white",font_scale=1.5)#设置主题,文本大小
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#输入两个绘图变量
                 color='#098154',#修改颜色
                 )
g.fig.set_size_inches(10,8)#设置图尺寸


python所有变量分布图 python变量分布图怎么画_数据集

修改中部图

sns.set(style="white",font_scale=1.5)
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                  color='#098154',
                  height=5, #中部图高度(中部图为正方形)
                  ratio=2,#中部图与边际图尺寸比
                  marker='^',#修改散点marker
                 )
g.fig.set_size_inches(10,8) 


sns.set(style="white",font_scale=1.5)
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                  color='#098154',
                  height=5, #中部图高度(中部图为正方形)
                  ratio=2,#中部图与边际图尺寸比
                  marker='^',#修改散点marker
                 )
g.fig.set_size_inches(10,8)


python所有变量分布图 python变量分布图怎么画_Python_05

修改边际图

边际图是一个直方图hist,更多详细设置可参考:seaborn直方图hist

:
sns.set(style="white",font_scale=1.5)
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                  color='#098154',
                  marginal_kws=dict(bins=15, #hist箱子个数
                                    kde=True,#开启核密度图
                                    color='#c72e29',#直方图hist填充色                                    
                                   ),
                 )
g.fig.set_size_inches(10,8)

:
sns.set(style="white",font_scale=1.5)
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                  color='#098154',
                  marginal_kws=dict(bins=15, #hist箱子个数
                                    kde=True,#开启核密度图
                                    color='#c72e29',#直方图hist填充色                                    
                                   ),
                 )
g.fig.set_size_inches(10,8)


python所有变量分布图 python变量分布图怎么画_数据集_06

kind参数设置

包含五个选项,即'scatter,reg,resid,kde,hex',默认为scatter,下面看看各类是什么样子。

for i in list('scatter,reg,resid,kde,hex'.split(',')):
    sns.set(style="white",font_scale=1.5)
    g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                      color='#098154',
                      kind=i,#scatter(默认),可选reg,resid,kde,hex
                     )
    g.fig.set_size_inches(10,8)  

for i in list('scatter,reg,resid,kde,hex'.split(',')):
    sns.set(style="white",font_scale=1.5)
    g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,
                      color='#098154',
                      kind=i,#scatter(默认),可选reg,resid,kde,hex
                     )
    g.fig.set_size_inches(10,8)

python所有变量分布图 python变量分布图怎么画_数据集

python所有变量分布图 python变量分布图怎么画_reg类型变量综合电路_08

 

python所有变量分布图 python变量分布图怎么画_直方图_09

python所有变量分布图 python变量分布图怎么画_数据集_10

python所有变量分布图 python变量分布图怎么画_python所有变量分布图_11

给中部散点图加上核密度图

sns.set(style="white",font_scale=1.5)#设置主题,文本大小
#sns.set_style("white", {"axes.facecolor": "#d5e4eb"})#自定义背景色
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#输入两个绘图变量
                 color='#098154',
                 )
g.fig.set_size_inches(10,8)#设置图尺寸
g.plot_joint(sns.kdeplot, zorder=0, n_levels=6,color='red')

sns.set(style="white",font_scale=1.5)#设置主题,文本大小
#sns.set_style("white", {"axes.facecolor": "#d5e4eb"})#自定义背景色
g = sns.jointplot(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#输入两个绘图变量
                 color='#098154',
                 )
g.fig.set_size_inches(10,8)#设置图尺寸
g.plot_joint(sns.kdeplot, zorder=0, n_levels=6,color='red')

python所有变量分布图 python变量分布图怎么画_直方图_12

 以上只是基础玩法,高级玩法还得seaborn.jointplot的底层seaborn.JointGrid上场

3、seaborn.JointGrid

class seaborn.JointGrid(x, y, data=None, height=6, ratio=5, space=0.2, dropna=True, xlim=None, ylim=None, size=None)
seaborn.JointGrid是seaborn.jointplot的底层,个人理解类似于seaborn的底层是matplotlib一般。

sns.JointGrid基础使用

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#一张画布
                 )
g = g.plot(sns.regplot, sns.distplot,)#画布上绘制三张图
g.fig.set_size_inches(10,8)#设置图尺寸

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,#一张画布
                 )
g = g.plot(sns.regplot, sns.distplot,)#画布上绘制三张图
g.fig.set_size_inches(10,8)#设置图尺寸


python所有变量分布图 python变量分布图怎么画_数据集_13

分别绘制中心及边际图

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)#中心绘制散点图
g = g.plot_marginals(sns.distplot, kde=True, color='#c72e29')#边际绘制hist直方图

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris,)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)#中心绘制散点图
g = g.plot_marginals(sns.distplot, kde=True, color='#c72e29')#边际绘制hist直方图


python所有变量分布图 python变量分布图怎么画_reg类型变量综合电路_02

分别个性化绘制边际图

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris, space=0)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)
#x轴方向边际图
g.ax_marg_x.hist(pd_iris['sepal length(cm)'], color='#01a2d9', alpha=1,
                 bins=15,
                 
                )

#y轴方向边际图
g.ax_marg_y.hist(pd_iris['sepal width(cm)'], color='#c72e29', alpha=1,
                    orientation="horizontal",
                   bins=15)
plt.show()

g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris, space=0)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)
#x轴方向边际图
g.ax_marg_x.hist(pd_iris['sepal length(cm)'], color='#01a2d9', alpha=1,
                 bins=15,
                 
                )

#y轴方向边际图
g.ax_marg_y.hist(pd_iris['sepal width(cm)'], color='#c72e29', alpha=1,
                    orientation="horizontal",
                   bins=15)
plt.show()


python所有变量分布图 python变量分布图怎么画_reg类型变量综合电路_15

分别绘制x轴方向及y轴方向边际图

#每个边际图是一个matplotlib.axes._subplots.AxesSubplot对象,可自由发挥绘制想要的图
g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris, space=0)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)
#x轴方向边际图
g.ax_marg_x.hist(pd_iris['sepal length(cm)'], color='#01a2d9', alpha=1,bins=15)

#y轴方向绘制箱图
g.ax_marg_y.boxplot(pd_iris['sepal width(cm)'],boxprops={'color':'r',})
plt.show()


#每个边际图是一个matplotlib.axes._subplots.AxesSubplot对象,可自由发挥绘制想要的图
g = sns.JointGrid(x='sepal length(cm)', y='sepal width(cm)', data=pd_iris, space=0)
g.fig.set_size_inches(10,8)
g = g.plot_joint(sns.scatterplot, color='g',marker='$\clubsuit,s=340)
#x轴方向边际图
g.ax_marg_x.hist(pd_iris['sepal length(cm)'], color='#01a2d9', alpha=1,bins=15)

#y轴方向绘制箱图
g.ax_marg_y.boxplot(pd_iris['sepal width(cm)'],boxprops={'color':'r',})
plt.show()

python所有变量分布图 python变量分布图怎么画_Python_16