ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

目录

​基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例​

​# 1、定义数据集​

​# 2、数据预处理​

​# 2.1、类别特征编码​

​# 2.2、特征筛选且空值填充​

​# 3、模型训练与推理​

​# 3.1、数据集切分​

​# 3.2、模型训练​

​# 4、PDP实现模型可解释性​

​4.1、Sex_encoding可视化​

​# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息​

​# (2)、绘制跨不同特征值(特征网格)的模型预测分布​

​# (3)、计算并绘制PDP图解释模型预测​

​4.2、Pclass可视化​


相关文章
ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例实现

基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# 1、定义数据集

PassengerId

Survived

Pclass

Name

Sex

Age

SibSp

Parch

Ticket

Fare

Cabin

Embarked

1

0

3

Braund, Mr. Owen Harris

male

22

1

0

A/5 21171

7.25

S

2

1

1

Cumings, Mrs. John Bradley (Florence Briggs Thayer)

female

38

1

0

PC 17599

71.2833

C85

C

3

1

3

Heikkinen, Miss. Laina

female

26

0

0

STON/O2. 3101282

7.925

S

4

1

1

Futrelle, Mrs. Jacques Heath (Lily May Peel)

female

35

1

0

113803

53.1

C123

S

5

0

3

Allen, Mr. William Henry

male

35

0

0

373450

8.05

S

# 2、数据预处理

# 2.1、类别特征编码

# 2.2、特征筛选且空值填充

   Pclass   Age  SibSp  Parch     Fare  Sex_encoding  Embarked_encoding  \
0       3  22.0      1      0   7.2500             1                  0   
1       1  38.0      1      0  71.2833             0                  1   
2       3  26.0      0      0   7.9250             0                  0   
3       1  35.0      1      0  53.1000             0                  0   
4       3  35.0      0      0   8.0500             1                  0   

   Survived  
0         0  
1         1  
2         1  
3         1  
4         0  

# 3、模型训练与推理

# 3.1、数据集切分

# 3.2、模型训练

# 4、PDP实现模型可解释性

4.1、Sex_encoding可视化

# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_PDP

# (2)、绘制跨不同特征值(特征网格)的模型预测分布

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_titanic_02

# (3)、计算并绘制PDP图解释模型预测

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_依赖图_03

4.2、Pclass可视化

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_titanic_04

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_二分类_05

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例_titanic_06