Pandas 之布尔索引

回到之前狗的名字的问题上, 假如我们想找到所有的使用次数超过 80 次的狗狗名字,应该怎么选择?

机器学习 第四节 第七课_数据

执行结果:

机器学习 第四节 第七课_数据_02

机器学习 第四节 第七课_数据_03

缺失数据的处理

对于 NaN 的数据, 在 numpy 中我们是如何处理的?

在 pandas 中我们处理起来非常容易

判断数据是否为 NaN

机器学习 第四节 第七课_数据_04

执行结果:

机器学习 第四节 第七课_数据_05

处理 NaN 数据

删除 NaN 所在行

机器学习 第四节 第七课_数据_06

执行结果:

机器学习 第四节 第七课_数据_07

填充数据

机器学习 第四节 第七课_数据_08

执行结果:

机器学习 第四节 第七课_数据_09

处理为 0 的数据

机器学习 第四节 第七课_数据_10

执行结果:

机器学习 第四节 第七课_数据_11

注: 当然不是每次为 0 的数据都需要处理

计算平均值等情况下, nan 是不参与计算的, 但是 0 会