python的 dropna python的dropna函数

转载

mob6454cc73e9a6 2023-05-31 16:13:31

文章标签 python的 dropna 缺失值数据原始数据 文章分类 Python 后端开发

一、介绍

pd.dropna() 函数主要用于删除缺失数据。

Series 返回一个仅包含非空数据和索引的 Series，默认丢弃含有缺失值的行
DataFrame 可以通过参数更详细的删除行数据

使用语法：

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数解释：

axis=0 删除含有缺失值的行 axis=1 删除列
how=all、any all表示删除全是缺失值的行、any表示任意一个缺失值
thresh=n 表示保留至少含有n个非缺失值的行
subset 定义查找的列
inplace 是否在原始数据框中修改数据

二、实操

0.构建测试数据集

import pandas as pd
import numpy as np

df = pd.DataFrame({'Name':['A','B','C'],
                   'Toy':[np.nan, 'Bat','Bull'],
                   'Born':[pd.NaT, pd.Timestamp('1992-12-12'), pd.NaT]})
'''
  Name   Toy       Born
0    A   NaN        NaT
1    B   Bat 1992-12-12
2    C  Bull        NaT
'''

1.axis 删除行列

axis=0 或者 axis='index' 表示删除含有缺失值的行

axis=1 或者 axis='columns' 表示删除含有缺失值的列

# 默认删除
df.dropna()

# 按列删除
df.dropna(axis=1)

2.how 删除方式

how='all' 表示删除全是缺失值的行（列）
how='any' 表示删除只要有任意一个缺失值的行（列）

df.dropna(how='all') # 无变化

df.dropna(how='any') # 任意一个

3.thresh=n 保留至少含有n个非NA值

df.dropna(thresh=2)
'''
  Name   Toy       Born
1    B   Bat 1992-12-12
2    C  Bull        NaT
'''

4.subset 定义列

df.dropna(subset=['Name','Born'])

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java获取屏幕上某坐标点的颜色 java输出坐标点

下一篇：java项目怎么变成软件 java项目转app

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python的 dropna python的dropna函数

python的 dropna python的dropna函数

一、介绍

二、实操

0.构建测试数据集

1.axis 删除行列

2.how 删除方式

3.thresh=n 保留至少含有n个非NA值

4.subset 定义列

51CTO博客