文章目录
- 2.1.1 判断各字段中是否存在缺失值 isnull().any/all(axis=0)
- 2.1.2 判断数据行中是否存在缺失值 isnull().any/all(axis=1)
- 2.1.2 定位到缺失值所在行 data.loc[data.isnull.any(axis=1)
- 2.1.3 统计各字段中缺失值的数量 data.isnull().sum(axis=0)
- 2.2.1 直接删除空值数据所在行 dropna(axis=0)
- 2.2.2 定义缺失值为0 fillna(0,inplace=False)
- 2.2.3 填充法 --- (中位数、平均值...) fillna(value={'?':data['?'].mean(), '?':data['?'].mode()[0]},inplace=False)
1.读取数据
2.数据清洗和预处理
2.1 查找空值
2.1.1 判断各字段中是否存在缺失值 isnull().any/all(axis=0)
2.1.2 判断数据行中是否存在缺失值 isnull().any/all(axis=1)
2.1.2 定位到缺失值所在行 data.loc[data.isnull.any(axis=1)
2.1.3 统计各字段中缺失值的数量 data.isnull().sum(axis=0)
2.2.处理空值
2.2.1 直接删除空值数据所在行 dropna(axis=0)
- 这里数据集不能够使用删除行来做,仅展示效果!
2.2.2 定义缺失值为0 fillna(0,inplace=False)
2.2.3 填充法 — (中位数、平均值…) fillna(value={‘?’:data[‘?’].mean(), ‘?’:data[‘?’].mode()[0]},inplace=False)