删除空值:dropna( )

dropna 函数默认删除所有出现空值的行,即只要一行中任意一个字段为空,就会被删除。我们可以设置 subset 参数,例如 dropna(subset = ['city']),来指定当 一行中的 city 字段为空时,才会被删除。

 

去重:drop_duplicates   默认删除完全重复的行

如果要删除指定列重复的数据,用subset参数来实现。

 

例:基于‘流量级别’这列进行去重

df.drop—duplicates(subset = , 瀵 量 缗 J' ) 
流 星 趿 别 投 放 地 区 
A 区 
A 区 
访 客 数 支 付 抟 化 率 
0 
0 
44300 
45D5g 
0 的 178 
01 [ 巧 5 
01 芟 6 
客 輦 价 
.79 
87 . 40 
. 11 
支 付 金 
3 〔 巧 387 . 33 
2711 . 23 
554 t22