有时候经过某些操作后生成的DataFrame的列名称是默认的,为了列名标记已与理解,有时候我们会有修改列名称的需求。提供修改列名的方法如下:
假如有初始的DataFrame如下
>>>import pandas as pd
>>>a = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})
>>> a
A B C
0 1 4 7
1 2 5 8
2 3 6 9
方法一:暴力方法
>>>a.columns = ['a','b','c']
>>>a
a b c
0 1 4 7
1 2 5 8
2 3 6 9
- 1
- 2
- 3
- 4
- 5
- 6
使用该方法有一个缺点,就是必须把所有的列名都写上,否则程序异常。
方法二:推荐的方法
>>>a.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)
>>>a
a b c
0 1 4 7
1 2 5 8
2 3 6 9
使用rename函数可以只修改特定列的名称,不需要修改的则不用管。
>>>a.rename(columns={'A':'a', 'C':'c'}, inplace = True) #inplace的意思是在原DataFrame上完成
>>>a
a B c
0 1 4 7
1 2 5 8
2 3 6 9
可以只修改A,C两列的名称,而不修改B。