有时候经过某些操作后生成的DataFrame的列名称是默认的,为了列名标记已与理解,有时候我们会有修改列名称的需求。提供修改列名的方法如下:
假如有初始的DataFrame如下

>>>import pandas as pd
>>>a = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})
>>> a 
   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9

方法一:暴力方法

>>>a.columns = ['a','b','c']
>>>a
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

使用该方法有一个缺点,就是必须把所有的列名都写上,否则程序异常。

 

方法二:推荐的方法

>>>a.rename(columns={'A':'a', 'B':'b', 'C':'c'}, inplace = True)
>>>a
   a  b  c
0  1  4  7
1  2  5  8
2  3  6  9

使用rename函数可以只修改特定列的名称,不需要修改的则不用管。

>>>a.rename(columns={'A':'a', 'C':'c'}, inplace = True) #inplace的意思是在原DataFrame上完成
>>>a
   a  B  c
0  1  4  7
1  2  5  8
2  3  6  9

可以只修改A,C两列的名称,而不修改B。