还在用Excel的vlookup?Python几行代码就能搞定,还可以指定输出顺序。


VLOOKUP函数是Excel中的一个纵向查找函数,功能是按列查找,最终返回该列所需查询序列所对应的值。


 然而这样的功能在Excel有点复杂,很多人往往记不住怎么做,本文使用Python的Pandas几行代码就能搞定,还可以按指定的列进行输出。


背景:

  1. 有两个excel,他们有相同的一个列; 

  2. 按照这个列合并成一个大的excel,即vlookup功能,要求:

  • 只需要第二个excel的少量的列,比如从40个列中挑选2个列  

  • 新增的来自第二个excel的列需要放到第一个excel指定的列后面; 

将结果输出到一个新的excel;

输入表格1-学生成绩表:

还在用Excel的vlookup?Python几行代码就能搞定!_java


输入表格2-学生信息表:

还在用Excel的vlookup?Python几行代码就能搞定!_java_02


输出表格:按学号列实现了vlookup,并且在指定列后面输出:

还在用Excel的vlookup?Python几行代码就能搞定!_java_03

步骤1:读取两个数据表

import pandas as pd
# 学生成绩表
df_grade = pd.read_excel("./course_datas/c23_excel_vlookup/学生成绩表.xlsx"
df_grade.head()

还在用Excel的vlookup?Python几行代码就能搞定!_java_04


# 学生信息表
df_sinfo = pd.read_excel("./course_datas/c23_excel_vlookup/学生信息表.xlsx"
df_sinfo.head()

还在用Excel的vlookup?Python几行代码就能搞定!_java_05


目标:怎样将第二个“学生信息表”的姓名、性别两列,添加到第一个表“学生成绩表”,并且放在第一个表的“学号”列后面?

步骤2:实现两个表的关联

即excel的vloopup功能

# 只筛选第二个表的少量的列
df_sinfo = df_sinfo[["学号""姓名""性别"]]
df_sinfo.head()

还在用Excel的vlookup?Python几行代码就能搞定!_java_06


df_merge = pd.merge(left=df_grade, right=df_sinfo, left_on="学号", right_on="学号")
df_merge.head()

还在用Excel的vlookup?Python几行代码就能搞定!_java_07


步骤3:调整列的顺序

df_merge.columns

问题:怎样将'姓名', '性别'两列,放到'学号'的后面?

接下来需要用Python的语法实现列表的处理

# 将columns变成python的列表形式
new_columns = df_merge.columns.to_list()
new_columns

还在用Excel的vlookup?Python几行代码就能搞定!_java_08


# 按逆序insert,会将"姓名","性别"放到"学号"的后面
for name in ["姓名""性别"][::-1]:
    new_columns.remove(name)
    new_columns.insert(new_columns.index("学号")+1, name)
new_columns

还在用Excel的vlookup?Python几行代码就能搞定!_java_09


df_merge = df_merge.reindex(columns=new_columns)
df_merge.head()

还在用Excel的vlookup?Python几行代码就能搞定!_java_10


步骤4:输出最终的Excel文件

df_merge.to_excel("./course_datas/c23_excel_vlookup/合并后的数据表.xl