我们在进行数据处理时,有时需要将多个Excel的相同sheet合并到一起(注意:sheet名需相同),例如
合并后的效果:
Python代码如下:
import pandas as pd
import os
# 需要合并的Excel文件路径
input_dir = os.path.join(os.getcwd(), 'C:/Users/admin/Desktop/文件夹名')
# 输出的Excel文件路
output_dir = os.path.join(os.getcwd(), 'C:/Users/admin/Desktop')
# 如果输出目录不存在,则创建
if not os.path.exists(output_dir):
os.makedirs(output_dir)
# 获取所有需要合并的Excel文件名
input_files = [os.path.join(input_dir, f) for f in os.listdir(input_dir) if
f.endswith('.xlsx')]
# 遍历每个Excel文件,并获取其中所有的Sheet
sheets = []
for file in input_files:
xl = pd.ExcelFile(file)
sheets += xl.sheet_names
# 定义输出的Excel文件名
output_file = os.path.join(output_dir, 'merged.xlsx')
# 定义一个字典,用于存储每个Sheet的数据
data = {}
# 遍历每个Excel文件和其中的每个Sheet,并将它们合并
for file in input_files:
xl = pd.ExcelFile(file)
for sheet_name in xl.sheet_names:
sheet_data = xl.parse(sheet_name)
if sheet_name in data:
data[sheet_name] = pd.concat([data[sheet_name], sheet_data],
ignore_index=True)
else:
data[sheet_name] = sheet_data
# 将合并后的每个Sheet数据写入输出的Excel文件中对应的Sheet
writer = pd.ExcelWriter(output_file)
for sheet_name in sheets:
if sheet_name in data:
data[sheet_name].to_excel(writer, sheet_name=sheet_name, index=False)
writer.close()