将一个工作簿中的多个工作表合并到一个新工作簿 Python

在日常工作中,我们经常需要处理Excel文件。Excel文件通常由多个工作表组成,每个工作表包含不同的数据。有时,我们需要将这些数据合并到一个新的工作表或新的工作簿中以便进一步分析和处理。本文将介绍如何使用Python将一个工作簿中的多个工作表合并到一个新工作簿中。

准备工作

在开始之前,我们需要安装一个非常实用的Python库——pandas。Pandas是一个强大的数据处理库,它提供了丰富的函数和方法来处理和分析数据。我们可以使用以下命令来安装pandas:

pip install pandas

安装完成后,我们还需要安装一个可选的库openpyxl。Openpyxl是一个用于读写Excel文件的库,它是pandas的一个依赖项。我们可以使用以下命令来安装openpyxl:

pip install openpyxl

一旦我们完成了这些准备工作,我们就可以开始合并工作簿中的工作表了。

合并工作表

首先,我们需要导入必要的库:

import pandas as pd

然后,我们需要使用pandas的read_excel()函数来读取源工作簿。该函数接受一个Excel文件的路径作为参数,并返回一个包含所有工作表的字典:

workbook = pd.read_excel('path/to/workbook.xlsx', sheet_name=None)

sheet_name=None将读取所有的工作表。如果我们只想读取特定的工作表,可以将工作表名称或索引作为参数传递给sheet_name

接下来,我们可以使用pandas的concat()函数来将所有工作表合并为一个数据框:

merged_data = pd.concat(workbook.values(), ignore_index=True)

merged_data是一个包含所有工作表数据的数据框。ignore_index=True将重新索引数据框,以确保所有数据的索引是唯一的。

最后,我们可以使用pandas的to_excel()函数将合并后的数据保存到一个新的工作簿中:

merged_data.to_excel('path/to/merged_workbook.xlsx', index=False)

to_excel()函数接受一个文件路径作为参数,并将数据框保存为Excel文件。index=False将忽略数据框的索引。

示例

假设我们有一个名为workbook.xlsx的工作簿,其中包含三个工作表:Sheet1Sheet2Sheet3。每个工作表包含以下数据:

Sheet1:

Name Age Gender
Alice 25 Female
Bob 30 Male
Carol 35 Female

Sheet2:

Name Age Gender
David 40 Male
Emma 45 Female
Frank 50 Male

Sheet3:

Name Age Gender
Grace 55 Female
Henry 60 Male
Iris 65 Female

我们可以使用以下代码将这些工作表合并到一个新的工作簿中:

import pandas as pd

# 读取源工作簿
workbook = pd.read_excel('workbook.xlsx', sheet_name=None)

# 合并工作表
merged_data = pd.concat(workbook.values(), ignore_index=True)

# 保存合并后的数据到新的工作簿
merged_data.to_excel('merged_workbook.xlsx', index=False)

运行上述代码后,我们将得到一个名为merged_workbook.xlsx的新工作簿,其中包含合并后的数据。

总结

本文介绍了如何使用Python将一个工作簿中的多个工作表合并到一个新的工作簿中。我们使用了pandas库来读取和处理Excel文件,以及将多个工作表合并为一个数据框。然后,我们使用了pandas的to_excel()函数