Python 读取多个CSV并合并成一个数据框

作为一名经验丰富的开发者,我很高兴能帮助你学习如何使用Python来读取多个CSV文件并将其合并成一个数据框。在本文中,我将详细介绍整个流程,并提供必要的代码示例和注释。

流程概述

首先,让我们通过一个表格来概述整个流程:

步骤 描述
1 导入必要的库
2 定义CSV文件列表
3 读取CSV文件并存储数据
4 合并数据框
5 检查合并后的数据框

步骤详解

步骤1:导入必要的库

在开始之前,我们需要导入Python中的pandas库,它提供了读取和处理CSV文件的功能。

import pandas as pd

步骤2:定义CSV文件列表

接下来,我们需要定义一个包含所有CSV文件路径的列表。假设我们有三个CSV文件:file1.csvfile2.csvfile3.csv

csv_files = ['file1.csv', 'file2.csv', 'file3.csv']

步骤3:读取CSV文件并存储数据

现在,我们将遍历CSV文件列表,逐个读取文件,并将数据存储在一个列表中。

data_frames = []
for file in csv_files:
    df = pd.read_csv(file)
    data_frames.append(df)

在这段代码中,我们使用pd.read_csv()函数读取每个CSV文件,并将结果存储在一个名为df的数据框中。然后,我们将这个数据框添加到data_frames列表中。

步骤4:合并数据框

一旦我们有了包含所有数据框的列表,我们可以使用pd.concat()函数将它们合并成一个单一的数据框。

merged_df = pd.concat(data_frames, ignore_index=True)

这里,我们使用pd.concat()函数将data_frames列表中的所有数据框合并成一个名为merged_df的新数据框。ignore_index=True参数确保在合并后的数据框中重新设置索引。

步骤5:检查合并后的数据框

最后,我们可以检查合并后的数据框,确保一切正常。

print(merged_df.head())

这将打印出合并后数据框的前几行,以便我们检查数据是否正确合并。

序列图

为了更好地理解整个过程,我们可以使用Mermaid语法创建一个序列图:

sequenceDiagram
    participant User as U
    participant Python as P
    participant CSV Files as F
    U->>P: Import pandas library
    U->>P: Define CSV file list
    U->>P: Read CSV files and store data
    U->>P: Merge data frames
    U->>P: Check merged data frame
    P->>F: Read each CSV file
    F->>P: Return data frame
    P->>P: Append data frame to list
    P->>P: Concatenate data frames
    P->>P: Print merged data frame

结语

通过本文,你应该已经学会了如何使用Python读取多个CSV文件并将其合并成一个数据框。这个过程包括导入必要的库、定义CSV文件列表、读取和存储数据、合并数据框以及检查合并后的数据框。希望这些信息对你有所帮助,祝你在Python编程之旅上一切顺利!