读取Excel中的两列数据

在实际工作中,经常会遇到需要从Excel表格中读取数据的情况。有时候我们只需要读取其中的两列数据,然后对这两列数据进行处理或分析。本文将介绍如何使用Python读取Excel表格中的两列数据,并提供一个示例来解决一个实际问题。

准备工作

在开始之前,我们需要安装一个Python库 pandas 来处理Excel数据。你可以使用以下命令安装 pandas

pip install pandas

读取Excel表格数据

假设我们有一个名为 data.xlsx 的Excel表格,其中包含两列数据: 姓名年龄。我们想要读取这两列数据并进行处理。

首先,我们需要导入 pandas 库,并使用 read_excel 函数读取Excel表格中的数据:

import pandas as pd

data = pd.read_excel('data.xlsx')

接下来,我们可以使用 data 变量来访问表格中的数据。我们可以使用 head() 方法来查看前几行数据:

print(data.head())

提取两列数据

假设我们想要提取 姓名年龄 这两列数据,并将它们保存在两个单独的变量中。我们可以使用以下代码来实现这一步骤:

names = data['姓名']
ages = data['年龄']

现在,names 变量将包含所有 姓名 列的数据,ages 变量将包含所有 年龄 列的数据。

示例:计算平均年龄

假设我们有一个包含员工姓名和年龄的Excel表格,我们想要计算所有员工的平均年龄。我们可以使用上述方法来提取 姓名年龄 列的数据,然后计算平均年龄。

以下是完整的示例代码:

import pandas as pd

data = pd.read_excel('employees.xlsx')

names = data['姓名']
ages = data['年龄']

average_age = ages.mean()

print(f"所有员工的平均年龄为:{average_age}")

这段代码将计算表格中所有员工的平均年龄,并输出结果。

关系图

下面是Excel表格中的两列数据的关系图示例:

erDiagram
    CUSTOMER {
        string 姓名
        int 年龄
    }

总结

通过本文的介绍,我们学习了如何使用Python读取Excel表格中的两列数据,并提供了一个示例来解决一个实际问题。使用 pandas 库可以轻松地处理Excel表格数据,提取所需的信息并进行进一步的计算或分析。希望本文对你有所帮助!