Python读取xlsx文件并查看行数

在数据分析和处理过程中,我们经常需要读取Excel文件中的数据。Python提供了多种库来读取和处理Excel文件,其中最常用的是pandas库。在本文中,我们将介绍如何使用pandas库读取xlsx文件,并查看文件中的行数。

准备工作

在开始之前,我们需要先安装pandas库。可以使用以下命令来进行安装:

pip install pandas

安装完成后,可以导入pandas库并开始编写代码。

读取xlsx文件

首先,我们需要导入pandas库:

import pandas as pd

然后,我们可以使用read_excel()函数来读取xlsx文件,并将其存储为一个DataFrame对象:

df = pd.read_excel('data.xlsx')

其中,data.xlsx是要读取的文件名。如果文件不在当前工作目录下,需要提供文件的完整路径。

查看行数

要查看文件中的行数,我们可以使用shape属性。shape属性返回一个元组,其中包含数据框的行数和列数。我们只需要取元组的第一个元素即可得到行数。

num_rows = df.shape[0]
print('文件中的行数为:', num_rows)

以上代码将打印出文件中的行数。

完整示例

import pandas as pd

# 读取xlsx文件
df = pd.read_excel('data.xlsx')

# 查看行数
num_rows = df.shape[0]
print('文件中的行数为:', num_rows)

示例数据

为了演示代码的运行效果,我们可以创建一个简单的xlsx文件。下面是一个包含10行数据的示例文件:

名称 年龄 性别
李明 18
张晓红 20
王刚 25
赵丽 22
刘强 30
陈静 28
杨华 24
徐霞 26
刘洋 29
王丽 27

将以上数据保存为data.xlsx文件,然后运行上述代码,即可得到文件中的行数。

结论

本文介绍了如何使用pandas库读取xlsx文件,并查看文件中的行数。通过read_excel()函数可以方便地读取xlsx文件,并将其存储为DataFrame对象。使用shape属性可以获得数据框的行数和列数。通过以上方法,我们可以轻松地处理Excel文件中的数据,并进行后续的分析和处理。

甘特图

gantt
    dateFormat  YYYY-MM-DD
    title       代码编写过程
    section 数据准备
    准备工作         :done, 2022-01-01, 1d
    创建示例数据    :done, 2022-01-02, 1d
    section 代码编写
    导入pandas库    :done, 2022-01-03, 1d
    读取xlsx文件    :done, 2022-01-04, 1d
    查看行数        :done, 2022-01-05, 1d
    section 测试与优化
    运行代码        :done, 2022-01-06, 1d
    优化代码        :done, 2022-01-07, 1d

饼状图

pie
    title 文件中的数据分布
    "男" : 5
    "女" : 5

以上是关于Python读取xlsx文件并查看行数的科普文章。通过pandas库,我们可以轻松地读取和处理Excel文件中的数据。通过以上代码示例,你现在已经掌握了如何读取xlsx文件并查看文件中的行数。