python 索引dataframe中的行

原创

mob64ca12edea6e 2023-12-23 05:15:56 ©著作权

文章标签 数据 Python python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12edea6e的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python索引DataFrame中的行

在数据分析和机器学习中，我们经常需要对数据进行筛选和提取，以便进行进一步的处理和分析。而对于使用Python进行数据处理的用户来说，pandas库是一个非常强大和常用的工具。

pandas是一个用于数据分析和处理的Python库，它提供了DataFrame这个数据结构，可以方便地处理和分析结构化数据。DataFrame类似于Excel中的表格，由行和列组成，可以进行灵活的数据索引和切片操作。

那么如何在Python中索引DataFrame中的行呢？接下来我们将通过几个示例来介绍。

创建DataFrame

首先，我们需要导入pandas库，并创建一个DataFrame对象来演示操作。

import pandas as pd

# 创建一个字典，包含姓名、年龄和性别三列数据
data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '年龄': [20, 25, 30, 35],
        '性别': ['男', '女', '男', '女']}

# 将字典转换为DataFrame
df = pd.DataFrame(data)

print(df)

上述代码中，我们创建了一个字典data，包含了姓名、年龄和性别三列数据。然后，通过pd.DataFrame()方法将字典转换为DataFrame对象，并赋值给变量df。最后，我们使用print()函数输出DataFrame的内容。

通过索引获取行

DataFrame对象有一个默认的索引，从0开始递增。我们可以通过iloc[]方法按照索引获取行数据。

# 通过索引获取第一行数据
row = df.iloc[0]

print(row)

上述代码中，我们使用iloc[0]获取了第一行数据，并将其赋值给变量row。最后，我们使用print()函数输出了这一行的内容。

通过条件筛选行

除了通过索引获取行，我们还可以通过条件筛选行。pandas提供了loc[]方法来实现这个功能。

# 筛选年龄大于等于30的行
rows = df.loc[df['年龄'] >= 30]

print(rows)

上述代码中，我们使用df['年龄'] >= 30来生成一个布尔型的Series，表示年龄是否大于等于30。然后，我们将这个Series传入loc[]方法中，得到一个包含筛选结果的DataFrame。最后，我们使用print()函数输出了筛选结果。

通过多个条件筛选行

如果我们需要同时满足多个条件来筛选行，可以使用逻辑运算符&和|来组合条件。

# 筛选性别为男且年龄大于等于25的行
rows = df.loc[(df['性别'] == '男') & (df['年龄'] >= 25)]

print(rows)

上述代码中，我们使用df['性别'] == '男'和df['年龄'] >= 25分别生成两个布尔型的Series，表示性别为男和年龄大于等于25。然后，我们使用逻辑运算符&将两个条件合并，并将结果传入loc[]方法中，得到一个包含筛选结果的DataFrame。最后，我们使用print()函数输出了筛选结果。