python关于dataframe操作

原创

mob649e8155edc4 2024-08-29 07:19:56 ©著作权

文章标签 数据 python Python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e8155edc4的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python中的DataFrame操作

Python是一种强大的编程语言，尤其是在数据科学和数据分析领域，其中Pandas库为数据处理提供了极大的便利。Pandas中最重要的结构是DataFrame，它是一种二维标记数据结构，可以方便地进行数据的操作与分析。下面我们将探讨如何在Python中使用DataFrame进行常见的操作。

创建DataFrame

首先，我们需要创建一个DataFrame。我们可以用Python字典或从CSV文件读取数据来创建。

import pandas as pd

# 从字典创建DataFrame
data = {
    '姓名': ['Alice', 'Bob', 'Charlie'],
    '年龄': [24, 30, 22],
    '城市': ['北京', '上海', '广州']
}

df = pd.DataFrame(data)
print(df)

输出结果为：

      姓名  年龄   城市
0   Alice  24   北京
1     Bob  30   上海
2  Charlie  22   广州

查看数据

一旦我们拥有了DataFrame，我们可以使用.head()方法查看前几行数据：

print(df.head(2))  # 查看前两行

输出结果为：

    姓名  年龄   城市
0  Alice  24   北京
1    Bob  30   上海

数据选择与过滤

我们可以通过列名或行号轻松选择数据。例如，要选择“姓名”这一列，可以使用以下代码：

names = df['姓名']
print(names)

要过滤出年龄大于25岁的人，我们可以使用以下代码：

filtered_df = df[df['年龄'] > 25]
print(filtered_df)

输出结果为：

    姓名  年龄   城市
1  Bob  30   上海

数据修改

如果我们希望修改某一列的数据，可以直接通过列名进行赋值。例如，假设我们想要将Alice的年龄改为25岁：

df.loc[0, '年龄'] = 25
print(df)

输出结果为：

      姓名  年龄   城市
0   Alice  25   北京
1     Bob  30   上海
2  Charlie  22   广州

添加与删除列

可以通过简单的赋值来添加新列。例如，假设我们添加一个新列“性别”：

df['性别'] = ['女', '男', '男']
print(df)

输出结果为：

      姓名  年龄   城市 性别
0   Alice  25   北京  女
1     Bob  30   上海  男
2  Charlie  22   广州  男

要删除某一列，则可使用.drop()方法：

df = df.drop('性别', axis=1)
print(df)

输出结果为：

      姓名  年龄   城市
0   Alice  25   北京
1     Bob  30   上海
2  Charlie  22   广州

总结

Pandas的DataFrame是处理数据的强大工具，它提供了丰富的方法来创建、查看、选择、修改、添加和删除数据。掌握这些基本操作可以极大地方便我们进行数据分析与科学计算。无论是通过表格形式展示数据，还是快速筛选、修改数据，Pandas都能高效地完成。希望这篇文章能帮助你更好地理解和使用Python中的DataFrame操作。