python循环统计dateframe某一列并把不同行放入新的dateframe

原创

mob64ca12f8da8d 2024-04-27 04:11:24 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12f8da8d的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python循环统计DateFrame某一列并把不同行放入新的DateFrame

在数据分析和处理中，我们经常会使用pandas库来处理数据。在实际操作中，有时候我们需要对数据进行循环统计，并根据某一列的数值将不同行放入新的DateFrame中。本文将介绍如何使用Python中的pandas库来实现这一功能。

pandas简介

pandas是一个开源的数据分析库，提供了快速、强大、灵活和易于使用的数据结构，用于数据操作和数据分析。pandas主要提供了两种数据结构：Series和DataFrame。其中，DataFrame是pandas中最重要的数据结构，类似于Excel表格，可以存储不同类型的数据，并且具有行和列的索引。

示例

假设我们有一个包含学生姓名、年龄和成绩的数据集，现在我们要对这个数据集进行循环统计，并根据成绩将不同行放入新的DataFrame中。下面是一个示例代码：

import pandas as pd

# 创建DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
    'Age': [20, 21, 22, 23, 24],
    'Score': [85, 90, 75, 80, 95]
}

df = pd.DataFrame(data)

# 创建空的DataFrame用于存放不同成绩的行
new_df = pd.DataFrame(columns=['Name', 'Age', 'Score'])

# 循环统计并放入新的DataFrame
for score in df['Score'].unique():
    subset = df[df['Score'] == score]
    new_df = pd.concat([new_df, subset])

print(new_df)

在这段代码中，我们首先创建了一个包含学生姓名、年龄和成绩的DataFrame。然后我们创建了一个空的DataFramenew_df，用于存放不同成绩的行。接着我们使用unique()方法获取成绩列中的唯一值，然后通过循环将对应成绩的行放入new_df中。最后我们打印出结果。

类图

下面是本文示例中涉及的类的简单类图：

classDiagram
    class DataFrame {
        - data
        + DataFrame()
        + unique()
        + concat()
    }
    class Series {
        - data
        + Series()
    }

在类图中，我们定义了DataFrame和Series类，DataFrame类包含data属性以及DataFrame()、unique()和concat()方法，而Series类只包含data属性和Series()方法。