python dateframe 数量

原创

mob64ca12d61d6b 2023-09-23 00:52:43 ©著作权

文章标签 饼状图 python 统计分析 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12d61d6b的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python DataFrame 数量

介绍

在数据分析和处理中，Pandas 是一个重要的 Python 库。Pandas 提供了一个名为 DataFrame 的数据结构，用于处理二维表格数据。DataFrame 可以被认为是传统的电子表格或 SQL 表的等效物。

本文将介绍如何使用 Pandas DataFrame 进行数量的计算和统计分析，并通过代码示例演示。

创建 DataFrame

在开始之前，我们首先需要创建一个 DataFrame 对象。DataFrame 可以从多种数据源创建，包括列表、字典、CSV 文件等。下面的示例展示了如何从字典创建一个 DataFrame。

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'Alice'],
        'Age': [25, 30, 18, 22],
        'City': ['New York', 'Paris', 'London', 'Sydney']}
df = pd.DataFrame(data)

上述代码创建了一个包含姓名、年龄和城市信息的 DataFrame。其中字典的键（Name、Age、City）对应 DataFrame 的列名，而字典的值则对应每一列的数据。

统计数量

一旦有了 DataFrame，我们就可以开始进行数量的计算和统计分析。

统计列数量

首先，我们可以使用 len() 函数来统计 DataFrame 中的列数量。例如，上述示例中的 DataFrame 包含三列，可以使用以下代码进行统计：

num_columns = len(df.columns)
print("列数量:", num_columns)

输出结果为 3，即 DataFrame 中有 3 列。

统计行数量

要统计 DataFrame 中的行数量，可以使用 len() 函数结合 df.index 属性。示例如下：

num_rows = len(df.index)
print("行数量:", num_rows)

输出结果为 4，即 DataFrame 中有 4 行。

统计某一列值的数量

有时候我们需要了解某一列中每个值的数量。Pandas 提供了 value_counts() 方法来计算某一列中每个值的出现次数。例如，我们可以统计名字出现的次数：

name_counts = df['Name'].value_counts()
print(name_counts)

输出结果为：

John     1
Nick     1
Alice    1
Tom      1
Name: Name, dtype: int64

这意味着名字 John、Nick、Alice 和 Tom 每个出现了一次。

绘制饼状图

为了更好地展示数量统计的结果，我们可以使用饼状图来可视化数据。在本文中，我们将使用 Matplotlib 库来绘制饼状图。

首先，我们需要安装 Matplotlib：

pip install matplotlib

然后，我们可以使用以下代码绘制名字的饼状图：

import matplotlib.pyplot as plt

# 统计名字出现的次数
name_counts = df['Name'].value_counts()

# 绘制饼状图
plt.pie(name_counts, labels=name_counts.index, autopct='%1.1f%%')
plt.axis('equal')
plt.title('名字分布')
plt.show()

上述代码中，plt.pie() 函数接受一个包含数量统计结果的列表，并使用 labels 参数传入每个值的标签。autopct 参数用于显示每个扇形的百分比数值。plt.axis('equal') 用于保持饼状图的圆形。plt.title() 用于添加图表标题。最后，使用 plt.show() 函数显示图表。

运行上述代码，将会显示一个名字分布的饼状图。