python unique 出现次数

原创

mob64ca12e5502a 2025-02-15 06:11:11 ©著作权

文章标签 Python 数据分析数据 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e5502a的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python中的唯一值及其出现次数

在数据分析和处理的过程中，了解数据的唯一值及其出现次数是一个非常重要的任务。Python作为一种强大的编程语言，提供了多种工具和库来帮助我们高效地实现这一目标。在本篇文章中，我们将探讨如何获取数据中唯一值的出现次数，并用代码示例进行说明。

使用Python获取唯一值及其出现次数

在Python中，最常用的数据处理库是Pandas。Pandas提供了非常方便的数据结构以及数据分析工具，使得分析工作变得更加简单。我们可以使用value_counts()方法来获取某一列中唯一值的出现次数。

示例代码

假设我们有一个包含学生姓名及其成绩的DataFrame，我们想要查看每个成绩的出现次数。以下是实现这一目标的代码示例：

import pandas as pd

# 创建示例数据
data = {
    '姓名': ['Alice', 'Bob', 'Alice', 'David', 'Bob', 'Charlie'],
    '成绩': [85, 90, 85, 75, 90, 80]
}

# 创建DataFrame
df = pd.DataFrame(data)

# 获取成绩的唯一值及其出现次数
成绩_counts = df['成绩'].value_counts()

# 输出结果
print(成绩_counts)

输出结果

运行上述代码后，我们可以得到类似如下的输出结果：

85    2
90    2
75    1
80    1
Name: 成绩, dtype: int64

从输出结果中，我们可以清晰地看到各个成绩的出现次数。

使用集合和字典

除了使用Pandas外，还可以使用内置的Python数据结构，例如集合和字典，来计算唯一值及其出现次数。以下是一个使用字典的示例：

# 使用列表存储成绩
成绩_list = [85, 90, 85, 75, 90, 80]

# 创建字典计数
成绩_counts_dict = {}

for 成绩 in 成绩_list:
    if 成绩 in 成绩_counts_dict:
        成绩_counts_dict[成绩] += 1
    else:
        成绩_counts_dict[成绩] = 1

# 输出结果
print(成绩_counts_dict)

输出结果

运行这段代码，你将得到如下输出：

{85: 2, 90: 2, 75: 1, 80: 1}

这样的方式在处理小规模数据时也是非常有效的。

旅行图示意

在数据分析的旅程中，我们可能会经过以下几个阶段：

journey
    title 数据处理旅程
    section 数据准备
      数据收集: 5: 数据科学家, 5: 系统架构师
      数据清洗: 4: 数据清洗员, 3: 数据科学家
    section 数据分析
      唯一值计数: 5: 数据科学家, 4: 数据分析师
      可视化: 3: 数据可视化员, 4: 数据分析师