python数据分析可视化实例

原创

mob64ca12d1e6a9 2023-08-30 11:05:35 ©著作权

文章标签 数据分析数组 Python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12d1e6a9的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python数据分析可视化实例

数据分析和可视化是现代数据科学中非常重要的一环。Python作为一种强大的编程语言，有着丰富的数据分析和可视化工具。本文将介绍一些常用的Python数据分析和可视化库，并给出相关实例代码。

数据分析库

Python有许多优秀的数据分析库，其中最受欢迎的是Pandas和NumPy。

Pandas

Pandas是一个强大的数据分析库，它提供了数据结构和数据分析工具，使得数据处理变得简单而高效。下面是一个使用Pandas进行数据分析的示例：

import pandas as pd

# 读取数据文件
data = pd.read_csv('data.csv')

# 查看前5行数据
print(data.head())

# 查看数据统计信息
print(data.describe())

# 筛选数据
filtered_data = data[data['age'] > 30]

# 分组统计
grouped_data = filtered_data.groupby('gender').mean()

# 保存结果
grouped_data.to_csv('result.csv')

以上代码首先使用read_csv函数读取名为data.csv的数据文件，然后使用head函数查看数据的前5行，使用describe函数查看数据的统计信息。接着，我们使用data['age'] > 30筛选出年龄大于30的数据，并将结果保存到filtered_data中。最后，我们使用groupby函数对性别进行分组统计，并使用mean函数计算每个组的平均值，结果保存到grouped_data中，最终将结果保存到result.csv文件中。

NumPy

NumPy是Python中的数值计算库，提供了多维数组对象和许多用于数组操作的函数。下面是一个使用NumPy进行数据分析的示例：

import numpy as np

# 创建一个一维数组
data = np.array([1, 2, 3, 4, 5])

# 计算数组的平均值
mean = np.mean(data)

# 计算数组的标准差
std = np.std(data)

# 计算数组的累计和
cum_sum = np.cumsum(data)

# 打印结果
print('Mean:', mean)
print('Std:', std)
print('Cumulative Sum:', cum_sum)

以上代码首先使用array函数创建一个一维数组data，然后使用mean函数计算数组的平均值，使用std函数计算数组的标准差，使用cumsum函数计算数组的累计和。最后，打印出计算结果。

数据可视化库

Python有多个强大的数据可视化库，其中最流行的是Matplotlib和Seaborn。

Matplotlib

Matplotlib是一个灵活的绘图库，提供了各种绘图功能，从简单的折线图到复杂的统计图表。下面是一个使用Matplotlib绘制折线图的示例：

import matplotlib.pyplot as plt

# 创建x和y数据
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

# 绘制折线图
plt.plot(x, y)

# 添加标题和标签
plt.title('Line Plot')
plt.xlabel('x')
plt.ylabel('y')

# 显示图表
plt.show()

以上代码首先创建了一组x和y数据，然后使用plot函数绘制折线图。接着，使用title、xlabel和ylabel函数添加标题和标签。最后，使用show函数显示图表。

Seaborn

Seaborn是一个基于Matplotlib的统计数据可视化库，提供了更高级和更美观的图表。下面是一个使用Seaborn绘制直方图的示例：

import seaborn as sns

# 创建一组随机数据
data = np.random.randn(1000)

# 绘制直方图
sns.histplot(data)

# 添加标题和标签
plt.title('Histogram')
plt.xlabel('Value')
plt.ylabel('Frequency')

# 显示图表
plt.show()

以上代码首先使用random.randn函数创建了一组随机数据，然后使用histplot函数绘制直