阿里云天池 Python训练营 Task10

原创

Python与SEO 2021-05-13 14:25:34 ©著作权

文章标签 Python教程 Python开发 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者Python与SEO的原创作品，请联系作者获取转载授权，否则将追究法律责任

阿里云天池 Python训练营 Task10

学习链接：
https://tianchi.aliyun.com/s/58327c15d1faee512c008128d3bb9e32
今日学习任务:
Task 4：宝可梦数据分析！
记录笔记:
学习完成之后，选择任意平台进行自我知识总结即可（今天学到了什么将来可能需要复习的知识点，用笔记来方便自己复习）知乎、CSDN、Github等。（如果对记笔记有疑惑，欢迎讨论）

Pandas, Seaborn, Matplotlib库安装

pip install matplotlib -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip install seaborn -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
pip install pandas -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

阿里云天池 Python训练营 Task10_Python教程

读取数据

df.info() 能够给我们更加详细的每个列的信息

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
df.info()

阿里云天池 Python训练营 Task10_Python教程_03

计算出每个特征有多少百分比是缺失的

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
percent_missing = df.isnull().sum() * 100 / len(df)
missing_value_df = pd.DataFrame({
    'column_name': df.columns,
    'percent_missing': percent_missing
})
# 查看Top10缺失的
missing_value_df.sort_values(by='percent_missing', ascending=False).head(10)

plt.show()

阿里云天池 Python训练营 Task10_Python开发_04

查看各代口袋妖怪的数量

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
df['generation'].value_counts().plot.bar()
plt.show()

plt.show()

阿里云天池 Python训练营 Task10_Python开发_05

查看每个系口袋妖怪的数量

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
df['type1'].value_counts().sort_values(ascending=True).plot.barh()
plt.show()

plt.show()

阿里云天池 Python训练营 Task10_Python开发_06

从宝可梦在实战中的角度来分析这组数据

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
#从宝可梦在实战中的角度来分析这组数据
interested = ['hp','attack','defense','sp_attack','sp_defense','speed']
sns.pairplot(df[interested])
plt.show()

plt.show()

阿里云天池 Python训练营 Task10_Python教程_07

通过相关性分析heatmap分析五个基础属性

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
# 通过相关性分析heatmap分析五个基础属性
interested = ['hp','attack','defense','sp_attack','sp_defense','speed']
plt.subplots(figsize=(10,8))
ax = plt.axes()
ax.set_title("Correlation Heatmap")
corr = df[interested].corr()
sns.heatmap(corr,
            xticklabels=corr.columns.values,
            yticklabels=corr.columns.values,
            annot=True, fmt="f",cmap="YlGnBu")
plt.show()

阿里云天池 Python训练营 Task10_Python教程_08

种族值分布

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
#选取平民神兽
interested = ['hp','attack','defense','sp_attack','sp_defense','speed']
for c in interested:
    df[c] = df[c].astype(float)
df = df.assign(total_stats = df[interested].sum(axis=1))
# 种族值分布
total_stats = df.total_stats
plt.hist(total_stats,bins=35)
plt.xlabel('total_stats')
plt.ylabel('Frequency')
plt.show()

阿里云天池 Python训练营 Task10_Python开发_09

不同属性的种族值分布

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
#选取平民神兽
interested = ['hp','attack','defense','sp_attack','sp_defense','speed']
for c in interested:
    df[c] = df[c].astype(float)
df = df.assign(total_stats = df[interested].sum(axis=1))
# 种族值分布
total_stats = df.total_stats
# 不同属性的种族值分布
plt.subplots(figsize=(20,12))
ax = sns.violinplot(x="type1", y="total_stats",
                    data=df, palette="muted")
plt.show()

阿里云天池 Python训练营 Task10_Python教程_10

找到神兽

# -*- coding: utf-8 -*-
#宝可梦数据分析-平民最强宝可梦系列

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

df = pd.read_csv("pokemon.csv")
interested = ['hp','attack','defense','sp_attack','sp_defense','speed']
for c in interested:
    df[c] = df[c].astype(float)
df = df.assign(total_stats = df[interested].sum(axis=1))
# 种族值分布
total_stats = df.total_stats
#找到神兽
df[(df.total_stats >= 570) & (df.is_legendary == 0)]['name'].head(10)
plt.show()

效果没调试出来，一脸蒙蔽！

上一篇：Python调用ip代理案例，快代理api调用demo

下一篇：Python发邮件脚本，Python调用163邮箱SMTP服务实现邮件群发

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

阿里云天池 Python训练营 Task10

阿里云天池 Python训练营 Task10

Pandas, Seaborn, Matplotlib库 安装

读取数据

计算出每个特征有多少百分比是缺失的

查看各代口袋妖怪的数量

查看每个系口袋妖怪的数量

从宝可梦在实战中的角度来分析这组数据

通过相关性分析heatmap分析五个基础属性

种族值分布

不同属性的种族值分布

找到神兽

51CTO博客

Pandas, Seaborn, Matplotlib库安装