前言:好久好久好久没有更新博客了,为了冲击明年的美赛,不得不先暂时放下爬虫的学习,开始学习数据分析,因为之前的两篇文章只是使用open()的方式再配合正则表达的方式进行数据分割后的数据可视化,如果只是想数据可视化,可以参考前面写的文章,但是并没有用到数据分析专用的模块(Pandas),所以那两篇文章,做做图片,那是相当足够了,因为数据是已经经过处理的。也希望我的读者能更我一起进步,陪伴我学习!大家一起冲冲冲!好了,屁话不多说,咱们直接整实际的。
目录
一、数据分析的定义及主要工具介绍
数据分析的目的:
数据分析之四剑客:Numpy、Pandas、Matplotlib、Seaborn
二、Pandas的数据类型
Series数据形式及相关参数:
DataFrame数据形式及相关参数:
三、学习思维导图
四:结语
一、数据分析的定义及主要工具介绍
数据分析的目的:
数据分析的目的就是为了找到有用的数据,而使用python进行数据分析的三个优点:方便,高效,第三方库丰富。
数据分析之四剑客:Numpy、Pandas、Matplotlib、Seaborn
NumPy是一个用于数值运算的Python库,专门对数值运算进行优化,最大的优势是快
Pandas是Python最重要的数据分析工具包
Matplotlib和Seaborn是最为常用的数据可视化的工具包,解决如何通过数据来绘制图表,来更好的展示数据。
二、Pandas的数据类型
在数据分析中,我们最多使用到的就是Pandas模块,因此我们需要先了解到它的数据类型:Series和DataFrame
Series数据形式及相关参数:
Series的数据类型以一维数组的形式表现,同时,我们在使用到时需要导入相关的包
# 导入Series,因为Series属于Pandas
from Pandas import Series
# Series的主要常用参数:data(数据,以list的形式),index(行索引,不设置时默认0-N)
# 书写方法一:
ser = Series(data=[1,'TheShy',20,'天不生theshy,LPL上单万古如长夜'],index=[2,4,6,8])
print(ser)
# 输出结果:
#2 1
#4 TheShy
#6 20
#8 天不生theshy,LPL上单万古如长夜
# 书写方法二:(输出结果都一样,就不分别展示了,自己拷贝代码去试试吧)
shuju = [1,'TheShy',20,'天不生theshy,LPL上单万古如长夜']
index=[2,4,6,8]
ser = Series(shuju,index=index)
print(ser)
# 书写方法三:
import Pandas as pd
# 弄数据的方法都有一样,只是直接导入pandas,更加简便
ser = pd.Series(shuju,index=index)
DataFrame数据形式及相关参数:
DataFrame的数据类型以二维数组的形式表现
# 导包
frome Pandas import DataFrame
# 参数介绍:DataFrame 的参数有data(数据),index(行索引),culumns(列索引)
# 书写方式一:
lol_list = [['上单','TheShy',20],
['打野','小天',19],
['中单','Faker',23],
['ADC','Uzi',22],
['辅助','Ming',21]]
df = DataFrame(data=lol_list,
index=['a','b','c','d','e'],
columns=['位置','ID号','年龄'])
print(df)
# 书写方式二:
# 使用字典创建
dic={
'姓名': ['小罗伯特·唐尼', '克里斯·埃文斯', '斯嘉丽·约翰逊', '克里斯·海姆斯沃斯'],
'饰演': ['钢铁侠', '美国队长', '黑寡妇', '雷神'],
'武器': ['钢铁战衣', '盾牌', '寡妇蜇', '雷神之锤'],
'语录': ['和平,我热爱和平','最好的选择就是重新开始 ','嘿,大兄弟,太阳下山了','要用知识来打败无知']}
df=DataFrame(dic)
print(df)
# 方法三:DataFrame其实就是由多条Series组成的
frome Pandas import DataFrame,Series
import Padas as pd
index_list = ['No1','No2','No3']
dic={
'姓名': Series(['娜娜','淼淼','依依'],index=index_list),
'类型': Series(['可爱单纯','风骚火辣','性感高冷'],index=index_list),
'爱好': Series(['逛街、电影、爱吃甜','喝酒、蹦迪、爱吃辣','看书、烘焙、爱吃酸'],index=index_list),
'时间': Series(['2019-2-14去看电影','2019-2-16去蹦迪','2019-2-18去烘焙'],index=index_list)
}
df = pd.DataFrame(dic)
print(df)
三、学习思维导图
四:结语
编程当然是自己多多实验啦!熟能生巧嘛!希望这篇文章你能喜欢。以后有时间会更新,你的点赞就是对我最大的支持,在这里就先感谢大家了!!!