之前和行业大佬讨教的时候,他们都非常认可这一点:一个优秀的数据分析师,应该是技能、统计学、业务sense的综合反映。不管你将来是从事数分行业,还是跳槽或自学数据分析,这三个部分缺一不可。

如果你还没有业内人士的指点,找不到合适的学习方法?不要担心,根据我7年的数分岗工作经验,为大家总结了这个思维导图:

数据分析知识图谱

panda python 文档 pandas 官方文档_人工智能

数据分析知识图谱

如何使用 Python 进行数据分析?

在Python数据分析中使用最多的库是pandas,本文展示的pandas官方文档手册介绍了使用 Python 数据分析全过程,包含数据导入、数据清洗、 数据聚合、数据分类汇总、数据关联、数据可视化、时间序列、数据导出等内容。

基于此,作者将常用的Python数据处理方法总结如下,使用pandas数据处理,介绍pandas的用法,每一章都包含对应的数据处理步骤,将所有的知识点总结为九个章节。

panda python 文档 pandas 官方文档_数据分析_02

以第一章为例,讲解pandas如何导入数据,如何从CSV中导入数据,这里使用蒙特利尔骑自行车的数据,使用read_csv函数进行讲解,后面对于数据导入的常用参数也逐一做了说明。

panda python 文档 pandas 官方文档_python_03

第六章为我们讲述了如何使用pandas处理时间数据和字符串数据

panda python 文档 pandas 官方文档_机器学习_04

panda python 文档 pandas 官方文档_python_05

第九章为我们详解了使用pandas如何从从 HTML,JSON,SQL,Excel(!!!), HDF5,Stata 和其他一些东西中读取数据

panda python 文档 pandas 官方文档_数据分析_06

限于篇幅原因,这里仅展示pandas官方文档第一章的内容,在后续章节介绍其他的pandas数据分析的方法,包含数据清洗数据运算等内容。