Datawhale开源 

贡献者:陈安东、金娟娟、杨佳达、老表


开源初心

当我入门数据分析时,用的是鼎鼎大名的《python for data analysis》,书中对技术操作讲解细致,但遗憾的是,对于数据分析的逻辑介绍就少了很多。我和很多学习者会觉得敲了一堆代码却并不知道有什么用。毕竟理论学习和生活中的实际运用有不小的鸿沟。如何抹平这个鸿沟,就需要自己的尝试以及学习实战的资料。

Datawhale数据分析教程来了!_建模

有没有这样一个开源教程,以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果? 调查了一圈,发现现有关于数据分析的项目好像没有可以完全符合这样标准的(失望.jpg)。

没有就自己来做!Datawhale的小伙伴一拍即合,来做一门自己想要的数据分析开源课程,期待让所有使用了这个教程的伙伴可以更好的开启自己的数据分析之路,既能掌握pandas等的知识点,又能掌握数据分析的大致思路和流程!

现在,这门课程已经更新到了1.3版本,优化了学习流程并有更好的答案讲解,后期还会逐步推出配套教材(特别感谢马老师的认可,推荐自己学生使用这个教材)。今后还是希望从基础的数据分析操作和数据分析流程讲起,在每个模块都引入实战的例子,并会不断加入新的内容(比如数据挖掘算法等)。这是个开源项目,会不断迭代,大家共同参与,一起努力。

关于项目的名字——动手学数据分析(Hands-on data analysis)。数据分析是从一堆数字中看到真相的过程。学会操作数据只是数据分析的一半功力,剩下的另一半要用我们的大脑,多多思考,多多总结,更要多动手,实打实的的敲代码。所以也希望在学习这门课时,多去推理,多去问问为什么;多多练习,确保理论实践结合起来,在课程结束的时候一定会有大收获。

开源地址:https://github.com/datawhalechina/hands-on-data-analysis

学习思路

教程内容

教程现分为三个单元,大致可以分为:数据基础操作,数据清洗与重构,建模和评估。

  1. 数据基础操作:我们将得到一个要分析的数据,要学习如何加载数据,查看数据,然后学习Pandas的一些基础操作,最后尝试探索性的数据分析。
  2. 数据清洗与重构:当我们可以比较熟练的操作数据并认识这个数据之后,我们需要将原始数据变为一个可用好用的数据,为之后放入模型做准备
  3. 建模和评估:我们根据任务需求不同,要考虑建立什么模型,我们将使用流行的sklearn库,建立模型。评估我们模型的好坏,对模型做优化。

Datawhale数据分析教程来了!_数据_02

通关方法

教程的代码都是jupyter形式,每部分教程都分为课程+答案两部分。学习期间,在课程代码中,完成所有的学习,自己查找资料,自己完成里面的代码操作,思考部分以及心得。之后可以和小伙伴讨论,分享资料和心得。关于答案部分,大家可以参考,但是由于数据分析本身是开放的,所以答案也是开放式的,更多希望大家可以有自己理解和答案。如果需要参考,答案部分提供了参考。

Datawhale数据分析教程来了!_建模_03

课程:按要求敲出自己的代码

Datawhale数据分析教程来了!_数据_04

参考答案

学习反馈

作为一个没基础的小白学习者,这期动手学数据分析我学得很舒服,教程也比较简单和清楚,整体学下来感觉是很流畅的。每个task我都会把教程看两遍。第一遍只看教程,按着教程思路顺下来,看完以后再啃利用Python进行数据分析这本书,边看边做笔记(顺便把csdn写了)作业的拓展性这里必须给我加分,然后第二遍看教程就是完全不看答案把作业和思考做完。基本上学完还是很有成就感的,而且真的有学到很多东西。这个课程作为一个数据分析的入门课程,真的巨赞!

——华北电力大学,吴丹飞

首先这个学习文档做得很好,很有引导性,也是我看下来项目中比较好的一种学习方式——主动学习,不懂就搜索、问。作为有Python数据分析基础的学员很有复习、提高、巩固的功能。项目相对来说没有那么的贴切生活。建模那一块我之前有接触过,但是我搞不懂就没什么可建议的了.

——李晴晴

帮助还不小,因为后面做项目感觉还在不断用这些技巧,非常有用。我觉得可以加点数据分析的分析思路过程。(作者:这是重点更新的部分)

——V1.0 版组队学习参与者

成为贡献者

如果你也想和我们一起成为数据分析开源教程的贡献者,无论是内容的补充完善,还是发现教程的错误,请毫不犹豫地去GitHub提Issues反馈!

记得说明提问内容属于哪一个部分,然后提交你希望补充内容或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以邮件联系chenands@qq.com。




Datawhale数据分析教程来了!_数据_05

核心贡献者陈安东

Datawhale成员,中央民族大学 | Queen Marry University of London

Datawhale数据分析教程来了!_数据分析_06

贡献者金娟娟

Datawhale成员,浙江大学硕士

Datawhale数据分析教程来了!_数据分析_07

贡献者杨佳达

Datawhale成员,数据挖掘工程师

Datawhale数据分析教程来了!_数据分析_08

贡献者老表

Datawhale成员,公号简说Python


教程开源学习贡献者

星:组织成员,数据分析师

玲:组织成员,算法工程师

高立业:组织成员,太原理工硕士

张文涛:组织成员,中山大学博士

Datawhale数据分析教程来了!_数据分析_09