Datawhale学习
开源贡献:Datawhale团队
今年最后一次组队学习,包含SQL、Go语言编程、Pandas数据分析、数据可视化、计算机视觉(目标检测)五个内容的路线学习,参与学习需要有一些Python基础。
关于开源
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
开源内容
截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。
开源地址
https://github.com/datawhalechina/team-learning
组队学习
关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。
开源学习
1 /SQL编程语言
开源贡献:王复振、杨煜、闫钟峰、杨梦迪、苏鹏、红星、张晋、汪健麟、苏丽敏、姚行志
组队学习说明:本次课程内容的设计参考了 MICK 老师的《SQL基础教程 第2版》、官方文档以及技术博客,对SQL中比较重要的知识点进行了记录和总结,每个小节都有练习题供学习者核查自己的学习效果。
任务路线:数据库的安装和使用 -> 数据库连接工具的安装和使用基础查询、分组、排序 -> 视图、子查询、函数、谓词、CASE表达式 -> 表联结 -> 窗口函数
组队学习周期:14天
定位人群:SQL小白、初学者,希望通过系统学习来提高SQL技能的人。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(2天)
Task02:基础排序与查询(2天)
- SELECT 语句基础。
- 算数运算符与比较运算符。
- 逻辑运算符。
- 表的分组与聚合。
- 为聚合条件指定条件。
- 对查询结果进行排序
2 /Go编程语言
开源贡献:光城、伊雪、苏鹏、梁家晖、李云龙
组队学习说明:本次课程是由Datawhale Go-Talent小组内部成员共同完成,是针对当前较热门的Go语言知识体系进行提炼及萃取的一门初学者课程。本次课程适用于任何小白人员。
任务路线:Go初探 -> 数据类型、关键字、标识符 -> 变量、常量、枚举 -> 运算符、控制语句等
组队学习周期:14天
定位人群:编程语言初学者,难度系数中
每个任务完成大概所需时间:3-5h
任务预览(1天)
Task08:结构体、方法、接口(1天)
- 掌握结构体在方法、接口的使用
- 区分方法与接口
3 /Pandas数据分析
开源贡献:耿远昊、谢文睿、吴丹飞
组队学习说明:理解并掌握pandas的所有核心知识
任务路线:Pandas基础、索引、分组、变形、连接等核心知识。
组队学习周期:28天
定位人群:有Python语言编程基础,对学习数据分析有需求的学习者。难度系数中
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task08:文本数据处理(3天)
- str对象
- 正则表达式基础
- 文本处理的五类操作
- 常用字符串函数
4 /数据可视化
开源贡献:杨剑砺、杨煜、耿远昊、李运佳、居凤霞、黄建国
组队学习说明:本次课程是由 Datawhale 数据可视化小组内部成员共同完成,是针对 matplotlib 初学者的入门课程。学习本课程需要基本的python基础即可。本次课程内容的设计几乎完全基于官方文档的结构,通过对于官方文档的归纳总结,系统梳理了python最重要的数据可视化包的方方面面,并且配有部分练习题供学习者核查自己的学习效果。
任务路线:掌握matplotlib中的图像组成、绘图接口、基本图形的绘制、容器对象概念、布局格式等内容。
组队学习周期:15天
定位人群:希望通过系统学习matplotlib包来提高python可视化技能的人,难度系数中
每个任务完成大概所需时间:3-5h
任务预览(4天)
Task02:艺术画笔见乾坤(4天)
- 熟悉绘图API。
- 熟悉自定义artist对象。
- 掌握绘图基本元素。
- 掌握容器对象。
5 /计算机视觉(目标检测)
开源贡献:安晟、宋志龙、闫永强、郝瑞祺等
组队学习说明:掌握从零构建一个目标检测网络各个环节的基本原理,训出一个和YOLO性能相当的简易网络。
任务路线:目标检测基本概念和经典的VOC数据集、锚框与模型结构、损失函数设计等内容
组队学习周期:15天
定位人群:具有一定CV基础,对CNN和Pytorch有一定了解,不会为装环境苦恼,至少跑过分类网络的训练。难度系数中上
每个任务完成大概所需时间:3-5h
任务预览(3天)
Task02:练死劲儿-网络设计 (3天)
- 了解锚框的概念及作用。
- 学习锚框的生成代码。
- 学习本教程所介绍的网络结构,包括特征提取模块和输出模块。
- 学习边界框的编解码,并思考其作用。
- 思考anchor是如何在网络中发挥作用的。
参与学习
快速通道
- 【SQL编程】开源地址
https://github.com/datawhalechina/team-learning-sql - 【Go编程语言】 开源地址
https://github.com/datawhalechina/go-talent - 【Pandas数据分析】 开源地址
https://github.com/datawhalechina/joyful-pandas - 【数据可视化】 开源地址
https://github.com/datawhalechina/fantastic-matplotlib - 【计算机视觉(目标检测)】 开源地址
https://github.com/datawhalechina/dive-into-cv-pytorch - 【Datawhale论坛】本期详细学习安排
论坛链接:http://datawhale.club/t/topic/508
学习规则
- 需交督促金3块:1块学习,1块分享,1块成长;
- 需要有一个等可以记录学习的公开帐号;
- 根据任务安排学习,完成后写学习笔记blog;
- 任务截止前在群内打卡,遇到问题一起交流讨论;
- 未按时打卡的同学视为自动放弃,流出学习群。