本月组队学习,包含推荐系统实践、Numpy入门(下)两个模块的路线学习。参与学习需要有一些Python基础。其中,推荐系统将结合Datawhale与天池发起的学习赛进行实践。

关于开源

Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。

开源内容

截止今日,Datawhale已经开源20多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。

开源地址

https://github.com/datawhalechina/team-learning

组队学习

关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。

开源学习

1 /Numpy入门(下)


开源贡献:韩绘锦、马燕鹏、王彦淳组队学习说明:本开源内容是Python基础的进阶,主要目标是学习Numpy在输入输出、随机抽样、数理统计和线性代数中的应用,为后期学习Pandas和Sklearn奠定坚实基础。任务路线:熟悉规则、输入输出、随机抽样、统计相关、线性代数、实践大作业

组队学习周期:10天

定位人群:有一些Python基础,难度系数中

每个任务完成大概所需时间:3-5h

任务预览(2天)


Task04:线性代数(2天)

  • 熟悉Numpy如何处理矩阵乘法以及向量的内积

  • 熟悉Numpy如何处理矩阵的特征值和特征向量

  • 熟悉Numpy如何处理矩阵的各种分解,如SVD、QR和Cholesky分解

  • 熟悉Numpy如何处理矩阵的范数、行列式和秩

  • 熟悉Numpy如何处理逆矩阵和线性方程组求解




2 /推荐系统实践(新闻推荐)


开源贡献:陈琰钰、罗如意、李万业、吴忠强、王贺、张汉隆组队学习说明:了解多路召回策略、冷启动策略、排序特征的构造方法、常见的排序模型和模型融合方法。任务路线:赛题理解 + Baseline、数据分析、多路召回、特征工程、排序模型 + 模型融合组队学习周期:15天定位人群:具有一定编程语言基础,对机器学习有一定的了解,会使用常见的数据分析工具(Numpy、Pandas),难度系数中

每个任务完成大概所需时间:3-5h

任务预览(3天)


Task03:多路召回

  • 熟悉常见的召回策略,如:itemcf, usercf以及深度模型召回等

  • 了解当前场景下的冷启动问题,及常见解决策略,了解如何将多路召回的结果进行合并

  • 完成多种策略的召回,冷启动及多路召回合并

  • 完成召回策略的调参和召回效果的评估