Datawhale干货
作者:Datawhale开源项目组
作为机器学习的入门经典教材,周志华老师的《机器学习》,自2016年1月底出版以来,首印5000册一周售罄,并在8个月内重印9次。先后登上了亚马逊,京东,当当网等的计算机类畅销书榜首,身边学习机器学习的小伙伴基本上是人手一本。
当初在学习周志华《机器学习》教材的过程中,遇到了公式推导的难题,苦于没有人答疑解惑,于是发起了Datawhale南瓜书开源项目,希望再也没有难推的公式,深入理解机器学习。
南瓜书是经典“西瓜书”《机器学习》公式完全解析指南,2019年5月发布之初便登上 了GitHub Trending第 2,截止此时star 数已经突破1.6万。很多读者留言南瓜书什么时候能有纸质版,在人民邮电出版社的支持下,终于发布了第一版,并且争取了最大的折扣分享给大家。
一、从开源到出版
从李沐开源的《动手学深度学习》,邱锡鹏的《神经网络与深度学习》,再到Datawhale开源的《南瓜书》出版,知识回归大众,让大众有机会和行业精英一样为社会做出贡献,是南瓜书项目的探索性意义。
南瓜书是Datawhale组织成员以及读者们一起相互支持的结果,从开源到出版,带来的收入其实不高,但让开源贡献者被大众认可是促使开源良性循环的重要一环,会促使国内的开源氛围变好,让更多人受益。
首先,确切地说,这是一本“伴侣书”
类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字 ——“南瓜书”. “南瓜书”对“西瓜书”中的公式进行了解析,并补充了必要的推导过程;在推导公式的过程中有时候会需要一些先验知识,编著者也进行了必要的补充.上述做法对学习机器学习时“知其然”并“知其所以然”非常重要. 现在能用一些机器学习工具来实现某个任务的人越来越多了,但是具有机器学习思维且了解其原理从而能够解决实际问题的能力在工作中更重要,具有这种能力的人也更具有竞争力.
其次,这是一本通过开源方式多人协作写成的书
这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率. 在我看来,这是一种站在读者角度且非常先进的生产方式,容易给读者带来很好的体验.
最后,这是一本完全根据学习经历编著而成的书
也就是说,这本书完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣. 其实,每个人在学习一门新的课程时,都会有自己独特的经验和方法. 这种经验和方法的共享非常难能可贵. 在这里,理解公式便是编著者认为了解机器学习原理的最好方法,其实对于这一点我也深表赞同,因为在学习中我就是那种喜欢推导公式的典型代表,只有公式推导成功,才觉得对知识的原理理解得更深刻,否则总是觉得心里不踏实.
二、感谢老师们的鼓励和支持
感谢俞勇、李沐、程明明、爱可可、徐亦达、王斌 6位人工智能领域大咖的亲笔推荐。
这是一本与众不同的书。首先,这是一本“伴侣书”。类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字——“南瓜书”。其次,这是一本通过开源方式多人协作写成的书。这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率。最后,这是一本完全根据学习经历编著而成的书。它完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。
——王斌 小米AI 实验室主任、NLP 首席科学家
面对一本有很多数学难题的教材,初学者最渴望的是有一位“全能助教”,能帮助详细解析,步进推导,以便更好地消化教材。由开源组织Datawhale 发起编写的“南瓜书”集众人的智慧、开源社区的力量,为广大机器学习初学者带来了福音,给周志华教授的畅销书“西瓜书”配了一个“全能助教”。愿这两本书为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。
——俞勇 上海交通大学特聘教授
上海交通大学ACM 班创始人,伯禹教育创始人
推导一遍所有公式是非常好的学习方法,很高兴看到“南瓜书”能专注于此. 它是学习“西瓜书”不可缺少的辅助材料。
——李沐 AWS 资深首席科学家
《动手学深度学习》作者
“南瓜书”是Datawhale 开源团队产出优质内容的一种全新探索。这本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。这种新的学习思路和撰写模式,自打开始那一刻,就紧紧抓住读者的需求和痛点,使得这本书成为非常值得推荐的好书。和这本书同样值得推荐的,还有Datawhale 的开源精神和实践精神。
——程明明 南开大学计算机系主任,开放共享科研记录行动倡议者
这本书是读透“西瓜书”的好“伴侣”。尽管这本书并不适合所有人,但真正需要它的人会觉得它特别有用。它就像一位学霸同桌,可以在你啃“西瓜书”一筹莫展的时候为你“雪中送炭”。对很多人来说,数学公式是一种很可怕的存在,但是学问之美往往就在“最险远处”,披荆斩棘之后方能品出其真滋味。如果想要理解机器学习,而不止步于了解和应用,这本书将是你的好“同桌”——伴你思考,同享“知其所以然”的乐趣。
——陈光 北京邮电大学副教授
知名博主@ 爱可可- 爱生活
对机器学习初学者来讲,“南瓜书”补充且拓展了数学方面的基本知识,是“西瓜书”的佐读良品。
——徐亦达 悉尼科技大学副教授,机器学习开源讲义作者
三、给读者的学习建议
首先,这本“南瓜书”要和“西瓜书”配套阅读
南瓜书的最佳使用方法是以西瓜书为主线,如果在阅读“西瓜书”时对公式疑惑或对概念理解不畅,可以通过“南瓜书”快速定位公式并进行推导,从而深入理解. 从这个意义来说,“南瓜书”可以看成是“西瓜书”的公式字典.超纲的数学知识以附录和参考文献的形式给出;
其次,阅读时克服对公式的排斥或者畏惧心理
公式是通过符号对原理本质的高度概括,是一种精简而美丽的数学语言. 推几个公式之后,相信读者会从中感觉到没有体验过的乐趣.
最后,需要静下心来仔细研读
看上去也有点儿枯燥,阅读时读者还是要事先做好克服困难的准备. 有时,即使编著者给出了推导过程,读者也不一定一眼就能理解,这就需要自己静下心来仔细研读. 只有这样,才有可能成为具有机器学习思维而不只是会用机器学习工具的人.