2020年,Datawhale开源项目“南瓜书”发布,受到全网转发。3年后,“南瓜书”完整版第2版完结撒花,重磅出版。
南瓜书是经典“西瓜书”《机器学习》公式完全解析指南,第1版受到了读者的一致好评,并得到了俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达6位人工智能领域大咖亲笔推荐!截止此时star 数已经突破2万。
相较于第1版,除了篇幅上从168页扩充到308页,《机器学习公式详解(第2版)》呈现出4大亮点:
▮ 对“西瓜书”中除了公式以外的重难点内容加以解析;
▮ 以过来人的视角给出学习建议;
▮ 对比较难理解的公式和重点内容扩充具体的例子说明;
▮ 对跳步过大的公式补充具体的推导细节。
从基础公式解析到难点探讨,无论你数学功底如何,都可以在《机器学习公式详解(第2版)》里找到你想要的。
▲
这是一本与众不同的书
我们正面临ChatGPT带来的一场技术革命,这场革命将会不断持续下去,其影响将十分深远,会触及整个社会的方方面面。人工智能再也无法走出大家的视野,了解、理解人工智能将会成为每个人最基本的能力。
众所周知,机器学习是这些年来人工智能中最核心的技术,要想学好人工智能,机器学习正是关键所在。《机器学习公式详解(第2版)》正是在这样的背景下创作出来的。
《机器学习公式详解》的第1版出版之后,大受读者欢迎。特别是其与“西瓜书”的结合,对于深耕于机器学习领域的读者来说无疑是极具指导意义的工具书。
但编著者们在收到众多读者的反馈意见后,毅然决定进行第2版的创作。第2版从多个方面对第1版进行了补充和修订,相信这一版能够更好地实现“南瓜书”与“西瓜书”的结合,给读者带来更多的收获。
首先,确切地说,这是一本“伴侣书”
类似于咖啡伴侣一样,《机器学习公式详解》系列是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字 ——“南瓜书”。“南瓜书”第1版对“西瓜书”中的公式进行了解析,并补充了必要的推导过程及先验知识。
“南瓜书”第2版是Datawhale成员的自学笔记,更是第1版的升级版。本书扩充了对“西瓜书”解读的覆盖面,对“西瓜书”中320个重难点公式做了详细解析和推导(重难点公式覆盖率达99%,第1版重难点公式数量为250),旨在全面解决机器学习中的数学难题。
上述做法对学习机器学习时“知其然”并“知其所以然”非常重要。 现在能用一些机器学习工具来实现某个任务的人越来越多了,但是具有机器学习思维且了解其原理从而能够解决实际问题的能力在工作中更重要,具有这种能力的人也更具有竞争力。
其次,这是一本通过开源方式多人协作写成的书
《机器学习公式详解(第2版)》采取多人分工合作、互相校验、开放监督的方式进行整本书的编著。这种方式既保证了书的质量,也保证了写作的效率。这是一种站在读者角度且非常先进的生产方式,容易给读者带来更好的体验。
最后,这是一本完全根据学习经历编著而成的书
其实,每个人在学习一门新的课程时,都会有自己独特的经验和方法。这种经验和方法的共享非常难能可贵。在机器学习领域,理解公式便是编著者认为了解机器学习原理的最好方法,其实对于这一点大多数人也深表赞同,因为在学习中很多人就是那种喜欢推导公式的典型代表,只有公式推导成功,才觉得对知识的原理理解得更深刻,否则总是觉得心里不踏实。
《机器学习公式详解(第2版)》正是抓住了这一关键,完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法。这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。
2
6位人工智能专家,亲笔推荐
本书得到了俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达6位人工智能领域大咖亲笔推荐!来看看他们怎么说?
写此序之时,我们正面临ChatGPT带来的一场技术革命。个人认为,这场革命将会不断持续下去,其影响将十分深远,会触及整个社会的方方面面。我相信人工智能再也无法走出大家的视野。了解、理解人工智能将会成为每个人最基本的能力。大家知道,机器学习是这些年来人工智能中最核心的技术。学好机器学习,也将是学好人工智能的关键所在,而这本书会助你一臂之力。这本书的第1版出版之后,大受读者欢迎。在收到众多读者反馈意见的基础上,第2版从多个方面进行了补充和修订,相信这一版会给读者带来更多的收获。
——小米AI 实验室主任、NLP 首席科学家 王斌
面对一本有很多数学难题的教材,初学者最渴望的是有一位“全能助教”,能帮助详细解析,步进推导,以便更好地消化教材。由开源组织Datawhale 发起编写的“南瓜书”集众人的智慧、开源社区的力量,为广大机器学习初学者带来了福音,给周志华教授的畅销书“西瓜书”配了一个“全能助教”。愿这两本书为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。
——俞勇 上海交通大学特聘教授,上海交通大学ACM 班创始人,伯禹教育创始人
推导一遍所有公式是非常好的学习方法,很高兴看到“南瓜书”能专注于此. 它是学习“西瓜书”不可缺少的辅助材料。
——李沐 AWS 资深首席科学家,《动手学深度学习》作者
“南瓜书”是Datawhale 开源团队产出优质内容的一种全新探索。这本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。这种新的学习思路和撰写模式,自打开始那一刻,就紧紧抓住读者的需求和痛点,使得这本书成为非常值得推荐的好书。和这本书同样值得推荐的,还有Datawhale 的开源精神和实践精神。
——程明明 南开大学计算机系主任,开放共享科研记录行动倡议者
这本书是读透“西瓜书”的好“伴侣”。尽管这本书并不适合所有人,但真正需要它的人会觉得它特别有用。它就像一位学霸同桌,可以在你啃“西瓜书”一筹莫展的时候为你“雪中送炭”。对很多人来说,数学公式是一种很可怕的存在,但是学问之美往往就在“最险远处”,披荆斩棘之后方能品出其真滋味。如果想要理解机器学习,而不止步于了解和应用,这本书将是你的好“同桌”——伴你思考,同享“知其所以然”的乐趣。
——陈光 北京邮电大学副教授,知名博主@ 爱可可- 爱生活
对机器学习初学者来讲,“南瓜书”补充且拓展了数学方面的基本知识,是“西瓜书”的佐读良品。
——徐亦达 悉尼科技大学副教授,机器学习开源讲义作者
3
第2版更新更适合读者自学
在撰写“南瓜书”第1版期间,作者谢文睿和秦州结识了同样在为“西瓜书”写注解的贾彬彬老师,但由于当时第1版已定稿,未能合作,三位编著者遂相约一起撰写“南瓜书”第2版。
三位编著者利用工作之余,历时两年,在第1版的基础上,延续之前的思路,以本科数学视角对“西瓜书”中的内容做了更进一步的解读。除了大幅扩充解读的公式数量以外,编著者们还在部分章节开篇处加注了学习建议和些许见解,供读者参考。此外,为了照顾数学基础薄弱的读者,他们又增添了许多数学知识的解读,同时将其前置在所用到的章节处,不再以附录的形式给出,以便于査阅。
同时还录制了“吃瓜教程”视频教程搭配第2版阅读,保障了高效阅读本书!
“南瓜书”第2版的使用方法保持不变,仍然是“西瓜书”的教辅,读者在阅读“西瓜书”过程中如遇到难以理解的知识点或者公式,可査阅本书相应章节的解读,辅以理解,效果最佳。为了与“西瓜书”中的图表进行区分,本书中的图表序号格式为“章节号-图表序号”(例如“图2-1”),而“西瓜书”中的图表序号格式为 “章节号.图表序号”(例如“图2.1”)。
对于“南瓜书”中的内容,需要掌握到何种程度?这是自本书第1版出版以来,编著者们收到的最多的反馈。其实学习目的不同,需要掌握的程度也不同。
学习机器学习的人群按照其学习目的可简单分为三类:期望从事机器学习理论研究的人,期望从事机器学习系统实现的人,以及期望将机器学习应用到具体场景的人。
针对“南瓜书”第2版:
▮ 对于期望从事机器学习理论研究的读者,本书中的内容理应全部掌握,同时对本书所涉及数学知识的归属学科也理应系统性学习,诸如最优化、矩阵论和信息论。
▮ 对于期望从事机器学习系统实现的读者,本书中的内容用于了解算法细节,以便进行工程化实现和性能优化,因此涉及算法原理的公式推导理应读懂。
▮ 对于期望将机器学习应用到具体场景的读者,本书可以帮助其深入理解各个算法所适用的数据类型,因此其中的公式推导可以不深究。
4
对于本书有几点阅读建议
首先,这本“南瓜书”第2版要和“西瓜书”配套阅读
“南瓜书”第2版的最佳使用方法是以“西瓜书”为主线,在阅读“西瓜书”时如对公式疑惑或对概念理解不畅,可以通过“南瓜书”第2版快速定位公式并进行推导,从而得到深入理解。从这个意义来说,“南瓜书”第2版可以看成是“西瓜书”的公式字典。另外,超纲的数学知识将以附录和参考文献的形式给出。
其次,阅读时一定要克服对公式的排斥或者畏惧心理
公式是通过符号对原理本质的高度概括,是一种精简而美丽的数学语言。相信读者们在“南瓜书”第2版和“西瓜书”的双重加持下,推导几个公式之后,能够从中感觉到没有体验过的乐趣。
最后,可以加入“南瓜书”第2版的读书会社群,互助学
《机器学习公式详解(第2版)》设置了专门的读书会社群,有名师直播讲解,也有作者的倾情解答,同时有一群为了一个目标努力的朋友一起学,相信一定会让你事半功倍的。(公众号后台回复“南瓜书”入群)
图书推荐
▼▼▼
内容简介:
周志华老师的《机器学习》(俗称“西瓜书”)是机器学习领域的经典入门教材之一。本书是基于Datawhale 成员自学“西瓜书”时记下的笔记编著而成,旨在对“西瓜书”中重难点公式加以解析,以及对部分公式补充具体的推导细节。
全书共16章,与“西瓜书”章节、公式对应,每个公式的推导和解析都以本科数学基础的视角进行讲解,希望能够帮助读者达到“理工科数学基础扎实点的大二下学期学生”水平。每章都附有相关阅读材料,以便有兴趣的读者进一步钻研探索。 本书思路清晰,视角独特,结构合理,可作为高等院校计算机及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
了解更多
▼▼▼