吴恩达机器学习课程对应代码吴恩达机器学课程讲义

转载

mob6454cc620c34 2024-04-18 21:18:33

文章标签 吴恩达机器学习课程对应代码人工智能机器学习吴恩达监督学习 文章分类 机器学习人工智能

吴恩达机器学习教程学习笔记（1/16）

吴恩达教授（Andrew Ng）的机器学习可以说是一门非常重视ML理论基础的课程，做做一些简单的笔记加上个人的理解。本笔记根据吴恩达的课程顺序，以每章内容作为节点进行记录。（共16章，其中第三章“线性代数回顾”与第5章“Octava教程”的笔记就不总结了）

第一章引言（Introduction）

以三个问题的形式展开：

1、机器学习是什么？

第一个机器学习的定义来自于Arthur Samuel。定义可以回溯到50年代，他编写了一个西洋棋程序。通过编程，让西洋棋程序自己跟自己下了上万盘棋。通过观察哪种布局（棋盘位置）会赢，哪种布局会输，久而久之，这西洋棋程序明白了什么是好的布局，什么样是坏的布局。所以他将机器学习做了定义：在进行特定编程的情况下，给予计算机学习能力的领域。
然而，上述是个有点不正式的定义，年代也比较久远。另一个年代近一点的定义，由卡内基梅隆大学Tom Mitchell提出，他对机器学习的定义，，一个程序被认为能从经验E（Experience）中学习，解决任务T（Tasks），达到性能度量值P（performance），当且仅当，有了经验E后，经过P评判，程序在处理T时的性能有所提升。

2、监督学习是什么？

监督学习指的就是我们给学习算法一个数据集，这个数据集由“正确答案”组成，学习这个数据集过后，试着推测出一个连续值的结果。

例子1：

现有波特兰俄勒冈州的研究所收集了一些房价的数据，如图，横轴表示房子的面积，单位是平方英尺，纵轴表示房价，单位是千美元。那基于这组数据，假如你有一个朋友，他有一套750平方英尺房子，现在他希望把房子卖掉，他想知道这房子能卖多少钱。

吴恩达机器学习课程对应代码吴恩达机器学课程讲义_吴恩达机器学习课程对应代码

我们应用学习算法，可以在这组数据中画一条直线，或者换句话说，拟合一条直线，根据这条线我们可以推测出，这套房子可能卖$150,000，当然这不是唯一的算法。可能还有更好的，比如我们不用直线拟合这些数据，用二次方程去拟合可能效果会更好。根据二次方程的曲线，我们可以从这个点推测出，这套房子能卖接近$200,000。稍后我们将讨论如何选择学习算法，如何决定用直线还是二次方程来拟合。两个方案中有一个能让你朋友的房子出售得更合理。这叫做回归问题。

例子2

假设说你想通过查看病历来推测乳腺癌良性与否（malignant为恶性，benign为良性）。

吴恩达机器学习课程对应代码吴恩达机器学课程讲义_人工智能_02