看吴恩达教授视频课的一些笔记。

1.1 欢迎

1.2 机器学习是什么

一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。

以下棋举例,E是程序上万次的自我练习的经验;T是任务下棋;P是赢得比赛的概率。

主要的两类算法为:监督学习和无监督学习。

1.3 监督学习

经典例子:预测房价

横轴表示房子的面积,单位是平方英尺,纵轴表示房价,单位是千美元。那基于这组数据,假如你有一个朋友,他有一套750平方英尺房子,现在他希望把房子卖掉,他想知道这房子能卖多少钱。




吴恩达机器学习最新笔记 吴恩达机器学课程讲义_监督学习



监督学习指我们给学习算法一个数据集,由正确答案组成,从而算出更多的正确答案。

我们试着去推出这一系列连续值属性,这叫做回归问题。

第二个经典例子检测肿瘤

吴恩达机器学习最新笔记 吴恩达机器学课程讲义_无监督学习_02

横轴表示肿瘤的大小,纵轴标出1和0表示是或者不是恶性肿瘤。如果是恶性则记为1,不是恶性,或者说良性记为0。

在知道一个肿瘤大小时去估算是良性还是恶性的概率,是分类问题。

当特性变多时,支持向量机中的巧妙数学方法,可以让计算机处理无限多个特征。

1.4 无监督学习

有监督学习是训练集对应正确答案。而无监督学习中,数据本身没有任何标签,或者都有着相同的标签。针对数据集,无监督学习就能判断出数据有两个不同的聚集簇。

无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法。

经典例子是谷歌新闻,会将大量新闻分组,聚类在一起。

另一个经典例子为鸡尾酒晚会,无监督的分离声音。