吴恩达机器学习课程笔记(一)

  • 前言
  • 目录
  • P1-1 什么是机器学习
  • P1-2 监督学习和无监督学习
  • 总结


前言

大家好,这是我第一次写技术博客,主要是想把自己学到的东西都记录下来,以达到整理总结的目的,同时将自己的学习总结分享出去,供大家参考,希望与大家共同努力,一起进步!

目录

P1-1 什么是机器学习

关于机器学习,一直以来没有一个明确的定义。这节课程给了如下两个定义

1、Arthur Samuel(1959) Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.

(在没有明确设置的情况下,使计算机具有学习能力的研究领域。)

2、Tom Mitchell(1998) Well-posed learning problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measure by P, improves with experience E.

(一个适当的学习问题:计算机程序从经验 E 中学习,解决某一个任务 T ,进行某一性能度量 P ,通过 P 测定 T 上的表现因经验 E 提高)

课程中举了一个例子:Arthur Samuel 设计了一个跳棋游戏,这个游戏的有趣之处是,程序会自己跟自己下棋,自己找出哪些布局会赢,哪些布局会输,从而通过一步一步地“练习”,最终变成一个“跳棋大师”。这个例子中,经验 E 就是程序每次和自己博弈,T 就是下跳棋,P 就是程序每次下跳棋可以赢的概率。程序通过每次和自己下(E),从而学会下跳棋(T),最终自己赢的概率(P)会越来越高,同时,程序下跳棋(T)的表现会越来越好

P1-2 监督学习和无监督学习

本次课程讲了机器学习的两个子类——监督学习和无监督学习

首先说监督学习。监督学习(Supervised Learning)指的是在进行机器学习之前,我们会给一个数据集,其中包含“正确答案”。比如房价预测。在进行机器学习之前,我们会给定一个样本数据,其中有不同面积下的房价数据,也就是说,机器学习的输出——房价这样的标签已经在数据集中给定。我们在这些数据的训练下,才能得到正确的输出。监督学习可以分为回归(Regression)和分类(Classification)。所谓回归问题,就是预测连续输出的问题(Predict continuous valued output),如房价预测,训练数据会被正确地标注不同面积下的房价。所谓分类问题,就是离散输出问题(Discrete valued output)。比如,预测肿瘤是否是恶性肿瘤,训练数据中会明确标注哪些是恶性肿瘤,哪些不是。以上这些都是样本数据会被标注的问题。生动地来说,就是机器会在“正确答案的监督下”进行。

再说无监督学习(Unsupervised Learning)。我们给定的训练数据中不会有正确的标注,即“正确答案”,机器需要通过自己来学习数据之间的区别,将他们分成不同的(cluster)。我们常用的搜索引擎就是很好的无监督学习的例子。算法会自动将相关的主题聚集在一起,这就是“聚类算法”。聚类算法在组织计算机集群、社交网络分析、市场细分以及天文数据分析中有这广泛的应用。

总结一下,监督学习问题就是训练数据中包含正确标注的机器学习问题,而非监督学习的训练数据中没有任何标注。这是监督学习和非监督学习之间的本质区别。在监督学习中,算法需要根据带有正确标注的数据训练出一个函数,来得到正确的输出;而非监督学习的训练数据中没有标注,机器需要通过自己来学习不同样本之间的联系和区别,实现聚类

总结

什么是机器学习?机器学习就是通过训练计算机,来让计算机能够具备某种能力的技术。机器学习分为监督学习和无监督学习,它们的本质区别就是训练数据中有没有带正确的标签。随着课程的学习,笔记将持续更新中,有什么理解不当的地方,欢迎大家指正~