吴恩达机器学习中文配音吴恩达机器学课程笔记

转载

angel 2023-09-23 08:52:04

文章标签 吴恩达机器学习中文配音机器学习监督学习数据 文章分类 机器学习人工智能

吴恩达机器学习课程笔记（一）

前言
目录

P1-1 什么是机器学习
P1-2 监督学习和无监督学习

总结

前言

大家好，这是我第一次写技术博客，主要是想把自己学到的东西都记录下来，以达到整理总结的目的，同时将自己的学习总结分享出去，供大家参考，希望与大家共同努力，一起进步！

课程中举了一个例子：Arthur Samuel 设计了一个跳棋游戏，这个游戏的有趣之处是，程序会自己跟自己下棋，自己找出哪些布局会赢，哪些布局会输，从而通过一步一步地“练习”，最终变成一个“跳棋大师”。这个例子中，经验 E 就是程序每次和自己博弈，T 就是下跳棋，P 就是程序每次下跳棋可以赢的概率。程序通过每次和自己下（E），从而学会下跳棋（T），最终自己赢的概率（P）会越来越高，同时，程序下跳棋（T）的表现会越来越好

P1-2 监督学习和无监督学习

本次课程讲了机器学习的两个子类——监督学习和无监督学习

首先说监督学习。监督学习（Supervised Learning）指的是在进行机器学习之前，我们会给一个数据集，其中包含“正确答案”。比如房价预测。在进行机器学习之前，我们会给定一个样本数据，其中有不同面积下的房价数据，也就是说，机器学习的输出——房价这样的标签已经在数据集中给定。我们在这些数据的训练下，才能得到正确的输出。监督学习可以分为回归（Regression）和分类（Classification）。所谓回归问题，就是预测连续输出的问题（Predict continuous valued output），如房价预测，训练数据会被正确地标注不同面积下的房价。所谓分类问题，就是离散输出问题（Discrete valued output）。比如，预测肿瘤是否是恶性肿瘤，训练数据中会明确标注哪些是恶性肿瘤，哪些不是。以上这些都是样本数据会被标注的问题。生动地来说，就是机器会在“正确答案的监督下”进行。

再说无监督学习（Unsupervised Learning）。我们给定的训练数据中不会有正确的标注，即“正确答案”，机器需要通过自己来学习数据之间的区别，将他们分成不同的簇（cluster）。我们常用的搜索引擎就是很好的无监督学习的例子。算法会自动将相关的主题聚集在一起，这就是“聚类算法”。聚类算法在组织计算机集群、社交网络分析、市场细分以及天文数据分析中有这广泛的应用。

总结一下，监督学习问题就是训练数据中包含正确标注的机器学习问题，而非监督学习的训练数据中没有任何标注。这是监督学习和非监督学习之间的本质区别。在监督学习中，算法需要根据带有正确标注的数据训练出一个函数，来得到正确的输出；而非监督学习的训练数据中没有标注，机器需要通过自己来学习不同样本之间的联系和区别，实现聚类。