讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法
机器学习入门(二) — 回归模型 (理论)_机器学习

1 预测房价

1.1 通过相似的房子预测你的房子

机器学习入门(二) — 回归模型 (理论)_机器学习_02
机器学习入门(二) — 回归模型 (理论)_面试_03

2 线性回归

2.1 应用线性回归模型

机器学习入门(二) — 回归模型 (理论)_面试_04
机器学习入门(二) — 回归模型 (理论)_机器学习_05
机器学习入门(二) — 回归模型 (理论)_面试_06

那么哪条线才是最好的呢?

2.2 应用一条线的成本

机器学习入门(二) — 回归模型 (理论)_面试_07

2.3 预测你的房价

机器学习入门(二) — 回归模型 (理论)_面试_08

3 加入更高阶的因素

3.1 用直线拟合房价或者…?

机器学习入门(二) — 回归模型 (理论)_机器学习_09

3.2 如果用二次函数怎么样?

机器学习入门(二) — 回归模型 (理论)_机器学习_10

3.3 更高阶的多项式

机器学习入门(二) — 回归模型 (理论)_机器学习_11

4 你相信这个模型吗?

显然,相比二次函数并不好!!!
过拟合
机器学习入门(二) — 回归模型 (理论)_机器学习_12

5 通过训练-测试分离来评估过拟合

你相信这个拟合吗?

机器学习入门(二) — 回归模型 (理论)_面试_13

二次函数怎么样呢

机器学习入门(二) — 回归模型 (理论)_面试_14

如何选择模型阶数 / 复杂度

机器学习入门(二) — 回归模型 (理论)_机器学习_15

训练 / 测试分离

机器学习入门(二) — 回归模型 (理论)_面试_16

  • 训练集
    用于模型构建
  • 测试集
    用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率

训练误差

  • 蓝色点为训练集数据
    机器学习入门(二) — 回归模型 (理论)_面试_17

测试误差

机器学习入门(二) — 回归模型 (理论)_面试_18

6 训练测试曲线

机器学习入门(二) — 回归模型 (理论)_面试_19

7 加入新的特征

仅仅通过房屋大小预测

机器学习入门(二) — 回归模型 (理论)_机器学习_20

加入其他的特征

机器学习入门(二) — 回归模型 (理论)_机器学习_21

应该选择多少特征

机器学习入门(二) — 回归模型 (理论)_面试_22

8 其他回归示例

薪资预测

机器学习入门(二) — 回归模型 (理论)_面试_23
机器学习入门(二) — 回归模型 (理论)_面试_24

股票预测

机器学习入门(二) — 回归模型 (理论)_机器学习_25

微博流行度

机器学习入门(二) — 回归模型 (理论)_面试_26

智能房屋

机器学习入门(二) — 回归模型 (理论)_面试_27

9 回归总结

机器学习流水线
机器学习入门(二) — 回归模型 (理论)_机器学习_28
机器学习入门(二) — 回归模型 (理论)_机器学习_29