讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法
1.1 通过相似的房子预测你的房子


2.1 应用线性回归模型



那么哪条线才是最好的呢?
2.2 应用一条线的成本

2.3 预测你的房价

3.1 用直线拟合房价或者…?

3.2 如果用二次函数怎么样?

3.3 更高阶的多项式

显然,相比二次函数并不好!!!
过拟合
你相信这个拟合吗?

二次函数怎么样呢

如何选择模型阶数 / 复杂度

训练 / 测试分离

- 训练集
用于模型构建 - 测试集
用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率
训练误差
- 蓝色点为训练集数据

测试误差


仅仅通过房屋大小预测

加入其他的特征

应该选择多少特征

薪资预测


股票预测

微博流行度

智能房屋

机器学习流水线

















