【机器学习】线性回归——最小二乘法（理论+图解+公式推导）

原创

Lineage_ 2023-01-17 08:49:37 ©著作权

文章标签 人工智能深度学习线性回归最小二乘法机器学习 文章分类 机器学习人工智能

©著作权归作者所有：来自51CTO博客作者Lineage_的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

一、概述
二、最小二乘估计

2021人工智能领域新星创作者，带你从入门到精通，该博客每天更新，逐渐完善机器学习各个知识体系的文章，帮助大家更高效学习。

【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_线性回归

一、概述

在生活实际中经常遇到一些情况，比如根据公司内部一些人的工资待遇去预测一个将从事相同工作人的工资，我们需要根据已有数据来对未来的数据进行推测。

在高中时候我们学过最小二乘法就是求 $【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_深度学习_02$

【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_03

由上图，显然我们希望的是找到一条直线使所以的样本点尽可能靠近该直线，即每个样本点到直线的距离最短，其实这么说还不太对，它不是到直线的距离最短，而是到与该样本点相同x点的y值的距离最短，如果是到直线的距离最短没有几何意义，如果是竖直距离，它可以表示我们预测值和真实值之间的一种离散程度，显然这个差值越小越好。

二、最小二乘估计

根据上面的理解这就引出了我们的损失函数，也就是最小二乘估计：

在给出公式之前，我们先给出一些约定，为了下面叙述方便：

$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_机器学习_04$ ：每个样本为列向量，形状为（n，1）
X：样本矩阵，为（m，n）

注意：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_最小二乘法_05$

w：为列向量，形状为（n，1）

我们下面公式推导的时候没有b，只是用了 $【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_机器学习_06$ ，这只是为了方便，其实可以把b放在X中和W向量中一起计算也可以，这样就变成了：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_深度学习_07$

$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_深度学习_08$

如果把两个矩阵这样写，其实是和 $【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_深度学习_09$ 是等价的。
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_10$
因为我们采用的是最小二乘估计，所以我们希望我们的损失函数最小，所以我们求取函数导数为0的点，就是我们的最优解，有人可能有疑问，导数为0的点不一定是最值点，这里说明一下，因为我们的损失函数为凸函数，有因为凸函数是可优化的，所以该函数导数为0的点一定是最值点。

你可以想象二次函数 $【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_机器学习_11$

所以我们的最优解就为：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_深度学习_12$
此时就需要对函数进行求导，令其导数为0
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_13$
这里可能有人不会进行矩阵求导，我来讲两种方式，第一种就是损失函数不采用矩阵方式进行表达，用求和符号将其变成每个样本的损失然后求和，针对于每个样本对其求导，然后讲每个样本的导数相加，这样就避免了矩阵的求导。

我采用的是第二种方式：

我们讲原矩阵写成微分的形式：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_14$
所以
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_13$
这样我们就求出了最优解w：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_16$
然后我们就可以构造决策函数：
$【机器学习】线性回归——最小二乘法（理论+图解+公式推导）_人工智能_17$
使用该函数就可以拟合我们的每一个样本点。