线性回归中的F值怎么计算线性回归f统计量

转载

mob6454cc75107c 2024-04-23 16:10:59

文章标签 线性回归中的F值怎么计算机器学习线性回归迭代梯度下降法 文章分类 机器学习人工智能

One Variable）和求解costfunction的最优值的学习算法—梯度下降法（Gradientdescent）以及多变量（multipleVariable）的线性回归。

1. 单变量的线性回归（Linear Regission with onevariable）

监督学习的样本中都含有对于每个输入变量的输出值，通过建立模型并且学习得到一个模型之后，使该模型可以通过给定的输入，预测出输出。

线性回归中的F值怎么计算线性回归f统计量_迭代

现在有这样的一组样本数据，我们需要通过该样本输入学习模型预测给定面积的房子的价格，建立模型：

线性回归中的F值怎么计算线性回归f统计量_迭代_02

Notation：m是样本个数，x是面积，y是价格

样本分布如下：

线性回归中的F值怎么计算线性回归f统计量_迭代_03

y，自然而然会想到CostFunction为

线性回归中的F值怎么计算线性回归f统计量_机器学习_04

学习的目标是得到一个theta值使J最小

线性回归中的F值怎么计算线性回归f统计量_机器学习_05

J(theta0,theta1)的图像是这样的

线性回归中的F值怎么计算线性回归f统计量_线性回归中的F值怎么计算_06

上面的每一个点对应于

线性回归中的F值怎么计算线性回归f统计量_梯度下降法_07

中的一个模型。

线性回归中的F值怎么计算线性回归f统计量_梯度下降法_08

2. 梯度下降法（Gradient Descent）

0的点）。

算法描述：

线性回归中的F值怎么计算线性回归f统计量_线性回归中的F值怎么计算_09

convex函数，局部最小值就是全局最小值，线性回归模型中的目标函数J就是convex函数，因此不用担心取不到最小值的问题。对于非convex函数，那么需要选取多个初始值进行梯度下降，选取最好的那个值。

线性回归中的F值怎么计算线性回归f统计量_迭代_10

线性回归中的F值怎么计算线性回归f统计量_梯度下降法_11

算法描述如下：

线性回归中的F值怎么计算线性回归f统计量_机器学习_12

simultaneousupdate），即对j时求偏导时，用到的theta是旧的theta。

Alpha的选取：如果alpha选取得太大，会导致算法不会收敛，因为每次迭代后梯度都会变大，而离目标越来越远，如果在实践中发现算法未能收敛，那么有可能是alpha选的太大了。

线性回归中的F值怎么计算线性回归f统计量_迭代_13

alpha选取过小虽然对算法的收敛没有影响，但是会影响到算法的效率，它会导致算法过慢收敛。

Batch Gradient Decent：

每次迭代需要计算所有样本的梯度之和，如果样本数量过大，算法的效率会很低。

Stochastic Gradient Decent：

每次只用一个样本进行迭代，虽然每次迭代不一定是往梯度最大的方向走的，但是也会最终收敛到最优值。

线性回归中的F值怎么计算线性回归f统计量_线性回归中的F值怎么计算_14

J(theta)根据算法定义，可以推导出：

线性回归中的F值怎么计算线性回归f统计量_迭代_15

3. 多变量的线性回归（Linear regission withmultiple Variable）

现实情况中，房价会受到面积以外的其他因素影响，比如房价数量，楼层数，房子的年龄等。

线性回归中的F值怎么计算线性回归f统计量_线性回归_16

线性回归中的F值怎么计算线性回归f统计量_机器学习_17

feature可以用一个向量X来表示，如果有n个feature，那么X的维数是n+1维的，多出来的一维用来表示模型中的常数项，建立以下模型。

线性回归中的F值怎么计算线性回归f统计量_线性回归中的F值怎么计算_18

线性回归中的F值怎么计算线性回归f统计量_机器学习_19

H(theta)可以用向量表示成

线性回归中的F值怎么计算线性回归f统计量_线性回归中的F值怎么计算_20

那么它的Cost function就是

线性回归中的F值怎么计算线性回归f统计量_线性回归_21

用向量表示成如下：

function J = computeCostMulti(X, y, theta)

	J = 0.5 / m * ((X * theta - y)' * (X * theta - y)); 
end

用梯度下降法来求最优值：

线性回归中的F值怎么计算线性回归f统计量_梯度下降法_22

用向量可以表示成：

function [theta, J_history] = gradientDescentMulti(X, y, theta, alpha, num_iters)
       m = length(y); % number of training examples
       J_history = zeros(num_iters, 1);

       for iter = 1:num_iters
               theta = theta - alpha / m * ((X * theta - y)' * X)';
       end
end

4. Feature Scaling

如果theta的数据范围差距很大，需要将这些数据标准化，原因是不标准化可能需要更多次的迭代，影响算法效率。

线性回归中的F值怎么计算线性回归f统计量_线性回归_23