梯度下降树 sklearn 梯度下降模型

转载

落笔成诗 2024-08-21 09:45:56

文章标签 梯度下降树 sklearn 逻辑回归算法机器学习梯度下降法 文章分类 深度学习人工智能

如愚见指月，观指不观月。

上节回顾——logistic回归模型和成本函数

梯度下降

梯度下降法的执行过程

计算图

logistic模型中的梯度下降算法

上节回顾——logistic回归模型和成本函数

$\hat y$

是在

梯度下降树 sklearn 梯度下降模型_机器学习_02

条件下，

梯度下降树 sklearn 梯度下降模型_算法_03

的概率。

。如果想要让我们的模型更加精确的话，就要让

$\hat y$

尽可能的接近

梯度下降树 sklearn 梯度下降模型_逻辑回归_05

。所以，我们定义了损失函数和成本函数，用于评估

$\hat y$

与

梯度下降树 sklearn 梯度下降模型_逻辑回归_05

的接近程度，以及模型的准确率。

损失函数是对单个样本来说的。

成本函数是对整个数据集来说的。

梯度下降树 sklearn 梯度下降模型_机器学习_02

是输入的样本数据，

梯度下降树 sklearn 梯度下降模型_逻辑回归_05

是样本对应的标签，

$\hat y$

是我们对

梯度下降树 sklearn 梯度下降模型_逻辑回归_05

的估计。

$w\,\,\,b$

是我们logistic模型的参数，我们希望找到合适的

$w\,\,\,b$

来让成本函数尽可能的小。接下来我们会介绍让成本函数

梯度下降树 sklearn 梯度下降模型_梯度下降法_14

尽可能小的方法。

之所以用这种形式的成本函数，因为这样的成本函数是凸的（convex），只有一个极值，我们用梯度下降法很容易的找到最小值，而不是局部极值。

梯度下降树 sklearn 梯度下降模型_算法_15

梯度下降

首先让我们来复习一下高数，什么是梯度？

梯度下降树 sklearn 梯度下降模型_梯度下降树 sklearn_16

方向导数：多元函数在某一方向上的导数，代表了多元函数某点在某一方向上的斜率。

例如，二元函数

梯度下降树 sklearn 梯度下降模型_逻辑回归_17

在某点

梯度下降树 sklearn 梯度下降模型_逻辑回归_18

上沿

梯度下降树 sklearn 梯度下降模型_机器学习_19

方向的方向导数为

梯度下降树 sklearn 梯度下降模型_梯度下降树 sklearn_20

，其中，向量

梯度下降树 sklearn 梯度下降模型_机器学习_19

为单位向量。

梯度：是多元函数某点上的一个向量。多元函数某点上梯度的方向，就是能让这一点处方向导数最大的方向。而梯度的模则是方向导数的最大值。（梯度就是方向导数最大的方向）

对于二元函数来说，某一点的梯度就是

$grad\,f(x_0,y_0)=(f_x(x_0,y_0),f_y(x_0,y_0))$

。（

梯度下降树 sklearn 梯度下降模型_算法_23

是

梯度下降树 sklearn 梯度下降模型_机器学习_24

对

梯度下降树 sklearn 梯度下降模型_机器学习_02

求的偏导，看不懂的话复习一下高数）

用爬山来举例，你在一座山上爬山，你这个位置的梯度，就是这座山上，你所在的这个位置，最陡的那个方向。

梯度下降就像下山，怎么下山才能尽可能快的下山呢？有一个方法就是，向着最陡的那个方向（梯度）走。

当然这样也有问题，就是我们有可能会走到局部极值（局部最优解），而不是最小值（全局最优解），所以我们才要求我们的成本函数是凸的。

梯度下降树 sklearn 梯度下降模型_梯度下降法_26

梯度下降法的执行过程

梯度下降法就是重复执行这样的步骤：

$w:=w-\alpha\frac{dJ(w)}{dw}$

$\alpha$

在这里代表的是学习率，就是梯度下降法中一步的步长。（就是你在“下山”的过程中，一步迈多大）

$\frac{dJ(w)}{dw}$

在这里就是梯度，和

$grad\,f(x_0,y_0)=(f_x(x_0,y_0),f_y(x_0,y_0))$

代表的是同一种东西。注意：

梯度下降树 sklearn 梯度下降模型_梯度下降树 sklearn_31

是n维平面上的一个点。

梯度下降树 sklearn 梯度下降模型_梯度下降树 sklearn_32

是成本函数。

计算图

例：

梯度下降树 sklearn 梯度下降模型_梯度下降法_33

这个函数的计算图便是：

梯度下降树 sklearn 梯度下降模型_机器学习_34

与这个蓝色箭头指向的流程相反，便可以进行导数的计算，如红色的箭头所示。

梯度下降树 sklearn 梯度下降模型_机器学习_35

假如我们想要求得

$\frac{dJ}{dv}$

，因为

梯度下降树 sklearn 梯度下降模型_逻辑回归_37

，所以

。

反向传播 backpropagatioin

假如我们想求得

$\frac{dJ}{da}$

，

（这不就是链式求导法则吗？）

logistic模型中的梯度下降算法

$z=w^Tx+b\\ \hat y=a=\sigma(z)\\ L(a,y)=-(ylog(a)+(1-y)log(1-a))$

如何用反向运算求导如图所示：

梯度下降树 sklearn 梯度下降模型_梯度下降树 sklearn_40

于是，我们就可以用梯度下降法，这是一次梯度的更新步骤。

$b:=b-\alpha\mathrm{d}b$

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：android 判断是安卓的还是ios 如何看是安卓还是苹果

下一篇：深度学习为什么求梯度导数梯度就是求导吗

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯