浅入深出被人看扁的逻辑回归！

原创

夕小瑶谈人工智能 2023-03-06 14:42:39 ©著作权

©著作权归作者所有：来自51CTO博客作者夕小瑶谈人工智能的原创作品，请联系作者获取转载授权，否则将追究法律责任

好像在各种机器学习入门教程中，逻辑回归模型（Logistic/Logit Regression）经常被拿来作为入门的机器学习模型，比如我家的Andrew Ng就是这样做的。

看起来，逻辑回归模型实在太简单，甚至容易被认为是一个拍脑袋想出的naïve的模型。今天，小夕就非要把它当做宝贝好好夸一夸，哼哼哼...

流水账一样的看似没毛病而且简单易懂的讲法是这样的：

浅入

怎么将n维向量X=[x1,x2,...,xn]映射成一个点y呢？很容易想到就是将向量X与另一个向量做内积啦。这个向量我们称为参数θ，即θ=[θ1, θ2 ,..., θn]。所以做内积就是X*θ’【即行向量X乘以（行向量θ的转置）】得到一个数。

但是如果X=[0, 0, 0, ..., 0]时，输出y应等于1，那怎么办呢？这时X*θ’肯定也是0 呀。。。所以为了解决这个问题，要再加个常数b，所以现在是X*θ’+b。我们为了看起来好看简洁，在X的最开头加个1，把b扔到θ的最开头，所以就成了新版的X*θ’，当然此时X=[1,X], θ=[b,θ]

好像还不行，因为这时的值域是(-∞,+∞)呀，可是我们要得到的是0或者1，模型给我输出一个100000是怎么回事。。。所以要把值域限制一下啦，将值域正负无穷改为(0, 1)，怎么改呢？出现了下面这个sigmoid函数：

浅入深出被人看扁的逻辑回归！_损失函数

在这个函数的限制下，哪怕输入为正无穷，输出也不会大于1，同样输入为负无穷，输出也不会为小于-1。所以现在模型成了：

sigmoid(X*θ’)。

这时，我们只需要认为当模型输出值大于0.5时，就认为是逻辑1；当输出值小于0.5时，就认为是逻辑0。预测函数（假设函数）完成！即h_theta(X)= sigmoid(X*θ’)，有了这个函数，我们就可以给样本贴类别标签啦。

好咯，然后还差什么？当然是训练模型用的损失函数/代价函数/目标函数啦。损失函数是什么呢？

浅入深出被人看扁的逻辑回归！_机器学习_02

诶？看起来很不错呀，仔细一看也能模模糊糊的看明白，反正当类别预测值与实际类别完全对起来的时候，J(θ)确实等于0的。

所以最后要干嘛呢？当然是得到我们的迭代公式然后梯度下降法啦。一求导就得到了下面的公式

浅入深出被人看扁的逻辑回归！_后验概率_03

然后坐等J(θ)收敛，从而得到最优模型参数θ了...

上面的讲解看起来没毛病呀~难道每一步真的都是这么恰好的信手拈来的吗？

前方超高能预警！

深出

慢慢来~从回归开始讲起啦。

回归的含义在高中就学过了，不过可能被老师解释的比较naïve（都忘了老师怎么讲的了。。。）。一个抽象而准确的描述是“回归即为两个或多个随机变量之间的相关关系建立数学模型”。设想一下，如果我们仅考虑两个随机变量，并且将其中一个随机变量看作机器学习的输入，也就是特征向量X，将另一个随机变量看作机器学习的输出，也就是类别预测y。那么...回归的意思是...

用一个数学模型直接描绘出X到y的映射关系！

如果还不懂的话，想一想我们之前的朴素贝叶斯模型是怎么用X训练模型求y的？是不是用贝叶斯定理呀~也就是下面这样：

浅入深出被人看扁的逻辑回归！_机器学习_04