证明逻辑回归的目标函数是凸函数

假设有训练数据证明逻辑回归的目标函数是凸函数_机器学习, 其中证明逻辑回归的目标函数是凸函数_逻辑回归_02为每一个样本,而且证明逻辑回归的目标函数是凸函数_最小化_03是样本的特征并且证明逻辑回归的目标函数是凸函数_最小化_04, 证明逻辑回归的目标函数是凸函数_逻辑回归_05代表样本数据的标签(label), 取值为证明逻辑回归的目标函数是凸函数_机器学习_06或者证明逻辑回归的目标函数是凸函数_取值_07. 在逻辑回归中,模型的参数为证明逻辑回归的目标函数是凸函数_最小化_08。对于向量,我们一般用粗体来表达。 为了后续推导的方便,可以把b融入到参数w中。 这是参数证明逻辑回归的目标函数是凸函数_最小化_09就变成 证明逻辑回归的目标函数是凸函数_逻辑回归_10,也就是前面多出了一个项证明逻辑回归的目标函数是凸函数_取值_11, 可以看作是b,这时候每一个证明逻辑回归的目标函数是凸函数_算法_12也需要稍作改变可以写成 证明逻辑回归的目标函数是凸函数_取值_13

那么逻辑回归的目标函数(objective function),把目标函数表示成最小化的形态。
证明逻辑回归的目标函数是凸函数_逻辑回归_14

  • 求解对w的一阶导数(参考matrix cookbook)
    为了做梯度下降法,首先要对参数证明逻辑回归的目标函数是凸函数_逻辑回归_15求导,证明逻辑回归的目标函数是凸函数_取值_16证明逻辑回归的目标函数是凸函数_逻辑回归_15的梯度计算如下:
    证明逻辑回归的目标函数是凸函数_算法_18
    证明逻辑回归的目标函数是凸函数_逻辑回归_19
    证明逻辑回归的目标函数是凸函数_算法_20
    证明逻辑回归的目标函数是凸函数_最小化_21
  • 求解对w的二阶导数(参考matrix cookbook)
    然后,我们再在上面结果的基础上对证明逻辑回归的目标函数是凸函数_逻辑回归_15求解二阶导数,也就是再求一次导数。
    证明逻辑回归的目标函数是凸函数_取值_23
    证明逻辑回归的目标函数是凸函数_算法_24
    证明逻辑回归的目标函数是凸函数_最小化_25
    证明逻辑回归的目标函数是凸函数_最小化_26
  • 证明逻辑回归目标函数是凸函数(参考matrix cookbook)
    由上可知,我们获得了Hessian Matrix 证明逻辑回归的目标函数是凸函数_取值_27
    hessian矩阵{j,k}元素为:证明逻辑回归的目标函数是凸函数_最小化_28
    证明逻辑回归的目标函数是凸函数_最小化_29
    证明逻辑回归的目标函数是凸函数_机器学习_30
    证明逻辑回归的目标函数是凸函数_逻辑回归_31
    令:
    证明逻辑回归的目标函数是凸函数_算法_32
    则: 证明逻辑回归的目标函数是凸函数_算法_33显然对任意i有
    证明逻辑回归的目标函数是凸函数_机器学习_34所以证明逻辑回归的目标函数是凸函数_算法_35
    假设有任意D+1维向量:
    证明逻辑回归的目标函数是凸函数_逻辑回归_36 = 证明逻辑回归的目标函数是凸函数_机器学习_37
    = 证明逻辑回归的目标函数是凸函数_取值_38
    证明逻辑回归的目标函数是凸函数_最小化_39
    所以有证明逻辑回归的目标函数是凸函数_最小化_40
    根据正定矩阵的充要条件对角矩阵证明逻辑回归的目标函数是凸函数_算法_35
    所以证明逻辑回归的目标函数是凸函数_机器学习_42所以证明逻辑回归的目标函数是凸函数_机器学习_43是正定矩阵。所以逻辑回归的目标函数是凸函数,证明完毕。

参考:假设一个函数是凸函数,我们则可以得出局部最优解即为全局最优解,所以假设我们通过随机梯度下降法等手段找到最优解时我们就可以确认这个解就是全局最优解。证明凸函数的方法有很多种,在这里我们介绍一种方法,就是基于二次求导大于等于0。比如给定一个函数证明逻辑回归的目标函数是凸函数_逻辑回归_44,做两次
求导之后即可以得出证明逻辑回归的目标函数是凸函数_算法_45,所以这个函数就是凸函数。类似的,这种理论也应用于多元变量中的函数上。在多元函数上,只要证明二阶导数是posititive semidefinite即可以。 问题(c)的结果是一个矩阵。 为了证明这个矩阵(假设为H)为Positive Semidefinite,需要证明对于任意一个非零向量证明逻辑回归的目标函数是凸函数_机器学习_46, 需要得出证明逻辑回归的目标函数是凸函数_机器学习_47

参考: matrix cookbook: https://www.math.uwaterloo.ca/~hwolkowi/matrixcookbook.pdf, 还有 Hessian Matrix。