基本术语

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_02

优化问题

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_03

 拉格朗日函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_04

 相对于λ而言(假如x和v已经确定),那么此函数相对于λ来说是线性的,同理关于v也是线性函数

拉格朗日对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_05

 关于λ和v的函数,在x的域中,找到是的L最小的参数

λ,v:拉格朗日乘子

性质

1.对偶函数为凹函数

解释:如果对函数L求极大,则关于λ和v是凸的(因为关于λ和v是分段线性的函数),反之如果对其求极小,则为凹函数

2.

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_06

 解释:对偶函数的函数值一定小于等于原问题的最优值,原问题最优值的下界

证明:设深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_07是原问题最优解,则

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_08


深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_09


深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_10

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_11

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_12

对于任意的λ,v,g(λ,v)一定是深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_13的下界,对g(λ,v)求极大可以得到最好的下界

由于g(λ,v)是一个凹函数,极大化g(λ,v),同时加上线性约束,是一个凸问题

例子:

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_14

 拉格朗日函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_15

 对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_16

 求g(V)的一阶偏导得到

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_17

 将求出的X带回g(V)求解最小值

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_18

 由于

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_19

为半正定矩阵,前面带有负号为半正定矩阵,所以g(V)为凹函数

例子:

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_20

 拉格朗日函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_21

 对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_22

 函数的共轭与对偶函数之间的关系:

函数共轭定义

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_23

 例子:

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_24

 拉格朗日函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最小值_25

 对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_26

 对偶问题性质

1.对偶问题深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_27和原问题深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_28

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_29

 2.最优拉格朗日乘子

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_30

 例子1:

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_31

 对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_32

 最大化g(λ,v),如果λ,v有可能使得

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_33

成立,取值一定为

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_34

,否则取值为负无穷

如果问题的取值为负无穷的话是没有意义的,所以去掉负无穷,只关心实质意义的内容,写成如下对偶问题形式

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_35

 化简上式得到

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_36

 例子2:

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_最优解_37

 拉格朗日函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_38

 对偶函数

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_取值_39

 化简为对偶问题

深度学习 凸优化 拉格朗日对偶 拉格朗日函数对偶_深度学习 凸优化 拉格朗日对偶_40

 观察例子1和例子2,例子1的原问题和例子2的对偶问题一致,例子中原问题的对偶问题的对偶问题仍为其自身