复习用,后续再添加内容
convex set
definition
∀x,y∈S⇒αx+(1−αy)∈S
一些凸集的例子
epi(f)是convex set
epi(f):={(xa)∈Rn+1f(x)≤a}
即f(x)上方的全部区域
凸集的交集是凸的,但是并集不一定
如果f是凸函数,则∂f(x)是凸集
proof
根据∂f定义,有
f(y)≥f(x)+⟨u,y−x⟩f(y)≥f(x)+⟨v,y−x⟩(1)(2)
对于任意α∈[0,1],
α⋅(1)+(1−α)⋅(2)⇒f(y)≥f(x)+⟨αu+(1−α)v,y−x⟩⇒αu+(1−α)v∈∂f(x)
Lagrange function
version 1.
x∈Rnmin(f(x)+i=1∑pI−(gi(x))+i=1∑qI0(hi(x)))
其中
I−(a)={0+∞a≤0a>0I0(a)={0+∞a=0a=0
这样可以确保当满足条件的时候,即为原函数,否则函数值为正无穷
但是由于指示函数难以优化,所以使用以下函数进行代替
I−(a)=λ∈R+max (λa)I−(a)=μ∈Rmax (μa)
可以证明,这两者是等价的
Lagrange function
x∈Rnminλ∈R+pμ∈Rqmax f(x)+i=1∑pλigi(x)+i=1∑qμihi(x)
primal and dual
p∗=x∈Rnminλ∈R+pμ∈Rqmax L(x,λ,μ)d∗=λ∈R+pμ∈Rqmaxx∈Rnmin L(x,λ,μ)
p∗≥d∗
proof
Let x∗ and (λ∗,μ∗) be the solution of primal and dual problems respectively, then
p∗=x∈Rnminλ∈R+pμ∈Rqmax L(x,λ,μ)=λ∈R+pμ∈RqmaxL(x∗,λ,μ)≥L(x∗,λ∗,μ∗)d∗=λ∈R+pμ∈Rqmaxx∈Rnmin L(x,λ,μ)=x∈Rnmin L(x,λ∗,μ∗)≤L(x∗,λ∗,μ∗)
Slater’s condition and KKT condition
Slater’s condition
若问题是凸问题(f是凸函数),且所有 gi 为凸函数
∃x0,⎩⎨⎧gi(x0)<0,Cx0<dAx0=bi=1,…,m
KKT condition
- 原始可行性(Primal feasibility)
fi(x∗)≤0,i=1,…,mhj(x∗)=0,j=1,…,p
- 对偶可行性(Dual feasibility)
λi∗≥0,i=1,…,m
其中 λi 是拉格朗日乘子,对应不等式约束。
- 拉格朗日函数极值点(Stationarity)
∇f0(x∗)+i=1∑mλi∗∇fi(x∗)+j=1∑pμj∗∇hj(x∗)=0
- 互补松弛性(Complementary slackness)
λi∗fi(x∗)=0,i=1,…,m
当优化问题是凸的时候,KKT条件是最优解的充要条件
Projected Gradient Descent
x∈Rnmin f(x)+IS(x)
使用次梯度算法
x(k+1)=proxαIS(x(k)−α∇f(x(k)))
接下来求proxαIS
proxαIS=x∈Rnargmin 21∥x−y∥2+αIS(x)=x∈Sargmin∥x−y∥=PS(y)
PS(y)=x∈Sargmin∥x−y∥⇔{PS(y)∈S⟨y−PS(y),z−PS(y)≤0,∀z∈S
PGD
x(k+1)=PS(x(k)−α∇f(x(k)))
Uzawa’s Algorithm
x(k+1)=x∈RargminL(x,λ(k),μ(k))λi(k+1)=[λi(k)+αkgi(x(k+1))]+,i=1,…,pμi(k+1)=μi(k)+αkhi(x(k+1)),i=1,…,q
如果使用梯度法求解x
x(k+1)=x(k)−αk∂x∂L(x(k),λ(k),μ(k))λi(k+1)=[λi(k)+αkgi(x(k+1))]+,i=1,…,pμi(k+1)=μi(k)+αkhi(x(k+1)),i=1,…,qx(k+1)←x(k+1)+θ(x(k+1)−x(k))
Augmented Lagrange Method
Lγ(x,μ)=f(x)+⟨μ,Ax−b⟩+2γ∥Ax−b∥2
x(k+1)μ(k+1)=x∈Rnargmin f(x)+2γAx−(b−γμ(k))2=μ(k)+αk(Ax(k+1)−b)
ADMM
对于如下优化问题:
x∈Rny∈Rnmin f(x)+g(y)
x(k+1)=argminx∈RnLγ(x,y(k),μ(k))y(k+1)=argminy∈RpLγ(x(k+1),y,μ(k))μ(k+1)=μ(k)+αk(Dx(k+1)−y(k+1))