图片来自于:《最优化:建模、算法与理论》https://bicmr.pku.edu.cn/~wenzw/optbook.html
由于《最优化:建模、算法与理论》已经很全面,因此只是将其整理一下方便查阅。
凸函数
凸函数定义
一阶条件
二阶条件
注:多元函数的泰勒展开和一元的有一些区别:
由于∇2f(x)⪰0对于所有x∈domf均成立,tx+(1−t)y∈domf,因此后面一坨大于等于0。
最优性条件
考虑
x∈Rnminf(s)(OPT)
零阶最优条件
x∗=x∈Rnargminf(x)⟺f(x∗)≤f(x)∀x∈Rn
一阶必要条件
x∗=x∈Rnargminf(x)⟹∇f(x∗)=0
二阶必要条件
注:对于全局极小点,必要条件成立,充分条件不成立
必要性证明
二阶泰勒展开
f(x+d)=f(x)+∇f(x)Td+21dT∇2f(x)d+o(∥d∥2).
f(x∗+d)=f(x∗)+21dT∇2f(x)d+o(∥d∥2).
这里好像直接用∇2f(x)⪰0也可以直接得出零阶条件
一阶最优条件
暂时只考虑f可微的情况,不可微的证明要用到次梯度的相关性质
当f是凸函数的时候,
x∗=x∈Rnargminf(x)⟹∇f(x∗)=0
证明
由于f是凸函数,根据一阶必要条件,
f(y)≥f(x)+∇f(x)(y−x)
因此,
f(x)≥f(x∗)+∇f(x∗)(x−x∗)=f(x∗)
根据零阶最优条件,得证。