最优化理论分析复习--最优性条件(一)

2024-01-08 23:30:48

上一篇

最优化理论复习–对偶单纯形方法及灵敏度分析

无约束问题的极值条件

由于是拓展到向量空间 R n R^n Rn, 所以可由高数中的极值条件进行类比

  1. 一阶必要条件
    设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处可微, 若 x ˉ \bar{x} xˉ 是局部极小点,则 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0
    类比于若 x ˉ \bar{x} xˉ 是极小值点则 f ′ ( x ˉ ) = 0 f'(\bar{x}) = 0 f(xˉ)=0

  2. 二阶必要条件
    f ( x ) f(x) f(x) x ˉ \bar{x} xˉ 处二阶可微,若 x ˉ \bar{x} xˉ 是局部极小点, 则 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0, 且 H e s s i a n Hessian Hessian 矩阵 ▽ 2 f ( x ˉ ) \bigtriangledown^2f(\bar{x}) 2f(xˉ) 是半正定的。
    类比于 若 x ˉ \bar{x} xˉ是极小值点则 f ′ ( x ˉ ) = 0 , 且 f ′ ′ ( x ˉ ) ≥ 0 f'(\bar{x}) = 0, 且 f''(\bar{x}) \geq 0 f(xˉ)=0,f(xˉ)0

  3. 二阶充分条件
    设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处二次可微,若梯度 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0, 且 H e s s i a n Hessian Hessian 矩阵 ▽ 2 f ( x ˉ ) 正 定 \bigtriangledown^2f(\bar{x})正定 2f(xˉ), 则 x ˉ \bar{x} xˉ是严格局部极小点。
    类比于 f ′ ( x ˉ ) = 0 , f ′ ′ ( x ˉ ) > 0 f'(\bar{x}) = 0, f''(\bar{x}) > 0 f(xˉ)=0,f(xˉ)>0 x ˉ \bar{x} xˉ 是极小值点

  4. 充要条件
    f ( x ) f(x) f(x) 是定义在 R n R^n Rn 上的可微凸函数 x ˉ ∈ R n \bar{x} \in R^n xˉRn, 则 x ˉ \bar{x} xˉ 为整体极小点的充要条件是 ▽ f ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) = 0 f(xˉ)=0
    注:如果 f ( x ) f(x) f(x) 是严格凸的,则全局极小点是唯一的。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

约束极值问题的最优性条件

基本概念

定义: 对 m i n f ( x ) min f(x) minf(x), 设 x ˉ ∈ R n \bar{x} \in R^n xˉRn 是任给一点, d =? 0 d \not = 0 d?=0, 若存在 δ > 0 \delta > 0 δ>0, 使得对任意的 λ ∈ ( 0 , δ ) \lambda \in (0, \delta) λ(0,δ), 有 f ( x ˉ + λ d ) < f ( x ˉ ) f (\bar{x} + \lambda d) < f(\bar{x}) f(xˉ+λd)<f(xˉ), 则称 d d d f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 处的下降方向。

  1. 引理: 设函数 f ( x ) f(x) f(x) 在点 x ˉ \bar{x} xˉ 可微, 若存在 d =? 0 d \not = 0 d?=0, 使得 ▽ f ( x ˉ ) T d < 0 \bigtriangledown f(\bar{x})^T d < 0 f(xˉ)Td<0, 则存在 δ > 0 \delta > 0 δ>0, 是使得对 ? λ ∈ ( 0 , δ ) \forall \lambda \in (0, \delta) ?λ(0,δ), 有 f ( x ˉ + λ d ) < f ( x ˉ ) f(\bar{x} + \lambda d)<f(\bar{x}) f(xˉ+λd)<f(xˉ)
    与梯度方向成钝角的方向是下降方向
    表示为
    F 0 = { d ∣ ▽ f ( x ˉ ) T d < 0 } F_0 = \{ d | \bigtriangledown f(\bar{x})^T d < 0\} F0?={df(xˉ)Td<0}

  2. 定义: 设集合 S ? R n , x ˉ ∈ c l S . S \subset R^n, \bar{x} \in clS. S?Rn,xˉclS., d d d 为非零向量, 若存在数 δ > 0 \delta > 0 δ>0, 使得对任意 λ ∈ ( 0 , δ ) , \lambda \in (0, \delta), λ(0,δ), 都有 x ˉ + λ d ∈ S \bar{x} + \lambda d \in S xˉ+λdS 则称 d d d 为集合 S S S x ˉ \bar{x} xˉ 的可行方向。
    就是移动方向在可行域内
    表示为 D = { d ∣ d =? 0 , x ˉ ∈ c l S , ? δ > 0 , ? λ ∈ ( 0 , δ ) , 有 x ˉ + λ d ∈ S } D = \{ d | d \not = 0, \bar{x} \in clS, \exists \delta > 0, \forall \lambda \in (0, \delta), 有 \bar{x} + \lambda d \in S \} D={dd?=0,xˉclS,?δ>0,?λ(0,δ),xˉ+λdS}
    x ˉ 处 的 可 行 方 向 锥 \bar{x} 处的可行方向锥 xˉ

  3. 定义: 若问题的可行点 x ˉ \bar{x} xˉ 是某个不等式约束 g i ( x ) ≥ 0 g_i(x) \geq 0 gi?(x)0 变成等式, 则该不等式约束称为关于可行点 x ˉ \bar{x} xˉ 的起作用约束; 否则称为不起作用约束。
    表示为
    I = { i ∣ g i ( x ˉ = 0 , x ˉ ∈ S ) } I = \{ i| g_i(\bar{x} = 0, \bar{x} \in S) \} I={igi?(xˉ=0,xˉS)}

  4. 定义:在起作用约束作对应切线,获得对应梯度,与这两个梯度同时呈锐角的方向为积极约束的可行方向。
    表示为 G 0 = { d ∣ ▽ g i ( x ˉ ) T d > 0 , i ∈ I ( x ) } G_0 = \{d | \bigtriangledown g_i(\bar{x})^T d > 0, i \in I(x) \} G0?={dgi?(xˉ)Td>0,iI(x)}
    即由约束条件求出的可行方向
    G 0 ? D G_0 \subset D G0??D
    问题标准形式:
    ???????? m i n f ( x ) \ \ \ \ \ \ \ \ min f(x) ????????minf(x)

s . t . { g i ( x ) ≥ 0 , 不 等 式 约 束 h j ( x ) = 0 , 等 式 约 束 x ∈ R n s.t.\left \{\begin{matrix} g_i (x) \geq 0,不等式约束 \\ \\h_j(x) = 0,等式约束 \\ \\ x \in R^n \end {matrix} \right. s.t.????????????gi?(x)0hj?(x)=0xRn?

几何最优性条件:设 S S S R n R^n Rn 的非空集合, x ˉ ∈ S , f ( x ) \bar{x} \in S, f(x) xˉS,f(x) x ˉ \bar{x} xˉ 处可微, 若 x ˉ \bar{x} xˉ 是局部最优解, 则 F 0 ∩ D = ? F_0 \cap D = \emptyset F0?D=?
即所有的可行方向都是上升方向

只有不等式约束时

由于 G 0 ? D G_0 \subset D G0??D 所以也有 F 0 ∩ G 0 = ? F_0 \cap G_0 = \emptyset F0?G0?=?,可行域之内不能有空洞

  • (F-J条件) 设 x ˉ ∈ S , I = { i ∣ g i ( x ˉ ) = 0 } , f ( x ) , g i ( x ) ( i ∈ I ) \bar{x} \in S, I = \{ i | g_i(\bar{x}) = 0\}, f(x), g_i(x) (i \in I) xˉS,I={igi?(xˉ)=0},f(x),gi?(x)(iI) x ˉ \bar{x} xˉ 处可微, g i ( x ) ( i ? I ) g_i(x) (i \notin I) gi?(x)(i/?I) x ˉ \bar{x} xˉ 处连续, 若 x ˉ \bar{x} xˉ 是问题的最优解,则存在不全为零的数 w 0 , w i ( i ∈ I ) w_0, w_i (i \in I) w0?,wi?(iI) 使得
    w 0 ▽ f ( x ˉ ) ? ∑ i ∈ I w i ▽ g i ( x ˉ ) = 0 w_0 \bigtriangledown f(\bar{x}) - \sum\limits_{i \in I} w_i \bigtriangledown g_i(\bar{x}) = 0 w0?f(xˉ)?iI?wi?gi?(xˉ)=0
    x ˉ \bar{x} xˉ F ? J F-J F?J
    为必要条件,极小值点一定是 F-J点, 但 F-J点不一定为极小值点

在这里插入图片描述

在这里插入图片描述
w 0 = 0 w_0 = 0 w0?=0 是另外另个约束条件的梯度必须能相互抵消,这种情况才有最优解,因此更多的是关注 w 0 =? 0 w_0 \not = 0 w0??=0的情况

  • (KKT条件) 设 x ˉ ∈ S \bar{x} \in S xˉS , f , g i ( i ∈ I ) 在 x ˉ 处 可 微 , g i ( i ? I ) 在 x ˉ 连 续 f, g_i(i \in I)在\bar{x} 处可微, g_i(i \notin I) 在\bar{x}连续 f,gi?(iI)xˉ,gi?(i/?I)xˉ(保证无空洞), { ▽ g i ( x ˉ ) ∣ i ∈ I } 线 性 无 关 \{ \bigtriangledown g_i(\bar{x}) | i \in I\} 线性无关 {gi?(xˉ)iI}线, 若 x ˉ \bar{x} xˉ 是局部最优解, 则存在非负数 w i , i ∈ I , w_i, i \in I, wi?,iI, 使得
    ▽ f ( x ˉ ) ? ∑ i ∈ I w i ▽ g i ( x ˉ ) = 0 \bigtriangledown f(\bar{x}) - \sum\limits_{i \in I} w_i \bigtriangledown g_i(\bar{x}) = 0 f(xˉ)?iI?wi?gi?(xˉ)=0

在这里插入图片描述
凸规划的判别方法:

  1. 可行域是凸集, 目标函数是凸函数
  2. 可行域是 ≥ \geq 的凹函数, 目标函数是凸函数

求KKT点

  • KKT条件的另一种表述
    x ˉ ∈ S \bar{x} \in S xˉS , f , g i ( i ∈ I ) 在 x ˉ f, g_i(i \in I)在\bar{x} f,gi?(iI)xˉ 处可微, { ▽ g i ( x ˉ ) ∣ i ∈ I } 线 性 无 关 \{ \bigtriangledown g_i(\bar{x}) | i \in I\}线性无关 {gi?(xˉ)iI}线, 若 x ˉ \bar{x} xˉ 是局部最优解, 则存在非负数 w i , i = 1 , 2... m w_i, i =1,2...m wi?,i=1,2...m 使得
    { ▽ f ( x ˉ ) ? ∑ i = 1 m w i ▽ g i ( x ˉ ) = 0 ( 没 要 求 对 应 的 g i ( x ) 为 约 束 条 件 ) w i g i ( x ˉ ) = 0 , i = 1 , 2... m ( 互 补 松 弛 条 件 ) w i ≥ 0 i = 1 , 2... m \left \{\begin{matrix} \bigtriangledown f(\bar{x}) - \sum\limits_{i = 1}^{m} w_i \bigtriangledown g_i(\bar{x}) = 0(没要求对应的g_i(x)为约束条件) \\ \\w_ig_i(\bar{x}) = 0, i = 1, 2...m (互补松弛条件) \\ \\ w_i \geq 0 i = 1,2...m \end {matrix} \right. ????????????????f(xˉ)?i=1m?wi?gi?(xˉ)=0(gi?(x))wi?gi?(xˉ)=0,i=1,2...mwi?0i=1,2...m?

通过这个表述方式,加上原来的约束然后将所有的方程列出来求解
在这里插入图片描述
在这里插入图片描述
有人会算的话请留言,感谢

下一篇

最优化理论复习–最优性条件(二)

文章来源:https://blog.csdn.net/m0_64372178/article/details/135313790
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。