最优化理论复习--使用导数的最优化方法

2024-01-10 10:45:56

文章目录

上一篇
最速下降法
牛顿法
下一篇

最优化理论复习–最优性条件（二）

最速下降法

考虑无约束问题 $x\in R^n$ , 其中 $f (x)$ 具有一阶连续偏导数（梯度下降法）
策略：从某一点出发，选择一个目标函数值下降最快的方向，沿此方向搜索以期尽快达到极小点。

下降方向：负梯度方向是最速下降方向
$-\frac{\bigtriangledown f(x)}{||\bigtriangledown f(x)||}$
注：在不同的尺度下最速下降方向是不同的

最速下降法的迭代公式：
$x_{k + 1} = x_{k} + \lambda_k d_{k}$

$d_{k}$ 为搜索方向为 $\bigtriangledown f(x_{k})$
$\lambda_k$ 为一维搜索步长，满足 $f(x_k + \lambda_k d_k) = \min\limits_{\lambda \geq 0} f(x_k + \lambda d_k)$

算法步骤：

给定初始点 $x_k \in E^n$ , 允许误差 $\epsilon > 0, k = 1$
计算搜索方向 $\bigtriangledown f(x_k)$
若 $||d_k|| \leq \epsilon$ , 停止，从 $x_k$ 出发，沿 $d_k$ 进行一维搜索，求 $\lambda_k$ , 使得 $f(x_k + \lambda_k d_k) = \min\limits_{\lambda_k \geq 0} f(x_k + \lambda d_k)$
令 $x_{k +1} = x_k + \lambda_k d_k, k = k + 1$ , 转2

在这里插入图片描述
最速下降法的收敛性是线性收敛的。
条件数越小，收敛越快；条件数越大，收敛越慢
最速下降法存在锯齿现象，因为相邻的两个搜索方向是正交的

牛顿法

设 $f (x)$ 是二次可微函数， $\in R^n$ , 又设 $x_k$ 是 $f (x)$ 的极小点的一个估计，将 $f (x)$ 在 $x_k$ 点泰勒展开，二阶近似
$f(x_k) + \bigtriangledown f(x_k)^T (x - x_k) + \frac{1}{2} (x - x_k)^T \bigtriangledown^2 f(x_k) (x - x_k)$
其中 $\bigtriangledown ^2 f(x_k) 是f(x)$ 在点 $x_k$ 处的海森矩阵

因此牛顿法的迭代公式为
$x_{k + 1} = x_k - \bigtriangledown^2 f(x_k)^{-1} \bigtriangledown f(x_k)$

算法步骤：

给定初始点 $x_0$ , 允许误差 $\epsilon > 0, k = 1$
若 $||\bigtriangledown f(x_k)|| \leq \epsilon$ , 停止，得解 $x_k$ ,否则，令 $x_{k + 1} = x_k - \bigtriangledown^2 f(x_k)^{-1} \bigtriangledown f(x_k), k = k + 1$ , 转2

在这里插入图片描述

牛顿法的收敛性是至少二阶收敛的

但是当初始点远离极小点时，牛顿法可能不收敛
因此在牛顿法的基础上增加了步长的概念

阻尼牛顿法
基本思想：增加沿牛顿方向一维搜索

迭代公式
$x_{k + 1} = x_k + \lambda_k d_k$

$d_k = - \bigtriangledown^2 f(x_k)^{-1} \bigtriangledown f(x_k)$
$\lambda_k = \min\limits_\lambda f(x_k + \lambda d_k)$

算法步骤：

给定初始点 $x_0 \epsilon > 0, k = 1$
计算 $\bigtriangledown f(x_k), \bigtriangledown^2 f(x_k) ^{-1}$
若 $||\bigtriangledown f(x_k)|| \leq \epsilon$ ，停止，否则令 $d_k = - \bigtriangledown^2 f(x_k) ^{-1} \bigtriangledown f(x_k)$
从 $x_k$ 出发，沿方向 $d_k$ 作一维搜索求 $\lambda_k$ ，令 $x_{k + 1} = x_k + \lambda_k d_k$
k = k + 1，转2

二阶矩阵逆矩阵公式：

对 $\begin{matrix} a & b \\ c & d \ \end{matrix} ]$ , 则 $∣ A ∣ = a d ? b c$
当 $\not = 0$ 时， A的逆矩阵为
$A^{-1} = \frac{1}{|A|}[ \begin{matrix} d & -b \\ -c & a \ \end{matrix} ]$
行列式的倒数乘主对角线互换，副对角线添负号

在这里插入图片描述
为了解决 $H e s s i a n$ 矩阵不存在的情况，提出修正的牛顿法

方法是在 $H e s s i a n$ 矩阵的基础上加一个参数的单位矩阵是它化为正定矩阵
构造 $G_k$ , $I$ 为单位矩阵， $\epsilon_k$ 是一个适当的正数
$G_k = \bigtriangledown^2 f(x_k) + \epsilon_k I$

算法步骤：

给定初始点 $x_0 \epsilon > 0, k = 0$
计算梯度 $\bigtriangledown f(x_k)$ , 若 $||\bigtriangledown f(x_k)|| \leq \epsilon$ , 停止，得到解 $x_k$ , 否则跳到3
计算 $\bigtriangledown^2 f(x_k)$ , 求修正后的矩阵 $G_k = \bigtriangledown^2 f(x_k) + \theta I$ 计算修正牛顿方向 $d_k = -(G_k)^{-1} \bigtriangledown f(x_k)$
从 $x_k$ 出发，沿方向 $d_k$ 作一维搜索，求步长 $\lambda_k$
令 $x_{k + 1} = x_k + \lambda_k d_k$ , k = k + 1, 转2

未完待续

文章来源:https://blog.csdn.net/m0_64372178/article/details/135372654
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！

最优化理论复习--使用导数的最优化方法

文章目录

上一篇

最速下降法

牛顿法

下一篇