优化基础系列 - 2. 无约束优化问题：一阶必要条件

0. 问题描述

这一讲关注以下问题：

无约束优化问题： \[ \begin{align} \label{eq:pblm-1} \min_{x \in \mathbb{R}^n} f(x) \end{align} \]

接下来讨论这个问题最优解需要满足的必要条件。

定理 1 （一阶必要条件）

考虑可微函数 \(f:\mathbb{R}^n\to\mathbb{R}\)。

如果 \(x^*\) 是 (f) 的局部极小点，即存在 \(\delta>0\) 使得 \[ \begin{align} |x-x^\ast|<\delta \ \Rightarrow\ f(x)\ge f(x^\ast), \end{align} \]
则 \(x^*\) 满足 \[ \begin{align} \label{eq:sln-1} \nabla f(x^*) = 0 \end{align} \]

下面分两步证明：

已知

求证：

证明：

局部极小点的定义：存在 \(\delta>0\)，当 \(|x-x^\ast|<\delta\) 时，有 \[ f(x)\ge f(x^*). \]

对右侧取极限：

对所有足够小的 \(h>0\) \(x^\ast+h\) 仍在 \((x^\ast-\delta,x^\ast+\delta)\) 内，所以 \[ f(x^\ast+h)\ge f(x^\ast). \] 于是 \[ \frac{f(x^\ast+h)-f(x^\ast)}{h}\ge 0,\quad h>0. \] 令 \(h\downarrow 0\)，得到右导数 \[ \lim_{h\downarrow 0}\frac{f(x^\ast+h)-f(x^\ast)}{h}\ \ge\ 0. \]
对左侧取极限：对所有足够小的 \(h<0\)，同样有 \[ f(x^\ast+h)\ge f(x^\ast), \] 但此时 \(h<0\)，所以 \[ \frac{f(x^\ast+h)-f(x^\ast)}{h}\le 0,\quad h<0, \] 令 \(h\uparrow 0\)，得到左导数 \[ \lim_{h\uparrow 0}\frac{f(x^\ast+h)-f(x^\ast)}{h}\ \le\ 0. \]
由于 \(f(\cdot)\) 在 \(x^*\) 可微，左右导数相等，都等于 \(f'(x^*)\)。于是 \[ 0\le f'(x^\ast)\le 0 \quad\Rightarrow\quad f'(x^\ast)=0. \]

一维情形得证。

现在设 \(f:\mathbb{R}^n\to\mathbb{R}\) 在 \(x^*\) 可微，且 \(x^*\) 是局部极小点。

思路：

沿任意方向 \(d\) 看一条“截面函数” \[ \varphi_d(t)=f(x^\ast+t d). \]
由于 \(x^*\) 是局部极小点，在 \(t=0\) 处，这个一维函数也有局部极小值，于是一维结果告诉我们 \(\varphi_d'(0)=0\)。
另一方面，由链式法则 \[ \varphi_d'(0)=\nabla f(x^\ast)^\top d. \] 所以对所有方向 \(d\) 都为 0，只能说明 \(\nabla f(x^\ast)=0\)。

下面将证明过程写得严谨一点。

总结一句话：

这就是“无约束极小点 ⇒ 驻点（梯度为零）”的一阶必要条件。

opt > opt-basics

#opt #optimization basics #Lagrange multiplier #KKT conditions

优化基础系列 - 2. 无约束优化问题：一阶必要条件

http://yylustb.github.io/2025/12/04/opt/opt_basics/opt_basics_2/

作者

yylustb

发布于

2025年12月4日

许可协议