最优化期末复习

典型题型

判断是否为局部最优解(非线性规划)

1.写出 L ( x , w , v ) L(x,w,v) L(x,w,v) ∇ f ( x ) , ∇ g ( x ) , ∇ h ( x ) \nabla f(x),\nabla g(x),\nabla h(x) f(x),g(x),h(x),求出 ∇ x L \nabla_xL xL ∇ x 2 L \nabla_x^2L x2L
(1)判断是否是可行点
(2)找出 I I I
(3)根据 I I I写出KKT方程。
(4)求解KKT方程,如果 w i < 0 w_i<0 wi<0,则不是KKT点->不是局部最优解
(5)如果 w ≥ 0 w\geq0 w0,则是KKT点。写出 ∇ x 2 L \nabla_x^2L x2L
               \;\;\;\;\;\;\; ∇ x 2 L \nabla_x^2L x2L正定->在 G G G上正定->局部最优解
               \;\;\;\;\;\;\; ∇ x 2 L \nabla_x^2L x2L不是正定,求 G ˉ \bar G Gˉ,如果 G ˉ = { ( 0 , 0 ) } \bar G=\{(0,0)\} Gˉ={(0,0)},则 G = ∅ G=\varnothing G=->局部最优解;如果 G ˉ \bar G Gˉ还有其他向量且 ∇ x 2 L \nabla_x^2L x2L G ˉ \bar G Gˉ上不是半正定的->不是局部最优解

凸集与凸函数

凸集定义和性质~表示定理:《绪论》p60

凸集的定义和性质

定义

在这里插入图片描述
超平面 H = { x ∣ p T x = a } H=\{\textbf{x}|\textbf{p}^T\textbf{x}=\textbf{a}\} H={xpTx=a}
半空间 H = { x ∣ p T x ≤ a } H=\{\textbf{x}|\textbf{p}^T\textbf{x}\le\textbf{a}\} H={xpTxa}
射线 L = { x ∣ x = x ( 0 ) + λ d , λ ≥ 0 } L=\{\textbf{x}|\textbf{x}=\textbf{x}^{(0)}+\lambda\textbf{d},\lambda\geq0\} L={xx=x(0)+λd,λ0}
多面体/集 { x ∣ Ax ≤ b } \{\textbf{x}|\textbf{Ax}\leq\textbf{b}\} {xAxb}
{ ∑ i = 1 k λ i α 0 , λ i ≥ 0 } \{\sum_{i=1}^k \lambda_i \alpha^{0}, \lambda_i\geq 0\} {i=1kλiα0,λi0} 凸集+锥
都是凸集。

性质

在这里插入图片描述
S 1 ∪ S 2 S_1\cup S_2 S1S2不一定是凸集

证明是凸集: 1.定义法。 2.性质法,用已知的凸集构造

极点和极方向的定义

极点

在这里插入图片描述
对于紧凸集,任何一点都能被极点的凸组合表示,但是对于无界集不适用->引入极方向。

方向、不同方向、极方向

在这里插入图片描述
有界集不存在(极)方向,只有无界集才可能存在。

方向的证明
1.定义
2.在这里插入图片描述

极方向的证明
d = α 1 d 1 + α 2 d 2 \textbf{d}=\alpha_1\textbf{d}_1+\alpha_2\textbf{d}_2 d=α1d1+α2d2,其中 α 1 , α 2 > 0 \alpha_1,\alpha_2>0 α1,α2>0,要说明 d 1 \textbf{d}_1 d1 d 2 \textbf{d}_2 d2是方向。
如果能推出 d 1 = λ d 2 , λ > 0 \textbf{d}_1=\lambda\textbf{d}_2,\lambda>0 d1=λd2,λ>0,则 d \textbf{d} d是极方向。
证明例子可见《绪论》p65

表示定理

在这里插入图片描述

凸集分离定理

定理1: S S S E n E^n En的闭凸集, y ∉ S y\notin S y/S,则存在唯一的 x ˉ ∈ S \bar x\in S xˉS,使得 ∣ ∣ y − x ˉ ∣ ∣ = i n f x ∈ S ∣ ∣ y − x ∣ ∣ > 0 ||y-\bar x||=inf_{x\in S}||y-x||>0 ∣∣yxˉ∣∣=infxS∣∣yx∣∣>0
x ˉ \bar x xˉ是这一最小距离点 ↔ \leftrightarrow 对任意 x ∈ S x\in S xS,有 ( y − x ˉ ) T ( x ˉ − x ) ≥ 0 (y-\bar x)^T(\bar x-x)\geq0 (yxˉ)T(xˉx)0
定理2: S S S E n E^n En的非空闭凸集, y ∉ S y\notin S y/S,则存在非零向量 p p p ϵ > 0 \epsilon>0 ϵ>0,使得对任意 x ∈ S x\in S xS,有 p T y ≥ ϵ + p T x p^Ty\geq\epsilon+p^Tx pTyϵ+pTx
定理3: S S S E n E^n En的非空凸集, y ∉ ∂ S y\notin \partial S y/S,则存在非零向量 p p p,使得对任意 x ∈ c l S x\in clS xclS,有 p T y ≥ p T x p^Ty\geq p^Tx pTypTx
推论4: S S S E n E^n En的非空凸集, y ∉ S y\notin S y/S,则存在非零向量 p p p,使得对任意 x ∈ c l S x\in clS xclS,有 p T ( x − y ) ≤ 0 p^T(x-y)\leq0 pT(xy)0
定理5: S 1 S_1 S1 S 2 S_2 S2是两个非空凸集, S 1 ∩ S 2 = ∅ S_1\cap S_2=\varnothing S1S2=,则存在非零向量 p p p,使得 i n f inf inf{    p T x ∣ x ∈ S 1 \;p^Tx|x\in S_1 pTxxS1} ≥ ≥ s u p sup sup{    p T x ∣ x ∈ S 2 \;p^Tx|x\in S_2 pTxxS2}
定理6: S 1 S_1 S1 S 2 S_2 S2是两个非空闭凸集, S 1 S_1 S1有界,且 S 1 ∩ S 2 = ∅ S_1\cap S_2=\varnothing S1S2=,则存在非零向量 p p p ϵ > 0 \epsilon>0 ϵ>0,使得 i n f inf inf{    p T x ∣ x ∈ S 1 \;p^Tx|x\in S_1 pTxxS1} ≥ ≥ ϵ + s u p \epsilon +sup ϵ+sup{    p T x ∣ x ∈ S 2 \;p^Tx|x\in S_2 pTxxS2}

Farkas定理

《教材》p25
在这里插入图片描述

Gordan定理

在这里插入图片描述

凸函数

定义

在这里插入图片描述

性质

在这里插入图片描述
f1 f2凸,max{f1, f2}凸

判别

一阶充要条件

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

二阶充要条件

在这里插入图片描述
在这里插入图片描述
逆定理不成立。

凸规划

注意:线性函数既是凸又是凹
凸规划的局部极小点就是全局极小点,且极小点的集合为凸集。

线性规划

在这里插入图片描述

非标准型LP转化为标准型LP:
1. x j x_j xj无非负约束,引入 x j ′ ≥ 0 , x j ′ ′ ≥ 0 x_j'\geq0,x_j''\geq0 xj0,xj′′0,令 x j = x j ′ − x j ′ ′ x_j=x_j'-x_j'' xj=xjxj′′
2.决策变量有上下界,如 1 ≤ x 3 ≤ 5 1\leq x_3\leq 5 1x35,令 x 3 ′ = x 3 − 1 x_3'=x_3-1 x3=x31,则 x 3 ′ ≥ 0 , x 3 ′ ≤ 4 x_3'\geq 0,x_3'\leq 4 x30,x34,后者可以加一个松弛变量转化为等式
3.含有绝对值
u i = x i + ∣ x i ∣ 2 , v i = x i − ∣ x i ∣ 2 u_i=\frac{x_i+|x_i|}{2},v_i=\frac{x_i-|x_i|}{2} ui=2xi+xi,vi=2xixi,则 u i , v i ≥ 0 , x i = u i − v i , ∣ x i ∣ = u i + v i u_i,v_i\geq0,x_i=u_i-v_i,|x_i|=u_i+v_i ui,vi0,xi=uivi,xi=ui+vi

法向量和等值线垂直( − 10 x 1 − 15 x 2 -10x_1-15x_2 10x115x2的法向量是 ( − 10 , − 15 ) T (-10,-15)^T (10,15)T),等值线沿着法向量移动时,目标函数值增加;沿法向量反方向移动时,目标函数值减少。

基本概念

无可行解:可行域为空
有可行解:

  • 无界解:不存在有限的最优解(认为不存在最优解)
  • 有最优解(唯一解/无穷多解)

基本解、基本可行解、(非)退化的基本可行解
A中任意m列组成的m阶可逆方阵B是基(矩阵)。 Ax=b
在这里插入图片描述

二阶可逆矩阵:
在这里插入图片描述

基本性质

在这里插入图片描述

如果LP存在最优解,一定在某个极点上找到。
这些定理的证明可以在《线性规划基本性质》末尾找到
1. K = { x ∣ Ax = b , x ≥ 0 } K=\{\textbf{x}|\textbf{Ax}=\textbf{b},\textbf{x}\geq0\} K={xAx=b,x0}的极点集和 Ax = b , x ≥ 0 \textbf{Ax}=\textbf{b},\textbf{x}\geq0 Ax=b,x0的基本可行解等价。
2.可行解 x \textbf{x} x是基本可行解 ⇔ \Leftrightarrow x \textbf{x} x的非零向量对应的A列向量线性无关
3. S = { x ∣ Ax = b , x ≥ 0 } S=\{\textbf{x}|\textbf{Ax}=\textbf{b},\textbf{x}\geq0\} S={xAx=b,x0}的方向 d \textbf{d} d有k个非零分量,则 d \textbf{d} d S S S的极方向 ⇔ \Leftrightarrow d \textbf{d} d的非零分量所对应A的列向量组的秩为k-1.
4.(1)LP有可行解,则一定有基本可行解。(2)如果有最优解,则存在一个基本可行解是最优解。
(3)如果有最优解,要么唯一,要么无穷。

单纯形法

极小化问题中,对于某个基本可行解,如果 z j − c j = c B B − 1 p j − c j ≤ 0 z_j-c_j=c_BB^{-1}p_j-c_j\leq0 zjcj=cBB1pjcj0,或是 c B B − 1 N − c N ≤ 0 c_BB^{-1}N-c_N\leq0 cBB1NcN0

在这里插入图片描述
达到最优解时,如果某个非基变量的检验数为零,则该LP存在多个最优解。
注意达到最优解时,y可以任取,但b≥0。

表格形式的单纯形法:
在这里插入图片描述
在这里插入图片描述

寻找初始可行解:两阶段法/大M法

x a \textbf{x}_a xa是在每一行增加的人工变量(为了凑出一个单位矩阵)。

两阶段法

在这里插入图片描述
在这里插入图片描述
情况(2),删去人工变量所在列,重新计算最后一行。

y i = B − 1 p j , b ˉ = B − 1 b y_i=B^{-1}p_j,\bar b=B^{-1}b yi=B1pj,bˉ=B1b,所以在重新计算时可以直接用 z j − c j = c B y i − c j , f = c B b ˉ z_j-c_j=c_By_i-c_j,f=c_B\bar b zjcj=cByicj,f=cBbˉ

大M法

在这里插入图片描述
在这里插入图片描述
退化解:某个基变量=0,可能会造成计算过程的循环。(确定出基变量时如果有多个最小比值,会出现退化解)

对偶原理

不同形式的对偶问题

对称形式

在这里插入图片描述

非对称形式

原问题:
m i n    cx s . t .    Ax = b x ≥ 0 min \;\textbf{cx}\\s.t.\;\textbf{Ax}=\textbf{b}\\\\\textbf{x}\geq\textbf{0}\\ mincxs.t.Ax=bx0

对偶问题:
m i n    wb s . t .    wA ≤ c min \;\textbf{wb}\\s.t.\;\textbf{wA}\leq\textbf{c} minwbs.t.wAc
在这里插入图片描述

对偶定理

弱对偶定理

x ( 0 ) \textbf{x}^{(0)} x(0) w ( 0 ) \textbf{w}^{(0)} w(0)是可行解,则 cx ( 0 ) ≥ w ( 0 ) b \textbf{cx}^{(0)}\geq\textbf{w}^{(0)}\textbf{b} cx(0)w(0)b
推论:
1.若LP(或DLP)问题有无界解,则其对偶问题(或原问题)无可行解;若LP(或DLP)问题有无可行解,则其对偶问题(或原问题)无可行解/目标函数值趋于无穷;
2.极大化问题的任何一个可行解所对应目标函数值都是其对偶问题目标函数值的下界;
3.极小化问题的任何一个可行解所对应目标函数值都是其对偶问题目标函数值的上界。

最优性准则

在这里插入图片描述

强对偶定理

若(L)(D)均有可行解 -> (L)(D)均有最优解->(L)(D)的最优目标函数值相等。
推论:若原问题(对偶问题)有最优解,则 对偶问题(原问题)也有最优解,且最优目标函数值相等。

互补松弛定理

(对称形式)
在这里插入图片描述
(非对称形式)
在这里插入图片描述

对偶单纯形法

在这里插入图片描述
如何得到初始对偶可行的基本解?
在这里插入图片描述
在这里插入图片描述
然后继续用对偶单纯形法解扩充问题
(1)扩充问题无解->原问题无解
(2)扩充问题有最优解->得到原问题可行解,如果扩充问题的最优值与M无关,则也是原问题的最优解
例子在《教材》p150

灵敏度分析

价格系数改变

非基变量

x k x_k xk的系数从 c k c_k ck变为 c k ′ c_k' ck
j ≠ k , z j ′ − c j ′ = z j − c j j≠k,z_j'-c_j'=z_j-c_j j=k,zjcj=zjcj不变
j = k , z k ′ − c k ′ = z k − c k − ( c k ′ − c k ) j=k,z_k'-c_k'=z_k-c_k - (c_k'-c_k) j=k,zkck=zkck(ckck)
如果 z k ′ − c k ′ ≤ 0 z_k'-c_k'\leq0 zkck0,B仍为最优基,反之 x k x_k xk为进基变量。

基变量

j ≠ k , z j ′ − c j ′ = z j − c j + ( c k ′ − c k ) y k j j≠k,z_j'-c_j'=z_j-c_j+(c_k'-c_k)y_{kj} j=k,zjcj=zjcj+(ckck)ykj
j = k , z k ′ − c k ′ = 0 j=k,z_k'-c_k'=0 j=k,zkck=0
将原单纯形表 x k x_k xk所在航乘 ( c k ′ − c k ) (c_k'-c_k) (ckck)到判别数行,并将 x k x_k xk对应判别数设为0.

右端向量改变

1. B − 1 b ′ ≥ 0 B^{-1}b'\geq0 B1b0,原来的最优基仍为最优基,但基变量取值、目标函数最优值都会变化

x B ′ = B − 1 b ′ = B − 1 b + B − 1 Δ b x_B'=B^{-1}b'=B^{-1}b+B^{-1}\Delta b xB=B1b=B1b+B1Δb
x N ′ = 0 x_N'=0 xN=0
f m i n ′ = f m i n + c B B − 1 Δ b f_{min}'=f_{min}+c_BB^{-1}\Delta b fmin=fmin+cBB1Δb

2. B − 1 b ′ B^{-1}b' B1b不是所有分量都大于等于0
原来的最优基不再可行,但是是对偶可行的基本解,重新求解。
将最右一列修改为 [ B − 1 b ′ , c B B − 1 b ] T [B^{-1}b',c_BB^{-1}b]^T [B1b,cBB1b]T即可。

增加新约束

P m + 1 x ≤ b m + 1 , P m + 1 P^{m+1}x\leq b_{m+1},P^{m+1} Pm+1xbm+1Pm+1是n维向量
1.如果原最优解满足新约束,那它也是新问题最优解
2.如果不满足,新约束中引入松弛变量变成等式,然后将系数直接加在表中(松弛变量作为基变量),判别数行不变,新的松弛变量判别数为0。然后高斯方法将基变量的矩阵重新变成单位矩阵->对偶单纯形法。
《教材》p166

在这里插入图片描述

最优性条件

主要考虑非线性问题
非线性问题的最优解(如果存在),可在可行域内任意一点达到,但线性规划通常在边界取到。
∇ f ( x ∗ ) = 0 \nabla f(x^*)=0 f(x)=0,称 x ∗ x^* x为驻点,分为极值点和鞍点。

无约束问题的极值条件

必要条件

一般用来反推某点不是极小点。

一阶

在这里插入图片描述

二阶

在这里插入图片描述

充分条件

在这里插入图片描述
推论:
f ( x ) = 1 2 x T A x + b T x + c f(x)=\frac{1}{2}x^TAx+b^Tx+c f(x)=21xTAx+bTx+c A A A对称正定,有唯一极小点 x ∗ = − A − 1 b x^*=-A^{-1}b x=A1b

充要条件

注意前提:凸函数!
在这里插入图片描述

约束极值问题的最优性条件

一些基础概念

下降方向

在这里插入图片描述

可行方向

在这里插入图片描述
如果是局部极小点, F 0 ∩ D = ∅ F_0\cap D=\varnothing F0D=

局部约束方向锥

在这里插入图片描述
如果 ∇ f ( x ) T d < 0 , ∇ g i ( x ) T d > 0 ( i ∈ I ) \nabla f(x)^Td<0,\nabla g_i(x)^Td>0(i\in I) f(x)Td<0,gi(x)Td>0(iI),则d是可行下降方向。

正则点

在这里插入图片描述

切锥

不等式约束问题的一阶最优性条件

KKT必要条件

在这里插入图片描述
在这里插入图片描述

一阶充分条件

凸规划+KKT->整体极小点
推论:如果是凸规划,整体最优解<->KKT点

一般约束问题的一阶最优性条件

在这里插入图片描述

KKT必要条件

在这里插入图片描述
互补松弛版本:
在这里插入图片描述
如果约束都是线性/只有一个约束,一般都是正则点。

Lagrange版本KKT条件

在这里插入图片描述

向量版本的Lagrange函数:
在这里插入图片描述

一阶充分条件

凸规划+KKT->整体极小点
在这里插入图片描述
推论:凸(线性)规划,KKT<->最优解

在这里插入图片描述

二阶条件

必要

在这里插入图片描述

充分

在这里插入图片描述

对偶问题

在课件《最优性条件》p111开始

Lagrange对偶问题

在这里插入图片描述
如果 θ ( w , v ) \theta (w,v) θ(w,v)不存在有限下界时,令 θ ( w , v ) = 0 \theta (w,v)=0 θ(w,v)=0
注意选择不同的集约束,结果可能不同。

对偶定理

弱对偶定理及推论

在这里插入图片描述
###
在这里插入图片描述

f m i n = i n f { f } , θ m a x = s u p { θ } f_{min}=inf\{f\},\theta_{max} = sup\{\theta\} fmin=inf{f},θmax=sup{θ},对偶间隙 δ = f m i n − θ m a x \delta=f_{min}-\theta_{max} δ=fminθmax

引理

在这里插入图片描述
证明见《教材》p245

算法

闭映射

在这里插入图片描述

x ( k ) x^{(k)} x(k)是定义好的点列,每一个 x i x_i xi被映射到 A ( x i ) A(x_i) A(xi)中,然后 y i y_i yi从集合 A ( x i ) A(x_i) A(xi)中任取,最终构成了 y ( k ) y^{(k)} y(k)

二次终止性

对于任意正定二次函数,从任意初始点出发,能经过有限步迭代到达极小值点,则称该算法有二次终止性。

一维搜索

如果 x ( k + 1 ) x^{(k+1)} x(k+1)是由精确一维搜索得到的,则有 ∇ f ( x ( k + 1 ) ) T d k = 0 \nabla f(x^{(k+1)})^Td^k=0 f(x(k+1))Tdk=0

算法优点缺点
0.618法不要求函数可微,甚至函数不连续时仍可应用收敛满,只适用于单峰区间,所以需要先确定单峰区间,再使用0.618法的计算公式
牛顿法初始点很重要,如果靠近极小点,至少以二级收敛速度收敛,但如果距离很远,可能会不收敛
抛物线法不用求导,计算比较简单没有牛顿法快,大概1.3
三次插值法

使用导数的最优化方法

最速下降法

最速下降方向: d ( k ) = − ∇ f ( x ( k ) ) d^{(k)}=-\nabla f(x^{(k)}) d(k)=f(x(k))
步长:精确搜索
全局收敛

牛顿法

牛顿方向: d ( k ) = − ∇ 2 f ( x ( k ) ) − 1 ∇ f ( x ( k ) ) d^{(k)}=-\nabla^2 f(x^{(k)})^{-1}\nabla f(x^{(k)}) d(k)=2f(x(k))1f(x(k)),不一定是下降方向。
步长:恒为1
可能收敛到极小点/鞍点,也可能Hesse矩阵不可逆无法继续迭代

阻尼牛顿法:步长为1 -> 精确搜索
修正牛顿法:保证每一步迭代目标函数值都下降

算法优点缺点二次终止性
最速下降法全局收敛。初始点任取。迭代过程简单,计算量和存储量小,开始时函数值下降很快,可以快速靠近最优解收敛速度慢,强条件下仅为线性。相邻两搜索方向正交,不适用于算法收局。
牛顿法收敛速度快(至少二阶)初始点不能任取。某步迭代时函数值可能上升。可能会不收敛/收敛到鞍点/无法计算。计算量存储量大
共轭梯度法初始点任取,计算量和存储量小,线性收敛

共轭方向法

《使用导数的最优化方法》p35

共轭方向

在这里插入图片描述
在这里插入图片描述

扩张子空间定理

在这里插入图片描述

共轭方向法

共轭梯度法

可行方向法

Zoutendijk可行方向法

在这里插入图片描述
在这里插入图片描述

求可行下降方向

在这里插入图片描述
在这里插入图片描述
非线性约束的情形 p25

Rosen梯度投影法

正交投影矩阵

在这里插入图片描述

梯度投影法原理

在这里插入图片描述
在这里插入图片描述

Wolfe既约梯度法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

惩罚函数法

将约束函数揉进目标函数,从而将约束优化转化为与原问题近似的无约束优化。

外点法

在这里插入图片描述

方法优点缺点特点
外点法初始点可以任取,可用于非凸规划的最优化惩罚项的二阶偏导数一般不存在;外点法的中间结果不是可行解,不可作为近似解;xk接近最优解时,罚因子可能很大,使罚函数性质变化,使搜索产生极大困难。惩罚系数不断增大
内点法中间结果都是可行解,可作为近似解选取初始点很困难,只适用于含不等式的非线性规划惩罚系数不断缩小

内点法

在这里插入图片描述

在这里插入图片描述
i n t    S = { s ∣ g i ( x ) > 0 , i = 1 , 2 , . . . , m } int\;S=\{s|g_i(x)>0,i=1,2,...,m\} intS={sgi(x)>0,i=1,2,...,m}