函数保留凸性的一些运算,限制为一条线
凸优化在学术研究中非常重要,经常遇到的问题是证明凸性。常规证明凸性的方式是二阶导数的黑塞矩阵为半正定,或者在一维函数时二阶导数大于等于零。但很多时候的数学模型并不那么常规、容易求导的,若能够知道一些保留凸性的运算,将能够显著减少证明凸性的难度。这篇博客总结一些这个知识点。
1. 非负加权和
若函数
f
1
,
…
,
f
m
f_1,\dots,f_m
f1,…,fm 为凸函数,参数
w
1
,
…
,
w
m
w_1,\dots,w_m
w1,…,wm 非负,则函数
f
=
w
1
f
1
+
⋯
+
w
m
f
m
f=w_1f_1+\dots+w_mf_m
f=w1f1+⋯+wmfm
为凸函数。
这可以推广到无限加权和的情况,若函数
f
(
x
,
y
)
f(x,y)
f(x,y) 对于
y
∈
A
y\in \mathcal{A}
y∈A 的每个值都是
x
x
x 的凸函数,并且
w
(
y
)
≥
0
w(y)\geq 0
w(y)≥0,那么函数
g
(
x
)
=
∫
A
w
(
y
)
f
(
x
,
y
)
d
y
g(x) = \int_{\mathcal{A}}w(y)f(x,y)dy
g(x)=∫Aw(y)f(x,y)dy
也是凸函数。(只要积分存在,即 ∫ A w ( y ) ∣ f ( x , y ) ∣ d y < ∞ \int_{\mathcal{A}}w(y)|f(x,y)|dy<\infty ∫Aw(y)∣f(x,y)∣dy<∞)
2. 限制为一条线
凸函数限制为一条线线(restriction to a line),几何意义是凸函数对某条线(这条线为: x + t v x+tv x+tv)与定义域的交集上的点取函数值:对于凸函数 f ( x ) f(x) f(x),对于它定义域内的一点 x x x,即 x ∈ dom f x\in \textbf{dom } f x∈dom f,另外一个满足 x + t v ∈ dom f x+tv\in\textbf{dom } f x+tv∈dom f 的点 v v v,那么函数
g ( t ) = f ( x + t v ) g(t)=f(x+tv) g(t)=f(x+tv)
是关于 t t t 的凸函数。
举例, f ( x , y ) = x 2 + y 2 f(x,y)=x^2+y^2 f(x,y)=x2+y2 为一个凸函数,它的图像为:
若
x
=
(
0
,
0
)
x=(0,0)
x=(0,0),
v
=
(
1
,
2
)
v=(1,2)
v=(1,2),
f
(
x
+
t
v
)
=
2
t
2
f(x+tv)=2t^2
f(x+tv)=2t2,图像为:
看到一些资料说,限制为一条线相当于一个函数竖截面与函数图像交点形成的那条线,如下:
但似乎并不完全是,这条线的形状跟
x
x
x,
v
v
v 的取值有关,这在一维函数时特别明显,但都是凸的。
例如,若 f ( x ) = x 2 f(x)=x^2 f(x)=x2,取 x = 0 , v = 2 x=0, v=2 x=0,v=2,则 g ( t ) = 4 t 2 g(t)=4t^2 g(t)=4t2,图像如下:
有一个定理:
f ( x ) f(x) f(x) 为凸函数,当且仅当对任何 x ∈ dom f x\in\textbf{dom} f x∈domf, x + t v ∈ dom f x+tv\in\textbf{dom} f x+tv∈domf, g ( t ) = f ( x + t v ) g(t)=f(x+tv) g(t)=f(x+tv) 都为凸函数。
证明:
假设
g
(
t
)
g(t)
g(t) 为凸函数,即对于
0
≤
α
≤
1
0\leq\alpha\leq 1
0≤α≤1,有
⇔
α
g
(
t
1
)
+
(
1
−
α
)
g
(
t
2
)
≤
g
(
α
t
1
+
(
1
−
α
)
t
2
)
⇔
α
f
(
x
+
t
1
v
)
+
(
1
−
α
)
f
(
x
+
t
2
v
)
≤
f
(
x
+
(
α
t
1
+
(
1
−
α
)
t
2
)
v
)
\begin{aligned} \Leftrightarrow&\alpha g(t_1)+(1-\alpha)g(t_2)\leq g(\alpha t_1+(1-\alpha)t_2)\\ \Leftrightarrow&\alpha f(x+t_1v)+(1-\alpha)f(x+t_2v)\leq f(x+(\alpha t_1+(1-\alpha)t_2)v) \end{aligned}
⇔⇔αg(t1)+(1−α)g(t2)≤g(αt1+(1−α)t2)αf(x+t1v)+(1−α)f(x+t2v)≤f(x+(αt1+(1−α)t2)v)
令
x
=
x
1
,
t
1
=
0
,
t
2
=
1
,
v
=
x
2
−
x
1
x=x_1, t_1=0, t_2=1,v=x_2-x_1
x=x1,t1=0,t2=1,v=x2−x1,
⇔
α
f
(
x
1
)
+
(
1
−
α
)
f
(
x
2
)
≤
f
(
α
x
1
+
(
1
−
α
)
x
2
)
⇔
f
(
x
)
为凸函数
\begin{aligned} \Leftrightarrow&\alpha f(x_1)+(1-\alpha)f(x_2)\leq f(\alpha x_1+(1-\alpha)x_2)\\ \Leftrightarrow& f(x)\text{ 为凸函数} \end{aligned}
⇔⇔αf(x1)+(1−α)f(x2)≤f(αx1+(1−α)x2)f(x) 为凸函数
□
\square
□