函数保留凸性的一些运算,限制为一条线

凸优化在学术研究中非常重要,经常遇到的问题是证明凸性。常规证明凸性的方式是二阶导数的黑塞矩阵为半正定,或者在一维函数时二阶导数大于等于零。但很多时候的数学模型并不那么常规、容易求导的,若能够知道一些保留凸性的运算,将能够显著减少证明凸性的难度。这篇博客总结一些这个知识点。

1. 非负加权和

若函数 f 1 , … , f m f_1,\dots,f_m f1,,fm 为凸函数,参数 w 1 , … , w m w_1,\dots,w_m w1,,wm 非负,则函数
f = w 1 f 1 + ⋯ + w m f m f=w_1f_1+\dots+w_mf_m f=w1f1++wmfm
为凸函数。

这可以推广到无限加权和的情况,若函数 f ( x , y ) f(x,y) f(x,y) 对于 y ∈ A y\in \mathcal{A} yA 的每个值都是 x x x 的凸函数,并且 w ( y ) ≥ 0 w(y)\geq 0 w(y)0,那么函数
g ( x ) = ∫ A w ( y ) f ( x , y ) d y g(x) = \int_{\mathcal{A}}w(y)f(x,y)dy g(x)=Aw(y)f(x,y)dy

也是凸函数。(只要积分存在,即 ∫ A w ( y ) ∣ f ( x , y ) ∣ d y < ∞ \int_{\mathcal{A}}w(y)|f(x,y)|dy<\infty Aw(y)f(x,y)dy<

2. 限制为一条线

凸函数限制为一条线线(restriction to a line),几何意义是凸函数对某条线(这条线为: x + t v x+tv x+tv)与定义域的交集上的点取函数值:对于凸函数 f ( x ) f(x) f(x),对于它定义域内的一点 x x x,即 x ∈ dom   f x\in \textbf{dom } f xdom f,另外一个满足 x + t v ∈ dom   f x+tv\in\textbf{dom } f x+tvdom f 的点 v v v,那么函数

g ( t ) = f ( x + t v ) g(t)=f(x+tv) g(t)=f(x+tv)

是关于 t t t 的凸函数。

举例, f ( x , y ) = x 2 + y 2 f(x,y)=x^2+y^2 f(x,y)=x2+y2 为一个凸函数,它的图像为:

在这里插入图片描述
x = ( 0 , 0 ) x=(0,0) x=(0,0), v = ( 1 , 2 ) v=(1,2) v=(1,2), f ( x + t v ) = 2 t 2 f(x+tv)=2t^2 f(x+tv)=2t2,图像为:
在这里插入图片描述
看到一些资料说,限制为一条线相当于一个函数竖截面与函数图像交点形成的那条线,如下:

在这里插入图片描述
但似乎并不完全是,这条线的形状跟 x x x, v v v 的取值有关,这在一维函数时特别明显,但都是凸的。

例如,若 f ( x ) = x 2 f(x)=x^2 f(x)=x2,取 x = 0 , v = 2 x=0, v=2 x=0,v=2,则 g ( t ) = 4 t 2 g(t)=4t^2 g(t)=4t2,图像如下:

在这里插入图片描述
有一个定理:

f ( x ) f(x) f(x) 为凸函数,当且仅当对任何 x ∈ dom f x\in\textbf{dom} f xdomf, x + t v ∈ dom f x+tv\in\textbf{dom} f x+tvdomf, g ( t ) = f ( x + t v ) g(t)=f(x+tv) g(t)=f(x+tv) 都为凸函数。

证明:
假设 g ( t ) g(t) g(t) 为凸函数,即对于 0 ≤ α ≤ 1 0\leq\alpha\leq 1 0α1,有
⇔ α g ( t 1 ) + ( 1 − α ) g ( t 2 ) ≤ g ( α t 1 + ( 1 − α ) t 2 ) ⇔ α f ( x + t 1 v ) + ( 1 − α ) f ( x + t 2 v ) ≤ f ( x + ( α t 1 + ( 1 − α ) t 2 ) v ) \begin{aligned} \Leftrightarrow&\alpha g(t_1)+(1-\alpha)g(t_2)\leq g(\alpha t_1+(1-\alpha)t_2)\\ \Leftrightarrow&\alpha f(x+t_1v)+(1-\alpha)f(x+t_2v)\leq f(x+(\alpha t_1+(1-\alpha)t_2)v) \end{aligned} αg(t1)+(1α)g(t2)g(αt1+(1α)t2)αf(x+t1v)+(1α)f(x+t2v)f(x+(αt1+(1α)t2)v)
x = x 1 , t 1 = 0 , t 2 = 1 , v = x 2 − x 1 x=x_1, t_1=0, t_2=1,v=x_2-x_1 x=x1,t1=0,t2=1,v=x2x1,
⇔ α f ( x 1 ) + ( 1 − α ) f ( x 2 ) ≤ f ( α x 1 + ( 1 − α ) x 2 ) ⇔ f ( x )  为凸函数 \begin{aligned} \Leftrightarrow&\alpha f(x_1)+(1-\alpha)f(x_2)\leq f(\alpha x_1+(1-\alpha)x_2)\\ \Leftrightarrow& f(x)\text{ 为凸函数} \end{aligned} αf(x1)+(1α)f(x2)f(αx1+(1α)x2)f(x) 为凸函数
□ \square