图卷积网络原理（二）【图信号与图的拉普拉斯矩阵】

矩阵乘法的三种视角

后续图卷积网络的原理讲解主要以矩阵乘法的显示展开，这里介绍矩阵乘法的几种不同的视角，这些视角有助于我们理解图卷积网络的逻辑过程。

对于矩阵 $A\in R^{m\times n}$ 和矩阵 $\in R^{n\times p}$ ，它们的乘积 $\in R^{m \times p}$ ，可以由如下三种视角计算得到。

內积视角：这是我们本科阶段就接触到的视角。矩阵 $C$ 的第i 行第 j 列是由矩阵 $A$ 的第 $i$ 和矩阵 $B$ 的第j列做內积运算得到。
即： $c_{i,j}=A_{i,*}\times B_{*,j}=\sum_{k=1}^{n} a_{i,k}*b_{k,j}$ 。 $A_{i,*}$ 表示A的第i行， $B_{*,j}$ 表示B的第j列。
行向量视角：矩阵 $C$ 的第 $i$ 行可以看做矩阵 $B$ 的所有行向量以矩阵 $A$ 的第i行为系数，线性组合而得到。这里的逻辑是：矩阵 $C$ 的第 $i$ 行的形状是 $1\times p$ ,该形状与矩阵 $B$ 的每一行的形状( $\times p$ )是一致的。因此我们看可以把 $C$ 的第 $i$ 行，看成是矩阵 $B$ 的所有行的线性组合。那么组合过程的系数是谁呢？因为每次组合，需要对矩阵 $B$ 的 $m$ 个行向量进行组合，那么势必需要 $m$ 个系数，每个系数负责去乘以一个行向量，很自然地矩阵 $A$ 的第 $i$ 列恰好是有 $m$ 个元素的，可以充当系数。
于是我们有： $C_{i,*}=A_{*,i} \times B$ 。
列向量视角：矩阵 $C$ 的第 $i$ 列，可以看做是矩阵 $A$ 的所有列向量，以矩阵 $B$ 的第 $i$ 行为系数，线性组合而成。
我们有： $C_{*,i}=A \times B_{i,*}$ 。

举个例子来说：
对于矩阵：
$\begin{bmatrix} 1 &-1 &2 \\ 0 & 2 &1 \end{bmatrix} \quad B=\begin{bmatrix} 2 & 0 \\ -1 & 1\\ 0 & -1 \end{bmatrix} \quad C=A\times B=\begin{bmatrix} 3 &-3\\ -2&1 \end{bmatrix}$

內积视角： $c_{0,0}=A_{0,*}\times B_{*,0}=\begin{bmatrix}1&-1&2\end{bmatrix} \times \begin{bmatrix}2\\-1\\0\end{bmatrix}=3$

行向量视角： $\begin{aligned} C_{0,*}= A_{0,*} \times B=\begin{bmatrix}1&-1&2\end{bmatrix} \times \begin{bmatrix} 2 & 0 \\ -1 & 1\\ 0 & -1 \end{bmatrix}=1\times \begin{pmatrix}2&0\end{pmatrix} + -1 \times \begin{pmatrix}-1&1\end{pmatrix}+2 \times \begin{pmatrix}0&-1\end{pmatrix}\\=\begin{pmatrix}3&-3\end{pmatrix} \end{aligned}$

列向量视角：
$C_{*,1}=A \times B_{*,1} = \begin{bmatrix} 1 &-1 &2 \\ 0 & 2 &1 \end{bmatrix} \times \begin{bmatrix} 0 \\ 1\\ -1 \end{bmatrix}=0 \times \begin{pmatrix}1\\0\end{pmatrix}+ 1 \times \begin{pmatrix}-1\\2\end{pmatrix}+ -1 \times \begin{pmatrix}2\\1\end{pmatrix}=\begin{pmatrix}-3\\1\end{pmatrix}$

图信号

给定图 $G = (V, E)$ ，其中 $V$ 表示节点集合，假设节点个数为 $N$ , $E=\{(u,v)|u\in V,v \in V\}$ 表示边集合。
所谓的图信号，是图节点到 $m$ 维向量空间 $R^m$ 的一个映射，即： $V\to R^m$ ，表示成向量的形式： $\bold{x}=\begin{bmatrix}x_1\\x_2\\\dots\\x_N\end{bmatrix}$ ，其中 $x_i$ 表示第 $i$ 个节点的特征信号。

为了方便后续的讲解，我们先把 $m$ 限制为1。

在研究图上面节点特征信号的时候，除了要自然而然的考虑图信号本身以外，还需要考虑图里面节点之间的连接关系，不同图上同一特征信号具有不同的性质。

拉普拉斯矩阵是用来研究图结构性质的核心对象，它负责将图中节点之间的连接关系以矩阵的方式引入到模型之中，它充当了一个离散图信号与图拓扑关系之间的桥梁的角色。

拉普拉斯矩阵的定义为： $L = D - A$ ，其中 $A$ 是图的邻接矩阵,如果 $A_{ij}=1$ 说明存在 $(i,j)\in E$ ，如果 $A_{ij}=0$ 说明 $(i,j)\notin E$ ，而且规定 $A_{ii}=0$ ；而 $D$ 是节点的出度矩阵，它是一个对角矩阵，其中 $D_{ii}=\sum^{N}_{j=1}A_{ij}$ 。因此 $L$ 的计算为：
$D_{ij}=\left\{ \begin{aligned} 0 &,if \space(i,j)\notin E \\ -1&,if \space (i,j) \in E, i \neq j \\ D_{ij} &, if \space i= j \end{aligned} \right.$

为啥说拉普拉斯矩阵是个桥梁呢？
我们可以看到特性信号向量 $\bold{x}$ 里面的每个元素是独立的，如果我们往 $\bold{x}$ 左乘它所在图的拉普拉斯矩阵 $L$ ，
即： $\bold{x'}= L\bold{x}$ 。我们看可以得到什么：
$\begin{aligned} \bold{x'}=L\bold{x}=(D-A)\bold{x} \end{aligned}$
因为 $L$ 的形状是 $N\times N$ ，而 $\bold{x}$ 的形状为 $N\times1$ ，于是它们乘积的结果 $\bold{x'}$ 的形状是 $N\times1$ 。
如果我们从行向量视角来看 $\bold{x'}$ 的计算的话，那么 $\bold{x'}$ 的第 $i$ 行可以看做是 $\bold{x}$ 的所有行的线性组合，而组合的系数是 $L$ 的第 $i$ 行，即有：
$\bold{x'_i}=L_{i*}\bold{x}$
而 $L$ 的第 $i$ 里面， $L_{ii}$ 是节点 $i$ 的出度， $L_{ij}=0$ 如果不存在节点 $i$ 到节点 $j$ 的边，否则 $L_{i,j}=-1$ 。因此
$\begin{aligned} \bold{x'_i}=L_{i*}\bold{x}=\sum_{j\in\{j|(i,j)\in E\}}A_{ij}x_i-\sum_{j\in \{j|(i,j)\in E\}}A_{ij}x_{j}\\=\sum_{j\in\{j|(i,j)\in E\}}A_{ij}x_i-A_{ij}x_{j}=\sum_{j\in\{j|(i,j)\in E\}}(x_i-x_{j}) \end{aligned}$
也就是： $\bold{x'}$ 的第 $i$ 个元素表示用节点 $i$ 与其他所有从它出去的节点的特征信号差的和。

这反映了 $i$ 节点的信号值与其他相邻节点信号值之间的差异程度。

当然了，这个差值的和是带符号的，如果出现一正一负的数据，他们进行求和后数值本身的绝对值会下降。
如果能够使用差的平方和就好了！

于是在 $\bold{x'}$ 的基础上，我们左乘一个 $\bold{x}^T$ :
$\begin{aligned} p=\bold{x}^T\bold{x'}=\bold{x}^TL\bold{x'}=\sum_{i=1}^{N}x_{i}[\sum_{j\in\{j|(i,j)\in E\}}(x_{i}-x_{j})]\\ =\sum_{i=1}^{N}\sum_{j\in\{j|(i,j)\in E\}}(x_{i}^2-x_{i}x_{j})\\ =x_{1}^{2}-x_1x_2+x_1^2-x_1x_3+\dots+x^2_1-x_1x_j+\\ x_{2}^{2}-x_1x_2+x_2^2-x_2x_3+\dots+x^2_2-x_2x_j+\\ \dots +\\ x_{N}^{2}-x_1x_N+x_N^2-x_Nx_2+\dots+x^2_N-x_Nx_j+\\ =(x_1^2-2x_1x_2+x^2_2)+(x^2_1-2x_1x_3+x^2_3)+\dots+(x^2_1-2x_1x_N+x^2_N)+\\ (x^2_2-2x_2x_3+x^2_3)+\dots+(x^2_2-2x_2x_N+x^2_N)+\dots\\ =\sum_{\{i,j|(i,j)\in E\}}(x_i-x_j)^2 \end{aligned}$
我们把这个标量叫做图信号的总变差,记做 $TV(\bold{x})=\bold{x}^TL\bold{x}$ .
$TV(\bold{x})$ 反映了图上各节点信号的平滑程度，而且总变差总是非负的。