图卷积神经网络的研究背景

尽管传统的卷积神经网络在文本和图像领域带来提升,但是它仅能处理欧氏空间数据。而同时,一种非欧空间数据:图数据,因其普遍存在性逐渐受到关注。图数据可以自然的表达实际生活中的数据结构,如交通网络、万维网和社交网络等。不同于图像和文本数据,图数据中每个节点的局部结构各异,这使得平移不变性不再满足。平移不变性的缺失给在图数据上定义卷积神经网络提出了挑战。

数学知识回顾

实对称矩阵

实对称矩阵有以下性质

1.   实对称矩阵A的不同特征值对应的特征向量是正交的。

2.   实对称矩阵A的特征值都是实数,特征向量都是实向量。

3.   n阶实对称矩阵A必可对角化,且相似对角阵上的元素即为矩阵本身特征值。

性质3证明:

相似对角化的充要条件是n阶方阵A有n个线性无关的特征向量;充分条件是A有n个不同的特征值,而n个不同的特征值一定对应n个线性无关的特征向量。实对称矩阵n重特征值对应n个线性无关的特征向量,满足充分必要关系,所以实对称矩阵一定可以对角化。

正交矩阵

定义:若A为N阶实对称矩阵,并且A满足AAT=ATA=E,那么A为正交矩阵。

性质:若A为正交矩阵,那么有以下推论:

浅谈图卷积神经网络_特征值


AT和A-1也为正交矩阵

正定矩阵

正定矩阵定义:给定一个大小为 的实对称矩阵A,若对于任意长度为n的非零向量X,有 恒成立,则矩阵A是一个正定矩阵。

半正定矩阵定义:类似地有 恒成立,则矩阵A是一个半正定矩阵。

    正定矩阵的判定方法

1.   求出A的所有特征值。若A的特征值均为正数,则A是正定的;

2.   计算A的各阶顺序主子式。若A的各阶顺序主子式均大于零,则A是正定的;

傅里叶变换

简而言之,傅里叶变换把一个输入信号分解成一堆正弦波的叠加。

从我们出生,我们看到的世界都以时间贯穿,股票的走势、人的身高、汽车的轨迹都会随着时间发生改变。这种以时间作为参照来观察动态世界的方法我们称其为时域分析。而我们也想当然的认为,世间万物都在随着时间不停的改变,并且永远不会静止下来。但是我们可以用另一种方法来观察世界的话,你会发现世界是永恒不变的,这个静止的世界就叫做频域.


但是对于音乐家来说,音乐更加直观的理解应该是如下图所示的:

浅谈图卷积神经网络_特征值_02

也就说我们看到的音乐频率图,完全可以通过控制乐器按压的位置和力量不同而实现。这里的频率图就是时域,而乐谱就是频域。

傅里叶变换是拉普拉斯变换的一个子集,我们要做的就是找到拉普拉斯变换在频域空间的坐标轴即找到一组符合拉普拉斯矩阵的正交基

图卷积神经网络的数学推导

拉普拉斯矩阵

浅谈图卷积神经网络_特征值_03

其中A为无向图的邻接矩阵,D为A矩阵的度矩阵。因为D是一个对角矩阵,A是一个对称矩阵,因此拉普拉斯矩阵L是实对称矩阵。又因为实对称矩阵可以进行相似对角化,即存在:

浅谈图卷积神经网络_特征值_04

 是由L的特征值组成的对角矩阵。其中U由L的特征向量组成,且因为L为实对称矩阵,所以它的特征向量相互正交,其就是我们要找到正交基。

假设我们的节点特征用  表示,用  表示频域上的卷积函数,那么傅里叶变换可以表示为  ,逆傅里叶变换可以表示为  。进一步地卷积过程可以表示为:

浅谈图卷积神经网络_对称矩阵_05

为了简化说明过程,我们令

浅谈图卷积神经网络_对称矩阵_06

(3)式虽然可以实现卷积过程,但是它的缺点也显而易见,对拉普拉斯矩阵进行求特征值和特征向量是个非常耗时的操作。因此这使得它不能在大型图上使用,为解决这个问题。有科学家提出使用多项式逼近函数的方式来逼近(5)式,具体如(6)式所示。

浅谈图卷积神经网络_特征值_07

因为(3)式可以变型为(7)式

浅谈图卷积神经网络_特征值_08

虽然多项式逼近函数来简化计算过程,已经达到很好的效果,但是它仍有大量计算。后来有科学家引入使用切比雪夫多项式来更好的简化计算。切比雪夫多项式的定义如(8)式所示。

浅谈图卷积神经网络_特征值_09

相应的(6)(7)式转变为(9)(10)

浅谈图卷积神经网络_特征值_10

为了将拉普拉斯矩阵L的值控制在[-1,1]之间,我们需要对其进行对称归一化(11)和规范化(12),并且我们假设K=1将(10)具体化为(13)。

浅谈图卷积神经网络_对称矩阵_11

       为了计算方便和考虑聚合过程,同时减少参数量。我们可以认为 ,基于此将(10)进一步简化为(13).

浅谈图卷积神经网络_特征值_12

最终我们有了图卷积神经网络的雏形(14)

                

浅谈图卷积神经网络_特征值_13

其中  表示节点在l+1层的嵌入表示,  为非线性激活函数,  为单位矩阵,  为邻接矩阵,  为第l层的权重矩阵。

在Pytorch中构建图卷积神经网络

模型定义

浅谈图卷积神经网络_特征向量_14


数据集构建

浅谈图卷积神经网络_特征值_15

拉普拉斯矩阵的归一化

浅谈图卷积神经网络_对称矩阵_16

实验结果

Total time elapsed: 6.6605s

Test set results: loss= 0.6278 accuracy= 0.8070

浅谈图卷积神经网络_特征向量_17