图卷积神经网络先验网络图卷积神经网络综述

转载

mob64ca1414098d 2023-09-29 20:56:58

文章标签 图卷积神经网络先验网络图图神经网络图卷积网络卷积神经网络 文章分类 midjourney AIGC

SGC：简化图卷积网络 《Simplifying Graph Convolutional Networks》

论文地址：https://arxiv.org/abs/1902.07153

一、简介

图卷积神经网络( $图卷积神经网络先验网络图卷积神经网络综述_图神经网络$ )是卷积神经网络在图数据上的变体，其通过在非线性函数前堆叠若干个一阶谱过滤器来学习图数据的表示。近期， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 及其变体在各种图应用领域都实现了state-of-the-art。但是，由于 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 是在神经网络“复兴”后提出的，因此不可避免的继承了神经网络的复杂性和难以解释性。

本文认为对于那些需求低的应用来说， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 继承自神经网络的复杂性是不必要的。因此，本文的目标是推断出在 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 之前基于"传统"路径能够获得的最简单模型。具体来说，本文通过移除 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 层之间的非线性并简化结果函数为单一线性变换，从而减少了 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 的额外复杂性。实验显示，最终得到的模型可以与 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 像媲美，且计算效率更高、拟合参数更少。本文将这个模型称为 $图卷积神经网络先验网络图卷积神经网络综述_图_09$ 。

直觉上， $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 是可解释的，且本文从图卷积的角度提供了理论分析。 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 中的特征抽取对应于单个固定的过滤器。 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_12$ 发现 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_13$ 能够改善任务准确率，本文证明这个方法能够有效的缩小图的谱域，且应用在 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 上能够产生低通过滤器。

通过在基准数据集上的评估，展示了 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 能够与 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 及其他state-of-the-art图神经网络媲美。然而， $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 的速度会快很多，甚至在最大的评估数据集上比 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_18$ 快2个数量集。此外，本文还证明了 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 能够有效的扩展至下游任务中。

二、方法

$图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 将带有部分标签的节点作为输入，并为图中的所有节点生成预测标签。形式化地，定义一个图为 $图卷积神经网络先验网络图卷积神经网络综述_图_21$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图_22$ 表示由节点 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_23$ 组成的顶点集合； $图卷积神经网络先验网络图卷积神经网络综述_图_24$ 是对称邻接矩阵，其中 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_25$ 表示节点 $图卷积神经网络先验网络图卷积神经网络综述_图_26$ 和 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_27$ 的权重，缺失的边通过 $图卷积神经网络先验网络图卷积神经网络综述_图_28$ 来表示。定义度矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_29$ 为一个对角矩阵，其对角线上的每个分量是等于邻接矩阵的行求和 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_30$ 。

图中的每个节点 $图卷积神经网络先验网络图卷积神经网络综述_图_26$ 对应一个 $图卷积神经网络先验网络图卷积神经网络综述_图_32$ 维特征向量 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_33$ 。整个特征矩阵 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_34$ 则是堆叠了 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_35$ 个特征向量，即 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_36$ 。每个节点都属于 $图卷积神经网络先验网络图卷积神经网络综述_图_37$ 个类别中的一个，并使用 $图卷积神经网络先验网络图卷积神经网络综述_图_37$ 维one-hot编码向量 $图卷积神经网络先验网络图卷积神经网络综述_图_39$ 表示。

模型仅知道一部分节点的标签，并希望预测节点的未知标签。

1. 图卷积神经网络 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$

类似于 $图卷积神经网络先验网络图卷积神经网络综述_图_41$ 或者 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ ， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 也是通过多个层来从每个节点的特征 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_44$ 中学习新的特征表示，并用线性分类器进行分类。对于第 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_45$ 个图卷积层来说，所有节点的输入表示为矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_46$ ，输出节点表示为 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_47$ 。自然而然地，初始化节点表示就是原始输入的特征：
$图卷积神经网络先验网络图卷积神经网络综述_图神经网络_48$
其作为第1个 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 的输入。

一个 $图卷积神经网络先验网络图卷积神经网络综述_图_50$ 层的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 等同于在图中的每个节点特征 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_44$ 上应用 $图卷积神经网络先验网络图卷积神经网络综述_图_50$ 层的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ ，且每个节点的向量表示都是平均了其邻居节点的表示。在每个图卷积层中，节点的向量表示会在三个阶段被更新：(1) 特征传播；(2) 线性变换; (3) 非线性激活函数。

1.1 特征传播

$图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 与 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ 的主要区别就是特征传播。在每层的开始，每个节点 $图卷积神经网络先验网络图卷积神经网络综述_图_26$ 的特征 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_58$ 是平均了它局部邻居的特征向量
$图卷积神经网络先验网络图卷积神经网络综述_图神经网络_59$
为了更加紧凑，这里将整个图上的更新表示为简单的矩阵操作。具体来说，令 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_60$ 表示规范化邻接矩阵
$图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_61$
其中， $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_62$ 且 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_63$ 是 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_64$ 的度矩阵。那么，等式 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_65$ 中所有节点的同步更新能够简化为一个稀疏矩阵乘法
$图卷积神经网络先验网络图卷积神经网络综述_图_66$
直觉上，这步操作沿着图的边平滑了局部向量表示，并且鼓励局部的点具有相似的预测。

1.2 线性变换与非线性激活

经过局部平滑后， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 层与 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ 层等价。每个层都被关联一个可学习权重 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_69$ ，用于对经过平滑的特征向量进行线性变换。最后，在特征向量 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_47$ 输出前，使用 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_71$ 这样的非线性激活函数对输出进行变换。整体来说，第 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_45$ 层的向量表示更新规则为
$图卷积神经网络先验网络图卷积神经网络综述_图_73$

1.3 分类器

类似于 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ ，对于节点分类任务， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 会在最后一层使用 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_76$ 分类器预测标签概率。 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_35$ 个节点的类别预测表示为 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_78$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图_79$ 表示节点 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_80$ 属于类别 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_81$ 的概率。 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 第 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_83$ 层的类别预测记为
$图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_84$
其中， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_85$ 。

2. $图卷积神经网络先验网络图卷积神经网络综述_图_09$

在传统的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ 层中，更深的层能够增加表达能力。因此，深层的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ 能够构建特征的层次结构，即第二层的特征是在第一层特征的基础上构建的。在 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_02$ 中，这些层还有第二个重要作用：每层的隐藏表示会被其一跳邻居平均。这也意味着，一个经过 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_45$ 层的阶段特征来源于其在图中的所有 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_45$ 跳邻居。这种方式类似于卷积神经网络，模型深度增加的同时也增加了特征的感知域。虽然随着深度的增加，卷积网络的效果会变好，但是典型的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_42$ 在3或4层之后就收益很小了。

2.1 线性化

假设两个 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 层间的非线性变换并不是必须的，模型的收益主要来自于局部平均。那么，移除每层的非线性变换并保留最后的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_76$ 。这样得到的模型仍然是线性的，且与 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_83$ 层的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 具有相同的感知域
$图卷积神经网络先验网络图卷积神经网络综述_图神经网络_97$
为了简化表示，将规范化邻接矩阵的重复乘法表示为 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_60$ 的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_83$ 次方法 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_100$ 。此外，将权重矩阵重新参数化为单一的矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_101$ 。那么最终的分类器表示为
$图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_102$
本文将其称为 $图卷积神经网络先验网络图卷积神经网络综述_图_09$ 。

2.2 Logistic回归

通过观察等式 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_104$ 能够获得 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 的直觉解释：分离特征抽取和分类器。即 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 可以看做是由一个固定的特征抽取/平滑组件 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_107$ ，后面跟一个线性 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_108$ 回归分类器 $图卷积神经网络先验网络图卷积神经网络综述_图_109$ 组成。由于 $图卷积神经网络先验网络图卷积神经网络综述_图_110$ 不需要权重，因此计算 $图卷积神经网络先验网络图卷积神经网络综述_图_110$ 就等价于特征预处理步骤。整个模型的训练就变成了在预处理特征 $图卷积神经网络先验网络图卷积神经网络综述_图_110$ 上的直接进行多类别 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_108$ 回归。

三、谱分析( $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_114$ )

1. 图卷积

图数据上的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_115$ 分析依赖于图 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 算子的谱分解。

图 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_118$ (规范化版本 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_119$ )为对称正定矩阵。该矩阵的特征分解为 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_120$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图_121$ 是由正交特征向量组成，且 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_122$ 为特征值对角矩阵。 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 矩阵的特征分解能够允许在图域上定义等价的傅里叶变换，特征向量对应 $图卷积神经网络先验网络图卷积神经网络综述_图_124$ 的模，特征值对应图上的频率。基于此，令 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_125$ 表示定义在图上顶点的信号，那么 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_126$ 的图上 $图卷积神经网络先验网络图卷积神经网络综述_图_124$ 变换为 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_128$ 且逆操作为 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_129$ 。因此，信号 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_126$ 和过滤器 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_131$ 的图卷积操作定义为
$图卷积神经网络先验网络图卷积神经网络综述_图_132$
其中， $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_133$ 表示对角矩阵，其对角线元素对应谱过滤器系数。

图卷积能够通过 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 的k阶多项式完成近似，
$图卷积神经网络先验网络图卷积神经网络综述_图神经网络_135$
其中， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_136$ 表示系数。在这个例子中，过滤器系数对应于 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 特征值的多项式，即 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_138$ 或者相当于 $图卷积神经网络先验网络图卷积神经网络综述_图_139$ 。

图卷积神经网络利用了等式 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_140$ 的线性近似，该线性近似具有系数 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_141$ 和 $图卷积神经网络先验网络图卷积神经网络综述_图_142$ 。得到基本的 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 卷积操作
$图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_144$
在其最终的设计中，将矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_145$ 替换为规范化版本 $图卷积神经网络先验网络图卷积神经网络综述_图_146$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_62$ 且 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_148$ 。

2. $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_10$ 和低通滤波

图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_150

$图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_05$ 中初始的过滤器对应于传播矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图_152$ 。规范化拉普拉斯算子为 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_153$ ，那么 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_154$ 。因此，特征传播 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_155$ 意味着过滤系数 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_156$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_157$ 表示 $图卷积神经网络先验网络图卷积神经网络综述_图_158$ 的特征值。上图展示了传播步骤 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_159$ 的变化与 $图卷积神经网络先验网络图卷积神经网络综述_图_160$ 过滤操作的关系。可以观察到，高阶 $图卷积神经网络先验网络图卷积神经网络综述_图_160$ 将会导致过滤系数的爆炸并在频率 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_162$ 上过度放大。

为了解决一阶过滤器的问题， $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_12$ 等人提出了 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_13$ 。该方法通过为所有节点加入自循环后的归一化邻接矩阵来替换 $图卷积神经网络先验网络图卷积神经网络综述_图_160$ 。本文称得到的传播矩阵为增强的归一化邻接矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_166$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_62$ 且 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_148$ 。相应的，定义增强规范化 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 矩阵 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_170$ 。这样，就可以将关于 $图卷积神经网络先验网络图卷积神经网络综述_图_171$ 的谱过滤器描述为 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_116$ 矩阵特征值的多项式，即 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_173$ ，其中 $图卷积神经网络先验网络图卷积神经网络综述_图_174$ 是 $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_175$ 的特征值。

定理1
令 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_176$ 是一个无向、有权且无孤立点的简单图的邻接矩阵，其对应的度矩阵为 $图卷积神经网络先验网络图卷积神经网络综述_图_177$ 。令 $图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_178$ 为增强邻接矩阵( $图卷积神经网络先验网络图卷积神经网络综述_图_179$ )，其对应的度矩阵为 $图卷积神经网络先验网络图卷积神经网络综述_图神经网络_180$ 。令 $图卷积神经网络先验网络图卷积神经网络综述_图_181$ 和 $图卷积神经网络先验网络图卷积神经网络综述_图_182$ 表示 $图卷积神经网络先验网络图卷积神经网络综述_图_183$ 的最小特征这和最大特征值。类似地， $图卷积神经网络先验网络图卷积神经网络综述_图卷积网络_184$ 和 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_185$ 则是 $图卷积神经网络先验网络图卷积神经网络综述_图卷积神经网络先验网络_186$ 的最小特征性和最大特征值。则有
$图卷积神经网络先验网络图卷积神经网络综述_卷积神经网络_187$