图卷积神经网络的作用图卷积神经网络模型

转载

mob64ca1412ee79 2023-09-08 14:23:51

文章标签 图卷积神经网络的作用 gcn 图卷积网络深度学习人工智能 文章分类 midjourney AIGC

本篇博客主要讲述三种图卷积网络（Graph Convolutional Network, GCN）的算法原理及python实现，全文阅读时间约10分钟。

这些博客都提供了算法的讲解和python的代码复现，感兴趣的可以了解一下

一、图卷积网络原理

图模型早期的研究被称为图信号处理（Graph Signal Processing, GSP）,在12年深度学习爆发以后，学术圈开始研究图模型与神经网络的结合。主要经过三代模型的发展后，相对成熟的图卷积网络开始发展起来，本文主要介绍的也是这三代图卷积模型的原理和变化。

1.0 预备知识

在介绍图卷积之前，需要先普及一些基本的理论知识：

图结构数据
一张图由节点和边组成，节点代表成员或者对象，而边表示节点间的关系，我们往往使用 $图卷积神经网络的作用图卷积神经网络模型_图卷积网络$ 表示一张图的结构特性， $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_02$ 称为图的邻接矩阵，其中 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_03$ 表示节点数量， $图卷积神经网络的作用图卷积神经网络模型_gcn_04$ 的数值则表示节点 $图卷积神经网络的作用图卷积神经网络模型_人工智能_05$ 和节点 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_06$ 之间的关系。
拉普拉斯图矩阵
基于图的邻接矩阵，我们可以方便的定义拉普拉斯图矩阵
$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_07$ 上式中 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_02$ 是邻接矩阵， $图卷积神经网络的作用图卷积神经网络模型_gcn_09$ 称为度矩阵，是一个对角矩阵， $图卷积神经网络的作用图卷积神经网络模型_人工智能_10$ 描述了每一个样本近邻的总和信息。
卷积定理：函数卷积的傅利叶变换是函数傅利叶变换的乘积。
傅立叶变换在图上的推广
拉普拉斯图矩阵 $图卷积神经网络的作用图卷积神经网络模型_gcn_11$ 的特征向量 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_12$ 可以作为傅立叶变换的基， $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_13$
图卷积的分类
图卷积主要可以分为基于谱域(谱分解/特征根分解)的卷积以及基于空域的卷积，今天介绍的三代卷积网络都是基于谱域的卷积，但其在空域上也有很好的解释性。关于空域图卷积会在以后的文章中专门介绍

1.1 第一代图卷积网络

第一代图卷积定义为

$图卷积神经网络的作用图卷积神经网络模型_gcn_14$

这里的

$图卷积神经网络的作用图卷积神经网络模型_gcn_15$ 表示激活函数,

$图卷积神经网络的作用图卷积神经网络模型_深度学习_16$ 表示可训练的网络参数，使用反向传播进行训练，

$图卷积神经网络的作用图卷积神经网络模型_人工智能_17$ 是输入的特征矩阵。

根据预备知识的第4点，

上式可以解释为， $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_18$ 将 $图卷积神经网络的作用图卷积神经网络模型_gcn_19$ 变换到频域当中，在频域中与训练得到的 $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_20$ 加权结合进行特征提取，继而又通过 $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_21$ 反变换到原来的空域当中。

第一代图卷积模型由LeCun组在14年提出，论文可见

Spectral networks and locally connected networks on graphs. In International Conference on Learning Representations。该模型作为早期的图卷积网络，缺点在于

每一次前向传播都需要计算 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_12$ , $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_23$ , $图卷积神经网络的作用图卷积神经网络模型_深度学习_24$
在空域内的解释性不好，没法很好利用图的近邻性质
卷积核需要 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_03$ 个参数

1.2 第二代图卷积网络

第二代图卷积模型定义为

$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_26$ 上式中，

$图卷积神经网络的作用图卷积神经网络模型_人工智能_27$ 为

$图卷积神经网络的作用图卷积神经网络模型_深度学习_28$ 的第

$图卷积神经网络的作用图卷积神经网络模型_gcn_29$ 个特征值，

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_30$ 是可训练的网络参数，对角矩阵又可以记为

$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_31$ 进而可以导出

$图卷积神经网络的作用图卷积神经网络模型_人工智能_32$ 于是有

$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_33$ 可以看出第二代图卷积网络使用的卷积核其实是

$图卷积神经网络的作用图卷积神经网络模型_人工智能_34$ 个拉普拉斯图矩阵的加和。那么这里的

$图卷积神经网络的作用图卷积神经网络模型_人工智能_34$ 是什么含义呢？如何定义的

$图卷积神经网络的作用图卷积神经网络模型_人工智能_34$ 个拉普拉斯矩阵。其实很简单，第

$图卷积神经网络的作用图卷积神经网络模型_人工智能_37$ 个图矩阵记录的是经过

$图卷积神经网络的作用图卷积神经网络模型_人工智能_37$ 跳以后可以找到的近邻，如下图所示

图卷积神经网络的作用图卷积神经网络模型_深度学习_39

通过定义不同的近邻，来提取更多的信息。

第二代图卷积网络在论文

Convolutional Neural Networks on Graphs with Fast Localized Spectral Filtering中被提出，相比与第一代图卷积模型，其优点在于

卷积核只有 $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_40$ 个参数，一般 $图卷积神经网络的作用图卷积神经网络模型_图卷积网络_40$ 远小于 $图卷积神经网络的作用图卷积神经网络模型_gcn_42$
不需要做特征根分解，直接用 $图卷积神经网络的作用图卷积神经网络模型_gcn_11$
空间域内的解释性较好

1.3 第三代图卷积网络

第三代图卷积模型，也是当前最流行的版本，由第一代卷积简化推导而来。第一代卷积模型可以表示为

$图卷积神经网络的作用图卷积神经网络模型_深度学习_44$ ，其中卷积核

$图卷积神经网络的作用图卷积神经网络模型_深度学习_45$ 是待训练的参数，特征向量

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_46$ 由标准化的拉普拉斯矩阵特征根分解得到

$图卷积神经网络的作用图卷积神经网络模型_人工智能_47$ ，这里的卷积核

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_48$ 可以理解为特征值

$图卷积神经网络的作用图卷积神经网络模型_深度学习_49$ 的函数，记为

$图卷积神经网络的作用图卷积神经网络模型_深度学习_50$ .

使用切比雪夫多项式

$图卷积神经网络的作用图卷积神经网络模型_人工智能_34$ 阶近似

$图卷积神经网络的作用图卷积神经网络模型_深度学习_50$ ,

$图卷积神经网络的作用图卷积神经网络模型_人工智能_53$ ，其中

$图卷积神经网络的作用图卷积神经网络模型_gcn_54$ ，

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_55$ 是需要学习的系数，

$图卷积神经网络的作用图卷积神经网络模型_深度学习_56$ 的定义是递归的

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_57$ ,

$图卷积神经网络的作用图卷积神经网络模型_人工智能_58$ 以及

$图卷积神经网络的作用图卷积神经网络模型_人工智能_59$ 。将估计式带入一代卷积模型中，可以得到

$图卷积神经网络的作用图卷积神经网络模型_gcn_60$ ，其中

$图卷积神经网络的作用图卷积神经网络模型_人工智能_61$ 。

进一步近似，约束

$图卷积神经网络的作用图卷积神经网络模型_深度学习_62$ , 取

$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_63$ ，则有

$图卷积神经网络的作用图卷积神经网络模型_深度学习_64$ ，因为

$图卷积神经网络的作用图卷积神经网络模型_图卷积网络_55$ 是需要学习的系数，可以将其约束为

$图卷积神经网络的作用图卷积神经网络模型_gcn_66$ , 则有

$图卷积神经网络的作用图卷积神经网络模型_gcn_67$ ，再使用重参数化技巧

$图卷积神经网络的作用图卷积神经网络模型_人工智能_68$ ，其中

$图卷积神经网络的作用图卷积神经网络模型_深度学习_69$ 和

$图卷积神经网络的作用图卷积神经网络模型_人工智能_70$ 。

据上，第三代图卷积模型为定义为

$图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_71$ 。其模型可以被理解为是对一代模型做了一阶的切比雪夫近似，为每一个节点提取一阶近邻的信息。

第三代图卷积模型在论文

Semi-Supervised Classification with Graph Convolutional Networks中被提出，由于其较好空域解释性和精简的模型结构，受到广泛应用。

1.4 图卷积网络的优缺点

特点：

训练的输入为 $图卷积神经网络的作用图卷积神经网络模型_gcn_72$ 和 $图卷积神经网络的作用图卷积神经网络模型_图卷积神经网络的作用_02$ ，以整张数据图为输入，而不是以batch训练
训练阶段会用到无标签的测试数据，因而是直推式半监督学习

优点：

显式的利用节点间的关系进行特征的提取
实现相对简单、计算并不复杂

缺点：

图卷积网络一般只有1-4层，无法深层堆叠，会出现梯度消失的问题
. 一般的图卷积网络以整张图作为输入，所以在普通机器上无法训练大规模的图数据

二、图卷积网络python实现

下面是图卷积网络的核心代码

#卷积层代码
import  torch
from    torch import nn
from    torch.nn import functional as F
from    utils import sparse_dropout, dot

class GraphConvolution(nn.Module):
    def __init__(self, input_dim, output_dim, num_features_nonzero,
                 dropout=0.,
                 is_sparse_inputs=False,
                 bias=False,
                 activation = F.relu,
                 featureless=False):
        super(GraphConvolution, self).__init__()


        self.dropout = dropout
        self.bias = bias
        self.activation = activation
        self.is_sparse_inputs = is_sparse_inputs
        self.featureless = featureless
        self.num_features_nonzero = num_features_nonzero

        self.weight = nn.Parameter(torch.randn(input_dim, output_dim))
        self.bias = None
        if bias:
            self.bias = nn.Parameter(torch.zeros(output_dim))


    def forward(self, inputs):
        # print('inputs:', inputs)
        x, support = inputs

        if self.training and self.is_sparse_inputs:
            x = sparse_dropout(x, self.dropout, self.num_features_nonzero)
        elif self.training:
            x = F.dropout(x, self.dropout)

        # convolve
        if not self.featureless: # if it has features x
            if self.is_sparse_inputs:
                xw = torch.sparse.mm(x, self.weight)
            else:
                xw = torch.mm(x, self.weight)
        else:
            xw = self.weight

        out = torch.sparse.mm(support, xw)

        if self.bias is not None:
            out += self.bias

        return self.activation(out), support

#模型代码
import  torch
from    torch import nn
from    torch.nn import functional as F
from    layer import GraphConvolution

from    config import args

class GCN(nn.Module):
    def __init__(self, input_dim, output_dim, num_features_nonzero):
        super(GCN, self).__init__()

        self.input_dim = input_dim # 1433
        self.output_dim = output_dim

        print('input dim:', input_dim)
        print('output dim:', output_dim)
        print('num_features_nonzero:', num_features_nonzero)


        self.layers = nn.Sequential(GraphConvolution(self.input_dim, args.hidden, num_features_nonzero,
                                                     activation=F.relu,
                                                     dropout=args.dropout,
                                                     is_sparse_inputs=True),

                                    GraphConvolution(args.hidden, output_dim, num_features_nonzero,
                                                     activation=F.relu,
                                                     dropout=args.dropout,
                                                     is_sparse_inputs=False),

                                    )

    def forward(self, inputs):
        x, support = inputs

        x = self.layers((x, support))

        return x

    def l2_loss(self):

        layer = self.layers.children()
        layer = next(iter(layer))

        loss = None

        for p in layer.parameters():
            if loss is None:
                loss = p.pow(2).sum()
            else:
                loss += p.pow(2).sum()

        return loss

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。