图卷积网络(2)

 ================================

为什么要使用图(Graph)?

很多问题在本质是都可以表示为图的形式。在真实世界中,我们会发现很多数据其实是以图的形式存在的,比如分子网络,社交网络以及论文引用网络等等。

基于图的任务

针对图数据,通常有以下几种比较常见的任务类型:

  • 结点分类(Node classification):给定一个结点,预测其类型。
  • 链路预测(Link prediction):预测两个结点之间是否存在连接。
  • 社区检测(Community detection):确定具有紧密连接关系的结点簇。
  • 网络相似度(Network similarity):衡量两个网络或子网络之间的相似性。

机器学习工作流

在图中,我们不仅有结点的特征(结点的数据),还有图的结构(结点之间是如何进行连接的)。

对于前者,我们很容易可以获得关于每一个结点的数据,但是对于后者,要抽取出关于网络结构的信息并非易事。

例如,如果两个结点相较其它结点更加相近,那我们是否应该以不同的方式来对待它们?对于具有很高或很低度(degree)的结点又应该如何处理?

事实上,每一个特定的任务在特征工程上,也即通过构造特征来表示结构信息,都是非常耗时耗力的事情。例如在下面的结点分类的任务中,特征的构造是一项具有技巧性的工作。

图卷积网络GCN(2)_Graph

 

 

将结点的特征与结构的信息同时作为输入,然后让机器自己去决定到底要利用哪些信息是非常有效且方便的方法,这也就是为什么我们需要图表示学习(Graph Representation Learning)的原因。

图卷积网络GCN(2)_结点_02

 

 


图卷积网络GCN(2)_结点_03

图卷积网络GCN(2)_Graph_04

 

 

 

图卷积网络GCN(2)_github_05

 

 

图卷积网络GCN(2)_Graph_06

 

 

图卷积网络GCN(2)_github_07

 

图卷积网络GCN(2)_github_08

 

 

 

图卷积网络GCN(2)_github_09

 

 

图卷积网络GCN(2)_github_10

 

 

图卷积网络GCN(2)_github_11

 

参考文献

[1]https://zhuanlan.zhihu.com/p/77729049 图嵌入的分类

[2]https://www.zhihu.com/question/54504471/answer/630639025 关于图卷积的物理学解释

[3]https://www.zhihu.com/question/54504471/answer/332657604 拉普拉斯公式推倒细节,包括谱分解和傅立叶变换

[4]http://tkipf.github.io/graph-convolutional-networks/ 两篇论文细讲

[5]https://github.com/conferencesub/ICLR_2020 各种图卷积核比较

[6]https://persagen.com/files/misc/scarselli2009graph.pdf GNN首次被提出的paper

[7]https://zhuanlan.zhihu.com/p/85287578 拉普拉斯矩阵和拉普拉斯算子的关系