1.交通(交通流量预测、出租车或网约车需求预测、交通流异常检测、停车位可用性预测)
交通流量预测:交通流量预测问题,即给定前T个时刻的历史流量信息,预测未来T‘时刻的交通信息。通过图卷积操作,结合交通系统层次结构,包括道路网络的微观层和宏观层来进行流量的预测。
出租车或网约车需求预测:进行出租车或网约车OD需求矩阵的预测,OD需求矩阵的预测比一般的需求预测更加具有挑战性,预测一个区域用车需求的同时还要预测乘客目的地分布。
交通流异常检测:交通流异常检测通常要考虑时间信息、空间信息等信息,这让交通流异常检测变得具有挑战性。可以利用交通的时空数据,空间信息采用图卷积网络捕获,时间依赖性采用深度神经网络建模。同时捕捉时空特性并建立预测交通流模型,利用异常分数来判断由交通事故、或短暂事件引起的非经常性交通流异常。
停车位可用性预测:对城市停车位可用性的有效预测可以提高停车效率,帮助城市规划,最终缓解城市拥堵。该任务面临非欧几里得的停车场空间自相关性(停车场的可用性会受附近的停车场占用情况的影响)问题。可以通过一个层次图卷积模块来捕获停车场之间的非欧几里得空间相关性,分别捕获局部空间依赖性和全局依赖性。
2.图像(视觉关系检测)
视觉关系检测:在进行目标检测时,很多时候个目标框之间是存在相对位置关系的,结合GCN可以利用这部分信息来提高检测的效果。比如person框应该是包括hat框和uniform框的,且框的出现具有一定的共现关系。定义目标框之间的关系如contain、overlap及no-relation等,通过图卷积来捕获其相互之间的位置关系和共现关系,提高各目标之间的相互依赖以提高检测效果。
3.推荐(用户商品偏好推荐)
用户商品偏好推荐:GCN可以弥补传统神经网络无法处理的(如社交关系、电商交易路径)非规则的结构数据,即图数据。在利用GCN提取关联关系的同时,结合商品评论来提取用户对商品的偏好,并进行特征融合可以提高推荐的效果。
4.文本(文本分类、信息抽取)
文本分类:将文本中的word和document作为图中的node,利用co-occurrence信息来构建edge,可以将文本分类问题看作是node分类问题。以词和文档作为顶点,利用词在文档中的TF-IDF值作为权重,来表示一个词在某个文本中的重要程度,连接词与词的边,用词与词的互信息作为权重,来表示词之间的相关性,以此建立邻接矩阵,然后通过两层图卷积网络即能有效提取图谱顶点中的特征表示来进行文本分类。
信息抽取:通过双向LSTM和GCN分别抽取文本的顺序特征和区域依赖特征,通过对每种关系构建完整的关系加权图,以每个词作为图的节点,边表示单词之间的关系概率,再使用GCN融合每种关系的信息,同时融入实体和关系之间的交互信息,来预测实体和每个单词对之间的关系,这种基于图卷积的实体关系抽取模型可以有效的解决关系重叠和多关系问题。
实际上GCN实际上跟CNN的作用一样,就是一个特征提取器,只不过它的对象是图数据,GCN精妙地设计了从图数据中提取特征的方法,让我们可以使用这些特征去对图数据进行节点分类、图分类、边预测,以及得到相应的图嵌入,而现实生活中很多重要的数据都是以网络结构的方式产生,利用图数据的特征提取器来处理基于这部分数据的任务也理所当然。而对于图像、文本等任务,通过抽象位置、共现、上下文等关系形成图结构,通过GCN来进行特定或额外特征提取和补充,也让其成为除了RNN、CNN及transformer等特征提取器外一种新的选择和尝试方向。