动机
以往的工作考虑了空间、时间或两者的结合进行建模。但是,我们观察到,也存在逻辑上的语义和时间、空间关系。因此,作者提出了一种多视角多任务时空图卷积网络( M2 )用于空气质量预测。
贡献
1.提出了一个深度学习框架,通过考虑空气质量数值和等级的联合影响来实现精确的空气质量预测。
2.提出的多视图模型考虑了地理、时间和逻辑上的空间关系统一,得以进行准确的预测。
3.大量实验表明,M2优于不同的基线,在真实数据集上有着优越的预测性能。
考虑的问题
1.逻辑上的空间联系:
说法上是这么说但感觉就是个聚类,像下图虽然A和C两个点离得比较远但是它们的空气污染数据事类似的。和我之前看的那篇多尺度自适应图神经网络里的思考方式很像。
2.多任务:两个任务:
回归(主任务),预测空气质量的数值;分类(次任务),预测空气质量的等级。虽然文章有证明空气质量等级在最后的结果上是有益的,但也没给出为什么。我个人猜测应该是类似于阈值一样的东西,在不同阈值(级别)下未来的空气质量变化会有所不同。可能也能从这种先验知识上去指导模型。
模型
整体结构,编码部分分为三个视图:地理空间视图、逻辑空间视图、时间视图。解码部分则是两个任务:
Denoise block
用FFT和IFFT对原始数据去噪,没啥说的
Geographical spatial view in encoder module
邻接矩阵的定义如下:
然后丢进GCN
Logical spatial view in encoder module
逻辑空间视图根据POI和RN对站点逻辑邻居之间的关系进行建模。除地理空间邻接相似度外,POI和道路网也会导致站点间的逻辑空间相似度。例如,工业园中的站点会有同样差的空气质量,而湿地中的站点会有相对新的空气质量。
其邻接矩阵的定义如下:
一样丢进GCN里:
Temporal view in encoder module
时序视图对时序关系进行建模。地理和逻辑空间关系对站点的影响因时间而异。为了区分不同视角下上下文状态在不同时刻的相对相关性,作者设计了一个注意力融合单元来提高从不同视角中提取相对信息的能力。
然后放进GRU
Value prediction in decoder module
将编码器hi的输出和值译码器ci的最后一个输出串联起来;用LSTM更新隐藏状态:
LSTM的输出包含了地理空间、时间和逻辑空间视图的所有效应。丢进全连接做最后的预测
Level prediction in decoder module
和上一个译码模块一本一至:
Joint training
实验
主要结果: