目前的预测方法大多侧重于学习局部空间相关性,而忽略了长距离交通流的空间相关性。在本文中,我们将改进的图卷积网络(GCN)与门控递归单元(GRU)相结合,提出了一种融合局部和全局空间相关(T-LGGCN)的交通预测混合模型
该模型由全局时空分量和局部时空分量两部分组成。对于全局时空分量,我们构造了全局相关矩阵(不管传感器的物理连通性如何,使用相关性方法分析任意两个传感器之间的相关性,构建全局相关矩阵)来改进GCN以获得全局空间相关性。然后堆叠GRU得到全局时空相关性。对于局部时空分量,利用完全连接层(FCL)和GCN相结合的策略来分析局部空间相关性。同样堆叠GRU得到局部时空相关性。最后将两个分量的输出相加,并使用密集网络生成预测结果。
目前,时间相关特征通常由时间卷积网络(TCN)、递归神经网络(RNN)、长短时记忆(LSTM)和门控递归单元(GRU)等模型提取。图方法通常用于分析空间相关性,如图卷积网络(GCN),图注意网络(GAT)。
交通流的空间相关性分析是近年来的研究热点。鉴于现有研究,需要考虑两个主要问题:(1)目前的研究主要集中在局部空间相关性的研究。但交通拥堵不仅会影响相邻节点,还会影响可到达的远程节点。具有类似功能的区域将具有类似的交通流状态,即使它们彼此相距很远。在局部空间相关性的基础上,有必要考虑引入全局空间相关性,以进一步增强空间相关性分析能力。(2)多层GCN可能导致平滑。
本文贡献:1.设计了全局时空分量,该分量考虑了非一阶相邻传感器之间交通流的空间相关性。2.发了一个局部时空组件。它结合了传感器节点自身的特征和一阶相邻节点之间的空间相关性。避免了GCN的平滑问题,提高了对交通流波动的预测能力。
交通流是复杂的、可变的和不确定的,其主要特征是:非线性、随机性、周期性和时空相关性。预测方法可分为传统方法和深度学习方法。传统方法包括经典统计方法和机器学习方法。经典统计方法如HA、ARIMA等在交通流平滑的情况下表现良好,当交通流发生剧烈变化时有缺陷,无法探索非线性和不确定性。且只考虑了时间相关性,忽略了空间相关性,随着对预测精度要求的提高,预测方法逐渐转向机器学习方法。
用深度学习方法,尤其是神经网络,来解决交通预测问题,常用卷积神经网络(CNN)、递归神经网络(RNN)和图卷积网络(GCN)。CNN平移不变性,只能处理欧几里德数据。RNN、LSTM和GRU适用于处理时间序列数据,其依赖于数据本身的时序。GCN能有效地提取交通流的空间相关性。
通常采用混合神经网络结构来代替单一的神经网络结构。原始GCN只能分析传感器的地理相关性,不能反映深层的空间相关性。通过全局时空分量,我们可以丢弃无用的传感器空间信息,提高全局时空相关分析的能力。在局部时空分量中,我们将节点特征学习和相邻节点空间相关挖掘分离,可以有效地避免平滑问题。
地理邻接矩阵
,通过阈值高斯核,使用传感器之间的距离dist(i,j)来计算aij的值
λ是阈值,σ^2是方差,aij代表邻接权重全局相关矩阵
,cij代表传感器i对j的空间影响关系,该矩阵描述了研究网络中传感器之间的相关性。时空特征矩阵
T是总时间步,S是传感器总数,利用待研究网络中交通流的全部特征数据构建时空矩阵,每列代表道路网络中的一个传感器,每行代表一个时间切片
(本文传感器的特征只有一个通道)任务:假设当前时刻为t,基于历史交通流数据地理邻接矩阵A和全局相关矩阵C,来预测未来一段时间的交通流
,
模型由局部时空相关性和全局时空相关性两部分组成,特征矩阵用于计算全局相关矩阵,输入特征矩阵和输出特征矩阵之间的误差通过损失函数进行调整。FCL用于提取节点自身的特征。最后对两个分量的输出进行求和,并利用稠密层控制输出步长,以获得预测结果。
GCN传播规则
邻接矩阵表示实际道路网络的地理结构,由式(1)计算。LOCAL:方程4的卷积运算期间,在特征聚合过程中,相邻节点越多,其节点的权重就越小。为了挖掘节点本身的空间特征,我们使用近似个性化神经预测传播(APPNP)模型来挖掘交通流的局部空间相关性。该模型可以平衡保留局部特征和挖掘邻域特征的需要,计算规则如下
fθ表示神经网络,用fθ提取每个传感器自己的特征,α表示自我特征的百分比。局部空间相关性挖掘公式如下
,使用FCL来提取节点特征
GLOBAL:对于传感器数据,我们使用Pearson相关系数法来分析传感器之间的相关性。设置了相关阈值k来选择高相关传感器。如果相关性大于k,则保持相关性值;否则,将其设置为0。通过这种方法,我们构造了相关矩阵C,使用它通过GCN卷积方法来聚合高度相关的传感器的特征。
Pearson相关系数法
其中
代表第i个传感器的交通流特征,是的平均值。相关矩阵描述的节点关系是有向加权图。基于相关矩阵的全局图卷积网络的计算规则
时间相关性:GRU(Gated Recurrent Unit Network门控循环单元网络)是解决时间序列预测问题的主流神经网络,它可以避免RNN的梯度爆炸和消失。以局部空间相关输出为例,GRU计算规则如下:
l代表local g代表global,
代表前一时刻隐藏层的输出。该单元将此时刻的值与前一时刻的输出相结合,以捕获时间相关性。
首先连接前一时刻的隐藏层输出
以及当前时刻的输入LGCN(X,A),然后,通过sigmoid函数将数据转换为[0,1]形式,充当门信号和使用门信号选择性地忘记和保存
和LGCN(X,A)的信息。T-LGGCN模型:我们使用等式13将全局时空分量和局部时空分量的输出相加,并将其输入到稠密层以输出预测结果
损失函数
引入L2正则化来避免过拟合问题。