基于多头注意力对抗机制的复杂场景行人轨迹预测

  • 4 MAGAM 模型
  • 4.1 模型整体框架
  • 4.2 轨迹编码器模块
  • 4.3 交互特征提取模块
  • 4.4 轨迹解码器模块
  • 4.5 生成器与判别器
  • 5 实 验
  • 5.3 评价标准
  • 5.5 实验结果与分析
  • 5.5.1 行人轨迹预测误差对比分析
  • 5.5.4 模型性能对比
  • 6 总 结


4 MAGAM 模型

一种基于多头注意力机制的生成对抗网络模型

4.1 模型整体框架

RNN轨迹预测输出结果 轨迹预测模型_RNN轨迹预测输出结果

图 2MAGAM 模型 的整体框架 模型采用生成对抗网络结构包括一个生成器和一个判别器 。生成器以行人的观测轨迹序列 T作为输入 ,学习各行 人之间 的复杂交互关系 并生成 预测 轨 迹 判别 器T^。学习判断某 一 轨迹是真实轨迹还是由生成器生成的轨迹 。其中

  1. 生****成器包括 3 个模块:分别为轨迹编码器模块 ,交互特征提取模块和轨迹解码器模块。
  2. 判别器中仅包含轨迹编码器模块

4.2 轨迹编码器模块

本模块对每个行人的历史轨迹迸行编码,利用 LSTM 对每个行人的历史轨迹序列进行建模,得到当前时刻的状态

4.3 交互特征提取模块

本模块旨在利用多头注意力机制深度捕捉行人之间 的交互模式。

RNN轨迹预测输出结果 轨迹预测模型_RNN轨迹预测输出结果_02

图3描述了利用多头注意力机制提取行人交互特征的过程。其交互状态为MHA_ i

RNN轨迹预测输出结果 轨迹预测模型_生成器_03

图4:本文对行人的相对位置编码

4.4 轨迹解码器模块

本模块利用基于 LSTM 的解码器来预测行人的未来轨迹。
在解码之前:

  1. 拼接状态-位移向量M_ i 与 Multi-Head 获取的行人交互状态 MHA_i 矩阵

4.5 生成器与判别器

  • 生成器通过 3个模块的计算能够为每个行人生成未来时刻的运动轨迹 ,然后判别器用来鉴别其输人的轨迹是真实轨迹, 还是由生成器生成的轨迹。
  • 在经过编码器进行编码后由Softmax 分类器计算输入轨迹是真实轨迹的概率进行轨迹分类

5 实 验

5.3 评价标准

  1. 平均位移误差——ADE
  2. 终点位置误差——FDE
  3. 平均非线性位移误差——AnlDE

5.5 实验结果与分析

5.5.1 行人轨迹预测误差对比分析

RNN轨迹预测输出结果 轨迹预测模型_深度学习_04

表二

  1. 从整体性能上看,MAGAM模型比基准模型的性能有所提高。
  2. ADE指标对比可以看出,多头注意力机制能更好地捕捉行人之间的交互特征,从而提高模型的准确率。
    图5:绿色是真实轨迹,红色是预测轨迹
    不论是在行走方向还是行走速度上MAGAM 模型预测轨迹与真实轨迹是最接近的

5.5.4 模型性能对比

RNN轨迹预测输出结果 轨迹预测模型_RNN轨迹预测输出结果_05

表三:模型结构越复杂,模型训练时
所消耗的时 间越多模型达到收敛状态的平均耗时越长

6 总 结

针对复杂场景 中 行人轨迹 的多样性与行人之间 复杂 的交互关系 本文提 出 了 基于多 头 注意力 对抗 机制 的行人轨迹 预测模型 首先 利 用 LSTM 提取每个行人的轨迹特征 然后通过多头 注意力 机制从, 融合 了 行人相 对位移信息 的 位 移 状态矩 阵 中 学 习 多个行人之间 的交互关系 , 再对加人 了 噪声 的 特征 向量进行解码得到预测轨迹 MAGAM 模型基于对抗生成机制 和高斯噪声来拟合生成多种可行 的行人 轨迹 . 为验证 MAGAM 模型 的性 能 本文不仅进行 了行人轨迹预测实验 还将模型应用 于道路车辆轨迹的预测任务 中 均得到 了 合理的预测路径 但相 比GAN模型 MAGAM的 , 于s o c i a l LSTM和s o c i a l , 计算成本较高 未来我 们将探索优化方法降低计算消耗 的 时长 此外 在实 际应用 中 需 要 根据具体 的 场景 以 及 目 标物体移动轨迹 的 特征 对模型 的 局 部 算法结构进行改进和 优化 从而实 现对复杂场景 中 的预测 目 标更全面的特征挖掘 。