基于多头注意力对抗机制的复杂场景行人轨迹预测
- 4 MAGAM 模型
- 4.1 模型整体框架
- 4.2 轨迹编码器模块
- 4.3 交互特征提取模块
- 4.4 轨迹解码器模块
- 4.5 生成器与判别器
- 5 实 验
- 5.3 评价标准
- 5.5 实验结果与分析
- 5.5.1 行人轨迹预测误差对比分析
- 5.5.4 模型性能对比
- 6 总 结
4 MAGAM 模型
一种基于多头注意力机制的生成对抗网络模型
4.1 模型整体框架
图 2 为 MAGAM 模型 的整体框架 模型采用生成对抗网络结构包括一个生成器和一个判别器 。生成器以行人的观测轨迹序列 T作为输入 ,学习各行 人之间 的复杂交互关系 并生成 预测 轨 迹 判别 器T^。学习判断某 一 轨迹是真实轨迹还是由生成器生成的轨迹 。其中
- 生****成器包括 3 个模块:分别为轨迹编码器模块 ,交互特征提取模块和轨迹解码器模块。
- 判别器中仅包含轨迹编码器模块
4.2 轨迹编码器模块
本模块对每个行人的历史轨迹迸行编码,利用 LSTM 对每个行人的历史轨迹序列进行建模,得到当前时刻的状态
4.3 交互特征提取模块
本模块旨在利用多头注意力机制深度捕捉行人之间 的交互模式。
图3描述了利用多头注意力机制提取行人交互特征的过程。其交互状态为MHA_ i
图4:本文对行人的相对位置编码
4.4 轨迹解码器模块
本模块利用基于 LSTM 的解码器来预测行人的未来轨迹。
在解码之前:
- 拼接状态-位移向量M_ i 与 Multi-Head 获取的行人交互状态 MHA_i 矩阵
4.5 生成器与判别器
- 生成器通过 3个模块的计算能够为每个行人生成未来时刻的运动轨迹 ,然后判别器用来鉴别其输人的轨迹是真实轨迹, 还是由生成器生成的轨迹。
- 在经过编码器进行编码后由Softmax 分类器计算输入轨迹是真实轨迹的概率进行轨迹分类
5 实 验
5.3 评价标准
- 平均位移误差——ADE
- 终点位置误差——FDE
- 平均非线性位移误差——AnlDE
5.5 实验结果与分析
5.5.1 行人轨迹预测误差对比分析
表二:
- 从整体性能上看,MAGAM模型比基准模型的性能有所提高。
- 从ADE指标对比可以看出,多头注意力机制能更好地捕捉行人之间的交互特征,从而提高模型的准确率。
图5:绿色是真实轨迹,红色是预测轨迹
不论是在行走方向还是行走速度上MAGAM 模型预测轨迹与真实轨迹是最接近的
5.5.4 模型性能对比
表三:模型结构越复杂,模型训练时
所消耗的时 间越多模型达到收敛状态的平均耗时越长
6 总 结
针对复杂场景 中 行人轨迹 的多样性与行人之间 复杂 的交互关系 本文提 出 了 基于多 头 注意力 对抗 机制 的行人轨迹 预测模型 首先 利 用 LSTM 提取每个行人的轨迹特征 然后通过多头 注意力 机制从, 融合 了 行人相 对位移信息 的 位 移 状态矩 阵 中 学 习 多个行人之间 的交互关系 , 再对加人 了 噪声 的 特征 向量进行解码得到预测轨迹 MAGAM 模型基于对抗生成机制 和高斯噪声来拟合生成多种可行 的行人 轨迹 . 为验证 MAGAM 模型 的性 能 本文不仅进行 了行人轨迹预测实验 还将模型应用 于道路车辆轨迹的预测任务 中 均得到 了 合理的预测路径 但相 比GAN模型 MAGAM的 , 于s o c i a l LSTM和s o c i a l , 计算成本较高 未来我 们将探索优化方法降低计算消耗 的 时长 此外 在实 际应用 中 需 要 根据具体 的 场景 以 及 目 标物体移动轨迹 的 特征 对模型 的 局 部 算法结构进行改进和 优化 从而实 现对复杂场景 中 的预测 目 标更全面的特征挖掘 。