1、SwinTrack: A Simple and Strong Baseline for Transformer Tracking

Transformer最近在改进视觉跟踪算法方面显示出明显的潜力。然而,现有的基于Transformer的跟踪器大多使用Transformer来融合和增强卷积神经网络(CNN)生成的特征。相比之下,在本文中,我们提出了一种完全基于注意力的Transformer跟踪算法,Swin-Transformer Tracker (SwinTrack)。SwinTrack使用Transformer进行特征提取和特征融合,允许目标对象和搜索区域之间的完全交互以进行跟踪。为了进一步提高性能,我们综合研究了特征融合、位置编码和训练损失的不同策略。所有这些努力使SwinTrack成为一个简单而坚实的基准。在我们彻底的实验中,SwinTrack在LaSOT上以0.717台SUC的成绩创造了新的记录,在45帧FPS的情况下超过了STARK 4.6 %。此外,在其他具有挑战性的计算机视觉最新进展概览2021年11月28日到2021年12月04日_transformer、TrackingNet和get -10k上,拥有0.483台SUC、0.832台SUC和0.694台AO,实现了最先进的性能。