目标检测TP

关注 mob64ca140c75c7

文章目录

介绍
大致架构以及流程
目标检测的效果
那么语义分割呢？
语义分割结果分析
结论

目标检测TP

转载

mob64ca140c75c7 2024-09-05 13:12:58

文章标签 目标检测TP 深度学习人工智能 transformer 建模 文章分类 计算机视觉人工智能

介绍

这次介绍的是Facebook AI的一篇文章“End-to-End Object Detection with Transformers”

恰好最近Transformer也比较热门，这里就介绍一下如何利用Transformer来进行目标检测以及语义分割。

这里我简要地介绍一下Transformer，这是一个用于序列到序列建模的模型架构，被广泛应用于自然语言翻译等领域。Transformer抛弃了以往对序列建模的RNN形式的网络架构，引入了注意力机制，实现了不错的序列建模以及变换能力。

大致架构以及流程

目标检测TP_深度学习

如上图所示，这里面主要分为两个部分：

Backbone：主要是CNN，用来抽取高级语义特征的
Encoder-Decoder：将高级语义特征利用并给出目标预测

更为细节地，给出如下的架构

目标检测TP_深度学习_02

我们按顺序地给出流程：

输入图片，形状为 $目标检测TP_人工智能_03$ , 其中 $目标检测TP_人工智能_04$ 代表通道数量
CNN抽取特征之后，得到 $目标检测TP_人工智能_05$ 形状的张量，其中 $目标检测TP_目标检测TP_06$
利用1x1的卷积，对特征的大小进行约减，得到 $目标检测TP_人工智能_07$ 的张量, 其中 $目标检测TP_人工智能_08$
将张量进行压缩（squeeze），形状变为 $目标检测TP_transformer_09$
得到了 $目标检测TP_transformer_10$ 个向量序列，作为序列输入到Encoder之中
Decoder得到输出的向量序列，通过FFN（Feed Forward Network）得到边界框预测以及类别预测，其中FFN就是简单的3层的感知机，边界框预测包括归一化后的中心坐标以及宽高。

目标检测的效果

目标检测TP_人工智能_11

如上图所示，可以看到DETR的计算次数不算多，但是FPS也不算高，只能算中规中矩。

那么语义分割呢？

这里给出关于语义分割的大致架构，如下图所示：

目标检测TP_transformer_12

注意到，图中所描述的，边界框嵌入（Box Embedding）实质上就是decoder的输出（在FFN之前）。

然后使用一个多头部注意力的机制，这个机制实质上是对Q，K，V进行多次的线性变换，在这里面，K和V是Encoder的输入，Q是decoder的输出。

其中M是多头部注意力的头部数量。

之后，通过一个简单的CNN，得到一个Mask矩阵，用来生成语义分割的结果。

语义分割结果分析

目标检测TP_transformer_13

可以看到比起PanopticFPN++来说，效果的提升有限，特别是AP并不佳，表现一般。

结论

文章将Transformer应用到了目标检测以及语义分割的领域，取得了不错的效果，但是性能上相较于FastRCNN类似架构的方法，并没有明显的提升，但显现出这种序列模型不错的扩展能力。用一个架构解决多种问题，统一化模型的目标指日可待。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：文件一级索引和二级索引

下一篇：ospf引入静态路由失败

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册