有兴趣的朋友可以相互讨论技术论文:https://arxiv.org/abs/2004.10934官方代码:https://github.com/AlexeyAB/darknet Abstract有大量的技巧可以提高卷积神经网络(CNN)的准确率(accuracy)。需要在大数据集下对这种技巧的组合进行实际测试,并对结果进行理论论证。某些技巧仅在某些模型上使用和专门针对某些问题,或只针对
转载 2024-05-16 23:10:06
74阅读
众所周知,实时目标检测( Real-Time Object Detection )一直由 YOLO 系列模型主导。飞桨在去年 3 月份推出了高精度通用目标检测模型 PP-YOLOE ,同年在 PP-YOLOE 的基础上提出了 PP-YOLOE+ 。后者在训练收敛速度、下游任务泛化能力以及高性能部署能力方面均达到了很好的效果。而继 PP-YOLOE 提出后,MT-YOLOv6、YOLOv7、DAMO
作者 | 范厘针  编辑 | 汽车人跟踪的评价指标有哪些?首先明确评价目标跟踪算法的出发点:希望所有出现的目标都要被及时找到;希望每个目标的位置要与真实的目标位置一致;希望每个目标都被分配一个唯一的ID,并且分配给这个目标的ID在整个序列中保持不变。用于评价的文件det.txt这个文件是保存模型推理的检测结果的文件,内容如下:1,-1,1359.1
想要注意的是,模型和数据集的详细信息并不是这里的主要关注点(它们只是为了尽可能简单,以便读者可以在自己的机器上复现,而不需要下
原创 2024-08-08 11:40:18
84阅读
大家好,马上又要周末了,这周有认真学习,认真科研吗?最近看了一篇新的论文,这里做一下分享。更新时间:2020.04.27论文题目:Know Your Surroundings:Exploiting Scene Information for Object Tracking作者:Goutam Bhat,Martin Danelljan,Luc Van Gool,Radu Timofte摘要:目前SO
一、理论来表达。基于目标特征的跟踪方法,并不是将目标作为一个整体进行跟踪的,而是在连续帧图像中匹配并跟踪一组特征点(如边界线条、质心、角点等)。基于特征的跟踪方法主要包括特征的提取和匹配两个环节。只要特征点可见,就可以实现对目标的持续跟踪。Niyogi.S等人针对目标的结构特征建立了主动模型,使用卡尔曼滤波器(Kalman filter)进行运动预测,通过使能量函数最小化的方法进行目标匹配,从而实
导读今天给大家推荐一个优秀的Github项目,总结了近几年的显著性目标检测相关顶会顶刊论文以及相应代码。尤其适合初学者的论文阅读,以及高级研究员的文献检索和代码查找。Github地址https://github.com/jiwei0921/SOD-CNNs-based-code-summary-欢迎大家直接关注最新动态,持续更新中。项目背景显著性目标检测(salient object detect
Transformers in Single Object Tracking: An Experimental Survey动机 该论文的研究动机是分析和评估最近提出的基于Transformer的单目标跟踪方法,并将它们与CNN和手工特征提取方法进行比较。此外,该研究还旨在通过实验评估这些跟踪器的跟踪鲁棒性和计算效率,并在不同的跟踪场景中测量它们的性能,以确定它们在特定情况下的优缺点。该论文的研究
作者:匿名用户配不配best paper这点不是在下这种匿名菜鸡能评价的,只是说一点在下知道的。仅从cv的角度来看,这类组合优化背景的geometric fitting的问题还是挺有应用背景的(以在下粗鄙的理解就是给一个目标的参数方程形式,但有多少个目标咱不知道,这类问题在cv里除了论文里面的ransac,还有一大类就是类别数目未定的图像分割,很多欧洲老哥把这类问题叫stochastic geom
转载 2024-06-30 10:57:35
55阅读
一、YOLOv1论文:《You Only Look Once: Unified, Real-Time Object Detection》https://arxiv.org/abs/1506.0264网络中的亮点:Yolo v1的思想:第一,将一副图片分成s*s个网络,如果目标中心落在网格,则这个网格负责预测这个目标。例如:图片分成7*7,狗的中心落在中心格子上。 第二,每个grid ce
转载 2024-06-14 08:25:27
120阅读
普通手机“随手”拍的雕像,一下就变成了精细的三维重建图。水杯来回动的动态场景下,细节清晰可见:静态场景效果也同样nice,狗狗突出的肋骨都被还原了出来:对比来看其他方法,效果是酱婶的……这就是英伟达最新提出的方法BundleSDF。这是一种可对未知物体的6D姿态追踪和三维重建的方法。用于从单目RGBD视频序列中跟踪未知物体的6自由度运动,同时进行物体的隐式神经三维重建,方法接近于实时(10Hz)。
转载 2024-06-21 07:44:17
98阅读
SVM全称是supported vector machine(支持向量机),即寻找到一个超平面使样本分成两类,并且间隔最大。SVM能够执行线性或⾮线性分类、回归,甚至是异常值检测任务。它是机器学习领域最受欢迎的模型之一。SVM特别适用于中小型复杂数据集的分类。超平面最大间隔  上左图显示了三种可能的线性分类器的决策边界:虚线所代表的模型表现非常糟糕,甚至都无法正确实现分类。其余两个模型在
本文将介绍一篇很有意思的论文,该方向比较新,故本文保留了较多论文中的设计思路,背景知识等相关内容。前言:人类具有识别环境中未知对象实例的本能。当相应的知识最终可用时,对这些未知实例的内在好奇心有助于了解它们。 这促使我们提出一个新的计算机视觉问题,称为:“开放世界对象检测”,其中模型的任务是:1)将尚未引入的对象识别为“未知”,无需明确监; 2)在逐渐接收到相应的标签时,逐步学
前言 语义分割的弱增量学习(WILSS)目的是学习从廉价和广泛可用的图像级标签中分割出新的类别,但图像级别的标签不能提供定位每个片段的细节。为了解决该问题,本文提出了一个新颖且数据高效的框架(FMWISS)。该框架提出了基于预训练的共同分割,以提炼出互补基础模型的知识来生成密集的伪标签。用师生结构进一步优化噪声伪标签,并引入基于内存的复制-粘贴增强技术,以改善旧类的灾难性遗忘问题。FMW
转载 2024-05-13 10:44:30
155阅读
前言阅读CVPR2019并总结CVPR2019目标检测方法进展综述2、Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression论文链接:https://arxiv.org/abs/1902.09630论文解读:https://mp.weixin.qq.com/s/6QsyYtEVjavo
转载 2024-05-26 22:49:02
61阅读
CVPR2021 | 2D目标检测论文解读1. UP-DETR:——《UP-DETR: Unsupervised Pre-training for Object Detection with Transformers(Oral)》2. OWOD——《Towards Open World Object Detection(Oral)》3. YOLOF——《You Only Look One-lev
目录导读引言方法Parallel Heterogeneous ArchitecturePrototype Learning by Adaptive Frequency Filter MotivationFrequency Similarity Kernel (FSK)Dynamic Low-Pass Filters (DLF)Paper: Mo
1. YOLOF-You Only Look One-level Feature1. 摘要:     本文重新回顾了一阶段检测器中的特征金字塔网络(FPN),并指出FPN网络的成功在于他它面对目标检测中的优化问题时的“分而治之”方法。从优化角度看,为了处理这个问题,我们没有使用复杂的特征金字塔结构,而是引入了一个可替代的方法--只使用一级特征来进行检测。基于这个简单并
转载 2024-04-08 21:56:54
128阅读
文章目录一、检测相关(16篇)1.1 Contextual Object Detection with Multimodal Large Language Models1.2 Towards minimizing efforts for Morphing Attacks -- Deep embeddings for morphing pair selection and improved Mor
本文分为两部分:算法讲解+论文精读 一、GradCAM深度学习可解释性分析论文:Grad-CAM: Visual Explanations From Deep Networks via Gradient-Based Localization创新点+数据挖掘点基础是CAM复习下CAM算法对深度学习实现可解释性分析、显著性分析可扩展性强,后续衍生出各种基于CAM的算法每张图片、每个类别,都能
  • 1
  • 2
  • 3
  • 4
  • 5