文章目录(一)任务表述(二)主要难题(三)研究进展 (一)任务表述图像理解的三大层次 图像水平的物体分类 通用目标检测 像素水平的物体分割分类(Classification):是最简单、最基础的图像理解任务 ImageNet是最权威的评测集,每年的ILSVRC催生了大量的优秀深度网络结构,为其他任务提供了基础。在应用领域,人脸、场景的识别等都可以归为分类任务。检测(Detection):在目标定            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-15 15:10:38
                            
                                73阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            论文: Spiking-YOLO: Spiking Neural Network for Energy-Efficient Object Detection论文地址:http://arxiv.org/abs/1903.06530Introduction  脉冲神经网络(Spiking neural network, SNN)将脉冲神经元作为计算单元,能够模仿人类大脑的信息编码和处理过程。不同于CN            
                
         
            
            
            
            作者:猿辅导研究团队 引言 普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫。而在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛以及实际的应用中,还包括目标定位和目标检测等任务。其中目标定位是不仅仅要识别出来是什么物体(即分类),而且还要预测物体的位置,位置一般用边框(boundi            
                
         
            
            
            
            目录论文相关信息摘要1. 介绍2. 相关工作3. RepPoints表示3.1 边框表示3.2 RepPoints4. RPDet: 一个anchor-free的检测器5. 实验实验的设置消融实验State-of-the-art Comparison结论 摘要现代目标检测器严重依赖于矩形边框来在不同的stage表征物体,如anchor,proposals以及最终的预测。边框使用起来很方便,但是边            
                
         
            
            
            
            一、前言目标检测是图像处理和计算机视觉学科的重要分支,对人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。计算机视觉对于目标运动的分析可以大致分为三个层次:运动分割,目标检测 --> 目标跟踪 --> 动作识别            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-08-26 10:43:16
                            
                                650阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            论文地址:A Survey of Modern Deep Learning based Object Detection Models 论文结构:一、论文亮点(与其他综述不同):1、深度分析了两类检测方法:单步和两步检测,并从历史的角度分析;2、详细的评估了重要的体系结构和轻量化模型。二、背景1、目标:识别出图像中所有物体并用框出2、挑战:1)内类差异:同一物体的不同形态,或被环境影响;2)过多的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-27 16:53:18
                            
                                234阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            此示例演示如何使用名为“更快r-cnn(具有卷积神经网络的区域)”的深度学习技术来训练对象探测器。概述此示例演示如何训练用于检测车辆的更快r-cnn对象探测器。更快的r-nnn [1]是r-cnn [2]和快速r-nnn [3]对象检测技术的引伸。所有这三种技术都使用卷积神经网络(cnn)。它们之间的区别在于它们如何选择要处理的区域以及如何对这些区域进行分类.r-cnn和快速r-概算在运行美国有线            
                
         
            
            
            
            论文链接:https://arxiv.org/abs/2008.00230 仓库链接:https://github.com/taozh2017/RGBD-SODsurvey介绍显著目标检测(Salient Obejct Detection)是模拟人类视觉感知系统来定位场景中最吸引人的目标,已被广泛应用于各种计算机视觉任务中。显著目标检测在现实中的应用有:立体匹配(stereo matching)、            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-12 13:41:17
                            
                                283阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            前言    开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他们在什么位置?这还不简单,图中有一个猫和一个人,具体的位置就是上图右侧图像两个边框(bounding-box)所在的位置。其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个目标            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-22 08:54:36
                            
                                219阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.目标检测要解决的核心问题除了图像分类之外,目标检测要解决的核心问题是:a.目标可能出现在图像的任何位置。b.目标有各种不同的大小。 c.目标可能有各种不同的形状。 如果用矩形框来定义目标,则矩形有不同的宽高比。由于目标的宽高比不同,因此采用经典的滑动窗口+图像缩放的方案解决通用目标检测问题的成本太高。2.目标检测相关算法:DPM算法:先提取DPM人工特征,再用latentSVM分类。这种特征提            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-28 15:14:00
                            
                                111阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            # 深度学习目标检测方法实现指南
## 一、整体流程
在实现基于深度学习的目标检测方法时,一般可以分为以下几个步骤,具体流程如下表所示:
| 步骤 | 描述 |
| ---- | ---- |
| 1 | 数据准备:收集、标注、划分训练集和测试集 |
| 2 | 模型选择:选择合适的深度学习模型,如Faster R-CNN、YOLO、SSD等 |
| 3 | 模型训练:使用训练集对模型进行训            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-05-18 03:55:03
                            
                                59阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            有关传统机器学习方法和深度学习方法在目标检测领域的一些总结。传统机器学习方法Detection based on AdaboostRef:Rapid Object Detection using a Boosted Cascade of Simple Features.(CVPR2001)这个方法是一个二分类方法,判断是还是不是人脸。主要包括了以下内容:文中提出了一种新的图片表达方式和三种特征,新            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-01 06:55:59
                            
                                45阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            翻译自:NICKZENG介绍这篇文章的目的是总结各种流行竞赛采用的一些常见的对象检测指标。这篇文章主要关注指标的定义。热门比赛和指标此任务包含以下竞赛和指标:
PASCAL VOC挑战赛 (Everingham等,2010)
COCO目标检测挑战 (Lin et al.2014)
Open Images挑战赛 (Kuznetsova 2018)上面的链接指向描述评估指标的网站。简单来说:所有这三个            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-29 15:40:51
                            
                                70阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            R-CNN(Region-based Convolutional Neural Network):R-CNN是一种经典的目标检测算法,它通过在图像中提取            
                
         
            
            
            
            导语:各种测距方法很多,目前应用较多的主要有PSD测距法、超声时间法、带运动机构的双像比较法和反射能量法。PSD测距法利用三角测距原理,用一种称之为位置敏感器件(Position Sensitive Device)的PSD元件来获得两路输出信号,根据这两路信号来获得物体的距离量值。超声时间法测量一束超声波从发射到反射回仪器的时间来判断被测距离。带运动机构的双像比较法这种方法比较复杂,系统中有两套光            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-09-30 07:19:23
                            
                                155阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            作者丨henry一个理工boy@知乎(已授权)编辑丨极市平台导读 鉴于显著性目标和伪装目标研究的相似性,本文作者将显著性目标与伪装目标合在一起进行研究,文章重点是特征提取网络与特征融合技术,主要介绍了三种方法EGNet,PFANet和SINet。 在自然界中许多生物都具有“伪装”的本领,变色龙能够根据周遭的环境来调整自身颜色以达到其“伪装”的目的;狮子将身体“伪装”在草丛之中            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2022-09-29 19:47:39
                            
                                226阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目标检测是很多计算机视觉应用的基础,比如实例分割、人体关键点提取、人脸识别等,它结合了目标分类和定位两个任务。现代目标检测器的框架可分为two-stage和one-stage两种类型,two-stage框架分为两步,精度高,但速度较慢,不能到、达到实时检测:1) 区分前景物体框与背景并为它们分配适当的类别标签;2) 回归一组系数使得最大化检测框和目标框之间的交并比或其它指标,最后,使用非极大值抑            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-11-22 14:53:26
                            
                                128阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1. Anchor   可以根据实际任务,修改anchor预设的大小和scale ,也就是说stride + anchor ratio + anchor scales都可以调整,选择不同stride确定了feature map的大小,stride就是说下采样的比例,4就是256*256变成64*64,ratio确定了纵横比和尺度。 2. IoU loss与focal            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-22 19:51:28
                            
                                109阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            基于深度学习的目标检测算法已经在计算机视觉领域取得了巨大的成功,其中一些著名的算法包括:R-CNN(Region-based Convolutional Neural Network):R-CNN是一种经典的目标检测算法,它通过在图像中提取候选区域,然后对每个候选区域进行分类和边界框回归。它使用卷积神经网络(CNN)来提取区域特征,并通过支持向量机(SVM)进行分类。Fast R-CNN:Fast            
                
         
            
            
            
            引言单目3D目标检测最大的挑战在于无法得到精确的深度信息,传统的二维卷积算法不适合这项任务,因为它不能捕获局部目标及其尺度信息,而这对三维目标检测至关重要。论文:https://arxiv.org/pdf/1912.04799v1 代码:https://github.com/dingmyu/D4LCN 参考paddle复现:3D目标检测(单目)D4LCN论文复现(https://aistudio.            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-26 14:25:12
                            
                                63阅读
                            
                                                                             
                 
                
                                
                    