yolo几代的区别YOLO V1head检测头s=7backbone是googleNetYOLO V2开始预测偏移量检测头s=13 bounding box设置为五个,为了速度和准确度同时满足Backbone卷积尺寸变小,vgg net论文得到一个结论, 7* 7卷积可以用更小的卷积代替,且 33卷积更加节约参数,使模型更小 网络可以做得更深,更好地提取到特征。为什么?因为每做一次卷积,后面都会接            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-15 19:24:28
                            
                                574阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Dynamic Sparse R-CNN论文:https://arxiv.org/abs/2205.02101Sparse R-CNN是最近的一种强目标检测Baseline,通过对稀疏的、可学习的proposal boxes和proposal features进行集合预测。在这项工作中提出了2个动态设计来改进Sparse R-CNN。首先,Sparse R-CNN采用一对一标签分配方案,其中匈牙利            
                
         
            
            
            
            1、Introduction提出问题:随着网络越来越深,梯度就会出现爆炸或者消失 解决方法: 1、在权重随机初始化的时候,不要特别大也不要特别小 2、在中间加入一些normalization,包括BN(batch normalization)可以使得校验每个层之间的输出和梯度的均值和方差相对来说比较深的网络是可以训练的,避免有一些层特别大,有一些层特别小,使用这些技术之后能够收敛,但是当网络变深的            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-13 09:47:47
                            
                                931阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            论文名称:RepVGG: Making VGG-style ConvNets Great Again 论文下载地址:https://arxiv.org/abs/2101.03697 官方源码(Pytorch实现):https://github.com/DingXiaoH/RepVGG 文章目录0 前言1 RepVGG Block详解2 结构重参数化2.1 融合Conv2d和BN2.2 Conv2d            
                
         
            
            
            
            YOLO v3  Yolov3是2018年发明提出的,这成为了目标检测one-stage中非常经典的算法,包含Darknet-53网络结构、anchor锚框、FPN等非常优秀的结构。上图三个蓝色方框内表示Yolov3的三个基本组件:(1)CBL:Yolov3网络结构中的最小组件,由Conv+Bn+Leaky_relu激活函数三者组成。(2)Res unit:借鉴Resnet网络            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-25 16:30:33
                            
                                108阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             yolo3与SSD、retinaNet等在MAP和时间上的对比:(关于MAP:MAP的全称为mean average precision,也就是均值平均精度,好多时候都直接称为准确度,它是的AP取的均值,比如在一个识别任务里面会有好多类目标,而每一类里面有多个不同的具体目标,每个目标的预测结果与真实结果之间的差别用precision来表示,对这一类平均就是AP,对每一类取均值,那就是M            
                
         
            
            
            
              1 引言 思路来源:大多数现有的目标检测算法会先关注某些目标区域,然后预测目标位置。但是,神经科学家发现,人类不会以固定的稳定性注视场景。取而代之的是,人眼四处走动,定位信息丰富的部分以了解目标的位置。这种主动的感知运动过程称为saccade。受此机制的启发,这篇文章提出了一种称为SaccadeNet兼顾效率和精度的目标检测器。它包含四个主要模块:Center 注            
                
         
            
            
            
            (Introduction)The deep learning community is abuzz with YOLO v5. This blog recently introduced YOLOv5 as — State-of-the-Art Object Detection at 140 FPS. This immediately generated significant discussi            
                
         
            
            
            
            前情概要上一篇博客,我通过mmdetection实现的源码解释了centernet的原理,并分析了该算法的一些优缺点,本篇博客我将讲解如何通过mmdetection运行centernet,并基于一个x光数据集对比centernet与yolov3的性能。本文使用数据集介绍本文使用的数据集是安检x光的数据集,数据集大小为3600张图片和对应标注,样例图片如下 而需要检测的物体label有10个:kni            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-20 19:17:16
                            
                                99阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1.常用概念理解softmax loss:在计算机视觉中,一般一个做多分类的网络的结构为:多个卷积层(池化)->一个或者两个全连接层->softmax层,softmax层的神经元个数由类别数决定(例如有10类,那么softmax层就有10个神经元),每个神经元的输出表示着输入样本属于该神经元代表的类的概率,他们的和为1。数学计算公式为:       &nb            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-05 14:33:57
                            
                                193阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录 1.解释一下ResNet、DesNet,它两的区别与联系。2.YOLOv3网络介绍一下,YOLO系列讲一下。3.RCNN网络特点,RCNN系列讲一下。4.Python中如何调用C++代码?5.有哪些滤波去噪操作?6.解释static关键字的作用,修饰变量和函数的区别。7.有哪些评定模型好坏的标准?8.传统人工智能算法与深度学习算法的区别?9.YOLO系列和RCNN系列的区别?10.            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-20 15:34:00
                            
                                354阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            YOLOv3: An Incremental ImprovementYOLOv3使用的网络比YOLOv1和YOLOv2都要大,但推断速度仍旧还算可以,与RetinaNet(另一个一阶段的网络)相比的话效果相当,但速度快了好几倍,和SSD对比也是如此。摘要和引言乃至全篇文章,写得非常口水话,更多是一篇博客而不是学术论文,本文也不避开这些口水话,尽量都翻译了。自述:作者说他这一年没做什么研究,花了大量            
                
         
            
            
            
            AlexNetAlexNet是在IMAGENET比赛中第一个获奖的CNN结构。VGGNetVGGNet和AlexNet实际上都是对最传统的CNN进行重复堆叠的实践,将效果较好的结构记录下来方便以后继续使用,常用的有vgga(11层),vgg16和vgg19。结构如下:   (示意图来自于cs231n的课件,有一点小问题,vgg16应该是3个conv层后接pool)ResNet论文原文 https:            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-17 15:10:39
                            
                                47阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            前言 这段时间到了新公司,工作上开始研究DeepLearning以及TensorFlow,挺忙了,前段时间看了VGG和deep residual的paper,一直没有时间写,今天准备好好把这两篇相关的paper重读下。 VGGnet VGG解读 VGGnet是Oxford的Visual Geometry Group的team,在ILSVRC 2014上的相关工作,主要工作是证明了增加网络的深度能            
                
         
            
            
            
            如果您喜欢我的文章,欢迎关注我的专栏。
   ResNet和DenseNet是计算机视觉领域的经典工作,作为CVPR 2016和2017的best paper,两者不仅有很强的创新性,而且大道至简,给了我们很好的启发。本文的目的是解读一下ResNet和DenseNet中那些影响深远的创新,让我们对网络架构有更深刻的思考。 
 ResNet(Deep Residual Learning            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-07 08:39:42
                            
                                250阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            DenseNet实现代码DenseNetDenseNet模型的基本思路与ResNet一致,但它是前面所有层与后面层的密集连接(dense connection),它的名称也是由此而来。 如下图所示: 如上图所示,DenseNet每两个层之间都有直接的连接,因此该网络的直接连接个数为。 对于每一层,使用前面所有层的特征映射作为输入,并且其自身的特征映射作为所有后续层的输入。DenseNet的优点:            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-19 20:21:47
                            
                                137阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Tensorflow2.0—YOLO V4-tiny网络原理及代码解析(三)- 损失函数的构建YOLO V4中的损失函数与V3还是有比较大的区别的,具体的可以看YOLOV4与YOLOV3的区别。 代码是在nets文件夹下面的loss.py文件中,在train.py中引用的是:model_loss = Lambda(yolo_loss, output_shape=(1,), name='yolo_l            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-30 08:53:17
                            
                                164阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录R CNN系列算法比较1.R-CNN:2.Fast R CNN3.FASTER -RCNN:YOLO系列YOLOv1YOLOv2YOLOv3YOLOv4SSD(Single Shot MultiBox Detector)R-CNN系列算法比较(two-stage)1.R-CNN:(1)image input;(2)利用selective search 算法在图像中从上到下提取2000个左右的R            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-08 22:20:48
                            
                                151阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                ResNet网络ResNet原理和实现总结一、ResNet原理和实现  神经网络第一次出现在1998年,当时用5层的全连接网络LetNet实现了手写数字识别,现在这个模型已经是神经网络界的“helloworld”,一些能够构建神经网络的库比如TensorFlow、keras等等会把这个模型当成第一个入门例程。后来卷积神经网络(Convolutional Neural Networks, C            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-03 22:05:00
                            
                                131阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            文章目录1.R-CNN1.1 R-CNN1.2 Fast R-CNN1.3 Faster R-CNN1.4 Mask R-CNN2.SSD3.YOLO 1.R-CNN1.1 R-CNN使用传统的锚框(提议区域)选择算法–选择性搜索算法* 选取高质量锚框。对每一个锚框使用预训练模型对其提取特征,每个锚框需要调整为预训练模型所需要的输入尺寸。使用支持向量机(SVM)对类别分类。训练线性回归模型来预测            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-08 12:03:32
                            
                                85阅读