YOLOX系列二tools/demo.py代码详解 文章目录YOLOX系列二前言一、代码详解1.网络参数设置,pycharm直接运行demo.py1.# 获取图片(文件夹中所有图片)get_image_list(path)2.预测参数初始化Predictor(object)3.图片(帧)检测 inference(self, img)4. visual(self, output, img_info,
预测更准确(Better)1) Batch Normalization       CNN在训练过程中网络每层输入的分布一直在改变, 会使训练过程难度加大,但可以通过normalize每层的输入解决这个问题。YOLO v2在每一个卷积层后添加batch normalization,通过这一方法,mAP获得了2%的提升。batch normalization
向AI转型的程序员都关注公众号机器学习AI算法工程在深度学习的训练中,强数据增强(strong data augmentation)通过对训练数据进行更大幅度的随机
转载 9月前
1358阅读
【DynamicHead介绍】本文提出了一个检测头,在尺度感知、空间感知和任务感知应用了不同的注意力方法。其将FPN的输出拼接在一起,得到一个L*H*W*C的特征层(L=3,表示三个FPN输出),进一步表示为L*S*C的特征层。在尺度感知上,应用一个L维度的注意力机制(类似SENet)。在空间感知上,使用了DCN卷积进行稀疏采样,并设置了一个重要性因子对采样后的特征值进行加权。在任务感知上,使得d
原创 3月前
627阅读
YOLOv5发布以来,模型经历了多版本迭代(包括YOLOv6、YOLOv7、YOLOv8及社区改进版本如YOLOv9-YOLOv11)。本文系统梳理各版本的核hor)、数据增强(Mosaic、MixUp)。:混合精度量化(FP16/INT8)、神经架构搜索(NAS)自动优化网络。
[DynamicConv介绍]动态卷积(Dynamic Convolution)是《DynamicConv.pdf》中提出的一种关键技术,旨在增加网络的参数量而几乎不增加额外的浮点运算(FLOPs)。以下是关于动态卷积的主要信息和原理:主要原理:1. 动态卷积的定义: 动态卷积通过对每个输入样本动态选择或组合不同的卷积核(称为"experts"),来处理输入数据。这种方法可以视为是对传统卷积操作的
原创 4月前
311阅读
文章目录前言yolo格式的数据集准备1.voc格式转yolo2.coco格式转yolo制作自己数据集的yaml文件总结前言yolov5已经很成熟了,作为一个拥有发展系列的检测器,它拥有足够的精度和满足现实中实时性要求,所以许多项目和比赛都能用的上,自己也拿来参加过比赛。 这里整理和分享下,自己搜集和修改的voc和coco格式转yolo格式的代码yolo格式的数据集准备1.voc格式转yolo如果自
【AFPN4介绍】1.AFPN 1.1 AFPN简介 AFPN(Adaptive Feature Pyramid Network)是一种改进的特征金字塔网络,旨在优化多尺度特征融合。与传统FPN(自顶向下单向融合)和PANet(双向融合)不同,AFPN通过自适应机制(如动态权重学习、跨尺度交互)实现更灵活的特征融合。其核心思想是让不同层级的特征根据内容自动调整融合权重,减少信息丢失,增强多尺度目标
原创 3月前
143阅读
【功能模块】 ①:图像检测模块:支持单张图片上传检测,自动标注坑洼位置及置信度 ②:视频检测模块:支持视频文件检测,实时标注并记录坑洼位置信息 ③:实时摄像头检测:连接摄像头进行实时坑洼检测,适用于车载系统 ④:数据统计分析:多维度统计检测结果,提供饼图、柱状图、趋势图可视化 ⑤:参数配置模块:支持调整置信
YOLOv11 作为目标检测领域的最新成果,其架构优化是提升性能的关键。本文将详细探讨 YOLOv11 的架构改进,以及这些改进如何帮助模型在实时应用中实现更高的准确性和效率。
硬件设备i7-11800H +RTX3060准备数据数据标注在网上下载自己需要的数据集,或者自己通过摄像头获取自己需要训练的数据;通过标注工具labelImage进行标注,windows版下载链接:链接:https://pan.baidu.com/s/10jby2x-fL-iWDiJbCg55iw 提取码:quo6打开labelImage,选择如下红框标注的按钮,用该模式标注出的文件满足yolo要
 [DSConv介绍]我们引入了一种卷积层的变体,称为DSConv(分布偏移卷积),其可以容易地替换进标准神经网络体系结构并且实现较低的存储器使用和较高的计算速度。 DSConv将传统的卷积内核分解为两个组件:可变量化内核(VQK)和分布偏移。 通过在VQK中仅存储整数值来实现较低的存储器使用和较高的速度,同时通过应用基于内核和基于通道的分布偏移来保持与原始卷积相同的输出。 我们在Res
原创 4月前
231阅读
【四】识别类别:Alcohol, Candy, Canned Food, Chocolate, Dessert, Dried Food, Dried Fruit, Drink, Gum, Instant Drink,
 [KANConv网络介绍]Kolmogorov-Arnold网络(Convolutional KANs),这种架构旨在将Kolmogorov-Arnold网络 (KANs)的非线性激活函数 整合到卷积层中,从而替代传统卷积神经网络(CNNs)的线性变换。与标准的卷积神经网络(CNN)相比,KANConv层引入了更多的参数,因为每个卷积核元素都需要额外的可学习函数。这使得它能够更好地捕捉
原创 4月前
119阅读
1点赞
 【UniRepLKNet介绍】大内核卷积神经网络最近受到了广泛的研究关注,但有两个未解决的关键问题需要进一步研究。1)现有大内核的架构很大程度上遵循传统或Transformer的设计原则,而大内核的架构设计仍然没有得到解决。2)由于 Transformer 已经主导了多种模态,大卷积核是否在视觉以外的领域也具有强大的通用感知能力还有待研究。在本文中,我们从两个方面做出贡献。1)我们提出
原创 3月前
131阅读
[SAConv可切换空洞卷积介绍]SAConv(可切换空洞卷积)原理与优点详解一、SAConv的核心原理SAConv(Switchable Atrous Convolution)是一种创新的卷积模块,旨在解决传统空洞卷积(Dilated Convolution)在多尺度目标检测中的局限性。其核心设计思想如下:动态空洞率切换机制SAConv通过可学习的开关函数(Switch Functions)动态
原创 4月前
216阅读
 【RepViT介绍】摘要        近年来,在资源受限的移动设备上,与轻量级卷积神经网络相比,轻量级视觉Transformer(ViTs)表现出更高的性能和更低的时延。 这种改进通常归功于多头自注意模块,它使模型能够学习全局表征。 然而,轻量级ViTs和轻量级CNNs之间的体系结构差异还没有得到充分的研
原创 3月前
335阅读
 温馨提示:前面博文曾经引入DSConv当时是改变是卷积方式,不是修改检测头。具体可以参考博文:[yolov11改进系列]基于yolov11引入分布移位卷积DSConv的python源码+训练源码这个篇文章利用DSConv设计检测头引入yolo11中,卷积原理还是一样的。[DSConv介绍]我们引入了一种卷积层的变体,称为DSConv(分布偏移卷积),其可以容易地替换进标准神经网络体系结
原创 3月前
162阅读
[ODConv介绍]在现代卷积神经网络(CNN)中,每个卷积层中学习单个静态卷积核是常见的训练范式。然而,最近在动态卷积的研究中表明,通过学习 n 个卷积核的线性组合,并且这些卷积核的权重取决于它们的输入相关注意力,可以显著提高轻量级 CNN 的准确性,同时保持高效的推理。但是,我们观察到,现有的工作通过一个维度(关于卷积核数量)赋予卷积核动态属性,但另外三个维度(关于每个卷积核的空间大小、输入通
原创 4月前
208阅读
 [可改变核卷积AKConv介绍]AKConv的主要思想:AKConv(可变核卷积)主要提供一种灵活的卷积机制,允许卷积核具有任意数量的参数和采样形状。这种方法突破了传统卷积局限于固定局部窗口和固定采样形状的限制,从而使得卷积操作能够更加精准地适应不同数据集和不同位置的目标。AKConv的改进点:灵活的卷积核设计:AKConv允许卷积核具有任意数量的参数,这使得其可以根据实际需求调整大小
原创 4月前
258阅读
  • 1
  • 2
  • 3
  • 4
  • 5