热门 最新 精选 话题 上榜
【AFPN4介绍】1.AFPN 1.1 AFPN简介 AFPN(Adaptive Feature Pyramid Network)是一种改进的特征金字塔网络,旨在优化多尺度特征融合。与传统FPN(自顶向下单向融合)和PANet(双向融合)不同,AFPN通过自适应机制(如动态权重学习、跨尺度交互)实现更灵活的特征融合。其核心思想是让不同层级的特征根据内容自动调整融合权重,减少信息丢失,增强多尺度目标
原创 4月前
143阅读
[yolov11改进系列]基于yolov11融合改进检测头AFPN4的python源码+训练源码
 【Haar介绍】在深度学习中,特征提取是关键环节。传统的卷积神经网络(CNN)通过卷积层提取图像特征,但在处理复杂图像时,单一的频域信息可能不足以捕获所有重要细节。为了解决这个问题,我们可以结合小波变换(DWT)和卷积操作,使用Down_wt卷积提高YOLOv11模型的精度。1. Down_wt卷积概述下图展示了Down_wt卷积的结构。通过Haar小波变换,该卷积模块实现了
原创 4月前
343阅读
[yolov11改进系列]基于yolov11引入Haar小波下采样Down_wt卷积减少信息丢失的python源码+训练源码
参与全球AI治理框架的讨论是推动技术向善的关键行动。以下是多层次参与路径,涵盖个人、机构到国际协作的实践建议: 一、国际组织与标准制定 加入核心治理机构 联合国AI咨询机构:参与年度《人工智能治理全球报告》磋商(联合国官网入口) OECD人工智能政策观察站:提交本国AI政策案例或参与专家评审(OECD.AI平台) IEEE标准协会:申请加入伦理对齐设计(Ethically Aligned Desi
原创 4月前
57阅读
 【AOD-PONO-Net介绍】AOD-Net是一个端到端的可训练去雾模型,直接从有雾图像产生清晰图像,而不是依赖于任何单独和中间参数估计步骤。基于重新公式化的大气散射模型设计,与现有工作共享相同的物理基础,但以一种“更端到端”的方式将其所有参数估计在一个统一模型中完成主要创新点端到端去雾模型:首次提出一个端到端训练的去雾模型,直接从雾图像生成清晰图像,避免了传统方法中估计传输矩阵和大
原创 4月前
127阅读
[yolov11改进系列]基于yolov11使用图像去雾网络AOD-PONO-Net替换backbone的python源码+训练源码
 【RevColV1介绍】可逆列网络去发表于ICLR2022,其是一种新型的神经网络设计(和以前的网络结构的传播方式不太一样),由多个子网络(列)通过多级可逆连接组成。这种设计允许在前向传播过程中特征解耦,保持总信息无压缩或丢弃。1.1 RevColV1的基本原理RevCol的主要原理和思想是利用可逆连接来设计网络结构,允许信息在网络的不同分支(列)间自由流动而不丢失。这种多列结构在前向
原创 4月前
89阅读
[yolov11改进系列]基于yolov11使用可逆列网络RevColV1替换backbone用于提高小目标检测能力的python源码+训练源码
 【ContextGuided介绍】1. ContextGuideBlock1.1 简介摘要: 随着在移动设备上应用语义分割模型的需求迅速增长,当前的顶尖网络由于参数量巨大,不适合移动设备使用,而其他小内存模型则遵循分类网络的原则,忽略了语义分割的固有特征。为了解决这个问题,我们提出了一个轻量级且高效的语义分割网络-上下文引导网络(CGNet)。本文首次提出CG块,改模块通过学习局部特征
原创 4月前
163阅读
[yolov11改进系列]基于yolov11引入轻量级下采样ContextGuided的python源码+训练源码
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!? 魔都架构师 | 全网30W技术追随者? 大厂分布式系统/数据中台实战专家? 主导交易系统百万级流量调优 & 车联网平台架构? AIGC应用开发先行者 | 区块链落地实践者? 以技术驱动创新,我们的征途是改变世界!? 实战干货:编程严选网1 在手机上分享密码Chrome 中可用于分享密码的模块。该模块旁边有一个二维码,可
yolov7训练自己的数据集前言一、下载整个项目通过git 下载或者直接下载压缩包二、安装所需环境三、准备数据集四、配置文件五、下载权重文件六、开始训练七、推理附录:遇到的问题 前言继美团发布YOLOV6之后,YOLO系列原作者也发布了YOLOV7。 YOLOV7主要的贡献在于:1.模型重参数化 YOLOV7将模型重参数化引入到网络架构中,重参数化这一思想最早出现于REPVGG中。 2.标签分配
文 | AUTO芯球作者 | 雷慢新能源车要变天了!全固态电池真要上车了,来看,这车身上写着全固态电池,知道这是什么车吗?奇瑞星纪元ET,我打听到的消息是,这是一辆全固态电池的路测车,负责电池制造的是国轩高科,电池能量密度为350 Wh/kg,比现在的三元锂电池普遍在150~250Wh/kg要高1倍左右,它支持1000公里以上续航。比我那60L油箱的车跑的还远!去年奇瑞还宣布自家的固态电池2026
原创 4月前
89阅读
固态电池真来了!星纪元ET已经上车
目标检测和边界框%matplotlib inline from PIL import Image import sys sys.path.append('/home/kesci/input/') import d2lzh1981 as d2l# 展示用于目标检测的图 d2l.set_figsize() img = Image.open('/home/kesci/input/img2083/img
如何用AI赋能服装设计行业,这是飞桨开发者技术专家洪力一直在思考的事。设计师构思并绘制出一件衣服后,如果可以一键生成衣服整体的效果,就可以帮助其根据成品的版型、款式等因素做出更好的设计。项目的基本思路确定以后,洪力在AI Studio平台使用飞桨框架开始实践。目前本项目可以实现服装生成,期待与更多开发者一起探讨更多可优化的地方(例如设计呈现的多样性),以下是洪力的分享。项目背景为了确立服装生成项目
应用程序中出现的文字统称为文本,根据作用的不同可以分为标题、控件标签、补充说明、错误信息和运营文本等。文字信息是最基础的交互元素,如早期的命令行界面,用户依靠阅读和写字符与计算机交互,大量的字符需要用户记忆,图形界面增加了直观的图形交互,降低了学习成本,但文字本身传递意义最为准确,复杂的信息还是以文字描述为主,所以在界面设计中依旧重要,易于理解的文本可以提供用户的操作效率。简洁简洁就是使用最少的文
vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。
原创 4月前
106阅读
【vLLM 学习】Cpu Offload Lmcache
这不是全息投影的魔术,而是思想在数字时空的重生某省级博物馆的玻璃幕墙前,一群中学生正与屏幕中的“古人”激烈辩论。长袍儒巾的老者时而捻须沉思,时而挥袖论道,唇齿开合间竟精准同步着方言韵白。当参观者突然改用俚语提问,数字人眼中掠过一丝了然的笑意——此刻,冰冷的史料记载正蜕变为有温度的思想交锋。在这场文化数字化的暗战中,2D实时交互数字人技术正撕开时空裂缝,让尘封的历史人物从单向输出的电子墓碑中彻底觉醒
文章题目《Learning Depth from Monocular Videos using Direct Methods》,来自18年CVPR,主要思想就是用单目视频作为深度值的监督信息训练网络实现单目深度估计。双目相机立体匹配的方法打开了无监督单目深度估计的大门,既然双目图像可以用作监督,很自然地想到单目视频也可以。于是,2017年的CVPR就有这样一项工作是用单目视频训练网络的。但单目视频
    首先是解决碰撞后沿着碰撞面移动,大体算法如下图     碰撞检测用的是collisionContext-->swetspherecheck(),即滑动球体查询,这样可以在角色移动前,判断这一步的移动会不会移动到建筑物内部,刚开始用的是球体查询,(用球体查询好像还牵涉一个本地坐标系到世界坐标系转
 有监督学习(Supervised learning)是一种有示教信号的学习方法,也就是已知一部分数据及其相应的标签(Label),然后建立模型并选取相应的损失函数(Loss function),通过最小化损失函数的方法得到最优模型参数,其中,最小化损失函数的过程就是训练过程。 图2 监督学习训练过程 有监督学习一般用于解决两类问题:回归问题(Regression)和分类问题(Class
目录前言0、导入需要的包1、gsutil_getsize2、safe_download、attempt_download2.1、safe_download2.2、attempt_download3、get_token、gdrive_download(没使用)3.1、get_token3.2、gdrive_download4、作者注释的函数总结 这个文件主要是负责从github/googleleap
在与 AI 对话时,你是否有过这样的困惑:明明前面刚聊过某个重要信息,可 AI 在后续对话中却 “忘得一干二净”,仿佛之前的交流从未发生?尤其是当对话篇幅较长时,这种情况愈发明显。这背后究竟藏着怎样的技术奥秘?今天就为你揭开 AI “健忘症” 的神秘面纱。一、有限的上下文窗口:AI 记忆的 “容量瓶颈”AI 的 “记忆” 依赖于上下文窗口—— 这是它在单次处理中能够理解和参考的文本长度上限。就像人
原创 4月前
152阅读
本文深入解析美颜SDK的开发流程,从API初始化接入、人脸识别与图像处理,到滤镜与动态贴纸的联动控制实现,带你全面掌握直播、短视频平台中“变美黑科技”的技术核心。不止于技术干货,还有实战建议与性能优化技巧,适合开发者、产品经理及美颜相关产品从业者一读即懂、一看即用。
文章目录0 简介1 系统概述系统设计原则3 实现效果4 Yolov5算法4.1 简介4.2 相关技术5 数据集处理及实验6 部分核心代码最后 0 简介今天学长向大家分享一个毕业设计项目毕业设计 基于深度学习的抽烟行为检测算法实现(源码分享)项目运行效果: 毕业设计 深度学习的抽烟行为检测算法实现 通过目前应用比较广泛的 Web 开发平台,将模型训练完成的算法模型部署,部署于 Web 平台。
作者:猿辅导研究团队 引言 普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫。而在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛以及实际的应用中,还包括目标定位和目标检测等任务。其中目标定位是不仅仅要识别出来是什么物体(即分类),而且还要预测物体的位置,位置一般用边框(boundi
本文围绕“从零开发直播美颜SDK”的实战过程,系统讲解了人脸美型、动态贴纸、滤镜系统的核心功能设计与技术架构。通过GPU加速、模块解耦、人脸关键点识别等关键技术手段,打造出一套高性能、可商用的美颜解决方案,并分享开发过程中踩过的坑与解决经验,适合开发者、创业者与平台运营者阅读。
打造基于AI Agent的经销商支持与服务平台。
原创 4月前
67阅读
签约快讯|天润融通签约台铃电动车
论文解读:《Developing a Multi-Layer Deep Learning Based Predictive Model to Identify DNA N4-Methylcytosine Modifications》1.文章概括2.前言3.数据4.方法4.1 序列特征4.2 深度学习模型框架4.2.1 残差神经网络([ResNet]())4.2.2 长短时记忆网络([LSTM](
前言:行人重识别(Person Re-identification)也称行人再识别,本文简称为ReID,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。广泛被认为是一个图像检索的子问题。给定一个监控行人图像,检索跨设备下的该行人图像。在监控视频中,由于相机分辨率和拍摄角度的缘故,通常无法得到质量非常高的人脸图片。当人脸识别失效的情况下,ReID就成为了一个非常重要的替代品技术。R
论文研读-基于种群分布的两阶段自适应知识迁移多目标进化多任务Multiobjective Evolutionary Multitasking With Two-Stage Adaptive Knowledge Transfer Based on Population Distribution此篇文章为 Z. Liang, W. Liang, Z. Wang, X. Ma, L. Liu and Z
目前生成式AI能够帮助普通人完成哪些日常工作?在科技飞速发展的今天,生成式 AI 正逐渐进入到我们日常生活的方方面面,为普通人完成日常工作带来了诸多便利。它就像一位全能助手,在多个领域发挥着重要作用。文案创作轻松搞定无论是撰写公众号文章、商业策划文案,还是日常的工作总结、报告,生成式 AI 都能提供有力支持。只需输入主题和关键信息,它能迅速生成结构合理、语句通顺的文本内容。比如,当你需要为一场促销
三维模型反射光照射实现1. demo效果2. 反射光介绍3. 实现要点3.1 反射光计算3.2 向着色器传值4. demo代码 1. demo效果2. 反射光介绍反射光分为漫反射和镜面反射,平行光属于慢反射。通常反射光指的是镜面反射光又称高光反射,指由光源直接经物体表面反射入眼睛的光线。镜面反射使物体看上去更有光泽 下图是反射光模型,光源发出的光照射到物体上并被反射,当反射光和视线正对时,在一定
Seed-Coder-8B-Instruct 仅需极少的人力投入,即可让 LLM 自行高效地管理代码训练数据,从而显著提升编码能力。通过自身生成和筛选高质量训练数据,可大幅提升模型代码生成能力。