qq6669490e54384的博客_人工智能(5)_51CTO博客

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册

# 人工智能

Transformer41~

Transformer41~

清华朱军团队提出的INT4算法，解决了超低INT精度训练的挑战。LLM训练效率要起飞了！将激活、权重和梯度量化为4位，有望加速神经网络训练。然而，现有的4位训练方法需要自定义数字格式，而现代硬件不支持这种格式。最近，清华朱军团队提出了一种使用INT4算法实现所有矩阵乘法的Transformer训练方法。使用超低INT4精度进行训练，是非常具有挑战性的。为了实现这一目标，研究者仔细分析了Transf

人工智能

后向传播

矩阵乘法

权重

原创 1月前 29 阅读

PyTorch-ONNX~精度对齐工具

PyTorch-ONNX~精度对齐工具

人工智能

2d

字符串

调试模型

原创 1月前 49 阅读

InstructBLIP

InstructBLIP

InstructBLIP 一共微调 60K steps，3B, 7B, 11/13B 模型的 Batch Size 分别是 192，128，64，优化器使用 AdamW，weight decay 设为

人工智能

数据集

Image

语言模型

原创 1月前 36 阅读

DEYOv2

DEYOv2

YOLOv5x的使用只是为了方便验证DEYOv2三个阶段的有效性。作者认为，像DEYOv2这样好的三阶段范式检测器需要在每个阶段

人工智能

目标检测

一对一

聚类

原创 1月前 26 阅读

SAM5~

SAM5~

现有的分割方法通常在封闭世界的数据集上进行基准测试，这些数据集具有一组预定义的类别，即假设训练和测试样本具有预先

人工智能

数据集

sed

模态

原创 1月前 26 阅读

分布式~深度学习框架

分布式~深度学习框架

分布式深度学习框架目的只有一个：解决超大模型的训练问题，主要针对两种场景：一个具有超大规模的 dense（密集）参数的模

人工智能

Server

服务器

数据

原创 1月前 51 阅读

CAME~

CAME~

Adafactor中的非负矩阵分解操作在深度神经网络的训练中不可避免地会产生错误，对这些错误的修正就是性能损失的来源

人工智能

语言模型

Ada

高性能计算

原创 1月前 12 阅读

ODISE

ODISE

本文的出发点很有意思，目前常见的开放式语义分割都使用多模态大模型处理未见类，而CLIP，ALIGH这类模型，训练时

人工智能

判别模型

去噪

生成器

原创 1月前 17 阅读

注意力机制~掩码详解

注意力机制~掩码详解

在代码中是通过将所有序列填充到相同的长度，然后使用“attention_mask”张量来识别哪些令牌是填充的来做到这一点，本文将详细介绍

人工智能

权重

Soft

ide

原创 1月前 35 阅读

目标检测12

目标检测12

在FCOS中，两个任务之间的竞争可以在顶部图中清晰地看到，即最高IoU的边界框（绿色）的分类信心较低，而最高分类得分的

人工智能

特征编码

目标检测

不一致性

原创 1月前 19 阅读

仪表盘读数识别~1

仪表盘读数识别~1

最终，方案的成绩如下。1、目标检测算法和ocr识别算法均源自开源算法库中SOTA模型，实现简单高效，且具备丰富的工业

人工智能

数据集

透视变换

v8

原创 1月前 0 阅读

傅立叶变换~1

傅立叶变换~1

在数学中，变换技术用于将函数映射到与其原始函数空间不同的函数空间。傅里叶变换时也是一种变换技术，它可以将函数从时域

人工智能

傅里叶变换

时域

频域

原创 1月前 15 阅读

缺陷检测~深度学习2

缺陷检测~深度学习2

上述训练的网络，输入是64x64x3的，但是整幅场景图像却是512x512的，这个输入和模型的输入对不上号，这怎么办呢？其实，

人工智能

2d

数据

ide

原创 1月前 22 阅读

One-2-3-45

One-2-3-45

下图展示了 One-2-3-45 与现有的主要图生 3D 的方法的对比。然而就在最近，来自 UCSD 等机构的研究者发布了一项最新工作，One-2

人工智能

3D

数据

泛化

原创 1月前 6 阅读

交叉熵损失函数

交叉熵损失函数

举个例子，假设在观察一段已发生的东京天气后，得到了天气发生的真实分布P ，我们可以使用概率分布 P 来计算真实的平均编码大小

人工智能

概率分布

神经网络

损失函数

原创 1月前 15 阅读

SAM6~

SAM6~

本文提出了一个将大型模型先验集成到低级计算机视觉任务中的框架，该框架利用了灰度编码和通道扩展技术，将大模型先验知

人工智能

去雾

数据集

灰度

原创 1月前 12 阅读

微调预训练模型

微调预训练模型

Monster API通过提供直观的界面和预定义的任务，以及创建自定义任务的灵活性，简化了这一过程。虽然像GPT-J、LLaMA、Falcon、Sta

人工智能

API

数据集

语言模型

原创 1月前 41 阅读

sampt

sampt

利用稳健和稀疏的点选择和传播技术来生成遮罩，将SAM的零样本能力扩展到动态视频的跟踪和分割任务上，在多个视频物体分割数据集基准DAV

人工智能

初始化

数据集

数据

原创 1月前 0 阅读

双目视觉中的极线校正

双目视觉中的极线校正

我们双目相机拍摄的时候实际情况下如下图a,两个图像做匹配时如我们图中蓝色箭头指示的匹配点那样，需要在全图中进行

人工智能

深度图

#if

#endif

原创 1月前 30 阅读

OpenVINO~YOLO8~2

OpenVINO~YOLO8~2

用OpenVINO C++ API编写YOLOv8-Seg实例分割模型推理本文章将介绍使用OpenVINO™ 2023.0 C++ API开发YOLOv8-Seg实例分

人工智能

v8

数据

API

原创 1月前 31 阅读

睡岗识别~

睡岗识别~

1、数据分析对于训练模型至关重要。2、针对算法精度和性能两者取舍来说，可先实验网络大小和输入图片大小对模型

人工智能

v8

随机数

#include

原创 1月前 14 阅读

RetNet

RetNet

本文提出了 retentive 网络RetNet，同时实现了低成本推理、高效长序列建模、媲美 Transformer 的性能和并行模型训练，打破了「不可能三角」。Transformer取代者登场？微软、清华刚推出的成本低、速度快、性能强LLM 的成功，某种程度上要归功于 Transformer 架构在自然语言处理任务上的突破。该架构最初是为了克服循环模型的 sequential tra

人工智能

建模

分块

缓存

原创 1月前 31 阅读

FlashAttention

FlashAttention

FlashAttention新升级！斯坦福博士一人重写算法，第二代实现了最高9倍速提升。Transformer上下文长度史诗级提升继超快且省内存的注意p://143ai.com

人工智能

分块

基准测试

共享内存

原创 1月前 42 阅读

HumanMAC

HumanMAC

多样性的指标逊色于baseline方法的原因，主要来自于baseline方法生成的“多样”结果存在大量的failure cases，详情可以见论文和demo中的可视化结果比较。人体动作预测是计算机视觉和图形学中的一个经典问题，旨在提升预测结果的多样性、准确性，并在自动驾驶、动画制作等多领域有非常多具体的应用。为克服上述问题，我们提出了一种建模动作预

人工智能

补全

建模

github

原创 1月前 31 阅读

LoRA微调

LoRA微调

本征维度的概念在由【论文1】提出。训练一个神经网络往往包含如下几步：对于一个给定的数据集，先设计网络的结构和选择对

人工智能

数据集

泛化

初始化

原创 1月前 11 阅读

烟火算法~

烟火算法~

部署的时候，有gunicorn和uvicorn两个web服务器，但是因为fastapi采用的是最新的ASGI标准，gunicorn采用的WSGI标准，所以不

人工智能

json

ide

JSON

原创 1月前 41 阅读

多模态预训练大模型~

多模态预训练大模型~

一般来说的深度神经网络在大规模数据集上进行训练，例如广泛使用的残差网络，是在ImageNet数据集上使用分类任务进行预

人工智能

模态

数据

数据集

原创 1月前 32 阅读

HyperDreamBooth

HyperDreamBooth

在只使用一张参考图像的情况下，HyperDreamBooth 在大约 20 秒内实现了对人脸的个性化处理，比 DreamBooth 快 25

人工智能

权重

迭代

可编辑

原创 1月前 17 阅读

xTrimoPGLM

xTrimoPGLM

在第一阶段，主要目标是逐步提高 GLM 损失的比例，达到预期的数量。团队也对比了当前比较热门的预训练模型的 FLOPs，目

人工智能

数据集

语言模型

数据

原创 1月前 39 阅读

DiffPack

DiffPack

蛋白质由氨基酸经脱水缩合反应形成，可折叠为复杂的 3D 空间结构，是生物体内执行各种功能（催化生物化学反应、传递信号）的主

人工智能

概率分布

去噪

深度学习

原创 1月前 10 阅读

首页
1
2
3
4
5
6
7
8
共2340条记录