whao143的博客_智能工厂,人工智能,各语言

测试ONNX和Torchscript加快推理速度

正如我们所看到的，没有直接的答案来优化推理时间，因为它主要取决于特定硬件和试图解决的问题。因此应该使用

人工智能

数据

批处理

数据集

原创精选 2024-08-07 16:17:17 512 阅读

51c视觉~合集11

视觉AI

原创精选 2024-08-04 17:08:59 244 阅读

51c~Pytorch~合集1

pytorch

原创精选 2024-08-03 23:22:47 301 阅读

深度学习trick2

当training loss低于阈值时，会反过来进行梯度上升，让training loss保持在一个阈值附近，让模型持续进行"random walk"，并期

人工智能

Group

GN

深度学习

原创精选 2024-07-30 14:59:52 245 阅读

Infini-Transformer

然而，Transformer 和基于 Transformer 的 LLM 由于注意力机制的固有特性，即 Transformer 中的注意力机制在内存占用和计算时间上都表

人工智能

建模

点积

基线

原创精选 2024-07-25 14:59:40 225 阅读

PiSSA

为了验证使用不同大小奇异值、奇异向量初始化适配器对模型的影响，研究人员分别使用高、中、低奇异值初始化 LLaMA 2

人工智能

初始化

奇异值分解

数据集

原创精选 2024-07-25 14:59:32 246 阅读

边缘检测算子合集

如图 3-8所示，左边表示的是一副灰度图像，从左到右从黑色(0)慢慢变为白色(255)，现在我们来看它的水平灰度剖面，灰度值从小到大平稳上升，其一阶导数表

人工智能

边缘检测

高斯滤波

像素点

原创精选 2024-07-24 10:59:43 280 阅读

CUDA (一)：CUDA C 编程及 GPU 基本知识

提到处理器结构，有2个指标是经常要考虑的：延迟和吞吐量。所谓延迟，是指从发出指令到最终返回结果中间经历的时间间隔。

c语言

机器学习

python

人工智能

CUDA

原创精选 2024-07-23 14:52:48 2966 阅读 1点赞 2评论

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

whao143_aiot的博客

测试ONNX和Torchscript加快推理速度

51c视觉~合集11

51c~Pytorch~合集1

深度学习trick2

Infini-Transformer

PiSSA

边缘检测算子合集

CUDA (一)：CUDA C 编程及 GPU 基本知识

欢迎