Megengine量化 量化指的是将浮点数模型(一般是32位浮点数)的权重或激活值用位数更少的数值类型(比如8位整数、16位浮点数)来近似表示的过程。 量化后的模型会占用更小的存储空间,还能够利用许多硬件平台上的专属算子进行提速。比如在 MegEngine 中使用8位整数来进行量化,相比默认的32位
转载
2021-02-10 11:01:00
279阅读
2评论
作者:王彪 | 旷视框架部异构计算组工程师 一、背景 什么是天元 旷视天元(MegEngine)是一个深度学习框架,它主要包含训练和推理两方面内容。训练侧一般使用 Python 搭建网络;而推理侧考虑到产品性能的因素,一般使用 C++ 语言集成天元框架。无论在训练侧还是推理侧,天元都担负着将训练和推 ...
转载
2021-08-06 13:59:00
132阅读
作者:王彪 | 旷视框架部异构计算组工程师 一、背景 什么是天元 旷视天元(MegEngine)是一个深度学习框架,它主要包含训练和推理两方面内容。训练侧一般使用 Python 搭建网络;而推理侧考虑到产品性能的因素,一般使用 C++ 语言集成天元框架。无论在训练侧还是推理侧,天元都担负着将训练和推 ...
转载
2021-08-06 13:59:00
300阅读
这几天突发想到在ETL中Merge性能的问题。思路的出发点是Merge到目标表需要扫描的数据太多,而现实情况下,假设应该是只有一小部分会被更新,而且这部分数据也应该是比较新的数据,比方说对于想FactOrders这样一张表,一些越日期越久远的订单可能不可能被更新。那么整个思路就是减小每次需要从磁盘加载目标表到内存中跟stage表进行merge操作的数据量。只是我存在着两个疑问,这也是我问题要进行下
转载
2024-07-14 09:46:21
66阅读
# 在 MegEngine 与 PyTorch 中混用的指南
在深度学习开发过程中,能够灵活运用多种框架是非常重要的。其中,MegEngine 和 PyTorch 各有其优势,学会如何在这两个框架中混用将提高你解决问题的能力。本文将为你提供一个步骤指南,以帮助你实现 MegEngine 与 PyTorch 的混用。
## 整体流程
下面是整件事情的大致流程,可以通过下表来帮助你理解每一步的目
旷视MegEngine网络搭建 在 基本概念 中,介绍了计算图、张量和算子,神经网络可以看成一个计算图。在 MegEngine 中,按照计算图的拓扑结构,将张量和算子连接起来,即可完成对网络的搭建。MegEngine 提供了基于 functional 和基于 Module 的两种方式搭建网络。 fu
转载
2021-02-08 06:55:00
170阅读
2评论
MegEngine亚线性显存优化 MegEngine经过工程扩展和优化,发展出一套行之有效的加强版亚线性显存优化技术,既可在计算存储资源受限的条件下,轻松训练更深的模型,又可使用更大batch size,进一步提升模型性能,稳定batchwise算子。使用MegEngine训练ResNet18/Re
转载
2021-02-17 06:54:00
210阅读
2评论
常见神经网络模型所用的 Tensor 数据类型 一般是 float32 类型, 而工业界出于对特定场景的需求(极少的计算资源,极致的推理速度),需要把模型的权重和或激活值转换为位数更少的数值类型(比 int8, float16) —— 整个过程被称为量化(Quantization)。
原创
2023-04-25 17:44:06
350阅读
MegEngine 1.13.1 中也已经支持了 XLA,在训练模型时可以选择开启此项功能,不同的模型可以获得 10%~80% 不等的速度提升。
原创
2023-12-13 10:58:52
102阅读
MegEngine 中采用了多种降低内存的解决方案,本次主要介绍的是 MegEngine 静态内存管理模块是如何利用顺序程序图中的数据流分析,实现内存重用以达到降低内存占用的效果。 ...
转载
2021-10-22 15:03:00
77阅读
2评论
旷视MegEngine基本概念 MegEngine 是基于计算图的深度神经网络学习框架。 本文简要介绍计算图及其相关基本概念,以及它们在 MegEngine 中的实现。 计算图(Computational Graph) 下面通过一个简单的数学表达式 y=(w∗x)+by=(w∗x)+b 来介绍计算图
转载
2021-02-08 06:50:00
311阅读
2评论
本文将介绍 Python 层的 functional、module 和 optimizer 模块。理解并掌握这几个模块对于高效搭建神经网络非常重要。
原创
2023-07-28 11:13:14
67阅读
本文介绍 Python 层的 data 模块。读者将通过本文了解到要构建数据 pipeline 所需要的对象,以及如何高效地构建 pipeline。
原创
2023-07-21 17:47:43
88阅读
本文将介绍 Python 层的 quantization 模块。量化是为了减少模型的存储空间和计算量,从而加速模型的推理过程。在量化中,我们将权重和激活值从浮点数转换为整数,从而减少模型的大小和运算的复杂性。通过本文读者将会对量化的基本原理和使用 MegEngine 得到量化模型有所了解。
原创
2023-07-31 16:18:43
85阅读
本文将会深入介绍 MegEngine CUDA 平台的底层卷积算子的实现原理,并将会对 Nvidia CUTLASS 的 Implicit GEMM 卷积 文档 进行解读和补充。 ...
转载
2021-07-30 14:26:00
1315阅读
2评论
本文通过讲述在支持 MegEngine Windows Python wheel 过程中遇到的问题以及解决问题的流程,此文最后的解决方法可能不是最优,欢迎留言指正。
原创
精选
2022-12-19 16:49:11
364阅读
MegEngine计算图、MatMul优化解析 本文针对天元在推理优化过程中所涉及的计算图优化与 MatMul 优化进行深度解读,希望能够帮助广大开发者在利用天元 MegEngine「深度学习,简单开发」的同时,也能够了解 CPU 优化的相关知识。从而帮助大家在模型部署的整体流程中更好地进行加速;在
转载
2021-02-17 07:49:00
0阅读
旷视开源的深度学习框架 MegEngine,MegEngine 是一个快速、可拓展、易于使用且支持自动求导的深度学习框架。以最新的 release 版本 release-1.13.0 为例介绍一下 MegEngine 的代码结构以及如何学习 MegEngine 的代码。
原创
2023-08-17 16:07:46
136阅读
因为 MegEngine 是动静合一的深度学习框架,MegBrain 解决了静态图的训练和推理问题,还需要有一个“组件”负责处理动态图的训练和推理、以及 Python 侧的训练接口,于是便有了 Imperative,也就是说,Imperative Runtime 是为了动态训练而单独设计的一套新接口
作者:MegEngineBot
链接:https://xueqiu.com/6174278257/252655719
来源:雪球
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
风险提示:本文所提到的观点仅代表个人的意见,所涉及标的不作推荐,据此买卖,风险自负。
原创
2023-06-08 15:36:29
138阅读
旷视MegEngine数据加载与处理 在网络训练与测试中,数据的加载和预处理往往会耗费大量的精力。 MegEngine 提供了一系列接口来规范化这些处理工作。 利用 Dataset 封装一个数据集 数据集是一组数据的集合,例如 MNIST、Cifar10等图像数据集。 Dataset 是 MegEn
转载
2021-02-08 07:06:00
161阅读
2评论