51CTO首页
AI.x社区
博客
学堂
精品班
软考社区
免费课
企业培训
鸿蒙开发者社区
信创认证
公众号矩阵
移动端
视频课 免费课 排行榜 短视频 直播课 软考学堂
全部课程 软考 信创认证 华为认证 厂商认证 IT技术 PMP项目管理 免费题库
在线学习
文章 资源 问答 课堂 专栏 直播
51CTO
鸿蒙开发者社区
51CTO技术栈
51CTO官微
51CTO学堂
51CTO博客
CTO训练营
鸿蒙开发者社区订阅号
51CTO软考
51CTO学堂APP
51CTO学堂企业版APP
鸿蒙开发者社区视频号
51CTO软考题库
51CTO博客

51CTO博客

  • 首页
  • 关注
  • 排行榜
  • 精品课程升职加薪
  • 免费资料领资料
  • 软考题库软考题库
    软考题库
    科目全、试题精、讲解专业,扫码免费刷
  • 搜索历史 清空
    热门搜索
    查看【 】的结果
  • 写文章
  • 创作中心
  • 登录注册

wx68ff7d5f0a693的博客

  • 动态
  • 博客
  • 分类
  • 订阅/关注
  • 意见
    反馈
  • 训练营训练营
wx68ff7d5f0a693

wx68ff7d5f0a693

这个家伙比较懒,还没有个人介绍
  • 62 人气
  • 2 原创
  • 1 粉丝
  • 31 阅读数
关注
于 2025-10-27 加入 51CTO6天

热门文章

  • LLM 分布式训练技术
  • 大模型显存计算完全指南:从零开始掌握内存优化技术

近期文章

  • LLM 分布式训练技术
  • 大模型显存计算完全指南:从零开始掌握内存优化技术
2025年
10月 2篇
精品课程领资料
免费资料>
2025软考
系统架构设计师 系统规划与管理师 软件设计师 系统集成项目管理工程师
信创认证
系统架构师 信创集成项目管理师 信创规划管理师 系统开发工程师
厂商认证
CKA/CKS架构师 红帽认证工程师 Oracle-OCP认证 Oracle-OCM认证
IT技术
数据库高级工程师 AIGC大模型实战 Linux云计算架构师 Python全栈开发
华为认证
数通HCIP认证 云计算HCIE认证 华为存储HCIE认证 HCIP安全认证

七日热门

全部文章
pwn学习4堆栈(笔记)
倒序
递归
寄存器
百度地图多维检索:自然语言理解的深度搜索实践
#百度地图开放平台
#java集成百度地图
#在线地图调用实践
#Java调用WebAPI实践
搜索
HarmonyOS:页面级弹出框
HarmonyOS Next
HarmonyOS
鸿蒙
C++内存管理的机制
ci
构造函数
数组
Rds 每日备份的库恢复的解决方案
sql
数据库
mysql

Ta的分类

加载更多

近期来访

  • 赵jiani
  • 按发布时间
  • 按阅读量
  • 时间轴
    全部2篇
    2025年2篇 10月2篇
  • 推荐/精选
  • 全部
    全部 原创 转载 翻译
LLM 分布式训练技术

LLM 分布式训练技术

转载原文地址LLM 单机训练的瓶颈LLM越来越大,单机显存不足训练速度不足分布式并行训练方向LLM可以从三个角度来进行分布式拆分:数据并行(应用最广)模型并行/流水线并行/层间并行(不同叫法)张量并行/层内并行(不同叫法)甚至可以三种并行方式同时应用,最大化利用显存和加速训练。数据并行将原始数据分割成不同的不想交子集,不同计算设备分别处理子训练集。由于每个计算设备都独立存储着完整的模型副本,因此各

数据
反向传播
分块
原创 6天前 10 阅读

大模型显存计算完全指南:从零开始掌握内存优化技术

还在为大模型显存不足而烦恼吗?7B模型需要多少显存?LoRA如何节省显存?这篇万字长文将彻底搞懂大模型显存计算,让你在有限硬件上训练大模型! 大模型显存计算器? 开篇:为什么显存计算是大模型时代的核心技能?在AI飞速发展的今天,你是否遇到过这些困境:? 硬件成本高企 - A100/H100显卡价格昂贵,中小企业难以承受? 显存不足限制 - 24GB显卡跑不动7B模型,40GB显卡训练13

数据类型
检查点
有效数字
原创 6天前 21 阅读

欢迎

51CTO博客

Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号

关于我们
官方博客 全部文章 热门标签 班级博客
了解我们 网站地图 意见反馈
友情链接
鸿蒙开发者社区 51CTO学堂
51CTO 软考资讯