DeepSeek最新发布DeepSeek-V3.2-Exp模型引入DSA稀疏注意力机制,实现长文本训练和推理效率的大幅提升。本文将深度解析技术原理,并重点探讨中昊芯英「刹那@」TPU取得的显著收益与适配成果。
12月30日,甲子光年智库正式发布《中国AI算力行业发展报告》。中昊芯英受邀参与了该报告的编写工作,并为报告的编写贡献了专业的见解和实践经验。
苹果宣布采用谷歌TPU而非英伟达GPU训练其AI模型,彰显科技巨头在AI算力硬件上的多元化探索。TPU专为AI设计,高效处理张量运算,相比GPU更适合AI训练场景。此举引发英伟达股价大跌,科技界加速AI算力硬件创新,TPU及类TPU芯片受追捧,预示着AI算力基础设施迎来新方向。
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号