DeepSeek 开源大模型：开源了什么？没开源什么？

关注 JavaPub

文章目录

文章目录
DeepSeek 开源大模型：开源了什么？没开源什么？
总结

DeepSeek 开源大模型：开源了什么？没开源什么？

原创

JavaPub 2025-07-31 11:54:19 ©著作权

文章标签 deepseek ai 数据开发者 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者JavaPub的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

DeepSeek 开源大模型：开源了什么？没开源什么？
总结

DeepSeek开源了什么?没开源什么?

DeepSeek 开源大模型：开源了什么？没开源什么？

DeepSeek 的爆火，除了自身的技术创新和架构创新等硬实力外，选择开源也是推动热度的一个关键因素。

首先，它开源了什么？

模型架构和参数：DeepSeek 开放了模型架构和参数，开发者可以直接使用这个高性能模型，无需从头训练。尤其是其混合专家（MoE）架构，作为一种创新技术，为开发者提供了新的思路，并且允许自由修改和商业化使用。
技术报告和配套工具：DeepSeek 还开源了技术报告和配套工具，相当于不仅提供了“秘籍”，还详细讲解了如何验证自己的成果。

那它没开源什么？

训练数据：训练数据是决定大模型质量的关键因素，但由于数据涉及版权等问题，DeepSeek 并未开源训练数据。这也是行业内的普遍做法。
训练代码和推理代码：虽然 DeepSeek 在技术报告中披露了部分训练方法，但训练代码和推理代码并未开源。因此，想要完全复现模型仍然存在较大难度。

总结

总的来说，DeepSeek 在模型架构、参数和配套工具方面的开源做得相当不错，但在训练数据和完整训练框架方面有所保留。尽管如此，作为使用者，DeepSeek 的开源无疑为我们带来了极大的便利。未来，AI 可能会像水和电一样，无缝融入我们生活的各个场景中。

赞
收藏
评论
分享
举报

上一篇：六种负载均衡算法

下一篇：GoLang 协程泄漏的原因可能是什么？

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册