提示词使用案例
学习了解如何用好prompt
prompt提示词工作的原理及作用
dashscope调用大模型API
当我们写程序的时候,什么时候用 DeepSeek-V3-0324,什么时候用 DeepSeek-R1? V3-0324:日常编程、快速开发、前端代码生成、常规脚本任务。 R1:数学密集型计算、复杂算法、代码逻辑深度优化、需要推理过程的任务。=> 更擅长复杂算法实现,能优化逻辑并减少错误。
DeepSeek大语言模型的训练过程
deepseek的强化学习RL和长链接推理CoT
混合精度框架
MoE(Mix of Expert)混合专家机制
MLA多头潜在注意力机制
为什么DeepSeek计算速度快,成本低?
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号