hgditren的博客_PHP,数据存储,服务架构

prompt使用案例

提示词使用案例

API

python

prompt

提示词

原创 5月前 75 阅读 #DeepSeek技术实践#

如何写好prompt提示词？

学习了解如何用好prompt

推理模型

优先级

prompt

提示词工程

原创 5月前 105 阅读 #DeepSeek技术实践#

Prompt提示词原理

prompt提示词工作的原理及作用

词向量

工作原理

提示词工程

原创 5月前 88 阅读 #DeepSeek技术实践#

dashscope调用大模型API

python

json

API

原创精选 5月前 841 阅读 #DeepSeek技术实践#

DeepSeek的大模型怎么选，V3还是R1？

当我们写程序的时候，什么时候用 DeepSeek-V3-0324，什么时候用 DeepSeek-R1? V3-0324:日常编程、快速开发、前端代码生成、常规脚本任务。 R1:数学密集型计算、复杂算法、代码逻辑深度优化、需要推理过程的任务。=> 更擅长复杂算法实现，能优化逻辑并减少错误。

推理过程

代码生成

算法实现

原创 5月前 340 阅读 #DeepSeek技术实践#

DeepSeek大模型的训练原理

DeepSeek大语言模型的训练过程

强化学习

数据

性能比

原创 5月前 120 阅读 #DeepSeek技术实践#

为什么DeepSeek-R1的推理能力强大?

deepseek的强化学习RL和长链接推理CoT

强化学习

连续控制

状态空间

原创 5月前 241 阅读 #DeepSeek技术实践#

DeepSeek的创新3:混合精度框架

混合精度框架

存储数据

框架使用

数据格式

原创 5月前 195 阅读 #DeepSeek技术实践#

DeepSeek的创新2:MoE（Mix of Expert）混合专家机制

MoE（Mix of Expert）混合专家机制

f5

链路

MoE

原创 5月前 142 阅读 #DeepSeek技术实践#

DeepSeek的创新1:MLA (Multi-Head Latent Attention)多头潜在注意力机制

MLA多头潜在注意力机制

缓存

键值

缓存机制

原创 5月前 320 阅读 #DeepSeek技术实践#

为什么DeepSeek计算速度快，成本低?

架构设计

高精度

矩阵乘法

原创 5月前 187 阅读 #DeepSeek技术实践#

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

抬头看世界，低头写代码