基于大模型的人工智能应用开发

原创

张善友 2024-06-09 11:41:36 博主文章分类：企业解决方案 ©著作权

©著作权归作者所有：来自51CTO博客作者张善友的原创作品，请联系作者获取转载授权，否则将追究法律责任

我们所向往的是一个不仅把人工智能生成内容视为工作的一部分，还将人工智能作为连接更加复杂任务的关键纽带的时代。

我们看到大模型应用开发过程中的两条轴线---垂直轴代表传入大模型的信息的复杂度，水平轴代表对大模型能力的要求。这两条轴线表明了模型优化需要考虑的两个方向---大模型需要知道的上下文信息和采取的行动。大模型知道的上下文越多，它基于特定应用场景做出的判断的能力越强；而对大模型的行动能力要求越高，就需要对大模型进行微调，或者通过Agent赋予大模型更多的智能。

Agent是人工智能应用开发中最为亮眼的部分，属于成熟度极低、潜在价值极高的领域，同时也位于上下文要求高、对模型行动力要求也搞得象限。Agent 需要大模型具有最强的推理能力，所以，至今为止也只有OpenAI公司的GPT-3.5/4 系列模型和Anthropic公司的Claude 3模型能够符合“Agent 大脑” 的要求。这些Agent能够进行自然语言对话、回答问题、生成文本内容、甚至编写和理解代码，最终成为自动化工具的核心组件。