前言
本书将向您介绍大型语言模型 (LLM) 的基本概念,以及与之相关的技术。
这本书首先介绍了 ChatGPT 等对话式 AI 的兴起,以及它们与更广泛的大型语言模型的关系。从那里,您将了解自然语言处理 (NLP)、其核心概念以及它如何导致 LLM 的兴起。接下来,您将深入了解转换器及其特征(例如自我注意)如何增强语言建模的能力,以及 LLM 的独特功能。本书最后探讨了各种 LLM 的架构、它们不断增长的功能所带来的机会,以及它们被滥用的危险。
学完这本书后,您将对 LLM 有透彻的了解,并准备好迈出将它们实施到您自己的项目中的第一步。
您将学到什么
- 掌握 LLM 的基本概念
-深入了解 NLP 的概念和方法多年来是如何演变的 - 了解 transformer 模型和注意力机制
- 探索不同类型的 LLM 及其应用
- 了解常用 LLM 的架构
- 深入研究对 LLM 的误解和担忧,以及如何最好地利用它们
这本书是给谁的
任何对学习 NLP、LLM 的基本概念和深度学习的最新进展感兴趣的人
目录
第1章:介绍
- AI的简要历史
- LLMs的地位
- 总结
第2章:NLP的演变
- NLP的历史
- NLP的任务
- NLP的基本概念
- 语言建模
- 总结
第3章:Transformer
- 注意力
- Transformer架构
- 总结
第4章:什么使LLMs变大?什么使Transformer模型成为LLM
- LLMs的类型
- 基础模型
- 应用LLMs
- 过拟合
- 灾难性遗忘
- 评估
- 总结
第5章:流行的LLMs
- 生成预训练Transformer
- 来自Transformer的双向编码器表示
- Pathways语言模型
- Meta AI的大型语言模型
- 总结
第6章:威胁、机会和误解
- LLMs与超级智能AI的威胁
- 误解和滥用
- 机会
- 总结