LangChain学习笔记1：基本概念

原创

手搓AI 2023-05-27 10:05:19 博主文章分类：NLP ©著作权

文章标签 数据库获取数据深度学习 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者手搓AI的原创作品，请联系作者获取转载授权，否则将追究法律责任

GPT：x中之事，事无大小，悉以咨之

概念

加载器（Loader）

从某种介质中获取数据，即加载。

文档（Document）

数据转换成文档进行处理。类比数据库转换成记录……

文本分割（Text Spltter）

LLM一次处理的数据有限，分割成多批进行处理。

向量数据库（Vector stores）

文档转换成向量，把文档存入到向量数据库，自动转换成向量。

链（Chain）

任务

代理（Agent）

门面，可以根据情况进行一系统任务chain处理。

嵌入 Embedding

用于衡量文本的相关性。这个也是 OpenAI API 能实现构建自己知识库的关键所在。他相比 fine-tuning 最大的优势就是，不用进行训练，并且可以实时添加新的内容，而不用加一次新的内容就训练一次，并且各方面成本要比 fine-tuning 低很多。具体比较和选择可以参考这个视频：https://www.youtube.com/watch?v=9qq6HTr7Ocw