GPT:x中之事,事无大小,悉以咨之


概念

加载器(Loader)

从某种介质中获取数据,即加载。

文档(Document)

数据转换成文档进行处理。类比数据库转换成记录……

文本分割(Text Spltter)

LLM一次处理的数据有限,分割成多批进行处理。

向量数据库(Vector stores)

文档转换成向量,把文档存入到向量数据库,自动转换成向量。

链(Chain)

任务

代理(Agent)

门面,可以根据情况进行一系统任务chain处理。

嵌入 Embedding

用于衡量文本的相关性。这个也是 OpenAI API 能实现构建自己知识库的关键所在。 他相比 fine-tuning 最大的优势就是,不用进行训练,并且可以实时添加新的内容,而不用加一次新的内容就训练一次,并且各方面成本要比 fine-tuning 低很多。 具体比较和选择可以参考这个视频:https://www.youtube.com/watch?v=9qq6HTr7Ocw

微调 fine-tuning

Fine-tuning(微调)是深度学习中的一种技术,它通常用于事先训练好的神经网络模型进行调整适应新的任务

参考:

https://liaokong.gitbook.io/llm-kai-fa-jiao-cheng/