检索增强生成RAG

关注人工zz研究员

文章目录

什么是RAG
为什么不直接查询知识库
为什么不把知识库直接加入训练
如果知识库力查到的内容过多，上下文装不下怎么办

检索增强生成RAG

原创

人工zz研究员 2024-02-02 18:10:08 博主文章分类：图像处理 ©著作权

文章标签 语言模型数据海量数据 文章分类 NLP 人工智能

©著作权归作者所有：来自51CTO博客作者人工zz研究员的原创作品，请联系作者获取转载授权，否则将追究法律责任

什么是RAG

检索增强生成（RAG）是指对大型语言模型输出进行优化，使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型（LLM）用海量数据进行训练，使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上，RAG 将其扩展为能访问特定领域或组织的内部知识库，所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法，让它在各种情境下都能保持相关性、准确性和实用性。

为什么不直接查询知识库

如果我们直接查询知识库的话，得到的结果是一段一段和查询相关的数据片段，需要人一个一个去筛选,而把查询结果直接给大模型，让大模型去消化吸收组织语言回答。大模型训练的是一种回答问题的能力。

为什么不把知识库直接加入训练

大模型参数量大，训练成本高，要得到一个稳定的大模型，需要消耗大量的资源。包括标注以及硬件成本，时间成本。做不到边训练边服务。每次有新的知识然后都要加进去训练的话，成本就更高了。并且并不能解决大模型幻觉问题。

如果知识库力查到的内容过多，上下文装不下怎么办

外部知识是分片处理，并且是用向量数据库。存储的是文本的语义特征。

赞
收藏
评论
分享
举报

上一篇：flask接受图像，并保存到本地

下一篇：使用python写一个程序批量判断ssh连接是否可用

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册