RAG_51CTO博客

RAG

RAGRAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了信息检索和生成模型的技术，它通过引入外部知识库来解决知识密集型的自然语言处理任务，例如问答和文本摘要等。RAG技术的核心在于两个阶段：检索阶段和生成阶段。 1. 检索阶段：模型从外部知识库中检索与输入文本相关的信息。这个知识库可以是大规模文本数据集的索引数据库。 2.&nbsp

生成模型

模态

自然语言处理

AI

原创

潇凝子潇

25天前

73阅读

一. 为什么要用 RAG ？如果使用 pretrain 好的 LLM 模型，应用在你个人的情境中，势必会有些词不达意的地方，例如问 LLM 你个人的信息，那么它会无法回答;这种情况在企业内部也是一样，例如使用 LLM 来回答企业内部的规章条款等。这种时候主要有三种方式来让 LLM 变得更符合你的需求： 1. Promt Enginerring：输入提示来指导 LLM 产生所需回应。例如常见的 In-context Learning，通过在提示中提供上下文或范例，来形塑模型的回答方式。例如，提供特定回答风格的示例或包含相关的情境信息，可以引导模型产生更合适的答案。 2. **Fine tuning：** 这个过程包括在特定数据集上训练 LLM，使其响应更符合特定需求。例如，一家公司可能会使用其内部文件 Fine tuning ChatGPT ，使其能够更准确地回答关于企业内部规章条款等。然而，Fine tuning需要代表性的数据集且量也有一定要求，且 Fine tuning 并不适合于在模型中增加全新的知识，或应对那些需要快速迭代新场景的情况。

语言模型

生成器

数据

原创

demo007x

4月前

503阅读

RAG~2

随着 LLMs 的潜力被进一步开发，旨在提升模型的可控性并满足不断演变的需求，RAG 的研究逐渐聚焦于增强推理能力，并且也探索了在微的评估内容，包括评估的对象、维度和指标，为深入理解 RAG 模型的性能和潜在应用提供了宝贵信息。正好也对应的 RAG 中的三个首字母。

人工智能

数据

语言模型

模态

原创

qq6669490e54384

1月前

71阅读

RAG Tip

手把手教你构建Agentic RAG：一种基于多文档RAG应用的AI Agent智能体 (.)一文说清大模型RAG应用中的两种高级检索模式：你还只知道向量检索吗？ (.)1、经典RAG应付不了的场景：基于全局的理解文档后回答问题。比如：对某知识内容进行总结摘要？跨文档与知识库的回答问题。比如：比较不同文档内容的区别？结合非知识工具的复合场景。比如：从文档提取产品介绍发送给xx客

多文档

多路

知识块

原创

山西空管技术支持

2月前

132阅读

RAG 考虑事项

优先考虑在数据加载期间维护句法结构，因为这对于有意义的文本分段至关重要。使用简单的分隔符（如 \n\n）格式化文档，以促进高效的文本分割。考虑到多语言环境中基于 ML 的语义分割器的计算强度和较差的性能，选择基于规则的文本分割器。在选择嵌入模型时，要考虑其多语言能力和不对称检索性能。

学习

原创

勤奋的米咩

8月前

111阅读

RAG 的 embedding

目录序列召回（一）序列召回（二）序列召回（三）序列召回（四）序列召回（一）源自论文：http://arxiv.org/abs/1511.06939 基于GRU的序列召回中通过GRU得到用户的embedding，与所有item的embedding做内积。两个向量内积就是用户-item的相似度。一个用户和所有item的内积，相当于获得了所有it

RAG 的 embedding

人工智能

深度学习

相似度

推荐系统

转载

mob64ca13f4c367

12天前

8阅读

Advanced RAG 08：使用 Self-RAG 打造高质量、可追溯的 RAG System

编者按：RAG 技术通过检索并利用外部知识源，能够较为有效地提升生成内容的准确性和多样性。然而，经典 RAG 流程也存在一些不足，例如不必要的检索会浪费计算资源，并可能引入无关内容或错误信息，影响生成质量。本文介绍了 Self-RAG 这一技术，通过引入 Reflection Tokens，语言模型能够根据具体需求动态决定是否检索外部知识

AI

RAG

原创

Baihai_IDP

2月前

59阅读

为什么说知识图谱 + RAG > 传统 RAG？

近期，微软开源GraphRAG的新闻成为热门话题。GraphRAG (Graph-Augmented Retrieval-Augmented Generation) 是一种基于图的检索增强生成技术，结合了知识图谱和传统的检索增强生成（RAG）方法，旨在提升大语言模型处理私有数据集问答的能力。本文从知识图谱的原理等角度，结合一个 GraphRAG 的生动类比，说明了为什么知识图谱+RAG 的方案优于

Graph

Augmented

应用场景

原创

金融机器智能官方

1月前

78阅读

Advanced RAG 03：运用 RAGAs 与 LlamaIndex 评估 RAG 应用

编者按：目前，检索增强生成（Retrieval Augmented Generation，RAG）技术已经广泛使用于各种大模型应用场景。然而，如何准确评估 RAG 系统的性能和效果，一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估，也难以针对性地优化和改进它。因此，开发一套科学、可靠的 RAG 系统评估指标体系，对于推动RAG技术的进一步发展具有重

LLM

RAG

AI

人工智能

原创精选

Baihai_IDP

4月前

298阅读

什么是RAG系统？

下面是一个简单的基于RAG的聊天机器人的例子，用于查询您的私人知识库。第一步是以适合查询的格式存储内部文档的知识

架构师

ci

首席架构师

转载

架构师酒馆

3月前

46阅读

又来一个RAG：RankRAG，英伟达RAG新思路

发布时间：2024 年 07 月 02 日RAG我们提出了一种名为 RankRAG 的创新指令微调框架，该框架使单个 LLM 能够同时进行上下文排序

microsoft

智能手机

数据集

数据

调优

原创

mb594bbce661473

1月前

41阅读

RAG基础与架构 | 六十八、为什么需要RAG？

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大、实战学习、面试题等，资料免费分享！

架构

人工智能

深度学习

大模型

ai

原创

沈页dd

7天前

0阅读

Graph RAG = 知识图谱 + RAG，优化全局搜索+局部搜索

基于社区的多层次摘要策略。类似于医学综述文章，从概括性的疾病描述到具体的治疗案例详细讲述，Graph RAG通过从不同层次生

知识图谱

人工智能

数据

Graph

结构化

原创

qq5b7f4f8742fb5

1月前

317阅读

论文阅读_RAG融合现有知识树_T-RAG

开发一个可以安全、高效地回答私有企业文档问题的大型语言模型（LLM）应用程序，主要考虑数据安全性、有限的计算资源以及需要健壮的应用程序来正确响应查询。

论文阅读

数据集

迭代

应用程序

原创

xieyan0811

3月前

93阅读

大模型 | RAG 架构设计三阶段：Naive RAG 架构设计、Advanced RAG 架构设计、Agentic RAG 架构设计

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、免费分享！

数据库

大模型

AI大模型

ai

人工智能

原创

Android老皮

7天前

34阅读

【大模型-RAG】RAG最佳实践论文及项目解读

论文《Searching for Best Practices in Retrieval-Augmented Generation》由复旦大学的研究人员撰写，旨在探索R

大模型

RAG

后训练

json

Augmented

原创

chaoql

7天前

49阅读

RAG基础与架构 | 七十、RAG的经典结构与模块

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI免费分享！

人工智能

大模型

ai

AI大模型

RAG

原创

沈页dd

6天前

38阅读

RAG未来的出路

总有人喊RAG已死，至少看目前不现实。持这个观点的人，大多是Long context派，老实说，这派人绝大多数不甚理解长上下文的技术实现点，就觉得反正context越长，越牛B，有点饭圈化，当然我并不否认长上下文对提升理解力的一些帮助，就是没大家想的那么牛B而已（说个数据，达到128K以上的语料数据，不到百分之5。尤其是对齐数据，这边更甚，不到总对齐训练语料

Self

搜索

数据

原创

Transofomer周

2月前

42阅读

RAG应用开发实战(01)-RAG应用框架和解析器

1 开源解析和拆分文档第三方的工具去对文件解析拆分，去将我们的文件内容给提取出来，并将我们的文档内容去拆分成一个小的chunk。常见的PDF word mark down, JSON、HTML。都可以有很好的一些模块去把这些文件去进行一个东西去提取。优势支持丰富的文档类型每种文档多样化选择与开源框架无缝集成但有时效果非常差，来内容跟原始的文件内容差别大。 2 PDF格式多样性

Java

原创

公众号JavaEdge

4月前

123阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

RAG

RAG

什么是 RAG，为什么要用 RAG？

RAG~2

RAG Tip

RAG 考虑事项

RAG 的 embedding

Advanced RAG 08：使用 Self-RAG 打造高质量、可追溯的 RAG System

为什么说知识图谱 + RAG > 传统 RAG？

Advanced RAG 03：运用 RAGAs 与 LlamaIndex 评估 RAG 应用

什么是RAG系统？

又来一个RAG：RankRAG，英伟达RAG新思路

RAG基础与架构 | 六十八、为什么需要RAG？

Graph RAG = 知识图谱 + RAG，优化全局搜索+局部搜索

论文阅读_RAG融合现有知识树_T-RAG

大模型 | RAG 架构设计三阶段：Naive RAG 架构设计、Advanced RAG 架构设计、Agentic RAG 架构设计

【大模型-RAG】RAG最佳实践论文及项目解读

RAG基础与架构 | 七十、RAG的经典结构与模块

RAG未来的出路

RAG应用开发实战(01)-RAG应用框架和解析器

检索增强生成RAG

Elasticsearch 8 RAG 技术分享

RAG vs Fine-tuning

RAG embedding什么关系

RAG基础与架构 | 六十九、RAG的经典应用场景

大模型系列——解读RAG

RAG综述论文分享

InternLM+LlamaIndex RAG实践

【黄啊码】为什么一定要用RAG？什么是RAG