大模型 | GraphRAG技术最新全面综述（一）GraphRAG概述、基于图的索引（Graph-Based Indexing）

原创

Android老皮 2024-08-26 13:43:54 ©著作权

文章标签 人工智能大模型 AI大模型 ai AI 文章分类 HarmonyOS 后端开发

©著作权归作者所有：来自51CTO博客作者Android老皮的原创作品，请联系作者获取转载授权，否则将追究法律责任

大型语言模型（如GPT-4、Qwen2和LLaMA）在自然语言处理领域取得了革命性的进展，但它们可能面临领域特定知识的缺乏、信息更新不及时等问题。

GraphRAG通过利用图结构信息，提供了一种解决方案，以更精确和全面的方式检索信息，生成更准确、上下文相关的回答。

直接语言模型（Direct LLM）、检索增强型语言模型（RAG）和图检索增强型语言模型（GraphRAG）之间的比较。在给定用户查询的情况下，直接语言模型（LLMs）可能因为回答浅显或缺乏具体性而受到影响。检索增强型语言模型（RAG）通过检索相关文本信息来解决这个问题，一定程度上缓解了这个问题。然而，由于文本的长度和实体关系的自然语言表达的灵活性，RAG在强调问题核心的“影响”关系方面存在困难。而图检索增强型语言模型（GraphRAG）方法利用图数据中明确的实体和关系表示，通过检索相关的结构化信息，能够提供精确的答案。

大模型 | GraphRAG技术最新全面综述（一）GraphRAG概述、基于图的索引（Graph-Based Indexing）_大模型

一、GraphRAG与相关技术

与RAG（Retrieval-Augmented Generation）相比，GraphRAG特别关注从图数据库中检索相关的关系知识，而不仅仅是文本。

与基于图的大型语言模型（LLMs on Graphs）和知识库问答（KBQA）技术相比，GraphRAG专注于检索外部图结构数据库中的相关图元素。

二、GraphRAG概述

GraphRAG框架利用外部结构化知识图谱来提高语言模型的上下文理解能力，并生成更有信息量的回答。

问题回答任务的GraphRAG框架概述。将GraphRAG分为三个阶段：G-索引（G-Indexing）、G-检索（G-Retrieval）和G-生成（G-Generation）。将检索来源归类为开源知识图谱和自构建的图数据。为了提高结果的相关性，可能采用各种增强技术，如查询增强和知识增强。与直接使用检索到的文本进行生成的RAG不同，GraphRAG需要将检索到的图信息转换成生成器可接受的模式，以提高任务性能。

大模型 | GraphRAG技术最新全面综述（一）GraphRAG概述、基于图的索引（Graph-Based Indexing）_ai_02