前言在 RAG(检索增强生成)系统的文档处理流程中,常规的方法其实就是对文档内容进行分段分割成文本块即可,但很多产品中经常会有另一个选项,就是对文档进行问答对的提取;小伙伴们今天老顾就来讲讲两者之间的差异,为什么有这个选项,以及如何进行运用?结构化 vs 非结构化普通文本块:拆分后是连续的文本片段(如 “章节片段”“语义段落”),属于非结构化数据,存储和检索时需基于整体文本的语义进行匹配。问答对:
Copyright © 2005-2025 51CTO.COM 版权所有 京ICP证060544号