Baihai_IDP的博客_IDP Meetup,技术干货,IDP

Advanced RAG 05：探讨基于文本内在语义信息的数据分块方法

编者按：在 RAG (Retrieval Augmented Generation) 系统中，将文本数据高效地划分成相对独立且富有语义信息的数据块（chunks）是一项较为关键的任务。基于规则的传统数据分块方法存在一些问题，因此探讨基于文本内在语义信息的数据分块方法非常必要。在这篇文章中，作者深入探讨了三种基于文本内在语义信息的数据分块方法：基于嵌入的方法、基于模型的

RAG

LLM

原创 2024-04-30 10:46:08 312 阅读 yyds干货盘点

提示词优化的自动化探索：Automated Prompt Engineering

编者按：作者在尝试教授母亲使用 LLM 完成工作任务时，意识到提示词的优化并不像想象中简单。提示词的自动优化对于经验并不丰富的提示词撰写者很有价值，他们没有足够的经验去调整和改进提供给模型的提示词，这引发了对自动化提示词优化工具的进一步探索。本文作者从两个角度分析了提示词工程的本质 —— 可将其视为超参数优化的一部分，也可将其视为一个需要不断尝试和调整的摸索、试错、修正过程。作者认为，对于拥有比

提示词工程

白海科技

AI

原创 2024-04-25 13:07:49 242 阅读

Advanced RAG 04：重排序（Re-ranking）技术探讨

编者按：重排序（Re-ranking）技术在检索增强生成（Retrieval Augmented Generation，RAG）系统中扮演着关键角色。通过对检索到的上下文进行筛选和排序，可以提高 RAG 系统的有效性和准确性，为最终的结果生成提供更精准的信息。本文介绍了两种主要的 Re-ranking 方法，并演示了如何将其融入到 RAG

RAG

检索增强生成

LLM

AIGC

AI

原创精选 2024-04-20 10:20:49 1587 阅读

Advanced RAG 03：运用 RAGAs 与 LlamaIndex 评估 RAG 应用

编者按：目前，检索增强生成（Retrieval Augmented Generation，RAG）技术已经广泛使用于各种大模型应用场景。然而，如何准确评估 RAG 系统的性能和效果，一直是业界和学界共同关注的重点问题。若无法对 RAG 系统进行全面、客观的评估，也难以针对性地优化和改进它。因此，开发一套科学、可靠的 RAG 系统评估指标体系，对于推动RAG技术的进一步发展具有重

LLM

RAG

AI

人工智能

原创精选 2024-04-17 11:37:22 582 阅读 yyds干货盘点

LLM 推理优化探微 (4) ：模型性能瓶颈分类及优化策略

编者按：在人工智能浪潮袭卷全球的大背景下，进一步提升人工智能模型性能，满足更多应用需求已经刻不容缓。如何优化模型延迟和吞吐量，成为了业界亟待解决的重要。我们今天为大家带来的这篇文章，其观点为：不同的性能瓶颈需要采取不同的优化策略，识别并解决主要的性能瓶颈是提升模型性能的关键。文章指出，主要有 4 种影响模型性能的瓶颈：计算能力受限、内存带宽受限、通信受限和开销受限。作者分别介绍了针对这 4

LLM

AI

人工智能

白海科技

原创 2024-04-11 11:10:46 190 阅读

Advanced RAG 02：揭开 PDF 文档解析的神秘面纱

编者按：自 2023 年以来，RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能（如：领域智能问答、知识库构建等）严重依赖RAG，优化其性能、提高检索效率和准确性迫在眉睫，成为当前 RAG 相关研究的核心问题。如何高效准确地从PDF等非结构化数据中提取信息并加以利用，是其中一个亟待解决的重要问题。本文比较分析了多种解决方案的优缺点，着重探讨了这一问题的应对

RAG

LLM

GenAI

白海科技

原创 2024-04-07 10:36:36 460 阅读

Advanced RAG 01：讨论未经优化的 RAG 系统存在的问题与挑战

编者按：自 2023 年以来，RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能严重依赖RAG，优化其性能、提高检索效率和准确性迫在眉睫，成为当前 RAG 相关研究的核心问题。我们今天为大家带来的这篇文章指出，Naive RAG 在编制索引、检索和内容生成这三个核心步骤中都存在诸多问题：a) 编制索引时，信息提取不完整、分块策略简单、索引结构未优

RAG

AI

LLM

白海科技

原创 2024-04-03 11:22:42 344 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

Baihai_IDP的博客

Advanced RAG 05：探讨基于文本内在语义信息的数据分块方法

提示词优化的自动化探索：Automated Prompt Engineering

Advanced RAG 04：重排序（Re-ranking）技术探讨

Advanced RAG 03：运用 RAGAs 与 LlamaIndex 评估 RAG 应用

LLM 推理优化探微 (4) ：模型性能瓶颈分类及优化策略

Advanced RAG 02：揭开 PDF 文档解析的神秘面纱

Advanced RAG 01：讨论未经优化的 RAG 系统存在的问题与挑战

欢迎