最近大半年时间都在做RAG的工作,分享一点个人探索的方向。和提升的方案。文章中会分享是如何做的,以及对应的效果。            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2024-07-23 12:21:14
                            
                                746阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            随着自然语言处理(NLP)和生成性人工智能(Generative AI)领域的最新进展,RAG(检索增强生成,Retrieval Augmented Generation)的引入有望推动现有技术如ChatGPT的进步,它通过结合基于检索的模型和序列到序列的架构来提升大型语言模型(LLM)生成响应的质量。然而,由于RAG存在一些不足之处,需要进行升级以实现其潜在的增强功能,这就是RAG Fusion            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2024-04-13 13:00:27
                            
                                434阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            聪明人往往很“懒”,但这种“懒”其实是高效的体现。他们总能找到解决复杂问题的最佳路径,用最少的力气获得最大的成果            
                
         
            
            
            
            论文中提出了一种ChunkRAG的新的检索方法,旨在解决 RAG 获取文档时会检索到不相关或关联较弱的信息,而ChunkRAG通            
                
         
            
            
            
            通过知识图谱增强 RAG 可以帮助检索,使系统能够更深入地挖掘数据集以提供详细的响应。译自Boost LLM Results: When to Use Knowledge Graph RAG,作者 Brian Godsey。有时,检索增强生成 (RAG) 系统无法深入文档集以找到所需的答案。我们可能会得到泛泛的或肤浅的回复,或者我们可能会得到回复,其中RAG系统检索到的细节很少,然后用不相关或不正            
                
                    
                        
                                                            
                                                                        
                                                                                        翻译
                                                                                    
                            2024-09-05 08:39:41
                            
                                77阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            检索到的结果可能包含冗余或不必要的信息,这可能会妨碍LLMs生成准确的结果。而且较长的prompt会减慢推理过程。因此,在检索增强            
                
         
            
            
            
            如果说,rerank能够让RAG的效果实现百尺竿头更进一步,那么LLM微调应该是RAG效果提升的最后一步。把召回的数据,经过粗排,重排序后            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-07-23 12:19:58
                            
                                327阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文简要介绍了RAG的原理和RAG调优的方法。可以从数据质量把控、数据分块、重新排名、检索优化、RAG架构、评估以及道德影响等            
                
         
            
            
            
            在构建 RAG 应用时,拿到检索结果并不意味着任务完成!如何挑出最有价值的内容?今天小米带你深入了解 LangChain4j 中的 RRF 和 Reranker 两种结果重排方法,全面提升问答质量!            
                
         
            
            
            
            正如我们所探讨的,在 RAG 和微调之间进行选择需要对 LLM 申请的独特需求和优先级进行细致的评估。没有一种万能的解决方            
                
         
            
            
            
            在(RAG)中同时使用文本嵌入和知识嵌入可以从几个方面增强模型的性能和能力:1、文本嵌入捕获单个单词或短语的语义,而知识嵌入捕获实体之间的明确关系。通过两种嵌入的集成,RAG模型实现了对输入文本和存储在知识图中的组织信息的更全面的把握。2、文本嵌入通过分析输入文本中的词共现提供有价值的上下文见解,而知识嵌入通过检查知            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                            精选
                                                        
                            2024-05-05 17:35:08
                            
                                259阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            通过在四个公共数据集(两个短形式问答数据集、一个长形式问答数据集和一个事实验证数据集)上的评估,证明了该方法的            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-13 10:50:51
                            
                                0阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            PlanRAG技术的核心在于,它使用单个语言模型来执行这两种类型的推理,以减少使用不同语言模型可能带来的副作用。检索与回            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-07-10 13:50:49
                            
                                121阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            大型语言模型 (LLM) 的兴起极大地推动了代码翻译领域,实现了编程语言间的自动化转换。然而,这些模型在处理复杂            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-13 10:41:07
                            
                                58阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            RAGRAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和生成模型的技术,它通过引入外部知识库来解决知识密集型的自然语言处理任务,例如问答和文本摘要等。RAG技术的核心在于两个阶段:检索阶段和生成阶段。
1. 检索阶段:模型从外部知识库中检索与输入文本相关的信息。这个知识库可以是大规模文本数据集的索引数据库。
2.             
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-23 14:11:18
                            
                                408阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            时效性问题:模型的知识在预训练后就固定了,无法自动更新最新信息知识覆盖局限缺乏特定领域或私有领域的专业知识对组织质量。RAG 通过在生成回答之前,先从知识库中检索相关信息,然后将检索到的信息作为上下文提供给语言模型,从而实现更准确、更可靠的响应。            
                
         
            
            
            
            对于这个简单示例,我们可以使用 CharacterTextSplitter,其 chunk_size 设为 500,chunk_overlap 设为 50,这样可以保持文本            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2024-08-02 10:00:59
                            
                                212阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Agentic RAG描述了基于AI智能体实现的RAG。具体来说,它将AI智能体纳入RAG流程中,以协调其组件并执行超出            
                
         
            
            
            
            AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握A教程、实战学习、面试题等,资料免费分享!