RAGFlow优化 Tips

原创

山西空管技术支持 2024-09-06 21:48:08 博主文章分类：AI+Agent ©著作权

©著作权归作者所有：来自51CTO博客作者山西空管技术支持的原创作品，请联系作者获取转载授权，否则将追究法律责任

关键字：

BERT架构、ColBERT、分段标识符、

Tip:

vllm部署的模型通过OpenAI-API-Compatible模型厂商添加；
Dify 和 FastGPT 的选型：其实有一个非常重要的关键点，Dify线上版至今还不支持多LLM并行，而FastGPT 稳定支持。在某些业务场景下，这一点就足以决定选型了。

1、优化模型

面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型：MiniCPM3-4B 是 MiniCPM 系列的第三代产品，整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125，媲美多款 70 亿～90 亿参数的 AI 模型。支持函数调用和代码解释器。

面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型，针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。

2、Cohere 公司发布了最新版本的 Command R 和 Command R+ 模型，这些企业级 AI 模型经过优化，专为商业应用场景设计。新版模型在编码、数学、推理和延迟方面进行了显著提升，特别是在处理检索增强生成 (RAG) 和多语言支持方面表现出色。

3、Jina AI发布 Jina ColBERT v2版本，基于BERT架构开发，旨在优化查询和文档之间的匹配和排序。用于在搜索引擎、推荐系统、问答系统等应用中实现高效、精确的信息检索和排序。

ColBERT 是一种专门用于信息检索的模型，名字来源于 “Contextualized Late Interaction over BERT”（基于BERT的上下文化后期交互）。它结合了BERT模型强大的语言理解能力，并在此基础上引入了一种新颖的“后期交互”机制，使得搜索变得更加高效和精准。