热门 最新 精选 话题 上榜
基于llama3的开源参数,详细介绍从0构造Transformer文本生成模型的过程。
原创 精选 2024-06-01 15:01:45
705阅读
yyds干货盘点
从0实现llama3
编者按: 目前,LLMs 在机器翻译、文本生成、多轮问答等任务上已表现得非常出色了。人们开始思考它们是否也可以用于数据标注工作。数据标注是训练和评估各种机器学习模型的基础,一直是一项昂贵且耗时的工作。是否能够借助 LLMs 的强大能力来为数据标注流程降本增效呢?本文深入探讨了这一问题。本文作者从业界最新研究入手,全面评估了 LLMs 在数据标注领域的应用前景。文章指出,在某些场景下使用 LLMs
原创 精选 2024-05-31 10:33:13
408阅读
yyds干货盘点
LLMs 能否胜任「数据标注」?机遇与挑战并存
编者按: 当前大热的大语言模型和检索增强生成模型,虽然在语言理解和内容生成方面取得了突破性的进展,但仍然存在诸多限制。它们缺乏根据目标导引行为、持续学习和与环境交互的能力,难以应对复杂多变的现实场景需求。今天为大家带来的这篇文章,作者的观点是人工智能领域正朝着开发更智能、更自主的 AI Agent 系统迈进,这将彻底改变我们使用人工智能的方式。作者相信人工智能的未来必将呈现出更智能、更自主的 AI
原创 精选 2024-05-29 10:37:42
244阅读
1点赞
yyds干货盘点
一种人机协作新范式?为每个人准备的 AI Agents “羊皮卷”
该章节呢,我们主要是看一下关于国内外主流的大语言模型,通过它们都具备哪些特点,来达成对多模型有一个清晰的认知。对于 "多模型" 的 "多" ,大家一定要有个概念,很多小伙伴只知道 "ChatGPT" ,或者是只知道国内的一些大模型,对国外的大模型不是特别了解,所以该章节就提炼总结一下。
原创 精选 2024-05-27 01:51:55
571阅读
2点赞
国内外主流LLM的特点
这一章节呢,我们主要学习的是AI大模型相关的一些背景和基础知识。大家可以看到这一章节的标题是 "5分钟速通大模型(LLM)发展与基础知识" ,标题名字倒是挺唬人的,相较于唬人的标题,大家肯定更关心的是接下来一段时间主要讲哪些内容呢? 首先,要请大家理解的是,由于内容篇幅大、涉及的知识面和方向也挺多的,所以接下来会有以下几个章节内容。第一个就是带领大家了解一下大语言模型的快速发展,接着会为大家介绍一下国内主要的 LLM 的特点,以及AIGC整个产业的拆解,包括一下专业的常见名词,最后会和大家讲一下应用开发者在目前这样一个大背景下的机会,最后就是实战部分 Agent智能体 的项目,针对这个项目做需求分析和技术选型相关的工作,这是这一大章节的主要内容,先来看一下大语言模型的发展一览吧。
原创 精选 2024-05-24 17:37:10
634阅读
1点赞
5分钟速通大语言模型(LLM)的发展与基础知识
编者按: 大语言模型拥有令人惊叹的语言理解和生成能力,却也存在自主决策、与外部系统交互等方面的不足。函数调用(Function Calling)技术的出现,正是为解决这一难题而生的创新方案,它赋予了大语言模型更强的自主能力和与外部世界连接的能力,成为实现真正智能自主 Agent 的关键一环。本期我们精心为各位读者伙伴呈现一篇详实的搭建技术教程,全面介绍了如何利用函数调用技术构建
原创 2024-05-23 10:36:17
996阅读
yyds干货盘点
让 LLMs 学会使用工具 | 函数调用(Function Calling)技术实例探索
5月14日,Openai发布了全新的GPT-4o模型,这个模型不仅智力相较于原先的GPT4大幅提升,还增强了多模态能力,能够实现与真人之间的视频通话,通话延迟小于30毫秒。除了升级之外,这个模型居然免费了!向所有用户开放,免费用户每三小时能用十次,GPT4用户则没有这个限制,今天我就用一篇文章教会你如何使用。首先我们要有一个微软outlook账号用于登录GPT打开outlook官网选择创建免费账户
原创 2024-05-19 19:30:22
298阅读
GPT-4o更新了什么?要如何使用?要怎么解除使用限制?一篇文章讲清楚
最近Meta新出炉的Llama 3已经成为AI领域的热门话题,这一系列开源大语言模型(LLM)拥有8B和70B两种参数规模,适用于预训练和各种任务的微调。无论你是否用于开发问答系统、文档检索、聊天机器人开发,或是其他LLM相关应用,Llama 3都能满足你的需求。
最新推出的Llama3,作为当前性能最强的开源基础大模型,非常适用于自然语言处理、机器翻译、文本生成、问答系统、聊天机器人等多种应用场景。通过微调这一技术,基础大模型如Llama3即使原生不支持中文,也能增加对中文的支持。本教程将展示如何使用LooPIN提供的GPU算力,从零开始为大模型添加新的训练素材,拓展其在原有能力基础上的新可能性。
原创 2024-05-16 01:29:49
2923阅读
yyds干货盘点
编者按: 目前,检索增强生成(RAG)系统成为了将海量知识赋能于大模型的关键技术之一。然而,如何高效地处理半结构化和非结构化数据,尤其是文档中的表格数据,仍然是 RAG 系统面临的一大难题。本文作者针对这一痛点,提出了一种处理表格数据的新颖解决方案。作者首先系统性地梳理了RAG系统中表格处理的核心技术,包括表格解析、索引结构设计等,并评述了现有的一些开源解决方案。在此基础上,作
原创 2024-05-15 10:25:54
620阅读
yyds干货盘点
Advanced RAG 07:在 RAG 系统中进行表格数据处理的新思路
编者按:当前,大语言模型已经成为自然语言处理领域的热点。LLMs 是否真的“智能”?它们又为我们带来了哪些启发?针对这些问题,Darveen Vijayan 为我们带来了这篇引人深思的文章。作者主要阐释了两个观点:第一,LLMs应被视为一种文字计算器,它通过预测下一个词来工作,当前阶段还不应被归为“智能”。第二,尽管LLMs 目前存在局限,但它们为我们提供了反思人类智能本质的契机。我们应保持开放的
原创 2024-05-11 11:21:50
125阅读
计算器对于数学的处理方式来说是一次重大的改变,那么 LLMs 对于语言来说呢?
novel 是一个类似 Notion 风格的所见即所得编辑器,具有 AI 助力自动补全功能。 * 支持 Notion 风格的 WYSIWYG 编辑 * 基于 AI 的自动补全功能
原创 2024-05-11 09:47:32
148阅读
Notion 风格所见即所得编辑器:AI 自动补全 | 开源日报 No.245
这个代码库包含了 500 多个涵盖了计算机视觉、自然语言处理等多个领域的 AI、机器学习、深度学习项目。持续更新并欢迎贡献者提交新项目或修复链接问题,同时提供各种实际应用场景下的示例代码和资源。如果你
原创 2024-05-11 09:46:52
165阅读
500 个 AI 项目代码库:计算机视觉到 NLP | 开源日报 No.248
编者按: 大模型的出现为构建更智能、更复杂的人工智能系统带来了新的契机。然而,单一的大模型难以应对现实世界中错综复杂的问题,需要与其他模块相结合,构建出复合人工智能系统(Compound AI Systems)。本文作者深耕人工智能领域多年,洞见独到。文中系统性地介绍了四种常见的 Compound AI Systems 部署模式:RAG 系统、Conversational AI 系统、Multi-
LLM
原创 2024-05-10 11:29:25
459阅读
解构复合人工智能系统(Compound AI Systems):关键术语、理论、思路、实践经验
Ollama on LinuxInstall-autoInstall Ollama running this one-liner:curl -fsSL https://ollama.com/install.sh | shManual installDownload the ollama binarysudo curl -L https://ollama.com/download
原创 2024-05-07 21:17:07
1578阅读
llama3 大模型安装及使用
编者按:在现实生活中,普通用户很难编写合适的提示词(prompt)来指示 LLM 完成期望任务。用户提出的 queries 往往存在词汇不准确、缺乏语义信息等问题,导致 LLM 难以理解并生成相关的模型响应。因此,如何优化 queries ,增强 LLM 对各类 query 信息
原创 2024-05-07 11:23:47
288阅读
Advanced RAG 06:生成结果的相关性低? 快用 Query Rewriting 优化技术
DeepFaceLive 是一个用于 PC 实时流媒体或视频通话的人脸换装工具。 - 可以使用训练好的人脸模型从网络摄像头或视频中交换
原创 2024-05-07 10:02:12
189阅读
视频通话实时换脸:支持训练面部模型 | 开源日报 No.235
plandex 是一个用于复杂任务的 AI 编码引擎。使用长时间运行的代理完成跨多个文件且需要多个步骤的任务,将大型任务分解为
原创 2024-05-07 10:01:19
113阅读
用于复杂任务的 AI 编码引擎:多文件多步骤拆解实现 | 开源日报 No.239
尽享 AI 技术魔法,upscayl 免费开源 AI 图像放大器,让你的低分辨率图像焕然一新!跨平台支持,Linux 优先,放大图像不损失质量,让你的图像处理更加轻松便捷!
原创 2024-05-07 10:00:52
60阅读
AI 图像无损放大器:多平台支持,轻松上手 | 开源日报 No.241
Retrieval-based-Voice-Conversion-WebUI 是一个基于 VITS 的简单易用的变声框架。
原创 2024-05-07 10:00:45
199阅读
基于 VITS 的变声框架:杜绝音色泄漏问题 | 开源日报 No.242
编者按:在 RAG (Retrieval Augmented Generation) 系统中,将文本数据高效地划分成相对独立且富有语义信息的数据块(chunks)是一项较为关键的任务。基于规则的传统数据分块方法存在一些问题,因此探讨基于文本内在语义信息的数据分块方法非常必要。在这篇文章中,作者深入探讨了三种基于文本内在语义信息的数据分块方法:基于嵌入的方法、基于模型的
原创 2024-04-30 10:46:08
312阅读
yyds干货盘点
Advanced RAG 05:探讨基于文本内在语义信息的数据分块方法
litellm 是一个使用 OpenAI 格式调用所有 LLM API 的工具。它支持 Bedrock、Azure、OpenAI、Cohere、Anthropic 等 100 多种 LLMs,提供企业
原创 2024-04-28 11:20:36
157阅读
统一所有 LLM API:支持预算与速率限制 | 开源日报 No.229
Real-ESRGAN 项目旨在开发实用的图像/视频恢复算法,提供动漫视频小模型和动漫插图模型,支持在线 Colab 演示和跨平台可执行文件,实现了真实世界盲目超分辨率训练,支持纯合成数据微调,集成了
原创 2024-04-28 11:18:52
67阅读
实用图像视频修复工具:完善细节、提高分辨率 | 开源日报 No.225
LangChain 是一个用于构建 LLMs 应用程序的库,它提供了统一的开发平台,帮助开发者快速部署 LangChain 应用程序到生产环境。LangChain 的主要功能包括管理 prompt、处
原创 2024-04-28 10:35:34
78阅读
LLMs 应用程序的构建利器:LangChain 助您驰骋 AI 世界 | 开源日报 No.100
LLaMA 2 是一个开源项目,用于加载 LLaMA 模型并进行推理。它提供了预训练和微调后的 LLaMA 语言模型的权重和起始代码,模型参数范围从 7B 到 70B。它支持多种规模的语言模型,最长支
云端大模型对接编程积木,创造更多可能性。
实战分享借助大模型用语音控制电梯
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Q
原创 2024-04-23 09:53:51
195阅读
阿里开源的32B大模型到底强在哪里?
本文给大家分享一个将模糊图片还原为照片级高清图像的AI项目:SUPIR。这个项目以尖端的大规模人工智能革新图像恢复技术,通过文本驱每张图像全新的生命力。
原创 2024-04-23 09:52:40
232阅读
一个令人惊艳的图片高清化重绘神器:SUPIR来了!
完整的大语言模型训练成本比较高昂,不是我们业余玩家能搞的,如果我们只是想在某个业务场景或者垂直的方面加强大模型的能力
原创 2024-04-23 09:52:25
190阅读
十分钟学会微调大语言模型