本地 LLM_51CTO博客

如何通过开源项目 LOCALAI 运行本地 LLM

我们研究了一种开源方法，用于在本地运行大型语言模型。LocalAI 是私有公司 Ollama 的替代品。译自How to Run a Local LLM via LocalAI, an Open Source Project，作者 David Eastman。今年早些时候，我写了一篇关于如何使用 Ollama 和 Llama 2 设置并运行本地 LLM的文章。在本文中，我将探讨在本地运行大型语言模

Docker

语言模型

Desktop

翻译

云云众生s

4月前

184阅读

AutoGen完整教程和加载本地LLM示例

Autogen代理可以根据需要执行代码、生成报告和自动执行任务。他们可以协同高效地工作，节省时间和精力，我们还介绍了如何在本地使用，这样可以在本地进行测试，而不需要OpenAI的API。微软的Autogen官网。

人工智能

深度学习

大语言模型

autogen

python

原创

deephub

3月前

124阅读

LLM大模型助力LangChain本地化方案

随着全球化的不断发展，语言障碍已经成为制约人们进行跨文化交流和合作的重要因素。为了解决这一问题，LangChain 本地化方案应运而生。LangChain 是一种基于区块链技术的语言服务生态系统，通过智能合约和去中心化网络，将全球范围内的语言服务提供者和需求者连接起来，实现语言服务的去中心化和优质高效。在 LangChain 本地化方案中，使用 ChatYuan-large-v2 作为 LLM 大

语言模型

智能合约

原创

你好小曼同学

9月前

373阅读

StarCoder 2：GitHub Copilot本地开源LLM替代方案

StarCoder2模型有三种不同大小可供选择，包括3B、7B和15B参数，并且支持广泛的编程语言。每个模型都是在The Stack v2上

github

copilot

开源

深度学习

大语言模型

原创

deephub

3月前

21阅读

使用LM Studio在本地运行LLM完整教程

打开“Model Configuration”，然后打开“Prompt Format”，向下滚动到“Pre-prompt / System prompt”，选择“>”符号打

机器学习

深度学习

大语言模型

人工智能

脱机

原创

deephub

3月前

196阅读

LLM memory llm memory system

文章目录key words:介绍**MMU****物理地址**线性地址虚拟内存逻辑地址内存管理内存及寻址地址变换地址变换分段机制分页机制启用分页机制实现线性地址到物理地址转换的过程分页机制和分段机制的不同页表结构两级页表结构不存在的页表页表项格式虚拟存储任务之间的保护和特权级保护 key words:物理地址: 内存单元所看到的地址，机器内主存的地址，包括RAM和ROM逻辑地址: cpu生成

LLM memory

操作系统

物理地址

页表

物理内存

转载

mob64ca140234eb

4月前

57阅读

【AIGC】Mac Intel 本地 LLM 部署经验汇总（CPU Only）

书接上文，我在 ollama 中部署 qwen1_5-14b-chat-q4_k_m.gguf 预量化模型，在非 Stream 模式下需要 89 秒才完成一轮问答，响应速度实在是太慢，后续需要想办法进行优化...

python

AIGC

transformers

原创

kida_yuan

3月前

300阅读

[LLM] Ollama+Open-webui本地运行大模型问答

前文已完成安装与部署Ollama，实现了qwen2大模型的命令行方式与API方式访问，但是对于日常使用来说还是不方便，特别是使用过OpenAI的界面后，会觉得操作界面不像ChatGPT那样美观，如果能使用web页面进行交互，使用体验更好，也能保留之前的聊天记录，便于后期翻阅查询。Open-webui就是一款适配Ollama的web端工具，它可以采用本地安装与docker安装方式进行部署，在Wind

Windows

Docker

Open-webUI

Hyper-v

WSL2

原创精选

科来者

1月前

211阅读

使用 Ollama 和 SingleStore 构建本地 LLM 应用程序

在数据隐私问题日益严重的时代，本地大型语言模型（LLM）应用程序的开发为基于云的解决方案提供了替代方案。Ollama 提供了一个

SQL

工作区

Cloud

原创

哦豁完蛋了

1月前

26阅读

LLM function

系列文章目录LLVM系列第一章：编译LLVM源码LLVM系列第二章：模块ModuleLLVM系列第三章：函数FunctionLLVM系列第四章：逻辑代码块BlockLLVM系列第五章：全局变量Global VariableLLVM系列第六章：函数返回值ReturnLLVM系列第七章：函数参数Function ArgumentsLLVM系列第八章：算术运算语句Arithmetic Statement

LLM function

编译器

LLVM

#include

g++

转载

mob6454cc6b413f

1月前

22阅读

回归LLM

人们对大型语言模型（LLM）的推理能力一直存在相当大的分歧，最初，研究者乐观的认为 LLM 的推理能力随着模型规模的扩大会自

人工智能

解决方案

生成器

迭代

原创

qq6669490e54384

1月前

38阅读

笔记：LLM

介绍部分使用ChatGPT查询得到……LLM是啥？NLP中的LLM大模型（Large Language Model）是指能够处理海量文本数据和生成高质量语言表达能力的大型神经语言模型。通常，LLM大模型会使用海量的训练数据和深度学习神经网络来学习文本数据的规律，并生成基于统计的语言表达。目前，常见的LLM大模型包括GPT-3/4、BERT、Transformer、ELMo等。这些模型已经在自然语言

自然语言处理

语言模型

数据

原创

手搓AI

2023-07-05 11:07:14

247阅读

LLM in a flash

在 M1 Max 上，从闪存加载每个 token 的延迟为 125 毫秒，内存管理（包括神经元的删除和添加）的延迟为 65 毫秒。虽然吞吐量的

人工智能

闪存

加载

数据

原创

qq6669490e54384

1月前

52阅读

LLM~幻觉

例如，有缺陷的数据源和未优化的数据利用，或是在预训练和对齐过程中可能会诱发幻觉的训练策略，以及源于

人工智能

数据

忠实度

领域知识

原创

qq6669490e54384

1月前

37阅读

使用GaLore在本地GPU进行高效的LLM调优

GaLore可以节省VRAM，允许在消费级GPU上训练7B模型，但是速度较慢，比微调和LoRA的时间要长差不多两倍的时间。作者：Geronimo。

python

人工智能

深度学习

神经网络

大语言模型

原创

deephub

3月前

23阅读

Aigc 和llm aigc和llm的关系

文章目录一.背景介绍二.LangChain简介2.1 常见应用场景三.LangChain特点3.1 优点3.2 不足四.LangChain功能4.1 基础功能4.2 功能模块4.2.1 LLM和Prompts4.2.2 Chain4.2.3 Agent4.2.4 Memory4.2.5 Embedding4.2.6 Models4.2.7 Indexes五.实战案例5.1 背景需求5.2 数据准

Aigc 和llm

AIGC

人工智能

机器学习

数据

转载

西门吹雪

4月前

171阅读

LLM和机器学习 llm和msc区别

文章目录一、什么是LLM二、LLM从海量文本中学习到了什么？三、LLM的知识到底存储到了网络中的什么地方四、如何修改LLM中的某些知识？五、如何平衡训练数据量、模型参数、增加epoch的关系六、思维链promting是啥七、代码预训练增强LLM推理能力八、各种大模型评测排行榜网站九、预训练数据集概览十、InstructGPT模型微调数据集十一、指令微调数据集格式十二、训练数据准备阶段参考文档一

LLM和机器学习

自然语言处理

人工智能

深度学习

数据

转载

mob64ca1416b5a8

8月前

151阅读

本地化部署大模型方案二：fastchat+llm(vllm)

FastChat 是一个开放平台，用于训练、服务和评估基于大型语言模型的聊天机器人。FastChat 为 Chatbot Arena ( https://c

langchain

语言模型

加载

应用程序

python

原创精选

杨虎成博客

5月前

3663阅读

LLM 日志采集

@[TOC](Logstash+MQ 日志采集)需求场景logback+MQ+Logstash采集多台服务（下文用生产端代替）的日志数据，汇总到一台服务器（下文用消费端代替）中。实现1.RabbitMQ 将日志消息发布到mq，消费端获取消息。 2.Logstash 收集日志数据。放在消费端，接收mq消息，文件形式输出到本地。服务环境1.windows环境 2 .mq（环境模拟）

spring

数据

百度

原创

不要喷香水

2022-11-27 21:23:01

306阅读

代码增强LLM

与LLM推理机制中严格硬编码工具调用的固定实践流程相反，以代码为中心的范式允许LLM动态生成tokens，并使用可

人工智能

数据

自然语言

模态

原创

AI世界印象

4月前

16阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

本地 LLM

如何通过开源项目 LOCALAI 运行本地 LLM

AutoGen完整教程和加载本地LLM示例

LLM大模型助力LangChain本地化方案

StarCoder 2：GitHub Copilot本地开源LLM替代方案

使用LM Studio在本地运行LLM完整教程

LLM memory llm memory system

【AIGC】Mac Intel 本地 LLM 部署经验汇总（CPU Only）

[LLM] Ollama+Open-webui本地运行大模型问答

使用 Ollama 和 SingleStore 构建本地 LLM 应用程序

LLM function

回归LLM

笔记：LLM

LLM in a flash

LLM~幻觉

使用GaLore在本地GPU进行高效的LLM调优

Aigc 和llm aigc和llm的关系

LLM和机器学习 llm和msc区别

本地化部署大模型方案二：fastchat+llm(vllm)

LLM 日志采集

代码增强LLM

CODE LLM 对比

Time-LLM

LLM~推理优化

Emergent Abilities of LLM

pytorch llm gpu

LLM记忆开发

UsableXAI_LLM

LLM360

llm_unlearn

AIGC NLP LLM