Ubuntu 22.04系统如何让Ollama使用GPU运行LLM模型

原创

a772304419 2025-09-01 13:38:55 博主文章分类：Linux ©著作权

文章标签 ubuntu linux 运维语言模型 LLM 文章分类 Html/CSS 前端开发

©著作权归作者所有：来自51CTO博客作者a772304419的原创作品，请联系作者获取转载授权，否则将追究法律责任

如何让Ollama使用GPU运行LLM模型

以 NVIDIA 为例，说明 Ollama GPU 模式运行大模型的具体操作。

1 安装英伟达容器安装包

以 Ubuntu 22.04 为例（其它系统请参考：英伟达官方文档）

配置 apt 源

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

更新源

sudo apt-get update

安装工具包

sudo apt-get install -y nvidia-container-toolkit

2 使用 GPU 运行 Ollama

# 以后台模式运行 ollama 容器，并允许容器访问主机上所有可用的 NVIDIA GPU
docker run --gpus all -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

3 使用 Ollama 下载模型

# 在线下载并运行模型
docker exec -it ollama ollama run qwen:7b

4 在 MaxKB 中添加 Ollama 模型

下载完成并运行模型服务后，即可在 MaxKB 中添加对应的模型并使用。

Ubuntu 22.04系统如何让Ollama使用GPU运行LLM模型_语言模型

上一篇：Excel 文件导入MaxKB知识库指导说明

下一篇：基于 rocketmq-spring-boot-starter 2.0.4 版本的完整 Spring Boot 集成示例

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯