ollama 没有用到gpu

原创

mob64ca12ebf2cc 2025-10-09 01:18:31 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12ebf2cc的原创作品，请联系作者获取转载授权，否则将追究法律责任

ollama 没有用到gpu，这个问题让我在配置和使用过程中遇到了一些挑战。在这篇博文中，我将分享自己解决“ollama 没有用到gpu”问题的整个过程，包括环境配置、编译过程、参数调优、定制开发、错误集锦和进阶指南。希望这能帮助到其他同样遇到问题的朋友们。

环境配置

在面对“ollama 没有用到gpu”的问题之前，我意识到首先需要确保环境配置正确。于是，我列出了所需的依赖和配置步骤，制作了思维导图来理清思路。

mindmap
  root((环境配置))
    GPU
    CUDA
    Ollama
  CUDA
    Version 11.2
    Toolkit
  Ollama
    Python3.8+
    pip

依赖版本

依赖项	版本
CUDA	11.2
cuDNN	8.1
Python	3.8
Ollama	最新版本

Shell配置代码

# 更新系统
sudo apt update && sudo apt upgrade -y

# 安装CUDA和cuDNN
sudo apt install nvidia-cuda-toolkit

在确认了依赖之后，我开始进入编译过程。

编译过程

我将“Ollama”下载到本地，并开始编译。在这一过程中，常常会遇到各种错误。因此，我绘制了一个状态图以跟踪各个阶段的进度和潜在的错误。

stateDiagram
    [*] --> Download
    Download --> Compile
    Compile --> Success
    Compile --> Error
    Error --> [*]

错误处理

在编译中遇到了几个问题，比如编译时间过长或库版本不兼容等，我将这些情况归纳整理。

sequenceDiagram
    用户->>编译器: 开始编译
    编译器->>系统: 设置环境
    系统-->>编译器: 响应时间
   编译器->>用户: 返回错误信息

在这里，编译耗时可以通过公式计算得出：

$$ 编译时间 = 准备时间 + 编译时间 + 连接时间 $$

参数调优

为了提高性能，我决定对一些参数进行调整。通过对比优化前后的代码，可以清晰地看出效果。

# 优化前代码
def compute():
    result = 0
    for i in range(1000000):
        result += (i * i)
    return result

# 优化后代码
def compute():
    return sum(i * i for i in range(1000000))  # 优化计算方式

内核参数

参数名	默认值	优化值
`kernel.thread_count`	512	1024
`cuda.memory_limit`	2048MB	8192MB

定制开发

在调试过程中，我发现需要一些定制化功能以满足我的需求。于是，我开始了模块开发，并使用思维导图进行整理。

mindmap
  root((模块关系))
    GPU支持
    数据处理
    接口模块
    用户交互

代码扩展片段

class CustomProcessor:
    def __init__(self):
        self.data = []

    def process_data(self, new_data):
        self.data.extend(new_data)  # 扩展数据处理能力

classDiagram
    class CustomProcessor {
        +process_data(new_data)
    }

错误集锦

在整个过程中，难免会遇到一些错误。我用关系图整理了这些错误及其解决方案，以便快速查找。

erDiagram
    ERROR {
        string message
        string type
    }
    SOLUTION {
        string description
    }

    ERROR ||--o{ SOLUTION: resolves

补丁代码片段

# 补丁代码
sudo apt install --reinstall nvidia-driver-460

进阶指南

为了更深入地理解和解决问题，我总结了一些可能的进阶方法和技术选型。通过四象限图表来帮助我优先级排序。

quadrantChart
    title 优先级评估
    x-axis 复杂度
    y-axis 影响度
    
    "GPU Driver Update": [0.1, 0.9]
    "Ollama Optimization": [0.4, 0.7]
    "Environmental Variable Tuning": [0.5, 0.4]
    "Custom Feature Development": [0.8, 0.8]

技术选型公式

选择技术 = 功能需求 + 性能需求 + 成本

路线图表格

阶段	时间	任务
环境配置	1周	安装依赖和设置环境
编译与调试	2周	编译代码并修复错误
参数调优与优化	1周	进行性能优化
定制开发	1周	添加新功能