Ollama

Ollama 是一个本�?LLM 运行时，可以轻松在你的机器上运行开源模型。OpenClaw �?Ollama 的原�?API（/api/chat）集成，支持流式传输和工具调用，并且当你通过 OLLAMA_API_KEY（或 auth profile）选择加入且未定义显式 models.providers.ollama 条目时，可以**自动发现支持工具的模�?*�?

快速开�?

安装 Ollama：https://ollama.ai
拉取模型�?

ollama pull gpt-oss:20b
# �?
ollama pull llama3.3
# �?
ollama pull qwen2.5-coder:32b
# �?
ollama pull deepseek-r1:32b

�?OpenClaw 启用 Ollama（任何值都可以；Ollama 不需要真正的密钥）：

# 设置环境变量
export OLLAMA_API_KEY="ollama-local"

# 或在你的配置文件中配�?
openclaw config set models.providers.ollama.apiKey "ollama-local"

使用 Ollama 模型�?

{
  agents: {
    defaults: {
      model: { primary: "ollama/gpt-oss:20b" },
    },
  },
}

模型发现（隐�?provider�?

当你设置 OLLAMA_API_KEY（或 auth profile）且**�?*定义 models.providers.ollama 时，OpenClaw 会从本地 Ollama 实例 http://127.0.0.1:11434 发现模型�?

查询 /api/tags �?/api/show
仅保留报�?tools 能力的模�?
当模型报�?thinking 时标�?reasoning
当可用时�?model_info["<arch>.context_length"] 读取 contextWindow
�?maxTokens 设置为上下文窗口�?10 �?
将所有成本设置为 0

这避免了手动模型条目，同时保持目录与 Ollama 的能力一致�?

要查看有哪些模型可用�?

ollama list
openclaw models list

要添加新模型，只需�?Ollama 拉取它：

ollama pull mistral

新模型将自动被发现并可供使用�?

如果你显式设�?models.providers.ollama，自动发现会被跳过，你必须手动定义模型（见下文）�?

配置

基本设置（隐式发现）

启用 Ollama 的最简单方式是通过环境变量�?

export OLLAMA_API_KEY="ollama-local"

显式设置（手动模型）

在以下情况下使用显式配置�?

Ollama 在另一个主�?端口上运行�?
你想强制使用特定的上下文窗口或模型列表�?
你想包含不支持工具报告的模型�?

{
  models: {
    providers: {
      ollama: {
        baseUrl: "http://ollama-host:11434",
        apiKey: "ollama-local",
        api: "ollama",
        models: [
          {
            id: "gpt-oss:20b",
            name: "GPT-OSS 20B",
            reasoning: false,
            input: ["text"],
            cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
            contextWindow: 8192,
            maxTokens: 8192 * 10
          }
        ]
      }
    }
  }
}

如果设置�?OLLAMA_API_KEY，你可以�?provider 条目中省�?apiKey，OpenClaw 会为你填充可用性检查�?

自定义基础 URL（显式配置）

如果 Ollama 在不同的主机或端口上运行（显式配置禁用自动发现，所以需要手动定义模型）�?

{
  models: {
    providers: {
      ollama: {
        apiKey: "ollama-local",
        baseUrl: "http://ollama-host:11434",
      },
    },
  },
}

模型选择

配置后，你所有的 Ollama 模型都可用：

{
  agents: {
    defaults: {
      model: {
        primary: "ollama/gpt-oss:20b",
        fallbacks: ["ollama/llama3.3", "ollama/qwen2.5-coder:32b"],
      },
    },
  },
}

高级

推理模型

�?Ollama �?/api/show 中报�?thinking 时，OpenClaw 将模型标记为支持推理�?

ollama pull deepseek-r1:32b

模型成本

Ollama 是免费且本地运行的，因此所有模型成本都设置�?$0�?

流式配置

OpenClaw �?Ollama 集成默认使用原生 Ollama API（/api/chat），它完全支持同时进行流式传输和工具调用。无需特殊配置�?

旧版 OpenAI 兼容模式

如果你需要改�?OpenAI 兼容端点（例如，在仅支持 OpenAI 格式的代理后面），请明确设置 api: "openai-completions"�?

{
  models: {
    providers: {
      ollama: {
        baseUrl: "http://ollama-host:11434/v1",
        api: "openai-completions",
        apiKey: "ollama-local",
        models: [...]
      }
    }
  }
}

注意：OpenAI 兼容端点可能不支持同时进行流式传输和工具调用。你可能需要在模型配置中使�?params: { streaming: false } 禁用流式传输�?

上下文窗�?

对于自动发现的模型，OpenClaw 使用 Ollama 报告的上下文窗口（如果可用），否则默认为 8192。你可以在显�?provider 配置中覆�?contextWindow �?maxTokens�?

故障排除

未检测到 Ollama

确保 Ollama 正在运行且你设置�?OLLAMA_API_KEY（或 auth profile），且你没有定义显式 models.providers.ollama 条目�?

ollama serve

并且 API 可访问：

curl http://localhost:11434/api/tags

没有可用的模�?

OpenClaw 仅自动发现报告工具支持的模型。如果你的模型未列出，要么：

拉取一个支持工具的模型，或
�?models.providers.ollama 中显式定义模型�?

要添加模型：

ollama list  # 查看已安装的内容
ollama pull gpt-oss:20b  # 拉取支持工具的模�?
ollama pull llama3.3     # 或其他模�?

连接被拒�?

检�?Ollama 是否在正确的端口上运行：

# 检�?Ollama 是否正在运行
ps aux | grep ollama

# 或重�?Ollama
ollama serve

另请参阅

模型 Providers - 所�?providers 概述
模型选择 - 如何选择模型
配置 - 完整配置参�?