Ollama
Ollama 是一个本�?LLM 运行时,可以轻松在你的机器上运行开源模型。OpenClaw �?Ollama 的原�?API(/api/chat)集成,支持流式传输和工具调用,并且当你通过 OLLAMA_API_KEY(或 auth profile)选择加入且未定义显式 models.providers.ollama 条目时,可以**自动发现支持工具的模�?*�?
快速开�?
-
安装 Ollama:https://ollama.ai
-
拉取模型�?
ollama pull gpt-oss:20b
# �?
ollama pull llama3.3
# �?
ollama pull qwen2.5-coder:32b
# �?
ollama pull deepseek-r1:32b
- �?OpenClaw 启用 Ollama(任何值都可以;Ollama 不需要真正的密钥):
# 设置环境变量
export OLLAMA_API_KEY="ollama-local"
# 或在你的配置文件中配�?
openclaw config set models.providers.ollama.apiKey "ollama-local"
- 使用 Ollama 模型�?
{
agents: {
defaults: {
model: { primary: "ollama/gpt-oss:20b" },
},
},
}
模型发现(隐�?provider�?
当你设置 OLLAMA_API_KEY(或 auth profile)且**�?*定义 models.providers.ollama 时,OpenClaw 会从本地 Ollama 实例 http://127.0.0.1:11434 发现模型�?
- 查询
/api/tags�?/api/show - 仅保留报�?
tools能力的模�? - 当模型报�?
thinking时标�?reasoning - 当可用时�?
model_info["<arch>.context_length"]读取contextWindow - �?
maxTokens设置为上下文窗口�?10 �? - 将所有成本设置为
0
这避免了手动模型条目,同时保持目录与 Ollama 的能力一致�?
要查看有哪些模型可用�?
ollama list
openclaw models list
要添加新模型,只需�?Ollama 拉取它:
ollama pull mistral
新模型将自动被发现并可供使用�?
如果你显式设�?models.providers.ollama,自动发现会被跳过,你必须手动定义模型(见下文)�?
配置
基本设置(隐式发现)
启用 Ollama 的最简单方式是通过环境变量�?
export OLLAMA_API_KEY="ollama-local"
显式设置(手动模型)
在以下情况下使用显式配置�?
- Ollama 在另一个主�?端口上运行�?
- 你想强制使用特定的上下文窗口或模型列表�?
- 你想包含不支持工具报告的模型�?
{
models: {
providers: {
ollama: {
baseUrl: "http://ollama-host:11434",
apiKey: "ollama-local",
api: "ollama",
models: [
{
id: "gpt-oss:20b",
name: "GPT-OSS 20B",
reasoning: false,
input: ["text"],
cost: { input: 0, output: 0, cacheRead: 0, cacheWrite: 0 },
contextWindow: 8192,
maxTokens: 8192 * 10
}
]
}
}
}
}
如果设置�?OLLAMA_API_KEY,你可以�?provider 条目中省�?apiKey,OpenClaw 会为你填充可用性检查�?
自定义基础 URL(显式配置)
如果 Ollama 在不同的主机或端口上运行(显式配置禁用自动发现,所以需要手动定义模型)�?
{
models: {
providers: {
ollama: {
apiKey: "ollama-local",
baseUrl: "http://ollama-host:11434",
},
},
},
}
模型选择
配置后,你所有的 Ollama 模型都可用:
{
agents: {
defaults: {
model: {
primary: "ollama/gpt-oss:20b",
fallbacks: ["ollama/llama3.3", "ollama/qwen2.5-coder:32b"],
},
},
},
}
高级
推理模型
�?Ollama �?/api/show 中报�?thinking 时,OpenClaw 将模型标记为支持推理�?
ollama pull deepseek-r1:32b
模型成本
Ollama 是免费且本地运行的,因此所有模型成本都设置�?$0�?
流式配置
OpenClaw �?Ollama 集成默认使用原生 Ollama API(/api/chat),它完全支持同时进行流式传输和工具调用。无需特殊配置�?
旧版 OpenAI 兼容模式
如果你需要改�?OpenAI 兼容端点(例如,在仅支持 OpenAI 格式的代理后面),请明确设置 api: "openai-completions"�?
{
models: {
providers: {
ollama: {
baseUrl: "http://ollama-host:11434/v1",
api: "openai-completions",
apiKey: "ollama-local",
models: [...]
}
}
}
}
注意:OpenAI 兼容端点可能不支持同时进行流式传输和工具调用。你可能需要在模型配置中使�?params: { streaming: false } 禁用流式传输�?
上下文窗�?
对于自动发现的模型,OpenClaw 使用 Ollama 报告的上下文窗口(如果可用),否则默认为 8192。你可以在显�?provider 配置中覆�?contextWindow �?maxTokens�?
故障排除
未检测到 Ollama
确保 Ollama 正在运行且你设置�?OLLAMA_API_KEY(或 auth profile),且你没有定义显式 models.providers.ollama 条目�?
ollama serve
并且 API 可访问:
curl http://localhost:11434/api/tags
没有可用的模�?
OpenClaw 仅自动发现报告工具支持的模型。如果你的模型未列出,要么:
- 拉取一个支持工具的模型,或
- �?
models.providers.ollama中显式定义模型�?
要添加模型:
ollama list # 查看已安装的内容
ollama pull gpt-oss:20b # 拉取支持工具的模�?
ollama pull llama3.3 # 或其他模�?
连接被拒�?
检�?Ollama 是否在正确的端口上运行:
# 检�?Ollama 是否正在运行
ps aux | grep ollama
# 或重�?Ollama
ollama serve
另请参阅
- 模型 Providers - 所�?providers 概述
- 模型选择 - 如何选择模型
- 配置 - 完整配置参�?