很多人刚把 OpenClaw 跑起来的时候,关注点都在“能不能用”。等真正开始高频使用,第二个问题马上就会冒出来:

怎么省 token,怎么省钱。

这不是抠门,而是现实。尤其你一旦开始接 Telegram、开多 agent、装 skills、做网页搜索,模型调用频率会明显上升。OpenClaw 本身很强,但强也意味着你更需要会做分层配置。

我自己的核心思路就一句话:

别让最贵的模型去干最便宜的活。

OpenClaw 在这方面其实挺有优势,因为它不是只绑定一个模型。它本来就是一个面向多 provider、多 agent、多工具协作的框架。只要你思路理顺,完全可以把“不同任务交给不同模型”这件事做得很自然。

一、先接受一个现实:不是所有问题都需要最强模型

有些任务,真的不值得上旗舰模型。

比如:

  • 把一句话润色一下
  • 提取一个列表
  • 总结 200 字短文本
  • 改一个标题
  • 判断这是不是待办事项

这些任务对推理深度要求不高,用便宜模型通常就够。

真正该上强模型的,通常是:

  • 多步骤复杂推理
  • 长上下文整合
  • 需要谨慎判断的写作或方案设计
  • 多 agent 最终汇总
  • 高风险内容审核

这一点,和 OpenClaw 的官方 sub-agents 文档思路也是一致的:重任务和重复任务,子 agent 可以用更便宜的模型,主 agent 保持更高质量的模型。

二、OpenClaw 为什么天然适合做模型分层

1)它有多 provider 思路

OpenClaw 的插件体系里,官方列出的模型 provider 很多,包括 OpenAI、Anthropic、Google、OpenRouter、Mistral 等等。也就是说,从架构上它就不是单模型思维。

2)它有多 agent 思路

你完全可以让:

  • 主 agent:用强模型
  • 子 agent:用便宜模型
  • 某些特殊任务:临时覆盖模型

这种分层在 OpenClaw 里很顺,不是硬拗出来的。

3)skills 和工具也会影响 token

官方 skills 文档专门提到 skills 列表本身就会有 token 影响。换句话说,省 token 不只是“换便宜模型”,还包括:

  • 少装没必要的 skill
  • 少给没必要的工具
  • 少让大模型背过多说明

这点很多人容易忽略。

三、我建议的新手模型分工法

为了方便理解,你可以把模型分成三档。

第一档:便宜模型

适合做:

  • 分类
  • 提取
  • 改写
  • 短内容总结
  • 子任务初稿

特点:

  • 便宜
  • 稳定性通常够用
  • 出错了也容易复核

第二档:中档模型

适合做:

  • 一般写作
  • 普通分析
  • 多段资料整合
  • 技术问答

特点:

  • 成本可控
  • 能力均衡
  • 适合当默认主力

第三档:强模型

适合做:

  • 最终决策
  • 高质量成文
  • 复杂推理
  • 多 agent 汇总
  • 高风险审核

特点:

  • 慢一点
  • 但在关键步骤值这个价

这三层不是死规则,但足够你把 80% 的成本浪费砍掉。

四、一个很实用的分配案例

假设你要让 OpenClaw 帮你完成“写一篇技术博客”的任务。

便宜模型负责:

  • 搜索结果去重
  • 提炼提纲
  • 把零散资料改成 bullet points

中档模型负责:

  • 根据提纲写出初稿
  • 把段落扩展成完整表达
  • 调整语言风格

强模型负责:

  • 审核事实有没有问题
  • 看结构是不是清楚
  • 输出最终版本

这样做的效果通常比“全程一个最强模型硬打”更划算,而且不一定更差。

因为强模型最值钱的地方,不在重复劳动,而在关键判断。

五、怎么在 OpenClaw 里落地这种思路

方法 1:主 agent 和 sub-agent 分模型

这是最推荐的。

官方文档明确提到,sub-agent 可以单独设置 model,甚至可以作为默认策略配置。换句话说,你完全可以让主 agent 保持高质量模型,而让后台研究和整理型子 agent 跑便宜模型。

这在实战里非常省。

方法 2:按 agent 角色分模型

如果你本来就用了多 agent 架构,那更简单:

  • 研究员 agent:便宜模型
  • 写手 agent:中档模型
  • 审核 agent:强模型

角色越清晰,模型分配越自然。

方法 3:减少无意义技能和上下文

这点虽然不像“换模型”那么显眼,但很关键。

如果你装了一堆当前根本不用的 skills,它们会进入系统提示或候选环境,长期下来就是隐形成本。

我现在的习惯是:

  • 当前不用的 skill 先关掉
  • 能让子 agent 单独持有的 skill,不让主 agent 全背着
  • 能短任务解决的,不做超长对话积累

这比盲目追求所谓“最强模型”更有效。

六、哪些省 token 的做法其实是错的

1)所有任务都切到最便宜模型

这会导致关键任务质量崩掉,然后你反复重试,最后更费 token。

2)什么都交给一个大模型

这看起来省配置,其实最容易烧钱。尤其当它还要负责搜索、总结、写作、审核全流程时,成本会很难看。

3)疯狂堆历史上下文

OpenClaw 会话用久了,上下文会越来越长。很多时候不是模型贵,而是你每次都在把旧内容重新喂进去。

4)工具和技能全开

很多人以为“全开最强”。实际上,越多能力意味着越重的系统提示和更多潜在调用。要学会收敛。

七、我自己的简化原则

如果你懒得做复杂规划,直接记住下面这套:

  1. 默认主力:选一个中档、稳定、便宜的模型
  2. 关键收尾:交给强模型
  3. 重复杂活:交给便宜模型或子 agent
  4. 不用的 skills 关掉
  5. 不要让一个会话无限变长

这五条做下来,基本就已经能把成本压到一个比较舒服的区间。

八、模型选择不是玄学,是任务分配

我越来越觉得,省 token 的核心不在“找到宇宙最便宜 provider”,而在于你有没有把任务分层。

OpenClaw 的好处就在这里:

  • 有 provider 体系
  • 有插件体系
  • 有 sub-agents
  • 有 skills 配置
  • 有多 agent 工作区

也就是说,它给了你足够多的杠杆。你不一定要全用,但至少你有能力做细分。

想继续看官方资料,我建议先看:

  • OpenClaw Skills 文档:https://docs.openclaw.ai/tools/skills
  • OpenClaw Sub-agents 文档:https://docs.openclaw.ai/tools/subagents
  • OpenClaw 官方 GitHub:https://github.com/openclaw/openclaw

结语

真正聪明的省 token,不是把体验砍烂,而是把高成本模型留给真正值得的步骤。

OpenClaw 非常适合这种“分层使用模型”的思路。你只要把主控、研究、初稿、审核这些环节拆开,成本和质量往往能同时兼顾。

最后也说个很现实的建议:如果你会频繁切换不同 provider、不同模型,尽量别让自己陷进一堆零散账号和不稳定线路里。我自己更愿意用 manusn.com 这种低价、稳定、对小白友好的 API 中转站来统一接入。尤其在 OpenClaw 这种会持续跑任务的场景里,线路稳、价格清楚、配置省心,长期体验真的差很多。