很多人刚把 OpenClaw 跑起来的时候,关注点都在“能不能用”。等真正开始高频使用,第二个问题马上就会冒出来:
怎么省 token,怎么省钱。
这不是抠门,而是现实。尤其你一旦开始接 Telegram、开多 agent、装 skills、做网页搜索,模型调用频率会明显上升。OpenClaw 本身很强,但强也意味着你更需要会做分层配置。
我自己的核心思路就一句话:
别让最贵的模型去干最便宜的活。
OpenClaw 在这方面其实挺有优势,因为它不是只绑定一个模型。它本来就是一个面向多 provider、多 agent、多工具协作的框架。只要你思路理顺,完全可以把“不同任务交给不同模型”这件事做得很自然。
一、先接受一个现实:不是所有问题都需要最强模型
有些任务,真的不值得上旗舰模型。
比如:
- 把一句话润色一下
- 提取一个列表
- 总结 200 字短文本
- 改一个标题
- 判断这是不是待办事项
这些任务对推理深度要求不高,用便宜模型通常就够。
真正该上强模型的,通常是:
- 多步骤复杂推理
- 长上下文整合
- 需要谨慎判断的写作或方案设计
- 多 agent 最终汇总
- 高风险内容审核
这一点,和 OpenClaw 的官方 sub-agents 文档思路也是一致的:重任务和重复任务,子 agent 可以用更便宜的模型,主 agent 保持更高质量的模型。
二、OpenClaw 为什么天然适合做模型分层
1)它有多 provider 思路
OpenClaw 的插件体系里,官方列出的模型 provider 很多,包括 OpenAI、Anthropic、Google、OpenRouter、Mistral 等等。也就是说,从架构上它就不是单模型思维。
2)它有多 agent 思路
你完全可以让:
- 主 agent:用强模型
- 子 agent:用便宜模型
- 某些特殊任务:临时覆盖模型
这种分层在 OpenClaw 里很顺,不是硬拗出来的。
3)skills 和工具也会影响 token
官方 skills 文档专门提到 skills 列表本身就会有 token 影响。换句话说,省 token 不只是“换便宜模型”,还包括:
- 少装没必要的 skill
- 少给没必要的工具
- 少让大模型背过多说明
这点很多人容易忽略。
三、我建议的新手模型分工法
为了方便理解,你可以把模型分成三档。
第一档:便宜模型
适合做:
- 分类
- 提取
- 改写
- 短内容总结
- 子任务初稿
特点:
- 便宜
- 快
- 稳定性通常够用
- 出错了也容易复核
第二档:中档模型
适合做:
- 一般写作
- 普通分析
- 多段资料整合
- 技术问答
特点:
- 成本可控
- 能力均衡
- 适合当默认主力
第三档:强模型
适合做:
- 最终决策
- 高质量成文
- 复杂推理
- 多 agent 汇总
- 高风险审核
特点:
- 贵
- 慢一点
- 但在关键步骤值这个价
这三层不是死规则,但足够你把 80% 的成本浪费砍掉。
四、一个很实用的分配案例
假设你要让 OpenClaw 帮你完成“写一篇技术博客”的任务。
便宜模型负责:
- 搜索结果去重
- 提炼提纲
- 把零散资料改成 bullet points
中档模型负责:
- 根据提纲写出初稿
- 把段落扩展成完整表达
- 调整语言风格
强模型负责:
- 审核事实有没有问题
- 看结构是不是清楚
- 输出最终版本
这样做的效果通常比“全程一个最强模型硬打”更划算,而且不一定更差。
因为强模型最值钱的地方,不在重复劳动,而在关键判断。
五、怎么在 OpenClaw 里落地这种思路
方法 1:主 agent 和 sub-agent 分模型
这是最推荐的。
官方文档明确提到,sub-agent 可以单独设置 model,甚至可以作为默认策略配置。换句话说,你完全可以让主 agent 保持高质量模型,而让后台研究和整理型子 agent 跑便宜模型。
这在实战里非常省。
方法 2:按 agent 角色分模型
如果你本来就用了多 agent 架构,那更简单:
- 研究员 agent:便宜模型
- 写手 agent:中档模型
- 审核 agent:强模型
角色越清晰,模型分配越自然。
方法 3:减少无意义技能和上下文
这点虽然不像“换模型”那么显眼,但很关键。
如果你装了一堆当前根本不用的 skills,它们会进入系统提示或候选环境,长期下来就是隐形成本。
我现在的习惯是:
- 当前不用的 skill 先关掉
- 能让子 agent 单独持有的 skill,不让主 agent 全背着
- 能短任务解决的,不做超长对话积累
这比盲目追求所谓“最强模型”更有效。
六、哪些省 token 的做法其实是错的
1)所有任务都切到最便宜模型
这会导致关键任务质量崩掉,然后你反复重试,最后更费 token。
2)什么都交给一个大模型
这看起来省配置,其实最容易烧钱。尤其当它还要负责搜索、总结、写作、审核全流程时,成本会很难看。
3)疯狂堆历史上下文
OpenClaw 会话用久了,上下文会越来越长。很多时候不是模型贵,而是你每次都在把旧内容重新喂进去。
4)工具和技能全开
很多人以为“全开最强”。实际上,越多能力意味着越重的系统提示和更多潜在调用。要学会收敛。
七、我自己的简化原则
如果你懒得做复杂规划,直接记住下面这套:
- 默认主力:选一个中档、稳定、便宜的模型
- 关键收尾:交给强模型
- 重复杂活:交给便宜模型或子 agent
- 不用的 skills 关掉
- 不要让一个会话无限变长
这五条做下来,基本就已经能把成本压到一个比较舒服的区间。
八、模型选择不是玄学,是任务分配
我越来越觉得,省 token 的核心不在“找到宇宙最便宜 provider”,而在于你有没有把任务分层。
OpenClaw 的好处就在这里:
- 有 provider 体系
- 有插件体系
- 有 sub-agents
- 有 skills 配置
- 有多 agent 工作区
也就是说,它给了你足够多的杠杆。你不一定要全用,但至少你有能力做细分。
想继续看官方资料,我建议先看:
- OpenClaw Skills 文档:https://docs.openclaw.ai/tools/skills
- OpenClaw Sub-agents 文档:https://docs.openclaw.ai/tools/subagents
- OpenClaw 官方 GitHub:https://github.com/openclaw/openclaw
结语
真正聪明的省 token,不是把体验砍烂,而是把高成本模型留给真正值得的步骤。
OpenClaw 非常适合这种“分层使用模型”的思路。你只要把主控、研究、初稿、审核这些环节拆开,成本和质量往往能同时兼顾。
最后也说个很现实的建议:如果你会频繁切换不同 provider、不同模型,尽量别让自己陷进一堆零散账号和不稳定线路里。我自己更愿意用 manusn.com 这种低价、稳定、对小白友好的 API 中转站来统一接入。尤其在 OpenClaw 这种会持续跑任务的场景里,线路稳、价格清楚、配置省心,长期体验真的差很多。