Claude Code 五大失败模式 + 成本失控自救:一张避坑总图

前六课教你把 AI 用强;这一课教你别被它反噬——五个最贵的失败模式,和一份把账单砍下来的自救清单。这最后一篇,把整个系列踩过的坑汇成一张图:五大失败模式,以及一份成本失控自救手册。你会发现,每个坑都对应着前面某一课的正解——这张图,也是整个系列的索引。

失败模式一:一上来就让它写

最常见的坑:不探索、不计划,一句话就让它开干。结果是在错误的地基上盖楼,越快越糟。正解:先探索、再计划、再编码(见 EP1)。

它写得风格统一、注释齐全,你看一眼觉得没问题就合了——直到生产出事。正解:给它装上验证闭环,让机器判定对错,而不是肉眼审(见 EP2)。

要么把整个库塞给它(贵、慢、迷失),要么什么背景都不给(它只能猜)。正解:上下文工程——喂对、压缩、隔离、沉淀(见 EP3)。

看到能并行就开一堆会话,结果在几个窗口间疲于奔命,反而更慢。正解:先判断任务是否真独立,并行是工具不是目的(见 EP5)。

不管 token 怎么花,一个项目烧掉几百刀才回过神。正解:把上下文和模型用量管起来(下一节展开)。

五大失败模式各对应前面一课的正解——这张对照表,收了最常见的几种失败模式:踩坑了,回到那一课。

社区里「烧了 500 刀」和「穷鬼套餐」其实是同一枚硬币的两面。把账单降下来,有几招实在的:

看清 token 去哪了:每轮输入 ≈ 当前上下文大小。账单贵,八成是上下文臃肿(回到 EP3)。
上下文瘦身:别塞整个库,及时压缩长会话——这是最大的一笔省。
模型分层:你手动按任务难度选模型——架构、难调试用最强的,改文案、跑格式用便宜或本地的,别一律上最贵的。
提示缓存:稳定不变的前缀(系统提示、CLAUDE.md、长文档)走缓存,命中后这部分按约一折计费(读缓存 ≈ 10% 输入价)——前提是前缀真的稳定;频繁变动反而要付写缓存的溢价(5 分钟 TTL 1.25×、1 小时 2× 输入价)。
平替路由:在工具层把非关键调用(分类、摘要、lint 解释)自动路由到便宜模型,不用每次手动切;但别为省小钱牺牲主力任务质量——那是更贵的返工。

一句话:省钱不是用更便宜的模型,是别浪费上下文、别用错模型层级。

回头看这七课——计划、验证、上下文、工作台、舰队、沟通、避坑——它们其实是一条线:把 AI 的能力一步步放大,同时把你对它的掌控一步步补齐。能力 × 掌控,才等于真正的产能。做到了,你就真的能一个人活成一个团队——这正是这个系列开头(EP0)许下的承诺。

而这,只是开始。把 AI 用顺之后,下一个问题是:怎么把 AI 装进你自己的产品——让你的用户也用上 AI 的能力。那是另一段旅程了。