多Agent 狂吞token,Claude 顶不住了:一人月烧15万美元,免费AI正在退场

随着AI应用场景的深化,特别是多智能体(Multi-Agent)系统的普及,Token消耗呈指数级增长,直接导致AI服务成本结构崩塌。Anthropic等头部厂商已因用户过度使用被迫调整订阅限制,Google也通过强硬策略迫使用户转向API付费。这预示着AI行业正从依赖高额补贴的“免费模式”向精细化的按用量计费模式转型,同时伴生着严重的系统稳定性风险与数据资产争夺战。

算力成本失控:从“单次对话”到“全天候运行”的质变

当前AI应用的形态已发生根本性转变,不再是简单的“一问一答”。用户将整个代码库纳入上下文、调用工具、执行多步操作,甚至全天候运行AI编程助手。这种变化直接导致了Token消耗的爆炸式增长。

  • 消耗量激增十倍:与2023年相比,单个问题生成的Token数量至少增加了十倍。虽然单个Token价格在下降,但单次Prompt带来的总成本涨幅已经抵消甚至超过了降价的红利。
  • 极端个人成本:Hyperbolic联创Yuchen Jin指出,大厂和初创公司的资深员工每天在Claude Code或Codex上的花费超过1000美元,年化高达36.5万美元。他感叹:“我们距离企业在大模型token上的支出超过人力员工成本的时代,已经不远了。”
  • 补贴模式难以为继:过去依靠“近乎免费”或“无限试用”吸引用户的策略正在收缩。对于那些全天候运行Claude的高级用户,Anthropic承认其消耗的资源远超正常水平,这使得原本包含在订阅费中的算力成本变得不可控。

Anthropic的应对:强制限流与订阅策略调整

面对激增的使用需求和高昂的运营成本,Anthropic被迫采取了强硬的限制措施,这直接打破了用户对“付费即无限”的预期。

多Agent 狂吞token,Claude 顶不住了:一人月烧15万美元,免费AI正在退场

  • 调整会话限制:Anthropic技术成员Thariq Shihipar发文称,为应对需求,正在调整免费版、Pro和Max订阅在高峰时段的“5小时会话限制”。虽然声称周限额不变,但这实际上限制了用户的连续使用能力。
  • 受影响的用户群体:大约7%的用户会撞上此前不会遇到的限流,其中Pro档用户受影响最明显。官方建议用户将后台高Token消耗任务挪到非高峰时段,这实际上将成本压力转嫁给了用户的时间安排。
  • 双重商业模式的博弈:Anthropic目前通过API和订阅服务两种形式销售AI服务。随着订阅用户消耗激增,API模式(按量付费)的商业合理性被再次印证,迫使厂商重新平衡两者关系,甚至通过限制订阅版来倒逼重度用户转向API。

高昂成本下的副作用:系统稳定性与工程风险

在成本飙升的同时,为了抢占市场而快速迭代的AI产品也暴露出了严重的稳定性问题和工程缺陷,给用户带来了额外的隐形成本。

  • 致命的代码缺陷:Claude Code近期被曝出高危漏洞:在特定异常下,插件后台刷新机制会误触git reset --hard origin/main指令,每10分钟执行一次,导致用户未提交的本地代码改动全部丢失。这对于依赖AI进行开发的工程师来说是毁灭性的。
  • 频繁的服务器宕机:仅在三月份,Claude服务器就至少宕机五次。对于按秒计费或正在执行关键任务的用户来说,服务的不可用性直接转化为经济损失。
  • AI代码的隐患:Claude Code本身是一款“100% AI代码构成的产品”,Github上提交的问题一直没断过。这揭示了一个悖论:AI生成的代码虽然提高了效率,但其自身的维护和稳定性却成了新的成本黑洞。

巨头的博弈:Google的“失控”补贴与OpenAI的路线差异

在这场成本危机中,不同巨头的应对策略揭示了他们对商业模式的不同理解,其中Google的做法尤为激进且备受争议。

  • Google的强硬驱赶:Google曾在免费路线上极为激进,试图通过“足够好、足够便宜”夺回流量入口。然而,其最新推出的Gemini CLI暴露了真实意图。官方直接告知用户,若想掌控配额与计费,请使用付费API key。这意味着Google会缩减付费订阅内的可用额度,强制重度用户另买API,这种“驱赶”策略极其强硬。
  • 内部资源混乱:Google的困境不仅在于补贴,更在于组织失控。内部各团队争抢GPU资源,开发者工具团队甚至无法说服公司优先开放模型给自家产品,免费用户的需求优先级反而更高,导致资源分配低效。
  • OpenAI与Anthropic的差异:同样是补贴,两者路线不同。有用户指出,自己虽然保留了每月200美元的订阅,但主要使用Cursor和Codex CLI,Claude实际使用量不高,等于间接补贴了其他重度用户。这种“交叉补贴”在商业上更隐蔽,但也难以持久。

数据即资产:免费模式背后的“隐形交易”

当“免费算力”不再成立,行业内关于数据资产的争夺战也浮出水面。如果一家公司愿意免费提供AI推理服务,其背后必然有着更强的商业动机。

  • 数据的价值:真实用户数据是AI时代最重要的资产之一。外界一直传闻有中间层服务试图截取输入输出数据,用于训练自家模型。虽然无法公开验证,但逻辑是一致的:用较弱模型生成的数据来微调新模型,成本远低于从头训练。
  • 免费的代价:世界上不存在免费的午餐。如果厂商补贴算力,要么是为了收集数据,要么是为了广告盈利,要么是为了转化潜在客户。随着成本激增,这种隐形交易的平衡正在被打破。
  • 计费模式的演变:过去关于“按消息数收费还是按实际用量收费”的争议越来越多(如Cursor的计费变更引发的用户愤怒),本质上是因为用户终于意识到,一条消息背后是一整套复杂的成本系统。未来的计费模式必将更加透明且昂贵,“免费AI”的退场已成定局。