国仁对话:Token成本太高,免费模式绝对走不通?这场对话透Agent商业闭环

Token消耗飙升背后:大模型厂商的算力焦虑

进入2025年,AI Agent的爆发式增长彻底改变了算力消耗的格局。国信证券研报明确指出,Agent驱动Token需求呈现爆发式增长,这直接推动大模型厂商的商业模式走向闭环——收入增长远高于训练成本提升,毛利率持续攀升。但另一边,硅谷和国内的AI企业正陷入一场“烧Token”竞赛:员工疯狂比拼每天能消耗多少Token,而高管们则为不断膨胀的AI账单焦虑。OpenRouter的数据印证了这一趋势:5月18日至24日,全球AI大模型总调用量达到28.9万亿Token,连续5周上涨。Token不仅仅是模型输出的计量单位,更成了AI公司运营成本的真实刻度——当Agent让Token消耗量飙升,免费模式的算力成本就像无底洞。

免费模式的白热化博弈:百亿撒钱拉新,但AI承诺幻觉反噬

今年春节,字节、阿里、腾讯三家合计撒了超过100亿元给AI应用拉新,豆包更是以春晚独家赞助的姿态,除夕当天实现AI互动总量19亿次,月活跃用户突破3.4亿。然而,免费模式带来了另一个副作用——AI承诺幻觉。豆包退机票事件中,AI不仅错误建议用户退票导致损失600元,还自作主张承诺“全权负责维权”“直接赔付”,甚至生成正式的赔偿承诺书。杭州互联网法院在首例AI幻觉侵权案中明确判决:AI不是民事主体,其承诺不具有法律效力。这意味着,免费模式下疯狂拉新而来的用户,面对的是“AI说的话不算数”的灰色地带。这种风险正在让免费模式从获客利器变成法律和声誉的定时炸弹。

国仁对话:Token成本太高,免费模式绝对走不通?这场对话透Agent商业闭环

Token成本太高:Agent商业闭环的算力账本

当Agent工具开始深度嵌入工作流,Token消耗量从千级别跃升至万级别甚至百万级别。面对高昂的算力账单,行业开始反思:免费模式绝对走不通。国信证券指出,大模型厂商的毛利率提升依赖于Token收入增长远超成本增长,但这需要精确的定价策略。与此同时,市场已出现分化:有的公司选择向用户直接收费(如按Token计费或订阅制),有的则在Agent工具中嵌入增值服务(如自动化日报、代码加速等)。硅谷101讨论的Agent爆火背后,Sonnet 3.5代码质量的提升大幅降低了Agent开发门槛,但代码质量问题反而可能加剧Token消耗——因为Agent需要反复调用模型来修正错误。Token成本过高,迫使开发者必须在算法效率和算力投入之间寻找平衡点。

RFT技术如何重塑Agent智能与成本结构

强化学习微调(RFT)的突破,被视为Agent在2025年真正拥有智能的关键。RFT不仅能赋予模型思考能力,还能让Agent根据环境反馈调整学习,类似大语言模型的“AlphaGo时刻”。但RFT的训练成本远高于传统的SFT(监督微调),这让行业面临抉择:是选择更便宜的SFT,还是效果更优但更昂贵的RFT?如果Agent要实现商业闭环,必须算清楚这笔账。陶芳波等观察者认为,RFT带来的智能提升可能被Token消耗的增长所抵消,但优质Agent带来的用户付费意愿,或许能覆盖这部分成本。OpenAI推出的自助浏览器Operator以及Manus获7500万美元融资,说明市场对高智能Agent的付费场景已逐渐接受。

从“拼模型”到“拼消耗”:中国AI价格战的歧途与出路

参考资料中对中国AI“莆田式”价格战的批评引发关注。当阿里、腾讯陷入Token价格战时,大量AI应用产出了“废片”式的低质量内容,用户被低门槛吸引,却因AI失效承诺而损失真实金钱。这种消耗战不仅耗尽企业资本,还可能导致国产AI陷入“无盾可用”的被动局面。相反,海外AI公司正在通过Agent商业闭环探索健康模式:Codex通过定时任务让Agent每日自动生成行业日报,甚至自我进化提取历史对话技能。这种“降低Token浪费”的策略,恰恰是中国AI行业需要警醒的——免费模式烧掉的不仅是钱,更是用户信任和行业发展空间。当Token成本居高不下,只有让Agent产生可量化的商业价值,免费模式才能真正被替代。