周鸿祎戳破“AI包月”幻觉:智力成本守恒,Token永远无法走流量老路

4 天前
6 阅读

近期,关于AI大模型“流量包月”的讨论再度升温,但360创始人周鸿祎给出了一个冷静的判断:这完全是基于错误认知的幻觉。他强调,Token作为AI世界的“度量衡”,其背后的算力与智力消耗成本是刚性的,这决定了AI服务无法重走互联网流量“管道化”和“包月不限量”的老路。

认知错位:把AI当成“信息管道”

很多用户习惯性地将AI比作手机流量或宽带,认为技术进步最终会把成本打下来,实现“几十块钱包月随便用”。这种期待源于过去二十年互联网商业模式的惯性思维。

然而,周鸿祎指出,这是一种典型的概念混淆:

  • 流量(Traffic):本质是数据的传输,是“搬运”已有的比特,成本极低,边际效应递减明显。
  • Token:本质是计算(Compute),是模型进行推理、生成全新智力结果的过程。

每一次Token的生成,都需要消耗GPU的算力资源和电力能源。这并非简单的数据传输,而是实打实的“智力生产”过程。把忙碌的CLEIU比作工厂,把Token比作工厂生产出来的产品,更贴切,而不是仅仅作为运输货物的管道。

核心逻辑:智力成本守恒定律

周鸿祎提出的核心观点是“智力成本守恒”。这意味着,获得高质量、高逻辑性、高推理能力的答案,代价是无法趋近于零的。

周鸿祎戳破“AI包月”幻觉:智力成本守恒,Token永远无法走流量老路

1. Token单价的刚性

Token的单价虽然会随着模型优化和硬件升级而下降,但不可能降至为零,也不可能降至像流量费那样以“GB”计费的低廉程度。

2. 模型能力的代价

如果用户需要大模型完成复杂的编程、深度的报告撰写或长链路的逻辑推理,消耗的Token数量巨大。这与简单的闲聊(Few-shot)有着本质的成本差异。目前的AI服务商普遍采用输入/输出Token分开计费的模式,正是这一客观规律的体现。

3. 定价悖论

任何宣称“不限量包月”的服务商,要么在偷偷降智(降低模型参数和推理深度),要么在用户触及一定限额后限制使用,要么就是面临着无法持续的巨额亏损。真正的“昂贵智力”无法通过廉价的“流量模式”来覆盖成本。

商业模式的分野:从广告到订阅制

既然无法走“流量变现”的老路,AI的商业模式必然发生根本性转变。

  • 传统互联网模式:用户免费使用(消耗流量),平台通过广告、电商等增值服务获利。核心是“羊毛出在猪身上”。
  • AI时代模式:由于底层是Token成本,直接收费(SaaS订阅、按量付费)成为主流。

周鸿祎认为,AI的存在形式更像是“造人”而非“修路”。培养一个聪明的员工(AI Agent)需要支付工资(Token费用),这不能通过看广告来抵消。因此,未来AI服务商的竞争,将是在单位Token成本下提供更高智力密度,而不是单纯比拼谁的价格更低、甚至谁敢承诺“不限量”。

技术路线与用户体验的修正

为了缓解成本压力,行业正在通过技术手段寻找平衡,这也影响了用户的体验预期:

  1. 以快打慢(RAG技术):通过检索增强生成技术,让模型只读取必要的资料再作答,减少上下文长度,从而大幅降低Token消耗。
  2. 以慢打快(慢思考模型):类似DeepSeek-R1或OpenAI的o1模型,通过增加推理时间的投入(背对 token 的计算),换取更高的准确率和解决问题的能力,前提是用户愿意为这“更长的思考”支付更多费用。
  3. 端云协同:将简单的任务放在端侧模型运行,复杂的任务才调用云端大模型,通过分层服务来管理整体的算力成本。

总结

周鸿祎的“戳破”,本质上是回归商业与物理常识。AI是智力的延伸,而智力在当前技术阶段依然是稀缺且昂贵的资源。认清“Token不是流量”这一事实,不仅能让用户合理预期服务价值,也能逼迫行业在提升模型效率、寻找可持续盈利模式上做出真正的创新。AI的未来不在“无限畅玩”的泡沫里,而在“好钢用在刀刃上”的精准计算中。