周鸿祎戳破“AI包月”幻觉：智力成本守恒，Token永远无法走流量老路

3 个月前

AI资讯

53 阅读

AI 商业模式周鸿祎

近期，关于AI大模型“流量包月”的讨论再度升温，但360创始人周鸿祎给出了一个冷静的判断：这完全是基于错误认知的幻觉。他强调，Token作为AI世界的“度量衡”，其背后的算力与智力消耗成本是刚性的，这决定了AI服务无法重走互联网流量“管道化”和“包月不限量”的老路。

认知错位：把AI当成“信息管道”

很多用户习惯性地将AI比作手机流量或宽带，认为技术进步最终会把成本打下来，实现“几十块钱包月随便用”。这种期待源于过去二十年互联网商业模式的惯性思维。

然而，周鸿祎指出，这是一种典型的概念混淆：

流量（Traffic）：本质是数据的传输，是“搬运”已有的比特，成本极低，边际效应递减明显。
Token：本质是计算（Compute），是模型进行推理、生成全新智力结果的过程。

每一次Token的生成，都需要消耗GPU的算力资源和电力能源。这并非简单的数据传输，而是实打实的“智力生产”过程。把忙碌的CLEIU比作工厂，把Token比作工厂生产出来的产品，更贴切，而不是仅仅作为运输货物的管道。

核心逻辑：智力成本守恒定律

周鸿祎提出的核心观点是“智力成本守恒”。这意味着，获得高质量、高逻辑性、高推理能力的答案，代价是无法趋近于零的。

周鸿祎戳破“AI包月”幻觉：智力成本守恒，Token永远无法走流量老路

1. Token单价的刚性

Token的单价虽然会随着模型优化和硬件升级而下降，但不可能降至为零，也不可能降至像流量费那样以“GB”计费的低廉程度。

2. 模型能力的代价

如果用户需要大模型完成复杂的编程、深度的报告撰写或长链路的逻辑推理，消耗的Token数量巨大。这与简单的闲聊（Few-shot）有着本质的成本差异。目前的AI服务商普遍采用输入/输出Token分开计费的模式，正是这一客观规律的体现。

3. 定价悖论

任何宣称“不限量包月”的服务商，要么在偷偷降智（降低模型参数和推理深度），要么在用户触及一定限额后限制使用，要么就是面临着无法持续的巨额亏损。真正的“昂贵智力”无法通过廉价的“流量模式”来覆盖成本。

商业模式的分野：从广告到订阅制

既然无法走“流量变现”的老路，AI的商业模式必然发生根本性转变。

传统互联网模式：用户免费使用（消耗流量），平台通过广告、电商等增值服务获利。核心是“羊毛出在猪身上”。
AI时代模式：由于底层是Token成本，直接收费（SaaS订阅、按量付费）成为主流。

周鸿祎认为，AI的存在形式更像是“造人”而非“修路”。培养一个聪明的员工（AI Agent）需要支付工资（Token费用），这不能通过看广告来抵消。因此，未来AI服务商的竞争，将是在单位Token成本下提供更高智力密度，而不是单纯比拼谁的价格更低、甚至谁敢承诺“不限量”。

技术路线与用户体验的修正

为了缓解成本压力，行业正在通过技术手段寻找平衡，这也影响了用户的体验预期：

以快打慢（RAG技术）：通过检索增强生成技术，让模型只读取必要的资料再作答，减少上下文长度，从而大幅降低Token消耗。
以慢打快（慢思考模型）：类似DeepSeek-R1或OpenAI的o1模型，通过增加推理时间的投入（背对 token 的计算），换取更高的准确率和解决问题的能力，前提是用户愿意为这“更长的思考”支付更多费用。
端云协同：将简单的任务放在端侧模型运行，复杂的任务才调用云端大模型，通过分层服务来管理整体的算力成本。

总结

周鸿祎的“戳破”，本质上是回归商业与物理常识。AI是智力的延伸，而智力在当前技术阶段依然是稀缺且昂贵的资源。认清“Token不是流量”这一事实，不仅能让用户合理预期服务价值，也能逼迫行业在提升模型效率、寻找可持续盈利模式上做出真正的创新。AI的未来不在“无限畅玩”的泡沫里，而在“好钢用在刀刃上”的精准计算中。

周鸿祎戳破“AI包月”幻觉：智力成本守恒，Token永远无法走流量老路

认知错位：把AI当成“信息管道”

核心逻辑：智力成本守恒定律

1. Token单价的刚性

2. 模型能力的代价

3. 定价悖论

商业模式的分野：从广告到订阅制

技术路线与用户体验的修正

总结

链接失效反馈