不能只算token账

背景:Token账的局限性

AI行业初期关注的是模型能力的衡量标准,例如Benchmark分数,而现在“烧不烧Token”成了更常见的问题。Token作为AI模型调用的计费单位,表面上可以体现成本和效率,但单纯依赖Token数量来评估商业模式存在局限性。

  • Token成本看似透明,但背后是算力、电力和基础设施的支出。
  • 模型调用的费用不仅取决于Token数量,还与任务复杂度、上下文长度、调用频率等因素密切相关。
  • 过度关注Token账容易忽略AI产品在实际应用中的整体价值,比如提升效率、减少人工错误、优化用户体验等。

详情:模型即产品,但不只是Token产品

AI行业曾流行“模型即产品”的理念,强调基础模型的强大能力。然而,随着产品落地,人们开始意识到模型只是产品的一部分,真正的价值在于它如何与产品深度整合。

两种不同处境

  1. 如小米的生态型AI公司:MiMo不仅作为API对外提供,还深度融入小米生态,包括小爱同学、智能手机、小米汽车和IoT设备。这种整合方式让模型即便不对外售卖Token,也能在内部产生巨大价值。
  2. 如智谱、MiniMax、月之暗面的独立模型公司:它们的产品更多依赖API和外部客户,缺乏成熟的终端产品分发渠道,导致在市场竞争中面临挑战。

龙虾范式的效率问题

龙虾(Llama)为代表的AI产品,采用了“模型作为通用API”的第一代范式。这种模式虽然降低了创业门槛,但也带来了以下问题:

  • 每次调用工具时都携带完整的上下文,造成多次API请求。
  • 成本高昂且效率低下,用户操作可能触发十几轮API调用。
  • 推理延迟和稳定性问题影响用户体验,形成恶性循环。

影响:从“Token消耗”到“智能调度”

随着AI进入企业真实工作流,Token不再只是模型调用的计费单位,而逐渐成为企业内部的“智能预算”指标,类似于云资源和电力配额。

不能只算token账

Token作为生产要素

  • 黄仁勋认为,未来工程师会拥有“年度Token预算”,意味着Token会成为企业内部效率评估和资源配置的工具。
  • 模型调用不再只是“一次请求一个回答”,而是持续的智能调度和效率提升。

杰文斯悖论与AI

  • 技术越高效,资源消耗反而可能越多。模型推理成本降低,企业会把更多任务交给AI。
  • Token单价下降不等于利润上升,总量使用增加可能导致亏损扩大。

分层定价:Token的“值钱程度”由应用场景决定

模型公司开始意识到,不同行业对Token的价值认知不同,因此分层定价成为必然选择。

定价策略的变化

Token用途 定价层级 价值表现
闲聊、摘要 低价 替代轻量级人工交互
客服、代码辅助 中价 替代标准流程岗位
医疗、金融、法律 高价 替代高技能人工决策
  • 企业客户采购AI服务时,越来越看重ROI(投资回报率)和成本替代。
  • 如果AI不能明确帮助企业节省成本或提升效率,企业将停止投入。

案例:Klarna的AI客服

  • AI助手上线首月处理了230万次对话,相当于700个全职客服。
  • 企业预计利润改善4000万美元。
  • 这种可量化节省让Token成为企业预算中的“效率单位”而非“消耗单位”。

未来趋势:深度整合与智能上限

Token效率不仅关乎成本,更关乎模型智能的上限。

智能上限的定义

  • 模型能否在有限的Token预算下,完成更高阶的任务?
  • Token效率越高,意味着在同样的资源约束下,模型能学到更多、推理更准。

第二代AI范式

  • 第一代:模型作为API,产品套在模型外面。
  • 第二代:模型与产品共同设计,形成深度整合。
    • 模型成为产品的一部分,而非独立服务。
    • 产品理解模型的边界,模型适配产品的需求。

企业入口与流程重塑

  • 模型公司的最终竞争力,不只在于模型强弱,而在于是否掌握了企业入口、降低了接入难度。
  • 能在企业原有流程中稳定运行的AI,才是真正的商业成功者。
  • 模型要证明自己能减少真实存在的交易成本,比如沟通、交接、确认、返工等环节。

结论:Token账之外,更要看产品账和生态账

AI模型的商业化不能只盯着Token账,而要综合考虑产品整合、生态协同和企业流程重塑。

  • OpenAI、Anthropic等公司虽融资强劲,但盈利压力巨大。
  • 小米、华为等拥有完整生态的厂商,可能更早实现AI的商业闭环。
  • 未来的赢家,是那些能把Token效率与产品价值统一起来,能帮企业真正省钱、提效的公司。