烧不起了,Meta喊停Token消耗战
数十亿美元的“内耗”:Meta内部AI账单惊人
据内部备忘录披露,Meta向约6000名员工发出警告:预计2026年仅用于“内部AI使用”的开支就将达到数十亿美元。这一数字涵盖了研发、测试、内部工具调用及模型推理等各个环节,相当于每年烧掉一个中型科技公司的全年营收。高额成本主要来自大规模语言模型在处理代码生成、内部搜索、文档摘要等任务时,产生的海量Token消耗。此前,员工可以无限制调用AI资源,导致算力需求呈指数级增长。

内部AI使用失控:从效率利器到成本黑洞
在内部,Meta的AI工具原本旨在提升开发效率和协作流畅度,但实际使用中却出现了明显的滥用迹象。员工将AI用于日常查询、生成大量无关内容甚至娱乐用途,使得每次会话动辄消耗数百万Token。一位内部人士透露,仅2025年第二季度,内部AI推理集群的利用率就飙升了300%,而其中近40%的请求与核心业务流程无关。这种“无限制”的使用模式,让原本用于训练下一代模型和对外服务的算力资源被严重挤占,导致研发预算大幅超支。
2027年新政:预算配额制“断腕”求生
为遏制支出,Meta决定在2027年正式推行以预算和配额为核心的管理制度。具体措施包括:
- 各部门将获得固定的月度或季度AI使用预算,超出部分需额外申请审批。
- 对每位员工的Token消耗设置每日/每周上限,超出后自动降权或限制调用等级更高的模型。
- 优先保障核心产品与基础研究部门的AI资源,对非关键用途实施灰度限制。
这一变革实质上叫停了此前“先消耗后结算”的自由模式,倒逼员工和团队精打细算,将Token花在刀刃上。
员工面临“AI配给制”:效率与成本的再平衡
新制度预计将直接影响约6000名与AI开发、应用相关的员工。他们需要重新评估工作流中的AI使用习惯——例如,从频繁使用大型模型(如Llama 405B)转向更小、更便宜的变体;合并少量多次的查询以降低请求次数;甚至暂时搁置某些实验性项目。虽然Meta强调“不会降低研发效率”,但短期内,员工可能抱怨AI响应变慢、模型能力降级或需要手动排队等待审批。对于习惯“无限API”的工程师文化而言,这不啻为一场痛苦的适应。
行业风向:科技巨头集体从“烧钱”转向“节流”
Meta的举措并非孤立事件。近年来,随着大模型训练和推理成本居高不下,谷歌、微软等公司也开始收紧内部AI使用权限,并推行类似的资源计量与配额策略。这标志着行业正从早期的“暴力堆算力”阶段,进入“精细化运营”阶段。可以预见,未来更多企业将效仿Meta,通过内部记账、成本责任制和配额管理,在保持AI创新活力的同时,遏制失控的Token消耗。对AI产业链而言,这也意味着面向企业的算力优化工具、资源管理平台和低成本推理解决方案将迎来爆发机遇。