烧不起了，Meta喊停Token消耗战

7 天前

AI资讯

25 阅读

Meta AI成本 Token消耗内部使用

数十亿美元的“内耗”：Meta内部AI账单惊人

据内部备忘录披露，Meta向约6000名员工发出警告：预计2026年仅用于“内部AI使用”的开支就将达到数十亿美元。这一数字涵盖了研发、测试、内部工具调用及模型推理等各个环节，相当于每年烧掉一个中型科技公司的全年营收。高额成本主要来自大规模语言模型在处理代码生成、内部搜索、文档摘要等任务时，产生的海量Token消耗。此前，员工可以无限制调用AI资源，导致算力需求呈指数级增长。

烧不起了，Meta喊停Token消耗战

内部AI使用失控：从效率利器到成本黑洞

在内部，Meta的AI工具原本旨在提升开发效率和协作流畅度，但实际使用中却出现了明显的滥用迹象。员工将AI用于日常查询、生成大量无关内容甚至娱乐用途，使得每次会话动辄消耗数百万Token。一位内部人士透露，仅2025年第二季度，内部AI推理集群的利用率就飙升了300%，而其中近40%的请求与核心业务流程无关。这种“无限制”的使用模式，让原本用于训练下一代模型和对外服务的算力资源被严重挤占，导致研发预算大幅超支。

2027年新政：预算配额制“断腕”求生

为遏制支出，Meta决定在2027年正式推行以预算和配额为核心的管理制度。具体措施包括：

各部门将获得固定的月度或季度AI使用预算，超出部分需额外申请审批。
对每位员工的Token消耗设置每日/每周上限，超出后自动降权或限制调用等级更高的模型。
优先保障核心产品与基础研究部门的AI资源，对非关键用途实施灰度限制。
这一变革实质上叫停了此前“先消耗后结算”的自由模式，倒逼员工和团队精打细算，将Token花在刀刃上。

员工面临“AI配给制”：效率与成本的再平衡

新制度预计将直接影响约6000名与AI开发、应用相关的员工。他们需要重新评估工作流中的AI使用习惯——例如，从频繁使用大型模型（如Llama 405B）转向更小、更便宜的变体；合并少量多次的查询以降低请求次数；甚至暂时搁置某些实验性项目。虽然Meta强调“不会降低研发效率”，但短期内，员工可能抱怨AI响应变慢、模型能力降级或需要手动排队等待审批。对于习惯“无限API”的工程师文化而言，这不啻为一场痛苦的适应。

行业风向：科技巨头集体从“烧钱”转向“节流”

Meta的举措并非孤立事件。近年来，随着大模型训练和推理成本居高不下，谷歌、微软等公司也开始收紧内部AI使用权限，并推行类似的资源计量与配额策略。这标志着行业正从早期的“暴力堆算力”阶段，进入“精细化运营”阶段。可以预见，未来更多企业将效仿Meta，通过内部记账、成本责任制和配额管理，在保持AI创新活力的同时，遏制失控的Token消耗。对AI产业链而言，这也意味着面向企业的算力优化工具、资源管理平台和低成本推理解决方案将迎来爆发机遇。

烧不起了，Meta喊停Token消耗战

数十亿美元的“内耗”：Meta内部AI账单惊人

内部AI使用失控：从效率利器到成本黑洞

2027年新政：预算配额制“断腕”求生

员工面临“AI配给制”：效率与成本的再平衡

行业风向：科技巨头集体从“烧钱”转向“节流”

链接失效反馈