大厂Token不再“管够”：腾讯开始限额，字节可部分报销

1 小时前

AI资讯

0 阅读

腾讯字节跳动 ai成本控制 Token限额

腾讯率先设限：Token额度不再“无限畅饮”

在AI应用快速普及的浪潮中，腾讯成为国内首家明确对员工Token使用进行限额的大厂。据内部消息，腾讯已为不同部门和岗位设定了每月Token消耗的硬性上限，超出部分需审批或由部门预算承担。这一举措改变了此前“按需取用、无成本约束”的宽松局面，直接向员工传递了“AI资源有价、使用需精打细算”的信号。部分研发团队反映，高负载的模型调用场景（如代码生成、大模型连续对话）已受到明显影响，不得不开始优化提示词调用次数或改用更轻量的模型。

字节另辟蹊径：员工自费后获部分报销

与腾讯的“直接设限”不同，字节跳动采用了更柔性的成本分摊机制。字节允许员工在个人账户中自行承担AI Token费用，同时开放了一条“部分报销”通道——员工提交合规的报销申请后，公司可按比例返还自费金额。这种模式既保留了员工使用AI工具的灵活性，又通过经济杠杆引导员工理性消费。据内部员工透露，报销比例通常根据场景重要性（如开发调试、日常办公）浮动，热门大模型API的调用频次在报销政策落地后明显下降，部分非刚需场景的调用量甚至腰斩。

大厂Token不再“管够”：腾讯开始限额，字节可部分报销

成本压力下的必然选择：大厂算起了AI账单

两大厂的动作背后是日益沉重的AI基础设施支出。随着大模型从实验室走向业务一线，员工每天动辄数百万次的Token调用正在快速侵蚀企业利润。据行业估算，单个拥有1000名研发人员的团队，若全员高频使用GPT-4级别模型，月均Token成本可达数百万元。此前不少大厂为抢占AI应用先机，对内部Token消耗采取“兜底”策略，如今随着投资回报率（ROI）考核压力增大，CFO们开始要求技术部门将Token视为“真金白银”的硬成本。腾讯与字节的举措并非孤例，阿里、百度等企业也已在内测类似额度管理制度，一场围绕AI资源精细化管理的内卷正在上演。

员工体验分化：有人抱怨“不够用”，有人学会“省着用”

额度管控直接影响了普通员工的AI使用习惯。在腾讯内部论坛中，有员工吐槽“写个几十页的方案，还没读完摘要额度就快见底了”，尤其是需要长上下文理解的场景（如代码审查、文档分析）受冲击最大。字节方面，报销流程的繁琐（需填写用途说明、上传AI对话截图）也让部分员工宁愿减少调用。但也有积极反馈：一些团队开始自发共享Token配额、优化Prompt以降低消耗，甚至催生了内部“AI省钱攻略”——例如将短任务从GPT-4降级至本地小模型、用缓存机制复用常见查询结果。技术部门则加速引入混合推理策略，将高频简单任务切换到成本更低的专用模型，以延长高端Token的“寿命”。

未来趋势：从“管够”到“管好”，Token经济化或成常态

腾讯与字节的做法标志着大厂AI资源管理进入新阶段。行业分析师指出，未来更多企业将采用“基础额度+自费/报销+部门预算池”的组合模式，甚至可能出现内部Token交易所——员工可将未被消耗的额度转卖给其他部门。更深远的变革是，企业开始基于Token消耗数据反推AI应用的价值评估：那些消耗大量Token但未能带来可量化效率提升的场景，可能被直接关闭或降级。对于员工而言，掌握“如何用最少Token完成最多任务”将不再是额外技能，而是数字时代的基本工作素养。大厂的这一轮调整，本质上是在提醒全行业：AI不是免费的午餐，每一行代码的生成、每一次对话的响应，都写着一张越来越清晰的成本账单。

大厂Token不再“管够”：腾讯开始限额，字节可部分报销

腾讯率先设限：Token额度不再“无限畅饮”

字节另辟蹊径：员工自费后获部分报销

成本压力下的必然选择：大厂算起了AI账单

员工体验分化：有人抱怨“不够用”，有人学会“省着用”

未来趋势：从“管够”到“管好”，Token经济化或成常态

链接失效反馈