大厂Token不再“管够”:腾讯开始限额,字节可部分报销
腾讯率先设限:Token额度不再“无限畅饮”
在AI应用快速普及的浪潮中,腾讯成为国内首家明确对员工Token使用进行限额的大厂。据内部消息,腾讯已为不同部门和岗位设定了每月Token消耗的硬性上限,超出部分需审批或由部门预算承担。这一举措改变了此前“按需取用、无成本约束”的宽松局面,直接向员工传递了“AI资源有价、使用需精打细算”的信号。部分研发团队反映,高负载的模型调用场景(如代码生成、大模型连续对话)已受到明显影响,不得不开始优化提示词调用次数或改用更轻量的模型。
字节另辟蹊径:员工自费后获部分报销
与腾讯的“直接设限”不同,字节跳动采用了更柔性的成本分摊机制。字节允许员工在个人账户中自行承担AI Token费用,同时开放了一条“部分报销”通道——员工提交合规的报销申请后,公司可按比例返还自费金额。这种模式既保留了员工使用AI工具的灵活性,又通过经济杠杆引导员工理性消费。据内部员工透露,报销比例通常根据场景重要性(如开发调试、日常办公)浮动,热门大模型API的调用频次在报销政策落地后明显下降,部分非刚需场景的调用量甚至腰斩。

成本压力下的必然选择:大厂算起了AI账单
两大厂的动作背后是日益沉重的AI基础设施支出。随着大模型从实验室走向业务一线,员工每天动辄数百万次的Token调用正在快速侵蚀企业利润。据行业估算,单个拥有1000名研发人员的团队,若全员高频使用GPT-4级别模型,月均Token成本可达数百万元。此前不少大厂为抢占AI应用先机,对内部Token消耗采取“兜底”策略,如今随着投资回报率(ROI)考核压力增大,CFO们开始要求技术部门将Token视为“真金白银”的硬成本。腾讯与字节的举措并非孤例,阿里、百度等企业也已在内测类似额度管理制度,一场围绕AI资源精细化管理的内卷正在上演。
员工体验分化:有人抱怨“不够用”,有人学会“省着用”
额度管控直接影响了普通员工的AI使用习惯。在腾讯内部论坛中,有员工吐槽“写个几十页的方案,还没读完摘要额度就快见底了”,尤其是需要长上下文理解的场景(如代码审查、文档分析)受冲击最大。字节方面,报销流程的繁琐(需填写用途说明、上传AI对话截图)也让部分员工宁愿减少调用。但也有积极反馈:一些团队开始自发共享Token配额、优化Prompt以降低消耗,甚至催生了内部“AI省钱攻略”——例如将短任务从GPT-4降级至本地小模型、用缓存机制复用常见查询结果。技术部门则加速引入混合推理策略,将高频简单任务切换到成本更低的专用模型,以延长高端Token的“寿命”。
未来趋势:从“管够”到“管好”,Token经济化或成常态
腾讯与字节的做法标志着大厂AI资源管理进入新阶段。行业分析师指出,未来更多企业将采用“基础额度+自费/报销+部门预算池”的组合模式,甚至可能出现内部Token交易所——员工可将未被消耗的额度转卖给其他部门。更深远的变革是,企业开始基于Token消耗数据反推AI应用的价值评估:那些消耗大量Token但未能带来可量化效率提升的场景,可能被直接关闭或降级。对于员工而言,掌握“如何用最少Token完成最多任务”将不再是额外技能,而是数字时代的基本工作素养。大厂的这一轮调整,本质上是在提醒全行业:AI不是免费的午餐,每一行代码的生成、每一次对话的响应,都写着一张越来越清晰的成本账单。