科技公司的AI焦虑:KPI高压、蒸馏实习生与反蒸馏
背景:AI竞赛与组织权力博弈
近年来,科技公司在大语言模型(LLM)研发上的竞争日趋激烈,尤其是随着2023年ChatGPT的横空出世,各头部公司开始调整内部资源与组织架构,以争夺技术优势。腾讯的AI Lab作为其核心研究机构之一,在这场混战中经历了一系列动荡与重构。AI Lab早期定位为学术前沿阵地,由张正友接手后,总办甚至一度不设硬性KPI,给予研究团队较大自由度。然而,这种自由并未带来稳定,反而在模型竞赛中暴露出资源分配、部门协作与内部竞争等多重问题。
张正友时代的自由与矛盾
张正友在位期间,AI Lab的核心技术骨干包括俞栋、史树明和刘威等,他们在NLP、CV等领域积累了深厚的技术基础。但随着混元模型项目的推进,AI Lab与机平、数平等部门之间的协作逐渐暴露出问题。例如,刘威曾因是否参与外部比赛的问题,与张潼在全员邮件中公开分歧。此外,AI Lab在算力资源上的不足也逐渐显现,仅拥有小几千张GPU,远不如机平的资源储备。
模型蒸馏与数字遗产的“复活”
AI“炼化”同事这一现象,指的是科技公司通过AI技术“蒸馏”离职员工的数字痕迹(如聊天记录、文档、邮件等),将其转化为可模拟其工作风格和行为的模型。这一技术的应用不仅提升了团队效率,也引发了对个人数据归属和职业伦理的讨论。在腾讯的案例中,部分核心人才离职后,AI Lab曾尝试利用类似方法保留其技术影响力,但效果不佳,最终导致组织进一步分裂。
模型蒸馏的具体实践
- 收集离职员工在公司系统中的数字资产,包括文档、会议记录、模型参数调整日志等。
- 通过自然语言处理和行为建模技术,训练出能模仿其风格的AI代理。
- 将这些AI代理嵌入团队,用于辅助新人学习、优化流程,甚至参与模型调优。
但这种技术手段也面临伦理挑战,尤其是在没有员工明确授权的情况下,其合法性与合规性存疑。
KPI高压与自由研究的冲突
AI Lab最初以“无KPI”的研究自由为卖点,吸引了大量顶尖科学家。但随着大模型商业化进程加速,总办对成果的要求逐渐提高,KPI压力随之而来。2023年混元项目成为内部焦点,AI Lab被要求产出具有竞争力的大模型,但因算力、数据与组织结构上的劣势,其成果被数平部“更优模型”所超越,最终失去项目主导权。这一过程中,AI Lab团队感受到理想与现实之间的强烈割裂。
AI Lab团队的“体感不好”
- 无法接触到核心基模资源,研究受限。
- 因部门墙导致合作效率低下。
- 研究方向频繁调整,缺乏稳定性和自主权。
组织重构与AI Lab的终结
随着张正友的离开和蒋杰的接手,AI Lab开始面临一系列人事与结构变动。史树明的离职导致NLP中心解体,俞栋的团队被合并为AGI中心。最终,在组织融合的推动下,AI Lab整体被撤销,原有成员分散至姚顺雨领导下的混元体系内。姚顺雨将团队拆分为五大板块:预训练、后训练、Baseline Infra、模型评估与Frontier(前沿),并强调“打破部门墙”的新文化。
姚顺雨的混元体系
- 预训练:由王迪的机器学习平台部主导。
- 后训练:曾由AI Lab负责,后被调整。
- Baseline Infra:提供模型训练与部署的基础平台。
- 模型评估:由数平部负责,制定评测标准。
- Frontier(前沿):吸纳AI Lab原班人马,专注探索型研究。
影响:科技公司的人才焦虑与未来挑战
AI Lab的撤销标志着腾讯内部AI研究体系的一次重大洗牌,也反映出科技公司在AI研发过程中普遍面临的组织与人才焦虑:
- 人才流失:核心科学家频繁离职,导致团队断层。
- 资源争夺:不同部门围绕算力、数据与模型主导权展开竞争。
- 文化冲突:研究自由与KPI导向之间的张力加剧。
- 技术伦理:模型蒸馏、数字遗产的使用引发争议。
对科技公司的启示
- 建立更灵活的人才机制,避免因人员流动导致项目瘫痪。
- 打破部门壁垒,加强基模与应用层的协同。
- 推进AI伦理建设,规范模型蒸馏与知识复用边界。
- 平衡自由研究与商业产出,避免理想主义与实用主义失衡。
未来,如何在高速演进的AI赛道中维持组织稳定、激发人才潜力,将成为科技公司必须面对的战略命题。