阿里离职风波后,林俊旸首发长文回顾Qwen技术哲学,并探讨“智能体式思考”
核心人物离职,行业震动
2026年3月4日,阿里通义千问(Qwen)技术负责人林俊旸在X平台发布了一篇意味深长的告别长文,正式宣布卸任。这条推文迅速引爆全球AI圈,获得超过1.3万点赞和近600万浏览量。值得注意的是,就在此前一天,Qwen团队刚刚发布了Qwen3.5小尺寸模型系列,甚至获得了马斯克的点赞。
林俊旸并非个例,Qwen团队正经历一场剧烈的人员变动。同日,Qwen后训练负责人郁博文(Chen Cheng)也宣布离职,他在评论中写道:“我知道离开并非你的选择。”此外,Qwen3.5、Qwen-VL及Qwen-Coder的核心贡献者Kaixin Li,以及Qwen-Coder系列模型的主要技术负责人Binyuan Hui(胡锐斌)等多位核心骨干均已离职或更新了“former MTS at Qwen”的个人简介。团队研究科学家Wenting Zhao称之为“一个时代的结束”,而Hugging Face亚太生态系统负责人Tiezhen Wang则称这是对Qwen的“巨大损失”。
推动Qwen登顶的技术哲学
作为阿里最年轻的P10级技术负责人,1993年出生的林俊旸拥有独特的“跨界”背景——本科英语、硕士语言学,这为他在多模态大模型领域的突破埋下了伏笔。在他的带领下,Qwen系列创造了令业界瞩目的成绩,全球下载量突破6亿次(部分统计超10亿次),衍生模型超过17万至20万个,超越Meta的Llama成为全球第一大开源模型家族。
林俊旸在回顾中提出了一个核心观点:“模型即产品。” 他强调,今天做基础模型本身其实就是在做产品,研究人员需要像产品经理一样,把研究成果做成真实世界可用的系统。这种理念贯穿了Qwen的发展:
- 极致的开源策略:凭借全尺寸开源策略,Qwen在全球开发者社区赢得了巨大声望,长期霸榜Hugging Face。
- 有人情味的社区互动:林俊旸个人定期发布更新、分享Benchmark结果、与全球开发者深夜互动,这种活跃的公共形象让Qwen在国际舞台上拥有了罕见的“人情味”。
“智能体式思考”的新范式
在这篇长文中,林俊旸不仅回顾了过去,更探讨了AI研发的未来方向——“智能体式思考”(Agentic Thinking)。
他回顾了过去一年的探索,指出团队发现传统的纯监督微调(SFT)存在局限性。虽然大量数据能够教会模型说话,但却难以教会模型“如何思考”。为了解决这个问题,团队开始尝试在后训练阶段引入强化学习(RL),让模型学会通过思考来解决未知问题。
这种转变意味着:
- 从“模仿”到“推理”:模型不再仅仅是模仿人类的回复,而是具备了推理和规划能力。
- 工具使用与交互:结合Qwen在“办事”功能上的探索(如买奶茶、点外卖),未来的模型将更加具备智能体的特征,在真实环境中执行任务。
深远影响与行业变局
林俊旸的离职及其技术反思,是在阿里AI战略调整的大背景下发生的。就在前两天,阿里刚刚宣布将大模型B端品牌和C端应用品牌统一为“千问”,“通义千问”名称不再使用。
从业绩来看,这一战略已取得显著成效:
- 用户规模:千问以2.03亿MAU成为全球第三大AI应用(仅次于ChatGPT和豆包),增速达惊人的552%。
- 活跃度飙升:春节“请客活动”期间,千问DAU从707万飙升至7352万,增幅940%,极大地缩小了与豆包的差距。
林俊旸的离职被视为阿里AI战略深层变动的缩影,但他留下的“模型即产品”哲学和对“智能体式思考”的探索,将继续影响Qwen及全球开源AI生态的未来发展。