林俊旸推荐,Anthropic研究者自白:如何成为一位优秀研究者?

跨学科根基:从北大外语硕士到AI技术领袖

林俊旸的成长路径打破了“AI研究者必须是纯理工科海归博士”的刻板印象。他本科就读于北京大学计算机科学专业,硕士阶段转入北京大学外国语学院语言学研究所,形成了罕见的“计算机+语言学”跨学科知识体系。这份对语言的超常敏感,让他对大模型的理解逻辑与纯理工背景研究者截然不同。硕士期间,他在北大孙栩教授的计算语言学实验室深耕,2018年一年就以第一作者在ACL、EMNLP、COLING等顶级会议上发表了4篇论文,覆盖机器翻译注意力机制、文本摘要全局编码等方向。2019年入职阿里后,他先后参与M6、OFA、Chinese-CLIP等里程碑项目,2025年5月晋升为阿里最年轻的P10技术负责人——完全在本土环境中成长为具有国际影响力的AI技术领袖。

刻意训练小技能:选题、读文献、写作、实验循环

他曾明确指出,真正的研究能力由一系列可被刻意训练的小技能叠加而成,绝非靠追热点能速成。这些技能包括:怎么选题、怎么读文献、怎么写作、怎么加速实验循环——每一条都对应着可重复的训练方法。在阿里期间,他主导Qwen系列模型的研发,从语言模型扩展到多模态、多尺寸完整家族,同步统筹具身智能方向。这种从单一课题到复杂多线布局的能力,正是多年训练“选题-论文-实验”闭环的结果。他曾在ICLR 2025的Keynote演讲中详细拆解Qwen2.5的技术架构,向全球学术界展示如何将实验循环从“试错”转化为“定向优化”。

技术决策者的松弛感与硬实力

他在工作中是说一不二的技术决策者,私下里却更像一个“技术宅男”:埋首代码、钻研论文,甚至在社交平台分享研究心得。这种不把自己装进“典型技术高管”框架的松弛感,让他成为国际开发者社群中能直接对话的人。他的管理哲学核心是:“每个小团队负责人最重要的事,就是招比自己更好的人,否则很失败。负责人ego要小,不要觉得自己无敌。”他理想的管理者是“讲逻辑的人”,用支持而非控制激发自驱力。这种松弛与信任的组合,正是团队持续产出高质量研究的底层引擎。

约束下的创新:资源受限如何催生创造

在清华大学AGI-Next前沿峰会上,他坦言中美算力基础设施可能存在一到两个数量级的差距——美国实验室有余力投入探索性研究,而阿里团队大部分算力消耗在完成交付任务上。但他同时提出,正是资源受限,反而推动了中国研究者在算法-硬件协同设计上的创造性探索。这种“约束下的创新”叙事,比单纯的乐观或悲观都更有说服力。例如Qwen模型在Hugging Face上下载量超6亿次,衍生模型超17万个,千问App月活全球第三——这些成绩正是有限资源下高效聚焦的证明。

帮助全人类:研究的终极价值

他对AI的未来有清晰的价值判断:“如果你的想法不是帮助全人类,那不如不做大模型。”他不认为模型只是通过考试的学霸,而是应走向真正能帮助人类的Agent,最终发展为能在物理世界行动的具身智能。这解释了他为何亲手组建Qwen具身智能团队——不只是业务扩张,而是对AI终局的判断。这种以“全人类”为尺度的研究愿景,驱动他在技术选择上保持克制与务实,正如Anthropic在Claude推理能力上强调“集成推理、用户可控的思考预算”而非盲目堆砌参数。研究者真正的护城河,永远是将小技能打磨成习惯,同时把价值观焊进每一次选择。