帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

7 小时前
15 阅读

“不务正业”的AI科学家:从斯坦福到DeepMind的数学狂人

Yi Tay并非典型的AI研究员。在加入Google DeepMind之前,他曾在斯坦福大学攻读博士,研究方向却横跨自然语言处理、多模态及强化学习。更令人惊讶的是,他从小就展现出极高的音乐天赋,钢琴造诣足以让他在职业演奏家的道路上走下去。但他最终选择放弃音乐,投身于AI——这一决定直接影响了Gemini的未来。在DeepMind,他主导了“Deep Think”推理框架的开发,让大模型在数学证明上首次具备类人的严谨逻辑。

金牌背后的“Deep Think”引擎:如何教会AI做奥数题

IMO(国际数学奥林匹克)金牌的难度,在于需要模型在无限的可能性中,锁定唯一的严谨推理路径。Yi Tay的团队从人类数学家的解题习惯入手,设计了“Deep Think”机制:模型会在一定时间内自我追问、验证每一步推导,甚至生成反向的“反例”来推翻自己的结论。去年,搭载该机制的Gemini Deep Think首次在奥数级别测试中突破人类金牌线;到了今年2月发布的Gemini 3 Deep Think,其解题速度和准确率更是达到顶尖人类选手的两倍以上,彻底改写了AI在纯推理领域的排名。

差点成为钢琴家:音乐与数学在AI大脑中的共振

当被问及为何能从音乐家转型为AI研究核心时,Yi Tay曾在内部分享中坦言:“弹钢琴时你需要同时处理旋律、和声、节奏——这和证明数学定理时处理公理、引理、逻辑链条本质相同。” 他在训练Gemini时,巧妙地将音乐中的“复调思维”注入模型架构:让多个子网络并行推理不同分支,再通过注意力机制协调最终结论。这种融合,让Gemini在面对IMO难题时,不再僵硬地套用公式,而是展现出类似人类演奏家般的“节奏感”与“直觉爆发”。

未来:用奥赛金牌的引擎,去解更大的谜题

如今Yi Tay正带领团队探索如何将“Deep Think”从数学领域迁移到物理学、生物学甚至药物分子设计。他在一次Tech Talk中比喻:“我们让AI学会了做莫扎特级别的赋格曲,现在要它去谱写贝多芬式的宏大交响。” 对于错失的钢琴家生涯,他笑称:“真正的音乐藏在宇宙的数学规律里,而我有幸用代码去弹奏它。”