谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了

4 小时前
2 阅读

皮查伊亲口承认:Gemini在Coding上落后了

在《纽约时报》播客访谈中,谷歌CEO桑达尔·皮查伊坦承,尽管谷歌在文本、多模态、语音、音频、推理等整体能力上依然强劲,但在一个关键方向“确实还没完全追上”。

  • 具体落后领域:带工具调用的智能体编程、指令跟随,以及需要长时间多步骤的长期任务。
  • 原因分析:每个顶级实验室的训练周期不同,三个月前可能领先,风向随时会变。皮查伊强调,Gemini 3.5 Flash是重要一步,补上了部分短板,但“对于需要资深开发者处理复杂代码库的长期任务,我们还有很大提升空间”。
  • 公司策略:被问及是否因同时押注太多方向导致资源分散,皮查伊回应称谷歌规模足够大,能够同时专注多个重要方向,不存在专注度问题。

多模态与推理:谷歌仍占据领先位置

尽管Coding领域被追赶,皮查伊明确指出了谷歌的优势所在。

谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了

  • 核心能力:文本、多模态(图像、音频)、语音理解、推理等综合能力,谷歌依然“蛮强的”。
  • 技术迭代:新发布的Gemini 3.5 Flash是一个新方向上的推进,虽可能带来一些回退,但可以通过后训练快速处理。
  • 现实检验:模型只有放到真实世界中应用,根据用户反馈持续迭代,才能越跑越好。Antigravity 2.0(内部使用已久的系统)正是关键支撑。

搜索25年最大改版:AI Mode不会一夜取代传统搜索

面对“经典搜索界面是否会消失”的追问,皮查伊给出了谨慎的渐进式演进路线。

  • 用户需求:搜索必须快,用户使用搜索是为了连接到互联网上已有的信息和内容,这对谷歌非常重要。
  • 节奏控制:谷歌不会“直接撕掉创可贴”全面切到AI Mode,而是会“有节奏地推进产品演进”。一年前还没有AI Mode,如今入口已更顺滑,但不会突然放弃传统搜索。
  • 商业价值:皮查伊认为商业价值最终取决于为用户创造的总价值。在AI Mode和Agentic Mode中,技术能为用户做的事比十年前多得多,随着价值提高,竞争和选择也会更多。

公众怕AI有道理:皮查伊承认焦虑很合理

针对《纽约时报》与Siena的调查(仅16%受访者认为AI总体是好事,35%认为坏事),皮查伊表示理解。

  • 焦虑根源:面对如此大规模的技术变化,人们担心工作、收入、未来生活被影响是自然的。以前不太复杂的技术变化都曾引起焦虑,更何况AI。
  • 行业责任:能做到的是继续把技术做好,同时让人们看到AI带来的实际好处。基础设施投入越来越大,需要想清楚如何更有效转化价值。
  • 健康讨论:围绕AI的广泛讨论是健康的,按现在的发展速度,大家有担心很合理,应该认真对待。

未来展望:年轻人仍有机会,但AI将改写工作

皮查伊对下一代保持乐观,同时承认AI将根本性地改变工作方式。

  • 对新毕业生的忠告:每个人都会多一种新能力,许多以前做不了的事将突然变得可能。就像电子表格出现前无法想象财务分析,AI将带来意外积极变化——更高效,也可能更多休闲时间。
  • 职业重塑实例:医生能花更多时间照顾病人,放射科医生通过AI处理过去10倍的信息量。人类光靠自己跟不上,必须借助AI。
  • 奇点与AGI:皮查伊引用哈萨比斯的说法“我们正站在奇点的山脚下”,将奇点定义为AGI的到来。他认为所有负责任的实验室在接近“递归式自我改进”时,必须进行更广泛的对话。即使AGI还需要10年,三年后的技术也会比今天强大得多,现在就需要行动和准备。