Google I/O之后,AI的参照系变了

Omni不再是视频模型:超级内容创作入口的诞生

在今年的Google I/O上,Omni脱胎换骨。它不再被框定为一个视频生成模型,而是被重新定义为「真正的超级内容创作入口」。这个入口能够嵌入所有创作者的工作流程——从视频剪辑、图文排版、音频混录到交互式故事板,Omni成为打通一切模态的中枢。对Google而言,这意味着一个比Coding想象空间更大的多模态应用市场正在成型。

Google I/O之后,AI的参照系变了

从编程到多模态:AI参照系的历史性转向

过去几年,AI行业的主流参照系是代码生成能力——谁的模型能写更复杂的程序,谁就代表先进生产力。但Google I/O 2026的发布彻底扭转了这一坐标。Omni所代表的不是辅助编码,而是直接接管内容创作的全流程。当AI能够通过自然语言指令生成完整的影视级片段、动态海报、交互式3D场景时,编程作为终极生产力标杆的地位被多模态创作所取代。参照系变了:衡量AI的标准不再是它写了多少行代码,而是它创造了多少种感官体验。

AI代理全面渗透:搜索、XR与智能体生态

大会上,Google全面揭露了其AI战略蓝图,AI代理(Agentic AI)成为贯穿搜索引擎、Gemini模型和硬件的核心线索。在搜索端,AI代理不再只返回链接,而是直接执行复杂任务——比如自动对比商品、预订行程、生成调研报告。在XR方面,Android XR与Gemini深度整合,代理可以理解用户视觉环境并实时提供上下文交互。基础设施层面,新一代TPU和云端支持原生多模态推理,使代理能够同时处理文本、图像、音频和视频,将「理解」与「执行」合为一体。

迈向AGI的关键一步:从工具到合作伙伴

大会的多项发布共同指向一个信号:Google正带领行业向通用人工智能(AGI)迈出关键一步。硬件与基础设施的升级(如下一代TPU和端侧模型部署)让实时多模态推理成为可能;Omni的内容创作能力让AI从被动响应变为主动生成;AI代理则让系统具备长期记忆与跨场景决策能力。开发者不再为单个API付费,而是接入一个能自主思考、学习并创造的智能体网络。AI的参照系不再是技术指标,而是它能否像人类合作伙伴一样,理解意图、完成目标并创造价值。