智源大会最清醒的一句话:大模型的下一场仗,不在屏幕里打了
“预测下一个物理状态” 取代 “预测下一个词元”
智源研究院在2026年大会上系统梳理了世界模型的演进路径,明确提出人工智能正经历一场重大范式变革。过去以语言为中心的大模型,无论规模多大,学到的都只是语言描述的世界,无法理解真实的物理后果。新一代世界模型的核心本质,是从“预测下一个词元”跃迁到“预测下一个物理状态”。
- 其发布的“悟界·Physis-v0.1”成为全球首个通用世界基座模型,能够以统一物理状态学习,实现物理正确、动作因果可溯、长程一致且通用泛化,旨在打破传统AI垂类场景专用的技术瓶颈。
- 这一转变意味着AI不再是困在屏幕里的聊天机器,而是要像人类一样感知、推理真实物理世界的时间、空间、规律和常识,并具备主动交互能力。

悟界系列全面落地:脑科学、药物发现与多模态统一
智源在2025年推出“悟界”系列后,2026年大会进一步展示了从微观生命到宏观机器人的系统化成果。
- 悟界·Brainμ1.0是全球首个理解与生成统一的多模态神经科学大模型,将Next-Token Prediction范式扩展至神经科学领域,相关研究成果已发表于《科学》杂志。同时发布了全球最大的AI-Ready神经科学数据集BrainToken。
- 悟界·OpenComplex2.5以单一模型覆盖药物发现四大关键步骤,可精确解析IDP灵活构象,系统性赋能创新药物研发全链路。
- 悟界·Emu3.5仅基于“预测下一个词元”就实现了文本、图像和视频的统一学习与生成,该成果作为中国原生创新刊发于《自然》正刊,证明多模态统一架构已经成熟。
具身智能与智能体:AI走出屏幕操练物理世界
针对具身智能面临的硬件不成熟、数据短缺、模型能力弱、落地难四大挑战,智源构建了自底向上的全栈技术体系。
- 发布的“悟界·RoboBrain Orca”以预测下一个物理状态为核心构建具身大脑,融合大量Ego-centric交互数据,提升下游少样本和跨场景泛化能力。
- 同时推出四款自主研发智能体:心脏辅助诊断、科学发现、个人专属助理和生物安全防护——这些智能体不再是对话框里的助手,而是直接介入物理世界诊疗、实验室操作和安全监测。
- 在大会AI科研体验区,观众可以现场体验SoulAgent(越用越懂你的个人智能体)、与AI医生的诊断互动,以及在不同构型机器人制作汉堡、递饮料的实际场景中,直接感受AI从屏幕走向现实的真实触感。