首页

登录

智源大会最清醒的一句话：大模型的下一场仗，不在屏幕里打了

1 个月前

AI资讯

63 阅读

世界模型 [大模型智源大会物理状态]

“预测下一个物理状态” 取代 “预测下一个词元”

智源研究院在2026年大会上系统梳理了世界模型的演进路径，明确提出人工智能正经历一场重大范式变革。过去以语言为中心的大模型，无论规模多大，学到的都只是语言描述的世界，无法理解真实的物理后果。新一代世界模型的核心本质，是从“预测下一个词元”跃迁到“预测下一个物理状态”。

其发布的“悟界·Physis-v0.1”成为全球首个通用世界基座模型，能够以统一物理状态学习，实现物理正确、动作因果可溯、长程一致且通用泛化，旨在打破传统AI垂类场景专用的技术瓶颈。
这一转变意味着AI不再是困在屏幕里的聊天机器，而是要像人类一样感知、推理真实物理世界的时间、空间、规律和常识，并具备主动交互能力。

智源大会最清醒的一句话：大模型的下一场仗，不在屏幕里打了

悟界系列全面落地：脑科学、药物发现与多模态统一

智源在2025年推出“悟界”系列后，2026年大会进一步展示了从微观生命到宏观机器人的系统化成果。

悟界·Brainμ1.0是全球首个理解与生成统一的多模态神经科学大模型，将Next-Token Prediction范式扩展至神经科学领域，相关研究成果已发表于《科学》杂志。同时发布了全球最大的AI-Ready神经科学数据集BrainToken。
悟界·OpenComplex2.5以单一模型覆盖药物发现四大关键步骤，可精确解析IDP灵活构象，系统性赋能创新药物研发全链路。
悟界·Emu3.5仅基于“预测下一个词元”就实现了文本、图像和视频的统一学习与生成，该成果作为中国原生创新刊发于《自然》正刊，证明多模态统一架构已经成熟。

具身智能与智能体：AI走出屏幕操练物理世界

针对具身智能面临的硬件不成熟、数据短缺、模型能力弱、落地难四大挑战，智源构建了自底向上的全栈技术体系。

发布的“悟界·RoboBrain Orca”以预测下一个物理状态为核心构建具身大脑，融合大量Ego-centric交互数据，提升下游少样本和跨场景泛化能力。
同时推出四款自主研发智能体：心脏辅助诊断、科学发现、个人专属助理和生物安全防护——这些智能体不再是对话框里的助手，而是直接介入物理世界诊疗、实验室操作和安全监测。
在大会AI科研体验区，观众可以现场体验SoulAgent（越用越懂你的个人智能体）、与AI医生的诊断互动，以及在不同构型机器人制作汉堡、递饮料的实际场景中，直接感受AI从屏幕走向现实的真实触感。