4180万美元种子轮爆火：韩国物理AI撕开视频预训练的真实落地逻辑

1 个月前

AI资讯

27 阅读

世界模型物理AI 视频预训练韩国AI

从论文到产线：物理AI的六年长跑

“Physical AI”这个词最早见于2020年《Nature Machine Intelligence》的一篇论文，系统定义了它是一类能够执行与智能生物体相关联任务的实体系统，核心在于将物理规律深度整合进人工智能。从学术圈的一声枪响，到2026年产业界全面接棒，中间隔了整整六年。这六年里，传感器成本降低了几个量级，端侧AI算力从理论走向工程化，机器人本体的可靠性和量产能力也悄悄走到了临界点——这些才是物理AI从论文走向产线的隐性推力。

视频预训练突围：世界模型为何突然能用

“世界模型”概念2018年就有人提出，但过去基本只活在论文里——太吃算力，生成质量不稳定，做不了实时交互。今年情况变了：

蚂蚁灵波团队开源了LingBot-World框架，实现近10分钟连续稳定的视频生成，端到端交互延迟控制在秒单位，用户可以用键盘鼠标实时控制虚拟角色。
极佳视界发布GigaWorld-1平台，定位物理世界的“数字沙盒”；阿里巴巴的ABot-PhysWorld在WorldArena评测基准上超越它，综合排名冲到第一。
这些开源项目把“只有巨头玩得起”的游戏变成了“小团队也能上手”的工具。真实世界的训练数据获取成本极高，且天然带有分布偏差——你很难在现实中凑齐工厂暴雪夜班、物流仓库断电应急、产线工人突发介入等所有边缘场景。但合成数据可以：在仿真环境中用提示词操控场景参数，数小时内即可生成覆盖极端条件的大规模训练视频，这在传统实采路线下需要数月甚至数年。

机器人不再是演员：智元与Figure的实干路线

去年机器人公司秀肌肉的方式还是拍Demo视频，设定好场景反复排练。今年玩法完全不同：

智元机器人在南昌3C产线做了直播：机器人被扔进真实工厂连续干活几个小时，没有预设剧本，几十万人次在线围观。一个月后，智元宣布人形机器人实现万台量产。
智元创始人邓泰华提出“XYZ曲线”分析框架：X是开发尝鲜期（玩Demo），Y是部署成长期（机器人进产线干活），Z是终局的智能涌现期。他给2026年的定性是：“部署态元年，正式从‘能动’走向‘会干’”。
美国人形机器人公司Figure AI完成超10亿美元融资，估值390亿美元。其新产品Figure 03展示了浇花、端菜、叠衣服等家务活，所有动作都是机器人自主完成，没有人在背后遥控。它的三层架构（本能-反射-思考）相当于给机器人装了一个不会宕机的神经系统。

汽车供应链涌入：物理AI的隐形推手

今年北京车展上，安波福、法雷奥、地平线、千寻位置等老牌汽车供应商扎堆展示机器人相关方案。汽车智能驾驶系统本质上就是一个“移动机器人”的感知-决策-执行闭环，其中的视觉感知、路径规划、实时控制三大模块，与机器人在技术架构上高度同源。汽车供应商手中的摄像头、雷达、线控底盘和实时操作系统，稍加适配就能迁移到机器人领域。汽车产业过去十年在智能化上烧的上千亿研发费用，正以“技术溢出”的方式流进物理AI赛道。这解释了为什么中国机器人公司能快速冲进量产：制造能力和供应链管理不是凭空长出来的，很多是现成的。

范式换轨：机器从“能动”走向“会干”

传统机器人采用“感知、规划、控制”三段式，由工程师写死规则，遇到没见过的状况直接卡住。物理AI走的是“感知、推理、执行”新路：感知后不经过人类写死的规则，而是由训练过的神经网络自己推理出该做什么。本质区别在于，前者是“工程师替机器思考”，后者是“机器自己理解物理世界”。国际机器人标准组织预测，未来三年内80%的新机型将采用这种新架构。英伟达在GTC上宣布与ABB、库卡、安川、发那科四大工业机器人巨头深度合作，全球超过200万台工业机器人可通过英伟达仿真平台做虚拟调试和AI训练，这意味着英伟达正押注成为下一代工业自动化的“操作系统”层。2026年是部署态元年，产业竞争刚刚开始，三年后哪些名字还在牌桌上，可能会出乎大多数人的意料。