4180万美元种子轮爆火:韩国物理AI撕开视频预训练的真实落地逻辑

从论文到产线:物理AI的六年长跑

“Physical AI”这个词最早见于2020年《Nature Machine Intelligence》的一篇论文,系统定义了它是一类能够执行与智能生物体相关联任务的实体系统,核心在于将物理规律深度整合进人工智能。从学术圈的一声枪响,到2026年产业界全面接棒,中间隔了整整六年。这六年里,传感器成本降低了几个量级,端侧AI算力从理论走向工程化,机器人本体的可靠性和量产能力也悄悄走到了临界点——这些才是物理AI从论文走向产线的隐性推力。

视频预训练突围:世界模型为何突然能用

“世界模型”概念2018年就有人提出,但过去基本只活在论文里——太吃算力,生成质量不稳定,做不了实时交互。今年情况变了:

  • 蚂蚁灵波团队开源了LingBot-World框架,实现近10分钟连续稳定的视频生成,端到端交互延迟控制在秒单位,用户可以用键盘鼠标实时控制虚拟角色。
  • 极佳视界发布GigaWorld-1平台,定位物理世界的“数字沙盒”;阿里巴巴的ABot-PhysWorld在WorldArena评测基准上超越它,综合排名冲到第一。
  • 这些开源项目把“只有巨头玩得起”的游戏变成了“小团队也能上手”的工具。真实世界的训练数据获取成本极高,且天然带有分布偏差——你很难在现实中凑齐工厂暴雪夜班、物流仓库断电应急、产线工人突发介入等所有边缘场景。但合成数据可以:在仿真环境中用提示词操控场景参数,数小时内即可生成覆盖极端条件的大规模训练视频,这在传统实采路线下需要数月甚至数年。

机器人不再是演员:智元与Figure的实干路线

去年机器人公司秀肌肉的方式还是拍Demo视频,设定好场景反复排练。今年玩法完全不同:

  • 智元机器人在南昌3C产线做了直播:机器人被扔进真实工厂连续干活几个小时,没有预设剧本,几十万人次在线围观。一个月后,智元宣布人形机器人实现万台量产。
  • 智元创始人邓泰华提出“XYZ曲线”分析框架:X是开发尝鲜期(玩Demo),Y是部署成长期(机器人进产线干活),Z是终局的智能涌现期。他给2026年的定性是:“部署态元年,正式从‘能动’走向‘会干’”。
  • 美国人形机器人公司Figure AI完成超10亿美元融资,估值390亿美元。其新产品Figure 03展示了浇花、端菜、叠衣服等家务活,所有动作都是机器人自主完成,没有人在背后遥控。它的三层架构(本能-反射-思考)相当于给机器人装了一个不会宕机的神经系统。

汽车供应链涌入:物理AI的隐形推手

今年北京车展上,安波福、法雷奥、地平线、千寻位置等老牌汽车供应商扎堆展示机器人相关方案。汽车智能驾驶系统本质上就是一个“移动机器人”的感知-决策-执行闭环,其中的视觉感知、路径规划、实时控制三大模块,与机器人在技术架构上高度同源。汽车供应商手中的摄像头、雷达、线控底盘和实时操作系统,稍加适配就能迁移到机器人领域。汽车产业过去十年在智能化上烧的上千亿研发费用,正以“技术溢出”的方式流进物理AI赛道。这解释了为什么中国机器人公司能快速冲进量产:制造能力和供应链管理不是凭空长出来的,很多是现成的。

范式换轨:机器从“能动”走向“会干”

传统机器人采用“感知、规划、控制”三段式,由工程师写死规则,遇到没见过的状况直接卡住。物理AI走的是“感知、推理、执行”新路:感知后不经过人类写死的规则,而是由训练过的神经网络自己推理出该做什么。本质区别在于,前者是“工程师替机器思考”,后者是“机器自己理解物理世界”。国际机器人标准组织预测,未来三年内80%的新机型将采用这种新架构。英伟达在GTC上宣布与ABB、库卡、安川、发那科四大工业机器人巨头深度合作,全球超过200万台工业机器人可通过英伟达仿真平台做虚拟调试和AI训练,这意味着英伟达正押注成为下一代工业自动化的“操作系统”层。2026年是部署态元年,产业竞争刚刚开始,三年后哪些名字还在牌桌上,可能会出乎大多数人的意料。