前美团技术大牛创业,教机器人打包外卖

前美团技术大牛为何盯上餐饮后厨?

创始人王栋博士曾担任美团外卖事业部技术负责人,带领千人团队构建了日均数千万订单的算法与系统。他离开美团后,在北美和新加坡实地调研数月,发现一个全球共性痛点:从商家出餐到骑手取餐之间,打包、封签、分拣等环节仍高度依赖人工,错单漏油直接拖累履约效率,而北美快餐时薪持续上涨、国内招工难问题同样突出。相比家庭或养老场景,餐饮后厨属于专业服务领域,决策链条短,中小商家付费意愿高,只要机器人能降低错单率、减少人工,ROI就清晰可见。2025年,他创立元节智能(AtomBite.AI),获英诺科创基金等机构千万级种子轮融资。

别家教机器人走路,他们教机器人打包

“大多数具身赛道创业者将精力集中在教人形机器人如何走得更稳、翻跟头,这种脱离产业实际需求的逻辑,本质上是概念外溢而非商业进化。”王栋直言。元节智能没有把重点放在重新发明机器人硬件上,而是选择从外卖打包与接驳这个“出错率最高、标准化程度相对较高、最易量化价值”的环节切入。打磨纸盒、装袋、封签……这些看似琐碎的动作,恰恰是后厨刚需。团队认为,先让机器人在可控场景中精准抓取、稳定操作,做到可用可靠,远比造一个会跳舞的机器人更有商业生命力。

不做VLA,要做VT-WAM:一个更懂物理的世界模型

技术路线上,元节智能没有跟风流行的VLA(视觉-语言-动作)框架。王栋解释:语言不是动作控制的核心,真实世界中的操作更依赖视觉理解、物理理解和动作映射。为此,他们自研VT-WAM(视觉-触觉世界动作模型),融合视觉与触觉模态——视觉能看见物体,但看不见接触;触觉看不见全局,却感知成败。视觉ground几何侧面,触觉ground物理侧面,两者经隐空间融合后,模型能预判接触后果。例如,一个饮料杯是否装水、温度冷热,都会影响抓取的摩擦力和重心变化,VT-WAM内置对液体晃动等物理因果的理解,让机器人动作符合真实物理规律,而非简单数据拟合。

从打包到接驳:高频场景如何反哺世界模型?

技术架构上,元节智能采用三层设计:

  • 最上层:具身世界模型,负责环境认知、决策与动作规划。
  • 中层:任务编排与调度引擎,将认知转化为具体执行计划,统一调度不同设备。
  • 底层:自研核心部件与通用硬件本体融合,确保长期稳定运行。

核心逻辑不是先造通用机器人再找场景,而是在高频后厨场景中持续收集真实交互数据,喂养世界模型。打包环节的标准化动作交由端侧轻量化小模型执行,以降低延迟;云端大模型专门处理物料缺失、异物干扰等异常,并通过KDS(厨房显示系统)联动人工补位。团队设想,未来模型能力会从打包延伸到分拣、配送接驳、烹饪协同,最终进入更广泛的服务业场景。

前美团技术大牛创业,教机器人打包外卖

商业路径:先搞定能省钱的活,再谈想象力

落地策略非常务实:先聚焦“能帮商家省钱”的刚需任务。王栋强调:“商家并不在意你的机器人像不像人,会不会跳舞,更在乎你到底能帮我干什么活。”外卖打包与接驳的错单率、撒漏损耗是商家最头痛的账单,元节智能的目标是降低人工依赖、提升履约准确性。目前,方案已具备商用基础,融资将主要用于模型迭代和产品落地。从后厨到家庭厨房的延伸,则是下一个阶段的想象力——但前提是先在真实的物理世界里,把打包这件事做彻底。