18家具身顶尖势力集结,RoboChallenge 打造全球最大具身模型竞技场
背景:机器人领域的“全球统考”
RoboChallenge 被誉为机器人界的“全球统考”,是一个开放式基准测试平台,旨在通过真实场景的远程真机评测,推动具身智能模型的发展。该平台整合了多款主流机器人设备,如 UR5、Franka Panda、Aloha、ARX-5 和 DOS-W1 等,并首创大规模远程评测机制,使全球团队能够在统一标准下进行技术比拼。
- 该评测机制摆脱了传统仿真测试的局限性,强调真实物理环境中的操作能力。
- RoboChallenge 持续吸引全球最顶尖的具身智能研发团队参与,推动技术标准的建立。
参赛亮点:中国团队强势崛起
在今年的 RoboChallenge 中,中国团队展现出强劲的竞争力。
自变量机器人推出的开源具身智能基座模型 WALL-OSS,以 46.43 分 的成绩位列全球第二,超越了美国团队的 pi0。该模型采用 共享注意力+专家分流架构,支持多任务操作,展现出高效的决策与执行能力。
- 支持多任务操作
- 采用共享注意力机制 + 专家分流架构
- 开源特性推动行业共同进步

同时,另一家中国创业公司 千寻智能,凭借其自研的 Spirit v1.5 VLA 模型,以总分 66.09、任务成功率 50.33% 的优异表现,成为榜单上的耀眼明星,进一步证明中国在具身智能领域的快速崛起。
平台机制:远程真机评测打破边界
RoboChallenge 的核心创新在于其 大规模远程真机评测机制。传统机器人测试多依赖仿真环境,但 RoboChallenge 强调在真实机器人上执行任务,确保技术落地能力。
- 支持多类型机器人接入,包括工业机械臂和移动平台
- 所有评测任务均通过远程操作完成,数据统一采集、评分
- 强调模型泛化能力与硬件适配性,推动通用具身智能发展
这种评测机制不仅考验模型的算法性能,也测试其对真实物理环境的适应能力,是具身智能领域最接近实际应用的测试方式。
技术趋势:开源与标准化推动行业协同
此次赛事中,多个团队选择开源其基础模型,例如自变量机器人的 WALL-OSS,这种做法促进了技术共享与快速迭代。
- 开源模型降低研发门槛,助力中小企业和学术机构快速进入赛道
- 基座模型+专家微调的架构成为主流趋势
- 评测标准逐步统一,形成可复制的技术进化路径
随着评测机制和模型架构的标准化,全球具身智能正从“各自为战”转向“协同进化”,为通用机器人技术的突破打下基础。
行业影响:加速迈向通用机器人时代
RoboChallenge 汇聚了来自中国、美国、欧洲等地的 18 家顶尖团队,标志着具身智能进入全球协作与竞争并行的新阶段。
- 中国团队在榜单中表现突出,显示出政策与产业协同的优势
- 评测结果直接反映模型在真实任务中的表现,为商业化落地提供参考
- 平台成为检验通用具身智能模型的“试金石”,推动机器人从单一功能向多功能演进
此次集结不仅是技术比拼,更是全球机器人产业迈向标准化、开源化和通用化的重要一步,为未来机器人进入家庭、工业、服务等多个领域奠定坚实基础。