一群00后极客和这家机器人公司共处72小时
在深圳科创学院四楼,“全球首届具身智能开发者大会”正如火如荼地进行。20组参赛队伍几乎全部由00后极客组成,他们要在三天时间内,让机械臂完成从识别、决策到操作的一系列任务。现场环境如同黑客松比赛,楼道和墙角随处可见选手支起的帐篷,奶茶和果切尚未吃完,咖啡味混着冷气弥漫整个空间,记录着这场高强度挑战的激烈程度。
比赛任务:从识别到精细操作
参赛选手需在72小时内训练高性能六轴机械臂,使其完成多个真实世界任务。比赛设定四个核心挑战项目,每个项目都对应机器人在家庭或工厂场景中的关键能力:
- 套环任务:考验机械臂抓取能力,需准确识别并抓取不同位置的木环。
- 水果分类:结合语言理解与视觉识别,让机械臂按指令将水果分入不同篮子。
- 插Type-C线:对柔性物体的精细操作能力提出高要求。
- 拼写英文单词:涉及长时序决策,机械臂需用积木拼出识别到的单词。
选手可以选择自变量WALL-OSS、Pi0.5、英伟达DreamZero等开源模型,结合自身采集的数据进行训练,目标是让机械臂在有限时间内完成任务。这些任务看似简单,但在真实物理环境下,光线、物体摆放、表面材质等变量都可能干扰识别和操作,对算法的泛化性提出极大挑战。
A/B榜机制:从开卷到闭卷,考验模型泛化性
为了更真实评估选手训练模型的能力,比赛采用了A榜和B榜的双机制:
- A榜:允许选手在设定环境下完成任务,类似于“开卷考试”,侧重考察模型在理想状态下的稳定性和复刻能力。
- B榜:审核员将随机调整环境变量(如位置、灯光、桌面颜色),考验模型在未知环境中的泛化能力,是“闭卷考试”。
比如,在B榜的套环任务中,木环不会固定在某个位置,环境也可能被改变,机械臂必须具备应对不确定性的能力。这种机制鼓励选手不再只追求“刷榜”,而是真正构建能适应现实世界的具身智能系统。
回归现实:挑战物理世界的复杂性
主办方自变量机器人创始人王潜表示:“这个比赛不想让大家停留在仿真、虚拟世界的画面里,而是上手动起来,体验物理世界的复杂性。”不同于以往赛事只提供仿真环境或数据集,本次大会强调选手直接接触真实机器人、采集真实数据、获得真实反馈。
王昊进一步解释:“工厂场景的机器人操作虽然受限,但家庭环境才是具身智能的圣杯。”家庭场景中的任务更加多样、开放,涉及复杂交互和多变环境。解决家庭任务的模型,才真正具备广泛应用的潜力。
尽管目前机器人在清洁任务中还只能完成整理、桌面清洁等基础操作,复杂任务仍需人类协作,但王昊坚持认为:“越早进入最复杂的场景,模型的智能水平才能越快提升。”
具身智能:系统工程的探索与开放生态
具身智能不仅涉及算法训练,更是从数据采集、模型优化、硬件适配到环境反馈的系统性工程。目前行业内对此尚无统一标准,而自变量的策略是:开放工具与平台,吸引更多开发者参与实践。
王潜在发言中提到:“就像小龙虾生态由无数个人开发者推动一样,具身智能也需要开放协作。”通过这种比赛机制,自变量希望构建一个真实、开放、协作的机器人智能演进路径,让模型在不断试错中迭代进化。
未来展望:从家庭出发,推动智能普及
此次大赛不仅是一次技术挑战,更是对具身智能落地路径的探索。自变量机器人已与58到家合作,在深圳推出智能保洁服务,让机器人保洁员上岗试运行。尽管当前能力有限,仍需人类辅助,但这一步意味着机器人正在从工厂走向更复杂、更开放的家庭环境。
“我们不是等模型完全成熟才推出应用,而是从真实场景出发,让模型在使用中不断完善。”王昊强调。通过这样的实践方式,具身智能的发展不再只是实验室里的理论推演,而是在真实世界中不断试错、迭代、成熟的过程。