阿里巴巴发布首个具身智能大模型 Qwen-Robot 系列,为机器人打造手、脚、大脑通用底座

灵巧的手、认路的脚、会思考的大脑:Qwen-Robot三件套亮相

Qwen-Robot是千问大模型家族中首个完整的具身智能系列,包含三个核心模型:一个负责灵巧操作,让机器人能像人手一样抓取、装配精细零件;一个负责自主导航,理解空间与路径,让机器人在复杂环境中“认路”;还有一个负责认知决策,成为机器人的“大脑”,理解任务并规划长时序步骤。这三个模型既可单独部署适配特定场景,也能协同运转,让不同形态的机器人真正迈向真实落地。

阿里巴巴发布首个具身智能大模型 Qwen-Robot 系列,为机器人打造手、脚、大脑通用底座

从大模型到基础智能体:通义技术团队的战略转身

通义千问技术负责人林俊旸在社交媒体上公开宣布,已在通义团队内部建立机器人与具身智能小组,并强调“多模态基础模型正转变为基础智能体”。这些智能体不再只是理解世界,而是通过强化学习、记忆模块与工具调用,获得长时序推理能力——能够控制机器人肢体、规划运动轨迹、处理传感器输入。林俊旸表示,这些智能体“绝对应该从虚拟世界走向物理世界”,标志着阿里大模型从纯软件向实体化方向的关键突破。

软硬协同布局:自研大脑+投资本体双管齐下

在具身智能领域,阿里采取“软件自研、硬件投资”的双轨策略。软件层面,Qwen-Robot系列专注于打造可跨本体迁移的通用“大脑”;硬件层面,阿里近年已投资了逐际动力、星动纪元、宇树科技、星海图、灵心巧手等多家机器人公司,并在2025年云栖大会与NVIDIA联合提出“Physical AI”计划,将AI大模型与机器人、自动化、工业制造深度结合。这种布局既涵盖了整机厂商,也卡位了底座模型层,为后续生态扩张打下基础。

物理AI新赛道:可靠性、精度与长时序推理的挑战

具身智能进入物理世界后,对模型的可靠性、执行速度和容错能力提出了远高于纯软件的要求。工厂产线上一次失误可能导致整条生产线受损,因此Qwen-Robot系列强调“掌握”(mastery)——不仅要会做,还要能稳定做、快速做、意外时能自行补救。通过超大规模物理交互经验与少量真机数据微调,模型在简单高价值任务上的成功率已提升至99%,执行速度达到前代近3倍。林俊旸指出,未来机器人“大脑”还需覆盖更多专业场景的业务知识与因果推理链条,而阿里正通过与平头哥芯片协同,推动云端AI能力向终端硬件落地,构建从芯片到应用的全栈闭环。