刚被马斯克收购,Cursor甩出1.5万亿参数“核弹”:10万卡从零训成通用大模型

马斯克再出手:SpaceX 600亿美元吞下Cursor

SpaceX以全股票交易形式收购了Cursor,交易规模高达600亿美元,成为AI领域有史以来最大的收购案之一。此举标志着马斯克正以前所未有的速度整合AI资源,将Cursor纳入其航天与科技帝国版图,直接对标谷歌和OpenAI的竞争格局。

xAI的短暂命运与马斯克的AI整合棋局

就在今年2月,SpaceX还收购了马斯克自己的AI公司xAI,估值一度飙至1.25万亿美元。然而,xAI在2025年净亏损130亿美元、月烧10亿美元,最终于5月7日被马斯克亲手解散,账面资产一夜归零。这一急速整合动作背后,是马斯克将AI力量从独立运营转向直接融入SpaceX生态的战略决断,Cursor成为新棋局的核心棋子。

刚被马斯克收购,Cursor甩出1.5万亿参数“核弹”:10万卡从零训成通用大模型

10万卡Blackwell集群:1.5万亿参数“核弹”从零诞生

收购后不足数月,Cursor便甩出重器——一个拥有1.5万亿参数的通用大模型,完全从零训练而成。该模型的训练依托于10万卡规模的Blackwell超级计算系统。根据公开数据,Blackwell系统可在十天之内训练一个1.8万亿参数的大模型,而此前Hopper世代即使对几百亿参数的模型也难以在数月内完成。Cursor的“核弹”正是建立在Blackwell的极限算力之上。

Cursor为Blackwell定制内核,MoE效率飙升

为了榨干Blackwell硬件的每一分潜力,Cursor为其从零构建了MXFP8内核,专门优化了混合专家(MoE)层的计算效率。结果显示,MoE层提速3.5倍,端到端训练速度提升1.5倍。这种硬核的底层优化,使得10万卡集群能够高效协同,大幅缩短模型迭代周期,也让1.5万亿参数的庞然大物从理论变为现实。

两天炼成庞然大物?AI训练的“新核武”时代

结合Blackwell系统的极限能力和Cursor的定制化优化,训练1.5万亿参数模型的耗时可能被压缩到两天以内——尽管官方未披露确切时间,但参考十天训练1.8万亿参数的能力,这一推测极具现实性。这意味着AI模型的构建速度已进入“天级”时代,企业可以快速试验、迭代和部署通用大模型,彻底颠覆了过去以月甚至年为单位的大模型训练节奏。