马斯克宣布 Grok V9-Medium 1.5T 模型完成训练:加入大量 Cursor 数据,两到三周内发布

参数规模跃升三倍,V9-Medium完成终极训练

相比当前支撑Grok所有生产线流量的v8版本(0.5T参数),V9-Medium的参数量直接翻了三倍,达到1.5T。马斯克明确表示,这一版本已实现“重大升级”,训练评估结果令人满意。尽管模型主体训练已经完成,xAI团队并未停下脚步——他们将立即进入补充训练环节,并在后续持续注入更多数据。

“Cursor数据”加持,代码能力迎来质变

本次升级中最引人注目的亮点是大量Cursor数据的加入。Cursor作为近年来备受开发者青睐的AI编程助手,其对话数据涵盖海量真实代码调试、重构与推理场景。xAI将此数据纳入V9-Medium的补充训练,旨在显著提升模型对复杂编程逻辑的理解能力以及上下文代码生成的质量。这不仅意味着Grok在软件工程领域的实用性将大幅增强,也可能使其在生成式AI的代码评估基准上更具竞争力。

微调与强化学习紧锣密鼓,两到三周内面世

据马斯克透露,V9-Medium目前正在进行监督微调(SFT),并将在几天后启动强化学习(RL)阶段。这两步是确保模型对齐人类偏好、提升交互稳定性的关键工序。按照当前进度,该模型预计在两到三周内面向公众发布,届时所有Grok用户将直接体验到1.5T参数带来的性能提升。

从Grok 3到V9-Medium:xAI的快速迭代

就在此前不久,xAI刚线上发布了升级版Grok 3大模型,该模型引入“思维链”推理能力,运算能力较前代提升十倍。而V9-Medium作为Grok基础模型家族的最新成员,其1.5T参数规模与Cursor数据注入,显示出xAI在短期内密集推进模型能力的策略——从超大参数底座到专项数据增强,步步为营。随着V9-Medium的落地,xAI在通用对话与代码开发两条赛道上将同时具备更强的火力。